专家视点|从猿到人:探索知识服务的凤凰涅槃之路

张晓林(中国科学院文献情报中心,上海科技大学)

ChatGPT的横空出世,给所有以数据和信息为原料、以“知识”为产出的行业带来了如埃隆•马斯克所说的“存在主义焦虑”(Existential Angst)。而且,ChatGPT的持续迭代正以迅雷不及掩耳之势扑面而来,例如跨模态能力的GPT-4、ChatGPT和Whisper API接口开放、微软推出GPT-4 Office全家桶全面提升办公生产力[1]…。许多专家分析总结了ChatGPT的技术及其发展趋势[2-3],作为知识服务的实践者,我更希望了解ChatGPT革命对知识服务带来的挑战和可能的应对,因此谨以此文提出个人见解抛砖引玉。 
 
 

 

1

ChatGPT将使传统知识服务的优势

荡然无存

 
我们已经看到,ChatGPT能编写程序、通过专业考试、编辑新闻稿、提出案件或病例知识背景总结等。上海交通大学图书馆李新碗馆长最近已实例展示了ChatGPT充当学科馆员回答咨询问题、作为助手协助撰写项目申请书态势综述的良好表现[4]。我在上科大情报服务中已用ChatGPT回答用户调研问题,几轮Prompts后答案达到有较好积累的情报人员水平。毋庸讳言,目前大多数基于数据、文献或网络信息进行收集、梳理、总结的数据分析、学科咨询、情报研究等传统知识服务都能通过ChatGPT类工具与Prompt机制的结合来很好完成。
这时我想到清华大学钱颖一教授在2021年的判断:人工智能将使中国教育优势荡然无存[5]。他指出,中国教育的长处是教师对知识点的传授、学生对知识点的掌握,不仅量多,而且面广,所以中国教育使得中国学生对基本知识达到高水平掌握。但是,中国教育的最大问题,是对教育从认知到实践都存在一种系统性的偏差,把教育等同于知识并局限在知识上。教师传授知识、学生接受知识,考核(高考)也是考知识,知识几乎成了教育的全部内容。而人工智能就是通过机器进行深度学习来工作,就是大量地识别和记忆已有的知识积累。它完全可以替代甚至超越那些通过死记硬背、大量做题而掌握知识的人脑。因此,未来的人工智能会让我们的教育制度下培养学生的优势荡然无存。现在看来,钱教授“不幸言中”。也许更为不幸的是,如果把“教育”换成“文献情报工作”或“知识服务”,他的结论相当普遍地依然成立。

 

 

2

ChatGPT正展现知识服务的具有

“量子优越性”的新生命形态

 

        很多专家总结了ChatGPT“为什么能”,例如它所依据的GPT机制(Generative Pre-trained Transformer)和大语言模型(LLM)等。但它之所以成为ChatGPT,根本地在于它的InstructGPT,通过基于人类反馈的强化学习(Reinforcement learning from human feedback),在有监督的语义微调和指令微调(Supervised Fine-Tuning和Instruction Fine-Tuning)和通过近似策略优化(OPP)的奖励模型等支持下,支持生成思维链(Chain-of-thought),提高了ChatGPT“知道知道”和“知道不知道”的能力、减少“不知道知道”和“不知道不知道”的限制、同时通过逐步思考帮助它回答其不知道的问题[2]。

从知识服务角度,我希望指出两个关键点,一是它一直致力于回答用户想要解决的问题,而不仅是为解决用户问题而检索信息;在如此做时它一直是在回答用户问题的过程中学会回答问题,一直自然地借助人类能力来服务人类和优化自己。这使得用户自然觉得它有用,而且几乎无门槛地好用,也让它能方便自然地嵌入用户的场景和过程中。二是大模型所体现出来的“涌现”能力。所谓“涌现”[6],指“当大量相似的实体彼此之间以及与所处环境在低尺度上相互作用时,更高的时空尺度上就可能自发产生许多意想不到的结果。这种非同小可的现象被称为“涌现”(emergence),这是各类复杂系统都有的特征”。ChatGPT所体现出来的强大思考能力就是大语言模型下的涌现的结果。有了人类自然加持和大规模复杂系统的涌现能力,ChatGPT重塑了知识服务的新生命形态,对传统知识服务形成降维式打击。这些特点值得我们深思。 

 

3

ChatGPT正逼迫我们突破从猿到

人的生存屏障

 
我的一个从事计算政策学研究的博士生“不幸”在论文即将预答辩时遭遇了ChatGPT,他花了相当心血的实体及实体关系抽取工作被ChatGPT“优雅而无情”地替代了,通话时隔着手机屏幕都能感受到他的“价值焦虑”甚至“存在焦虑”。
我们一起分析了他的博士论文是研究什么和如何研究的。其实,他是从政策失灵出发,询证计算分析相关领域的政策在分类施策、精准施策、协同施策、组合施策方面可能存在的问题和可能的解决途径。实体与实体关系的抽取只是初步基础,但研究的核心是探索How和Why以及可能的What If。
创新性研究是从问题到数据到信息到知识到智慧到解决方案的过程,对应是计算智能、感知智能、认知智能[7]、决策智能[8]的不同阶段。诚然,许多研究在一定阶段需要计算智能或感知智能来描述What以及部分How,也有许多“研究”停留在计算智能和感知智能,包括内容抽取、实体抽取和计量分析等。感知智能聚焦的主要是对象和关系,是关联性探索和描述(ChatGPT说到底是相关关联—“这些语句最有可能与这些问题相关且各自最可能如此相关”),但认知智能、决策智能,主要探索How、Why和What If。在数据、算力和算法迅速发展的今天,需要超越计算智能和感知智能,致力于聚焦于认知智能,努力支持决策智能。
要解决认知智能和决策智能,需要对复杂决策环境及其因果动力学的把握。因果关系推理涉及图灵奖获得者Judea Pearl提出的三个层次,“见”—即通过观察在事物之间建立联系的能力;“做”—即对某事做出改变,并关注后果;“反事实“(CounterFactual)[9],即提出“如果…会如何”,推测未采取行动的后果,建立想象不同情景的能力。人工智能主要是由深度学习(deep learning)推动的,它们可以学习如何把一个事物与另一事物相关联,随后这些习得的关联性就可以投入实际应用。但这只是登上了梯子的第一阶,而这把梯子应该通向更高目标,即“深度理解”(deep understanding)[10],尤其是高阶复杂系统下的因果关系的理解。应该说,ChatGPT目前还主要是计算智能和感知智能,但部分突破了(尤其在Prompt的帮助下)认知智能。
目前看来,这份博士论文研究还是立足于决策智能高度,通过贯通问题+数据+情报+知识+智慧+可能解决方案,通过场景驱动来达到真正的创新,至少现在还有其创新意义,不至于被后浪拍死在沙滩上。这个案例也许对知识服务有普遍意义。我们做什么和怎么做决定了我们的生存几率。但现在我们没有选择的余地,必须从计算智能和感知智能的舒适区走出来,从在树梢上轻松地四肢蹦跶跳到大草原去学会直立行走,尽快在技术(不知什么时候)赶上来之前驾驭认知智能和决策智能的挑战。

 

4

知识服务在ChatGPT时代的凤凰

涅槃之路呼唤新的生命机制

 
面对ChatGPT,知识服务领域的各种探索在积极展开。我个人并不假装做过系统或深入思考,更多是提出可能探索的方向(无排名先后)。
我们要拥抱ChatGPT及类似工具。我在上科大情报馆员团队讨论学校战略情报调研时要求,对每个问题先用ChatGPT跑一遍,尤其是站在用户实际解决问题角度、通过对ChatGPT不断提示(Prompt)来优化ChatGPT的回答。难点在于:用户的实际问题到底是什么?用户看到ChatGPT的各梯次回答后又会提出什么问题?不同用户根据自己个性化需求又会提出什么不同问题?如何自然无痕地了解用户的不断变化又各异的问题?需要什么样的技术或系统机制来支持这个Prompt Engineering服务?如何把这种能力建设成可信赖可持续且有高度竞争力的服务机制?……
我们要支持ChatGPT驱动下的AI for Science(简称AI4S,这里Science不仅是科技医疗领域,还包括人文与社会科学)。国际货币基金组织(IMF)原副总裁朱民先生提出,AI赋能科学研究将成为未来全球科技竞争的前沿[11]。科技部也在今年2月明确表示将把人工智能作为战略性新兴产业给予大力支持。全球范围AI4S已经风起云涌[12]。但AI赋能科学的作用机理不断演变,可能包括:(1)对相对明确问题和相对单一数据集,AI通过海量数据深度学习快速发现或筛选隐藏的特征及关系,大幅度提高研究效率。(2)对高度复杂数据集和具有较大不确定性的问题,借助大规模复杂数据可能带来的涌现现象去发现事先不知道或根本没想到的特征及关系及规律,提高研究的创新性突破性颠覆性。(3)对高度复杂的多层多维的模糊、动态和多元因果关系环境,借助高复杂甚至异构的大规模数据的涌现潜力及其对多阶因果推理的探索潜力,去探索新的理论与技术方向、新的框架或机制可能。知识服务、尤其是研究型机构或面向战略需求的知识服务,如何以实质贡献方式参与到这些工作中?如何为此构建具备(甚至可调节)不同复杂度的融汇的可计算的数据基础环境?如何在科研实际环境或设施中嵌入类似ChatGPT及其Prompt Engineering的智能服务?如何以计算甚至智能的手段提供相应的安全、权益、道德、可信赖性管理等服务?……
文献情报机构号称拥有知识宝库。一种自然的冲动就是建设自己的大语言模型或ScienceGPT。但我个人对这类行动的合理性、可行性、成本效益、可预见的市场竞争性(谁说ChatGPT不是ScienceGPT?)等持谨慎态度,至少不是知识服务行业可普遍选择的道路。但是,如何让馆藏(包括网络下数实结合的“资源体系”)乃至整个学术交流体系变成全尺度全模态可计算的大规模数据基础?如何把对象机构或社区的各类知识对象转换成全域全模态可计算的大规模知识生态基础?如何为这种可计算的知识基础提供高度智能的应用支持能力(包括通过接入ChatGPT或文心一言)?如何让这种可计算的知识基础全粒度可解析地接入用户知识过程及其在AI驱动下的服务流程中?……
可能还有许多可做。我想说,许多支撑技术已经或者即将到位,而且技术与人才都是逼出来的,不应该成为“不行动”的挡箭牌。
其实,我们最大的敌人是我们自己,是我们长期熟悉、习惯、热爱、甚至为止骄傲的那些“立身之本”。这时需要思考,为什么发明了Transformer的Google被OpenAI打败了?Google把Transformer和GPT用来支持“信息搜索”,它太喜欢自己的“优势能力”、不希望包括它自己的创新来颠覆它?在历史上,具有强大优势地位的主导者被新兴创新者打败的例子比比皆是,数码相机打败柯达、手机打败数码相机、外卖打败方便面、微信打败扒手…。即使在科学领域,我们已经有过AlphaFold2改变了结构生物学领域的前车之鉴[13]。
不过,也许,这正是激动人心的机遇之春?该大展身手和考验证明自己了? 

转自“数据分析与知识发现”

 

首页    行业新闻    专家视点|从猿到人:探索知识服务的凤凰涅槃之路