我的位置: 上观号 > 上海科技 > 文章详情

肖仰华:大小模型协同,拥抱“千行百业”的应用场景

转自:上海科技 2023-12-23 09:51:49

近日,在2023复旦管院科创周的复旦科创先锋年度论坛上,复旦大学计算机科学技术学院教授、上海市数据科学重点实验室主任肖仰华发表了“走向千行百业的大模型”主题演讲,围绕人机协作模式的前景、大模型对全行业的发展影响等视角分享了最新研究和前沿洞察。




金句



1.未来的认知模式一定是人机协作的认知模式。

2.大模型在千行百业的应用,本质就是利用大模型实现专家水平的认知智能的过程。

3.大模型所能认知的跨学科知识,将给我们带来前所未有的机会。

4.大模型的能力发展与人类的认知发展理论存在高度可映射关系。

5.To B服务的智能化正在经历从传统小模型、知识图谱驱动向大模型驱动的引擎升级。


01

人机协作认知多变的复杂世界


自ChatGPT去年11月底上线以来,这一年是梦幻般的一年。ChatGPT在不到2个月的时间里突破了1亿“月活”,很多新技术名词层出不穷,“我们似乎处于前所未有的技术加速发展时代,而唯一不变的是变化本身。”


快速变化的技术正在让这个世界日益复杂。在肖仰华看来,“我们整个人类社会日益变成了人、机、物融合的复杂系统,这个系统的复杂性前所未有。”


人类的认知受限于生物智能的本质,有限的认知能力难以认知当下快速变化、日益复杂、不确定的世界。“我们一定要把认知能力让渡给机器,让机器也在一定程度上具备人的认知能力,进而开展人机协作的认知,才有可能认知日益加速变化的复杂世界。”


一旦把认知能力赋予机器,机器的认知能力可以随着世界复杂性的增长而增长。当下的机器智能,只要“喂”给它的数据越来越多,供养的算力越来越多,智能就会持续增长。“唯有机器形成认知世界的能力,才有可能与世界复杂性的增长同步。未来的认知模式一定是人机协作的认知模式。”


肖仰华认为,很多技术的出现在某种程度上是时代发展的必然,必须发展人机协作的认知。而目前人机协作的认知结果就是大家熟知的ChatGPT这一类大模型,大模型可以认为是机器认知这个世界的一个技术成果。


02

通用人工智能是一场技术“元革命”


理解图像,理解现场的照片并做出精妙回答;操控机械臂,完成一些只有人类才能完成的复杂规划任务……在这样快速发展的趋势中,机器人不单单在理解千行百业的文本,它们又进一步向多模态快速发展。


当生成式语言模型逐步向多模态、具身化快速发展,这一系列的发展趋势形成合力,会带来一场前所未有的技术革命,我们把这场技术革命称为“通用人工智能技术革命”,这绝不是传统意义上的某一次技术革命所能比拟的。

肖仰华认为,通用人工智能将会渗透整个社会生产、生活的每一个角落,将会渗透进社会的每一根“毛细血管”,对人类社会产生广泛而深远的影响。“我一直把通用技术革命视作是一场‘元革命”。在他看来,这一波行业智能化解决方案,恰恰是先发展通用认知能力。只有建立起通识能力,才有可能发展专业认知能力,通识是专识的基础。

03

大模型拥有哪些新能力?


在肖仰华看来,大模型带来了开放世界的理解能力、强大的组合创新能力,大模型的评估评价能力首次达到人类专家水平,具有复杂任务的规划能力。

“我们常说跨部门、跨层级、跨专业……一个‘跨’字往往意味着难题所在。”肖仰华表示,大模型是巨大的知识容器,尤其擅长跨学科边界处的知识,给我们提供了跨领域、跨专业,尤其是跨系统边界的知识。不同部门、不同学科之间的认知是一个巨大的盲区,大模型所能认知的跨学科知识,其很多内容可能是人类从未探索或触及的领域,这将给我们带来前所未有的机会。

正因为大模型具备这些能力,肖仰华倾向于认为大模型这对于行业发展,尤其是对于To B行业的发展,会是一次全新的智能引擎升级。To B服务的智能化正在经历从传统小模型、知识图谱驱动向大模型驱动的引擎升级。”


ChatGPT比较好地实现了机器与人类的开放式对话,也就是开放式闲聊,然而实际应用场景多需机器的复杂决策能力,复杂决策才是领域应用的根本特点。

To B行业的应用本质是一类复杂、严肃的决策任务在这方面,现在的大模型还有漫长的路要走。

大模型容易编造虚假事实去“一本正经胡说八道”。这就是为什么很多严肃场合大家不敢用大模型的重要原因,“大模型要为千行百业创造价值,首要问题是解决‘幻觉问题’。

此外,因为已经在通用领域学到很多通用知识,大模型往往还缺乏领域的忠实度。

04

百花齐放的场景应用

如何让大模型在行业应用里创造价值,也就是场景和应用问题。


“大模型赛道是百花齐放的,我们没有必要都专注于通用大模型。”在肖仰华看来,从通用大模型,到行业/领域大模型、场景大模型、科学/专业大模型,要开辟大模型竞争新赛道,避免在通用大模型的红海竞争。“这条赛道足够宽广,每一家企业都可以发现专属自己独特优势的竞争机会。”

我国正在大力推动数据要素市场化,当数据成为第五个生产要素,数据将成为数字中国战略实施的重要元素。当前的数据价值变现全链路上的各个环节,仍然需要人类专家的密集参与,暂时还难以实现数据要素的有效、高效流通和数据价值变现。其根本原因在于缺乏智能化手段。


“但实际上,大模型已经具备了一定的数据理解能力,将可能实现自动化的数据要素价值变现。”


05

大小模型协同有效落地


大模型成为数据要素释放价值的重要工具,那么在推动大模型进入行业应用时,成本和价值将是必须要考虑的问题。


如何降低大模型使用成本?肖仰华认为,并不是任何场景都需要使用大模型,很多大模型应用属于“杀鸡用牛刀”,大小模型协同才是降低应用成本的有效方法。


又该如何促进大模型更好地落地?“首先要把大模型炼制过程变成科学。”在肖仰华看来,现在大模型的炼制方式很像传统的炼金术炼丹,所有的数据准备好丢进服务器,然后祈祷好的效果,整个过程并不透明。

“要想让炼制过程更加透明、科学,仍然需要努力。其中很重要的努力就是对语料进行精准刻画。我们需要掌握大模型炼制工艺的关键参数,及其对大模型效果的评价体系,建立起数据特性与模型能力之间的因果关系。”


大模型的能力发展与人类的认知发展理论存在高度可映射关系。人类认知在什么时候发展出注意力,什么时候发展出信念,什么时候发展出欲望……儿童的认知能力存在一个持续发展的过程,这对大模型炼制存在指导意义。


肖仰华补充说道,“对于行业大模型炼制,尤其要注重数据的选择,不能盲目配比数据。炼制过程也要注重高质量指令数据的收集。”


在肖仰华看来,大模型的行业落地路径与行业专家的演进路径十分相像。大模型在千行百业的应用,本质就是利用大模型实现专家水平的认知智能的过程。


“在推动大模型进入千行百业应用的过程中,一定要合理定位、正确认识、场景多元、积极开辟新赛道。要注重大模型的成本和价值,促进大模型和千行百业的深度融合,大模型绝不应该只停留在炼金术阶段,我们要推动它变成科学,大模型必须与行业深度融合才有可能实现真正的可持续发展。”肖仰华说道。



来源:复旦大学管理学院

编辑:拾



↓分享

↓点赞

↓在看