Portfolio News

启明星 | 云知声梁家恩:山海大模型与行业应用 | 世界人工智能大会

10/08/2023

编者按:在由启明创投主办的2023世界人工智能大会“生成式AI与大模型:变革与创新”论坛上,人工智能等技术前沿领域的著名专家与学者,顶级投资人和领军创业者汇聚一堂,共同探索中国科技创新的驱动力量。

本次论坛是大会唯一一场由创投机构主办的相关论坛,立足创业与投资视角,分享了最新生成式AI前沿信息和实践探索,并发布了行业首份基于对海内外逾百家企业深入调研撰写的生成式AI洞察报告,全方位解读了生成式AI的产业变革和未来十大展望。

启明创投投资企业云知声董事长兼CTO梁家恩在演讲中分享了生成式AI赋能未来的力量。梁家恩指出大模型带来了AI的新时代,开启了“数据动力学”新范式:预训练、指令微调和反馈强化。大模型整合大数据,将成为AI 2.0时代的“发电厂”,并将会驱动人才、技术、市场等产业核心要素的升级。云知声自研的山海大模型有强大的通用能力,并聚焦于插件扩展和领域增强等相关能力构建,围绕智慧物联和智慧医疗等行业赋能客户。未来云知声将继续探索智能极限、引领产业升级。

以下为精编整理的演讲实录。

今天非常高兴在这个论坛上和大家分享、交流。启明创投一直支持我们的发展,至今已有十年的时间了,我们走过了AI 1.0时代,现在我们发布了大模型,AI 2.0时代已经开启,我们希望围绕这一话题和大家进行分享。


云知声董事长兼CTO梁家恩

这次的分享分成两部分:一个是宏观的部分,从十年的产业实践出发,我们是怎么看待这一次的大机会;第二是微观的部分,云知声在这些年发展的实践路径以及大模型给我们带来的机会。

01/
大模型整合大数据
将成为AI 2.0时代的“发电厂”

人工智能确实是很多代人的梦想,从1956年开始提出这个概念,一直到今天,已经60多年过去了,如果算上图灵时代,已经有80多年了。

这个时代经历了三个阶段。最早我们希望机器能够像人一样做事。第二阶段是希望机器像人类的专家一样分析问题和解决问题。第三个阶段是完全从神经网络的角度出发,我们能不能训练出好的会学习的机器,完全从错误当中学习知识,就像曾子所说的“吾日三省吾身”,这种情况下我们能把模型训练到最大。大模型我们可以归纳为老子在《道德经》里所说的“为学日益,为道日损”。

“为学日益”使得数据的规模和计算的尺度比以前大得多,方法上反而比以前看起来要简洁得多,特别是Transformer模型出来之后,是非常紧凑的学习框架,它的威力非常大。

大模型推出之后我们认为它已经开启了数据动力学的时代。像人类想飞到天上是空气动力学的问题。到今天为止我们认为人工智能最重要的是能不能用机器把数据学好。

这分为三个阶段:在无监督学习阶段,因为拥有1750亿参数,GPT基本实现了博览全书;我们会发现它有很强的语义抽象能力,这时可以通过指令的微调,让它学到知识,并真正解决问题;ChatGPT加上人工反馈的机制,能实现德才兼备。我们认为大模型的起点从2018年预训练大模型开始,后面GPT在规模上提升起来,到ChatGPT已经呈现出非常强大的通用释放能力,这是围绕我们的语言展开的,是一种新的范式。

我们认为大模型能更好地整合大数据。在互联网时期,它已经开始产生红利了,我们通过数据等传统的方法分析学到的知识。我们过去使用煤、石油,有了好的发电厂、炼油厂之后,才发现能源可以赋能所有的行业。大模型建立了非常好的数据整合的框架,为AI 2.0时代构建了很好的“发电厂”,智能数据成为了生产力要素。以前我们说这个要素是存在的,但是如果没有好的装置把它对外智能且有效地输出,就很难实现价值。我们认为现在它开启了一个像MaaS服务的模式,未来会成为各个行业里创新的重要机制。

为什么我们认为大模型已经到了AI 2.0时代?它会对产业的核心要素的升级起到关键作用。

由于人才、技术和市场的共同作用才能形成一个大的产业。过去我们在AI 1.0的时代也做了这个工作,但是只能解决系统里的一些零部件,由智能功能完成某一些环节。现在有了大模型之后,我们发现不论在人才端、市场端,还是核心技术和驱动产品创新端里都有很大的突破。对外来说,未来大家可以看到越来越多的虚拟人的形象出现,也会通过分析营销数据更真实地理解市场的动态。对内来说,对我们的生产效率、生产质量的提升,包括组织效率的提升都会有实质性的变革。

02/
未来要务实地解决实际场景中的问题
让大模型真正产生商业价值

新的商业模式分为两个方面。在通用平台方面,过去在互联网时代诞生的像BAT这些巨头,以及移动互联网里一些视频巨头,其实都是由这种平台型公司构建的。大模型出现后,这些平台仍然会有新的模式,这些模式并不是说把里面的部件直接变成大模型的部件,逻辑与今天的商业逻辑相比没有什么大的变化,而是通过大模型制造规模效应和边际成本的降低,形成飞轮效应,可以带来新的颠覆和创新。如果应用形态并没有发生变化,只是希望改变巨头业务中的内核,单纯靠这个技术来推动的机会并不大。我们借助新的多模态的交互和行业多模态的应用,把这个平台构建起来就会有新的机会。

另外就是在行业大模型层面,大家看到像AI 2.0时代,很多2B的新兴业务开始出现。通用大模型像一个完整的“六边形战士”,在各个方面都不错。最重要的是我们能不能在一个行业里面真正可靠地解决问题。以最先进的GPT-4的模型来说,它的可靠性、可控性都存在很大的风险,这些问题如果不能得到有效解决的话,作为商业系统来说,在行业里面解决一些严肃场景的应用问题,就会有比较大的挑战。我们认为整个行业的大模型生态,应该要务实解决这方面的问题。另一方面要把成本降到足够低,对于企业应用而言,成本是很大的负担,对于其规模化会带来很大的影响。

大模型带来了很多优势,也有很多挑战。大家比较直观地感觉到它的认知能力有了很大的提升。在AI 1.0的时代,不管谁做的聊天机器人,聊不到十轮已经暴露其智商与人类有显著的差距,但是ChatGPT推出之后,全球上亿用户和它对话了大半年,感觉聊天可以一直进行下去。可以说它的认知能力有显著提升,交互的体验感也有明显的提升。

另外就是生成式的能力,人与机器协同,创造能力也得到了比较大的提高。过去AI 1.0时代是鉴别式人工智能,帮我们实现一个确定性的目标。譬如把声音转成文字,这是确定性的任务。人类需要机器辅助做各种创作。虽然GPT会出现事实性问题,但如果将其转变成可控的能力,可以为我们打开很好的局面。同时它也显著地提升了我们的知识和信息的整合能力。当然也有负面的因素,虽然现在的大模型并不具备人类的意识能力,但我们怎么调校它才能将其变为可控的系统?这是我们需要解决的问题。

未来应该要务实地解决实际场景中的问题,让大模型真正产生商业价值。另外它的可靠性、可控性和合规性都要得到有效的控制,才可能达到好的商业化。

03/
通过人工智能的手段
创造一个互联直觉的世界

在过去十年中,云知声希望能够通过人工智能的手段,创造一个互联直觉的世界。2012年,刚好赶上深度学习在ImageNet刷榜,这是行业内非常有标志性的事件。这个团队当时是在卷积网络实现了突破,那一年刚好是云知声创立的第一年。

2016年,AlphaGo作为人工智能的浪潮席卷行业,今天的大模型代表第三波浪潮。在此期间,我们主要构建了底层非常强大的超算平台,这个超算平台的构建是我们做这个大模型的基础。当时的大模型是在2018年做出来之后,开始通过预训练的方式和底层调优的方式,解决语义理解的问题。人工智能皇冠上的明珠就是理解能力是否足够强大。语言不仅是交流的工具,更多是解决认知问题的关键部件。

2018年,人工智能行业已经具备强大的通用语言理解能力了。GPT之后通用的能力可以得到更大的释放。我们认为AGI时代由ChatGPT展开了。过去,我们很难设计一个系统应对这么多的复杂任务,OpenAI在ChatGPT推出之后已经打开了新的局面,但它只是我们的起点,并不是我们的终点。

我们的技术体系覆盖底层的超算平台至上层的智能组件和大模型。云知声在今年上半年5月24日开发了山海大模型,除了底层的通用能力,我们聚焦构建插件能力、领域增强和客户定制的能力,这是围绕行业应用展开的。我们过去积累的是智慧物联、智慧医疗方面的应用。有应用的驱动才能让我们的模型变得越来越强大。

通用的基础上我们构建的是插件的扩展。大模型最大的问题之一是信息的时效性非常有限,另外它能不能有效地控制、使用工具,这也是一个很大的问题。此外,还需要通过行业知识提高它的专业性和可靠性。

在领域增强维度,我们重点强调的是在医疗行业的应用。目前我们已经有几百家医院在商业应用了。这轮应用通过预训练,包括指令微调和插件的增量,扩展我们在行业里面的应用。通过医疗行业的应用,我们已经在MedQA评测中超越了GPT-4的水平,6月底从81分提高到了87分。山海大模型在满分为600分的模拟国内临床执业医师资格考试中,目前为止已经突破500分,360分就可以拿到资格证了。

除此之外,我们还提供了约7个应用场景,主要是在医院里面展开。医院中有很多定制工作,因为一个通用模型并不能解决它的需求,包括需求定制、数据安全、风险控制、服务支持等。只有把这些问题有效解决之后,行业应用才真正能够打通。

目前,国内我们已在2万多间酒店房间内应用了大模型,过去,与人工智能的对话不可能实现这样的流畅度,仅仅可以完成功能性的交互,但现在有了山海大模型之后,灵活度高了很多。

04/
AGI将会继续探索智能的极限
同时引领产业的升级

未来,我们认为AGI将会继续探索智能的极限,同时引领产业的升级。

首先,探索智能极限其实是科学层面的问题,虽然说它开启了起点,但是未来还有很大的挑战,包括更大的模型、数据和算法,以及可控性和可靠性方面的研究。现在我们认为这基本上超过了图灵测试的水平,它会从模仿达到超越。因为当系统能达到这个状态以后,在研究可计算的问题时,很有可能会超越人类的智慧。

对于产业来说,最核心的还是解决问题,能够比较可靠、高效地驱动产业的发展。智能探索需要大量资金;从赚钱的角度来说,我们需要把产业推动起来,形成良性的商业闭环,将行业真正构建起来。

 

请关注启明创投公众号

在后台输入“生成式AI报告

获取完整报告下载方式