启明星 | 云知声梁家恩：山海大模型与行业应用 | 世界人工智能大会

Portfolio News

启明星 | 云知声梁家恩：山海大模型与行业应用 | 世界人工智能大会

10/08/2023

编者按：在由启明创投主办的2023世界人工智能大会“生成式AI与大模型：变革与创新”论坛上，人工智能等技术前沿领域的著名专家与学者，顶级投资人和领军创业者汇聚一堂，共同探索中国科技创新的驱动力量。

本次论坛是大会唯一一场由创投机构主办的相关论坛，立足创业与投资视角，分享了最新生成式AI前沿信息和实践探索，并发布了行业首份基于对海内外逾百家企业深入调研撰写的生成式AI洞察报告，全方位解读了生成式AI的产业变革和未来十大展望。

启明创投投资企业云知声董事长兼CTO梁家恩在演讲中分享了生成式AI赋能未来的力量。梁家恩指出大模型带来了AI的新时代，开启了“数据动力学”新范式：预训练、指令微调和反馈强化。大模型整合大数据，将成为AI 2.0时代的“发电厂”，并将会驱动人才、技术、市场等产业核心要素的升级。云知声自研的山海大模型有强大的通用能力，并聚焦于插件扩展和领域增强等相关能力构建，围绕智慧物联和智慧医疗等行业赋能客户。未来云知声将继续探索智能极限、引领产业升级。

以下为精编整理的演讲实录。

今天非常高兴在这个论坛上和大家分享、交流。启明创投一直支持我们的发展，至今已有十年的时间了，我们走过了AI 1.0时代，现在我们发布了大模型，AI 2.0时代已经开启，我们希望围绕这一话题和大家进行分享。

云知声董事长兼CTO梁家恩

这次的分享分成两部分：一个是宏观的部分，从十年的产业实践出发，我们是怎么看待这一次的大机会；第二是微观的部分，云知声在这些年发展的实践路径以及大模型给我们带来的机会。

01/
大模型整合大数据
将成为AI 2.0时代的“发电厂”

人工智能确实是很多代人的梦想，从1956年开始提出这个概念，一直到今天，已经60多年过去了，如果算上图灵时代，已经有80多年了。

这个时代经历了三个阶段。最早我们希望机器能够像人一样做事。第二阶段是希望机器像人类的专家一样分析问题和解决问题。第三个阶段是完全从神经网络的角度出发，我们能不能训练出好的会学习的机器，完全从错误当中学习知识，就像曾子所说的“吾日三省吾身”，这种情况下我们能把模型训练到最大。大模型我们可以归纳为老子在《道德经》里所说的“为学日益，为道日损”。

“为学日益”使得数据的规模和计算的尺度比以前大得多，方法上反而比以前看起来要简洁得多，特别是Transformer模型出来之后，是非常紧凑的学习框架，它的威力非常大。

大模型推出之后我们认为它已经开启了数据动力学的时代。像人类想飞到天上是空气动力学的问题。到今天为止我们认为人工智能最重要的是能不能用机器把数据学好。

这分为三个阶段：在无监督学习阶段，因为拥有1750亿参数，GPT基本实现了博览全书；我们会发现它有很强的语义抽象能力，这时可以通过指令的微调，让它学到知识，并真正解决问题；ChatGPT加上人工反馈的机制，能实现德才兼备。我们认为大模型的起点从2018年预训练大模型开始，后面GPT在规模上提升起来，到ChatGPT已经呈现出非常强大的通用释放能力，这是围绕我们的语言展开的，是一种新的范式。

我们认为大模型能更好地整合大数据。在互联网时期，它已经开始产生红利了，我们通过数据等传统的方法分析学到的知识。我们过去使用煤、石油，有了好的发电厂、炼油厂之后，才发现能源可以赋能所有的行业。大模型建立了非常好的数据整合的框架，为AI 2.0时代构建了很好的“发电厂”，智能数据成为了生产力要素。以前我们说这个要素是存在的，但是如果没有好的装置把它对外智能且有效地输出，就很难实现价值。我们认为现在它开启了一个像MaaS服务的模式，未来会成为各个行业里创新的重要机制。

为什么我们认为大模型已经到了AI 2.0时代？它会对产业的核心要素的升级起到关键作用。

由于人才、技术和市场的共同作用才能形成一个大的产业。过去我们在AI 1.0的时代也做了这个工作，但是只能解决系统里的一些零部件，由智能功能完成某一些环节。现在有了大模型之后，我们发现不论在人才端、市场端，还是核心技术和驱动产品创新端里都有很大的突破。对外来说，未来大家可以看到越来越多的虚拟人的形象出现，也会通过分析营销数据更真实地理解市场的动态。对内来说，对我们的生产效率、生产质量的提升，包括组织效率的提升都会有实质性的变革。

02/
未来要务实地解决实际场景中的问题
让大模型真正产生商业价值

新的商业模式分为两个方面。在通用平台方面，过去在互联网时代诞生的像BAT这些巨头，以及移动互联网里一些视频巨头，其实都是由这种平台型公司构建的。大模型出现后，这些平台仍然会有新的模式，这些模式并不是说把里面的部件直接变成大模型的部件，逻辑与今天的商业逻辑相比没有什么大的变化，而是通过大模型制造规模效应和边际成本的降低，形成飞轮效应，可以带来新的颠覆和创新。如果应用形态并没有发生变化，只是希望改变巨头业务中的内核，单纯靠这个技术来推动的机会并不大。我们借助新的多模态的交互和行业多模态的应用，把这个平台构建起来就会有新的机会。

另外就是在行业大模型层面，大家看到像AI 2.0时代，很多2B的新兴业务开始出现。通用大模型像一个完整的“六边形战士”，在各个方面都不错。最重要的是我们能不能在一个行业里面真正可靠地解决问题。以最先进的GPT-4的模型来说，它的可靠性、可控性都存在很大的风险，这些问题如果不能得到有效解决的话，作为商业系统来说，在行业里面解决一些严肃场景的应用问题，就会有比较大的挑战。我们认为整个行业的大模型生态，应该要务实解决这方面的问题。另一方面要把成本降到足够低，对于企业应用而言，成本是很大的负担，对于其规模化会带来很大的影响。

大模型带来了很多优势，也有很多挑战。大家比较直观地感觉到它的认知能力有了很大的提升。在AI 1.0的时代，不管谁做的聊天机器人，聊不到十轮已经暴露其智商与人类有显著的差距，但是ChatGPT推出之后，全球上亿用户和它对话了大半年，感觉聊天可以一直进行下去。可以说它的认知能力有显著提升，交互的体验感也有明显的提升。

另外就是生成式的能力，人与机器协同，创造能力也得到了比较大的提高。过去AI 1.0时代是鉴别式人工智能，帮我们实现一个确定性的目标。譬如把声音转成文字，这是确定性的任务。人类需要机器辅助做各种创作。虽然GPT会出现事实性问题，但如果将其转变成可控的能力，可以为我们打开很好的局面。同时它也显著地提升了我们的知识和信息的整合能力。当然也有负面的因素，虽然现在的大模型并不具备人类的意识能力，但我们怎么调校它才能将其变为可控的系统？这是我们需要解决的问题。

未来应该要务实地解决实际场景中的问题，让大模型真正产生商业价值。另外它的可靠性、可控性和合规性都要得到有效的控制，才可能达到好的商业化。

03/
通过人工智能的手段
创造一个互联直觉的世界

在过去十年中，云知声希望能够通过人工智能的手段，创造一个互联直觉的世界。2012年，刚好赶上深度学习在ImageNet刷榜，这是行业内非常有标志性的事件。这个团队当时是在卷积网络实现了突破，那一年刚好是云知声创立的第一年。

2016年，AlphaGo作为人工智能的浪潮席卷行业，今天的大模型代表第三波浪潮。在此期间，我们主要构建了底层非常强大的超算平台，这个超算平台的构建是我们做这个大模型的基础。当时的大模型是在2018年做出来之后，开始通过预训练的方式和底层调优的方式，解决语义理解的问题。人工智能皇冠上的明珠就是理解能力是否足够强大。语言不仅是交流的工具，更多是解决认知问题的关键部件。

2018年，人工智能行业已经具备强大的通用语言理解能力了。GPT之后通用的能力可以得到更大的释放。我们认为AGI时代由ChatGPT展开了。过去，我们很难设计一个系统应对这么多的复杂任务，OpenAI在ChatGPT推出之后已经打开了新的局面，但它只是我们的起点，并不是我们的终点。

我们的技术体系覆盖底层的超算平台至上层的智能组件和大模型。云知声在今年上半年5月24日开发了山海大模型，除了底层的通用能力，我们聚焦构建插件能力、领域增强和客户定制的能力，这是围绕行业应用展开的。我们过去积累的是智慧物联、智慧医疗方面的应用。有应用的驱动才能让我们的模型变得越来越强大。

通用的基础上我们构建的是插件的扩展。大模型最大的问题之一是信息的时效性非常有限，另外它能不能有效地控制、使用工具，这也是一个很大的问题。此外，还需要通过行业知识提高它的专业性和可靠性。

在领域增强维度，我们重点强调的是在医疗行业的应用。目前我们已经有几百家医院在商业应用了。这轮应用通过预训练，包括指令微调和插件的增量，扩展我们在行业里面的应用。通过医疗行业的应用，我们已经在MedQA评测中超越了GPT-4的水平，6月底从81分提高到了87分。山海大模型在满分为600分的模拟国内临床执业医师资格考试中，目前为止已经突破500分，360分就可以拿到资格证了。

除此之外，我们还提供了约7个应用场景，主要是在医院里面展开。医院中有很多定制工作，因为一个通用模型并不能解决它的需求，包括需求定制、数据安全、风险控制、服务支持等。只有把这些问题有效解决之后，行业应用才真正能够打通。

目前，国内我们已在2万多间酒店房间内应用了大模型，过去，与人工智能的对话不可能实现这样的流畅度，仅仅可以完成功能性的交互，但现在有了山海大模型之后，灵活度高了很多。

04/
AGI将会继续探索智能的极限
同时引领产业的升级

未来，我们认为AGI将会继续探索智能的极限，同时引领产业的升级。

首先，探索智能极限其实是科学层面的问题，虽然说它开启了起点，但是未来还有很大的挑战，包括更大的模型、数据和算法，以及可控性和可靠性方面的研究。现在我们认为这基本上超过了图灵测试的水平，它会从模仿达到超越。因为当系统能达到这个状态以后，在研究可计算的问题时，很有可能会超越人类的智慧。

对于产业来说，最核心的还是解决问题，能够比较可靠、高效地驱动产业的发展。智能探索需要大量资金；从赚钱的角度来说，我们需要把产业推动起来，形成良性的商业闭环，将行业真正构建起来。

请关注启明创投公众号

在后台输入“生成式AI报告”

获取完整报告下载方式

启明星 | 云知声梁家恩：山海大模型与行业应用 | 世界人工智能大会

More News