3月25日,中国发展高层论坛2023年年会在北京召开。在经济峰会《人工智能引领新产业革命》分组会环节,复旦大学泛海国际金融学院执行院长钱军对话了清华大学苏世民书院院长薛澜、中国科学院自动化研究所人工智能伦理与治理中心主任曾毅、IBM大中华区董事长兼总经理陈旭东、启明创投创始主管合伙人邝子平,共同就包括ChatGPT在内的人工智能领域的热点话题进行了讨论。
启明创投创始主管合伙人邝子平在演讲中指出,大模型的规模有了巨大的飞跃,预训练提升了创新的效率,通用性极强,此外,大模型能够继续学习和提高。邝子平认为,新一代人工智能将颠覆搜索、人机交互、内容生成、教育等行业。
邝子平称,“现在大模型的方向已经确定,灯塔已经很明确,我非常有信心,赶上GPT3、GPT3.5在中国是有极大概率的事情,也就是时间的问题。”
但他同时亦指出,国际交流、监管、全球共识、人和机器的可持续关系等都是值得深入探讨的议题。
以下系经精编整理的演讲实录。
大家下午好!最近大家都在讲新一代人工智能,讲得都比较热闹,所以在我阐述新一轮的人工智能对我们整个产业、对各方面意味着什么、我们需要考虑一些什么问题之前,我可能花2分钟时间大致说一下我们讲的新一轮人工智能到底是什么。最近这个话题很热,每碰到一位做企业的人都跟我们说,我们在做人工智能、我们也在做大模型、我们15年前就在做大模型,这个有点太“厉害”了。
现在说的大语言模型,以ChatGPT为代表的新一代的人工智能到底是什么。
第一个,模型的规模比起过往是巨大的飞跃,是1750亿个参数,历史上没有过这么大的模型。由于这个模型的巨大,OpenAI又通过用这个大模型把几十个TB(Terabyte)的数据往里面灌去做预训练,所以在处理和生成自然语言方面它有一个非常巨大的飞跃。几十个TB是什么意思?就是把美国的国会图书馆所有的文献都往里面去灌了一遍也就大概这个规模,这是模型的巨大。
第二个,预训练。用这么海量的数据往这个模型里面进行预训练得出来的结果,基本上刚刚像我说的,把人类几千年的文字内容都输入进去了,因为是一个自训练,所以也不存在过去说这个训练的数据过多了我们需要标注,所以是预训练不需要标注的过程。
第三个,因为它是往里面去灌这些通用的人类几千年积攒下来的巨大的知识、文字数据,所以它的通用性极其强。以前我们也有很多优秀的人工智能企业,往往都是在一个垂直领域里面,但这次革命是它的通用性极强,因此不需要做什么调整,ChatGPT很多一般性的对话都已经能够基本解决了,当然它还开放一个API,如果企业有兴趣在那上面用更多的跟行业有关的数据做一个分析的话,它对那个行业里的任务会做得更好。
最后,它可以在这个过程中继续去学习、继续去提高。
打造这样一个大模型需要很多顶尖人才和努力,2015年OpenAI就开始做这个事情,每次的训练需要的价格也很昂贵,所以如果是15人的小团队跟我说也在做大模型做了N年,我们做的模型基本上能够把OpenAI打掉,这个肯定是不准确的。这次的人工智能革命为什么会那么根本性地改变整个社会对人工智能的期待,是因为它在这些方面有巨大的变化。
这个基础上我们说新一代人工智能会颠覆哪些行业?因为我们做投资见了很多企业,我会简单提一下中国的现状,我们现在的初创企业大致所在的水平。
颠覆哪些行业?一个是大家可能比较容易理解的搜索行业。搜索行业从根本上会被颠覆,过去我们通过一个搜索引擎寻找到一些相关的网上的资讯、文章等等,但是现在我们是通过这样一个引擎找出我们需要的答案,这两者非常不一样,后台如果是一个大模型的AI是可以给出答案的。这里面引出一个我们需要思考的问题,过去我去搜索,搜索引擎会告诉我搜到的这些结果的链接,我去点击查找这个答案,而现在人工智能提供的结果,我到底信不信这个答案提供方的结果?这是非常值得我们去考虑的问题。
人机交互会发生根本性的改变,中国过去这些年有很多小的聊天机器人,其实都不太好用,这个我相信在未来会是一个增量,有了这样一个底座、引擎以后,很多过去用不起来的聊天机器人就能够用起来,甚至过去用得很好的聊天机器人也会在未来被颠覆。最近已经有一个新闻说丰田准备切换到ChatGPT去,确实这样的聊天机器人在车上,你跟它对话会更人性化、更好用。
内容生成的行业会产生根本性的改变。譬如文稿的撰写,一些并不是准备去拿大奖的小说、剧本基本上就能够从这样的人工智能里面生成了;另外中国是一个游戏制造大国,现在中国在游戏美工方面投入大量人力,而且也都做得很优秀,这方面的工作可能在两个月后的未来就会被人工智能所取代。
教育会发生翻天覆地的变化,除了学生会用ChatGPT写作文以外,其实还有很多事情会改变。从正面来看,更个性化的一对一的辅导具备可能性了,但是老师的作用变成什么样,我们需要在学校里面教的是什么,这个我相信马上就会发生变化。
更长远的,我们现在看云,我们几个软件的工程师就能够去开一家软件企业,因为不需要买服务器等等;一个电商的平台就能够让一个小家庭把东西卖到全世界去。如果像OpenAI、ChatGPT这样的底座、平台做得越来越成功以后,AI平台上面能够造就出来的新药研发企业、新材料企业等,我相信都会在这个世界发生,会把这个作为一个投资热点。
中国的现状怎么样?在过去一段时间里面,我们知道百度文心一言已经发布出来,包括阿里巴巴、字节跳动、腾讯等等这些大厂也都会紧随其后。另外我们知道的已经浮出水面的独立的大模型企业也已经有四、五家,所谓浮出水面就是说准备A轮,第一次找我们来聊融资,要融过亿、甚至两三亿美元的企业。我们见了上百家在OpenAI或者是做图片的应用型企业,所以这块的投资会很热闹、创业也会很热闹。
在这样的情况下我们需要有些什么思考呢?还是蛮沉重的思考,比如中国希望看到怎样的AI发展?最近这些年,中国人工智能的发展是有一定的优势的,起码在前一波,因为中国的人才、市场应用、大量的投资投入,让很多类似中国四小龙等的企业有一定的优势,但在这一波里面没有在最先进的行列里。然而,因为现在大模型的方向已经确定,灯塔已经很明确,我非常有信心,赶上GPT3、GPT3.5在中国是有极大概率的事情,也就是时间的问题,但是之后怎么办?在目前已经很明确的灯塔技术之外需要大量的国际交往、国际交流,未来怎么做?还有在这样的情况下中国这些AI平台肯定是在互联网平台之后的又一个新的、巨大的平台现象,中国监管机构对这些大平台的取态是怎样的?
最后回到刚刚曾毅教授的观点,我认为人工智能是一个世界性的现象、世界性的技术,我觉得应该能有足够的国际智慧,在这个话题上能够像气候议题一样,我们需要一些国际的共识,这个不是不同政体之间的冲突,而是人类和机器的一个关系,如果我们全世界不能达成某种共识的话,这是一个非常值得大家担忧的话题,刚刚曾毅教授谈到的人和机器的可持续的关系,我觉得那也是一个非常重要的话题。