在智谱AI技术开放日(Zhipu DevDay)上,启明创投投资企业智谱AI推出新一代基座大模型GLM-4,并发布All Tools、GLMs、MaaS API、大模型科研基金、大模型开源基金以及“Z计划”创业基金等内容。
01/
GLM-4
新一代基座大模型GLM-4,整体性能相比GLM-3全面提升60%,逼近GPT-4;支持更长上下文;更强的多模态;支持更快推理速度,更多并发,大大降低推理成本;同时GLM-4增强了“智能体”能力。
基础能力(英文):GLM-4在MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等数据集上,分别达到GPT-4的94%、95%、91%、99%、90%、100%的水平。
指令跟随能力:GLM-4在IFEval的prompt级别上中、英分别达到GPT-4的88%、85%的水平,在Instruction级别上中、英分别达到GPT-4的90%、89%的水平。
对齐能力:GLM-4在中文对齐能力上整体超过GPT-4。
长文本能力:智谱AI在LongBench(128K)测试集上对多个模型进行评测,GLM-4性能超过Claude 2.1;在“大海捞针”(128K)实验中,GLM-4的测试结果为128K以内全绿,做到100%精准召回。
多模态-文生图:CogView3在文生图多个评测指标上,相比DALLE3约在91.4%-99.3%的水平之间。
02/
ALL Tools
GLM-4实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型,以完成复杂任务。
简单来讲,即只需一个指令,GLM-4会自动分析指令,结合上下文选择决定调用合适的工具。
All Tools-文生图:GLM-4能够结合上下文进行AI绘画创作(CogView3),如下图所示,大模型能够遵循人的指令来不断修改生成图片的结果:
All Tools-代码解释器:GLM-4能够通过自动调用python解释器,进行复杂计算(例如复杂方程、微积分等),在GSM8K、MATH、Math23K等多个评测集上都取得了接近或同等GPT-4 All Tools的水平。
同样GLM-4也可以完成文件处理、数据分析、图表绘制等复杂任务,支持处理Excel、PDF、PPT等格式文件。
All Tools-网页浏览:GLM-4能够自行规划检索任务、自行选择信息源、自行与信息源交互,在准确率上能够达到78.08,是GPT-4 All Tools的116%。
All Tools-Function Call:GLM-4能够根据用户提供的Function描述,自动选择所需Function并生成参数,以及根据Function的返回值生成回复;同时也支持一次输入进行多次Function调用,支持包含中文及特殊符号的Function名字。这一方面GLM-4 All Tools与GPT-4 Turbo相当。
All Tools-多工具自动调用:除了以上单项工具自动调用外,GLM-4同样能够实现多工具自动调用,例如结合网页浏览、CogView3、代码解释器等的调用方式。
03/
GLMs与MaaS API
GLM-4的全线能力提升使得智谱AI有机会探索真正意义上的GLMs。用户可以下载(更新)智谱清言App,进行体验,快速创建和分享自己的“智能体”。
同样,MaaS平台也将全网开放GLM-4、GLM-4V、CogView3等模型API,并邀请内测GLM-4 Assistant API。
04/
智谱AI期待与研究者和开发者
共同探索大模型的未来
智谱AI一直在路上,期待与所有研究者和开发者共同探索大模型的未来,为社会创造价值。
从ChatGLM一代、二代、三代以来,智谱AI几乎开源了所有内核模型,包括千亿级基座GLM-130B、搜索增强模型WebGLM、图形理解模型VisualGLM、代码模型CodeGeeX1、2,文生图模型CogView1、2,图形增强理解模型CogVLM还有可视化认知Agent模型CogAgent。智谱AI希望这些模型能够帮助研究者和开发者深入认知大模型技术,而不是简单调用。
大模型科研基金
智谱AI重视科研突破、重视源头创新,也希望无私地回馈科研界。
智谱AI联合CCF中国计算机学会发起了CCF-智谱大模型基金,围绕预训练大模型理论、算法、模型、应用等相关研究提供资助;通过降低大模型研究的门槛,立足每一个计算机领域科研工作者均有机会参与大模型的研究,推进大模型技术和应用的创新落地。
智谱AI联合中国中文信息学会社会媒体处理专委会联合发起SMP-智谱大模型交叉学科基金。支持探索大模型与各领域交叉创新,促进大模型与各类学科的有机融合。所有的科研基金参与者拥有自己研发的知识产权。
2023年已经有来自全国三十余所高校参与了41个研究项目,累计提供了超1000万元现金和算力资源(合作伙伴)的科研支持。
2024年,智谱AI对学术研究的支持还将继续。
大模型开源基金
智谱AI认为,一个健康的大模型生态系统绝不仅依赖少数公司的研发,而是需要众多研究者和开发者的想象力和创造力共同参与。
为了促进大模型生态的健康发展,智谱AI将发起开源开放的“大模型开源基金”,这包括三个“一千”:
第一个“一千”,是1000张卡。智谱AI将为大模型开源社区提供一千张卡,助力开源开发;
第二个“一千”,是1000万元人民币。智谱AI将提供1000万元的现金用来支持与大模型相关的开源项目。
第三个“一千”是1000亿tokens。智谱AI将为优秀的开源开发者提供1000亿免费API tokens。
“大模型开源基金”的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。一枝独秀不是春,中国的人工智能事业要繁荣、要发展,需要所有的参与者、产业链上下游合作伙伴、开发者社区、学术界一同努力。
“Z计划”创业基金
面向全球,智谱AI发布“Z计划”,支持大模型早期创业者的创新探索。大模型创业是长征路。“Z计划”是智谱联合生态伙伴发起的大模型创业基金,总计10亿元人民币;专门支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。
在2024年,乃至更长远的未来里,智谱AI都将坚持更开放的心态,团结更广泛的生态伙伴,共创人工智能美好未来。