以下文章来源于澎湃新闻科技频道 ,作者张静
编者按:在2024向星力·未来数据技术峰会上,启明创投投资企业星环科技(688031.SH)创始人、首席执行官孙元浩宣布,星环科技的定位从Data Infra进一步延伸到AI Infra,为企业客户打造AI基础设施,建立从语料处理、模型训练、知识库建设等一整套工具链,帮助企业快速建立行业大模型。
峰会期间,孙元浩接受了澎湃科技的采访。他分析指出,企业用户对于模型的需求是高精准度及解决实际问题的能力,因此,大模型的新趋势是用RAG(检索增强生成)和Agent(智能体)技术提升模型精准度。针对大模型落地的核心难点,孙元浩表示高质量语料是关键,他提出了例如构建用于推理的知识图谱的解决方案。
启明创投微信公众号经授权转载。
星环科技创始人、首席执行官孙元浩
“大模型卷价格对企业用户来说帮助并不大,企业用户对模型的精准度要求高,通用大模型更应通过提升模型精准度和模型效果,赢得竞争力。”企业级基础软件供应商星环科技创始人、首席执行官孙元浩日前在2024向星力·未来数据技术峰会期间接受澎湃科技采访时作出上述表示。
01/
企业用户对于模型的精准度要求很高
希望能够解决实际问题
近期,中国通用大模型价格战打得火热,科技巨头纷纷参战。孙元浩表示,这是由中国特殊生态造成的。在他看来,企业用户对于模型的精准度要求很高,希望能够解决实际问题,当前即使是市场上最大参数的模型也未必能达到企业要求,所以降价对企业用户而言帮助有限。“企业的要求远比现在的模型能力高很多”。
在孙元浩看来,仅依靠低价很难让用户形成粘性,“降价是为了给开发者提供低廉的Token价格,基于通用大模型开发应用,从而试图构建生态,收集高质量数据。但事实上,模型是很容易被替代的,用户想换就换,因为接口全部是自然语言,没有额度限制。”
去年,孙元浩判断,要让大模型变成“理科生”,成为专业领域的专家模型。今年,他认为大模型的新趋势是用RAG(检索增强生成)和Agent(智能体)技术提升模型精准度。“现在大家又开始开发Agent,可能马上会出现成千上万个Agent,这可能是现在大模型能力不够造成的,模型没办法聪明地学习现在该用什么工具、怎么用,构建Agent的过程就是教大模型怎么使用内部工具。”
02/
高质量语料是解决行业大模型幻觉
及可信可控等核心落地难点的重要手段
目前,通用大模型数量快速增加,并不断升级迭代,但却不能完全适应企业AI应用需求。企业对行业大模型需求增加,迫切需要降低使用门槛。“现在每个大模型应用开发都要很久,重复训练量很大。我们想把整套AI基础设施建好,用户再在大模型上开发应用就快了。”孙元浩表示,过去一年帮助企业客户落地大模型时,发现每个环节都遇到了挑战。为此,星环科技开发了语料处理、模型训练、知识库建设等工具链,就是为了帮助企业建立行业大模型,快速使用生成式AI(AIGC)。
在AI基础设施中,星环科技无涯大模型Infinity可为各行业定制自有大模型,提供意图理解、语义召回、数据处理和分析能力。基于无涯大模型,星环科技推出无涯·问知、无涯·问数、无涯·金融、无涯·工程等AI原生应用,可应用于金融、能源、制造、工程等领域。
孙元浩表示,大模型擅长生成文本,但回答严肃问题不可控,为此团队经过微调、增加语料,将模型训练成“理科生”,同时将企业内部数据知识化,利用RAG提升模型准确度。
语料质量决定了模型质量,高质量语料也是解决行业大模型幻觉、可信可控等核心落地难点的重要手段。孙元浩表示,大模型结构已不是秘密,训练方法也不是秘密,但语料散落在各种地方,导致工作量大,“目前最大的挑战是把现有资料整理起来训练或微调模型,企业应用要求100%准确,所以用现在的语料还不够,我们正在构建知识图谱用于推理,再结合大模型提升准确度。”
来源 | 澎湃科技
作者 | 张 静