启明新闻

启明头条 | 错过启明创投生成式AI与医疗健康论坛现场?精华汇总版来了

2023/06/01

2023年5月,由动脉网VB100主办、启明创投联合主办的第七届未来医疗100强大会·生成式AI与医疗健康论坛在上海顺利举办。

本次论坛大咖云集。中国医院协会信息专委会主任委员王才有、启明创投执行董事毛硕及启明创投投资企业北京智谱华章科技有限公司首席执行官张鹏、英矽智能联合首席执行官兼首席科学官任峰、复动医疗首席技术官周开波、透彻未来联合创始人兼首席执行官刘岩斌出席并发表精彩演讲。

深势科技联合创始人兼首席执行官孙伟杰、左手医生首席执行官张超、正岸健康联合创始人兼首席技术官苏腾荣、蛋壳研究院高级研究员叶艳妍出席论坛,并参与深度讨论环节。

各方嘉宾全面探讨生成式AI技术与医学领域的未来潜能与行业机遇。

01/
王才有:“数据二十条”助推AI在医疗领域的发展

中国医院协会信息专委会主任委员王才有从创新政策“数据二十条”入手,讲述了医疗健康企业如何利用医疗数据实现自己的价值。

国家创新地提出数据的基础制度“数据二十条”,为数据价值的释放打开了一道门。医疗健康工作天然离不开数据,医学的进步,意味着人们获取医疗信息的能力逐渐提高。信息化、数字化时代使过去认为难以获取的数据成为可能。但是,传统的制度无法让数据流动起来,无法产生内在动力。“数据二十条”的创新在于避开了数据所有权的陷阱,建立三权分置的运行机制,通过对数据持有权、加工使用权、数据产品经营权进行确权和授权,从而激发出数据分享的内在动力。

AI创造数据价值有其独特的能力,但也面临一定的挑战:一是数据的可访问性,二是要避免数据“偏见”风险,三是因果关系是一门新的科学。

医疗数据和其背后的含义是有场景的、有对象的,理解它具有一定复杂性。对于医疗数据使用而言,还会涉及到伦理的问题、患者隐私的问题、知情权和信息规避的问题,所以医疗数据的共享一定需要行业部门对制度的进一步细化。通过进一步确权、授权,在确保安全的基础上,促进流动性,使沉睡的数据产生价值。

医疗AI好比是刚发明的汽车,尽管交通制度规范还没有健全,但是它在一些非伤害的领域应用已经出现端倪。利用数据拯救生命,关键是要找到创新的场景。

02/
毛硕:AI技术驱动下的商业生态是关键

启明创投执行董事毛硕在论坛上分享了投资视角下生成式AI在医疗健康领域的投资机会。

毛硕认为以大模型为代表的生成式AI技术,确实引领了一场新的技术革命。ChatGPT意味着AI 1.0深度学习时代进入2.0大模型时代。与AI 1.0版本相比,它有4个明显特点:更智能;具有多任务能力;使用更便捷、更经济;更多强大的能力以更快的速度在产生。

生成式AI发展迅猛,未来将成为智能时代的基石。在此基础上,未来的企业也会争相构建相关基础设施,届时会有两类企业:第一类是拥有基础大模型的“服务商”:如谷歌、微软、百度等巨头,或OpenAI、智谱AI等顶级AI创业团队;第二类是垂直行业的应用企业:如使用GPT3进行广告文案生成的JASPER、使用GPT3.5+Stable Diffusion进行营销图像生成的TYPEFACE……但医疗领域对新技术的采纳速度相对较慢。

面对一项新技术,不能为了用技术而去用技术,而是要先发现问题,再用技术解决问题。目前,在药物发现、临床注册、临床诊断、临床治疗、医院运营等领域,仍存在很多难以解决的、成本极高的问题,而生成式AI模型已具有问答能力、生成能力、归纳能力、对话能力,如果将现有需求和现有能力结合起来,就能产生新的机会,这也是很多创业者和投资者要考虑的问题。

国内的AI与医疗健康的相关创业者应当关注AI搭建的能力、数据获取能力以及产品力和商品力,正如上一代的互联网,最后存活下来的不一定是技术最牛的,而是商业生态或者产品最受用户认可的。

毛硕表示,启明创投最看重的企业核心能力有三点:想象力:即如何把医疗问题抽象化、数字化;数据获取能力:即如何建立数据获取、数据规范和数据处理的标准;产品力与商业力:即对客户需求及商业生态有敏感洞察。

03/
张鹏:用大模型技术助力各行业智能化降本增效

北京智谱华章科技有限公司首席执行官张鹏在论坛上分享了智谱AI目前的研究,探讨了预训练模型是否能为医疗健康领域的企业带来效率的提高。

张鹏首先分享了几个观点。第一,预训练模型从2018年发展至今,能够提供非常强大的通用泛化能力,可完成多场景任务,降低成本、提高效率,这是非常关键的特性,所以能够成为新一代人工智能应用的基础设施;第二,大模型技术发展的过程,本身也是一个探索的过程、一个量变产生质变的过程,当前大模型能力正在涌现并且保持着高速发展;第三,大模型训练成本高昂,让各行各业用较低的成本用起来,实现技术普惠,是智谱AI作为商业化公司需要考虑的问题。

智谱AI在2022年就研发了拥有1300亿参数的大模型GLM-130B,对标OpenAI的GPT3。张鹏认为千亿模型是生成式AI时代的基座,且亟需建立以中文为核心的超大规模预训练模型。机器智能具有规模效应,随着模型参数规模的不断增长,它的能力也在不断拓展。例如当参数量比较少时只能做简单的语言理解,参数量增加后就逐渐可以做推理类的数学题等。模型本身没有变,但模型的能力随着参数变大而不断提高,其本质是量变引起质变,外界将其称为“涌现”现象。因此千亿模型的能力非常突出,同时千亿模型也有利于企业在商用和成本之间寻找到平衡点。

预训练模型是生成式AI未来的发展方向,但训练一个千亿模型面临种种挑战,包括训练成本高昂、人力投入极大、训练过程不稳定等。但创新不是一蹴而就的,智谱AI并不想踩着别人的脚印一步一步往前走,而是想在其中去做一些自己的创新。例如,我们通过融合GPT和BERT两种训练框架形成了自主创新的GLM多任务预训练框架,同时支持了生成式和填空式下游任务的需求。

据悉,智谱AI今年3月开源了模型ChatGLM-6B,目前是唯一可以与国际主流开源模型竞争的国内模型。开源两个月以来,在全球最大开源软件平台GitHub上获得超过26万星,超过斯坦福同期模型的关注度和好评度。截至目前,智谱AI的开源模型全球累计下载量超200万,收到包括70多个国家与地区1000多个科研机构的使用需求(包括谷歌、微软、脸书、麻省理工、伯克利、哈佛、普林斯顿、牛津、剑桥等),并连续两周登上全球最大开源大模型平台Hugging Face大模型趋势榜榜首。

ChatGLM模型尤其注重对国内科研及企事业单位的合作与支撑,中国移动、美团、360、联想、金山WPS等企业已基于ChatGLM模型从事领域大模型研发。智谱AI还与首都之窗等机构基于ChatGLM共同进行政务相关大模型探索与服务。截至目前,ChatGLM模型先后为中科院多个院所、之江实验室、上海人工智能实验室、北京智源及多家知名高校、企业提供科研支持。

04/
任峰:生成式人工智能赋能药物研发

英矽智能联合首席执行官兼首席科学官任峰在论坛上从生物医药的角度分享了对生成式AI的理解。

传统药物研发面临研发费用高、成功率低、研发周期长等问题。这主要是因为目前有三方面的问题还没有得到解决,一是没有找到好的靶点,二是如何生成好的分子,三是如何设计好的临床试验方案。而这也正是AI可以起到作用的地方。英矽智能发明的三个AI平台,就是针对这些问题。

英矽智能是全球率先将生成式AI应用于药物发现领域的公司,已经成功赋能多款抗肿瘤候选药物的发现和设计。

“英矽智能的AI平台建立在生成式AI的基础上,包括靶点发现平台PandaOmics,分子生成平台Chemistry42和临床试验结果预测平台inClinico。另外,我们有多款已经推进到临床阶段的药物,也均出自生成式人工智能平台,譬如一款全新机制用于治疗特发性肺纤维化的候选药物,一款靶向主蛋白酶的口服新冠小分子等。”任峰说。

比如,英矽智能的多模态生成式强化学习平台Chemistry42,就是建立在多年对大型生物、化学和文本数据集建模和训练的基础上,包括42个生成式AI模型和超过500个用于评分的预测模型,帮助研究人员通过基于结构的药物设计(SBDD)和基于配体的药物设计(LBDD)思路,利用尖端深度学习技术从头开始生成具有所需特性的分子。

据任峰介绍,这42种生成式AI模型包含了生成式对抗网络(GANs)、自注意力机制为基础(Transformer-based)的知识图谱、大型自然语言模型等多种可生成虚拟分子结构的算法;而预测模型可以判断每种模型所生成的候选分子是否达到所需特性,包括分子的成药性、稳定性、靶点选择性、是否有晶型盐型等等。

“我们还会利用强化学习对生成未达标分子结构的生成算法进行惩罚,反之进行奖励,通过这种过滤机制去掉不准确的分子。这与ChatGPT的强化学习(RLHF)模型是一样的道理。”任峰说。

05/
孙伟杰:AI for Science新范式驱动药物研发

深势科技联合创始人兼首席执行官孙伟杰与启明创投执行董事毛硕在论坛上进行了深度对话,共同探讨了AI for Science驱动的药物研发。

孙伟杰认为,AI可以帮助新药研发做到过去做不了的事。深势科技是AI for Science的标杆企业,该公司曾在18个月内连续完成四轮融资。深势科技开创性地提出了“多尺度建模+机器学习+高性能计算”的革命性科学研究新范式,并推出了Bohrium®微尺度科学计算云平台、Hermite®药物计算设计平台、RiDYMO™强化动力学平台及电池材料计算设计平台等微尺度工业设计基础设施,颠覆了现有研发模式,打造“计算引导实验、实验优化设计”的全新范式。

AI for Science简单来说就是用AI去学习一系列事物底层运作的科学规律。

孙伟杰表示:“AI for Science也已经进入到预训练模型时代了,那AI for Science所处的行业阶段差不多相当于LLM在2018年左右的那个阶段。因为我们可以发现AI for Science的预训练模型,它的能力要远远超过我们任何一个细分的科学问题上的小模型,那说明整个领域的发展正在变成由预训练模型来驱动的。”

“比如一些难成药的靶点,现在可以开发了。以深势科技RiDYMO™平台为例,就可以对蛋白动态构象进行充分采样,探索全新的隐藏/别构口袋,诱导形成可药口袋,助力难成药靶点的理性开发。其实这本质上是把一个生命科学的问题,转化成了计算工程的问题。”孙伟杰说。

孙伟杰表示,如果说GPT是一个通识的文科生,AI for Science就是一个硬核的理科生,它可以求解一系列复杂的物理方程,可以去推演在微观层面电子、原子、分子的运动和变化,来帮助我们做各种场景的药物研发等。所以说,AI for Science可以说是我们研究客观世界的一个基础的AI预训练模型。

06/
张超:主动式AI解决方案 让优质医疗触手可及

左手医生首席执行官张超与启明创投投资人孙墨陶在论坛上进行了深度对话,探讨主动式AI的现状以及对现在痛点的解决方案。生成式AI已经渗透到医疗行业,左手医生在现场直接演示了医疗专业GPT模型如何生成病历,引领未来医疗信息化、数字化和智能化的发展。主动式AI解决方案正助力优质医疗触手可及,让患者受益,同时也推动了行业发展。

张超分享道,过去7年左手医生在知识图谱、临床智能应用等方面积累了丰富的医疗数据,在技术上,左手医生自2020年起就将GPT技术应用于医疗Chatbot等场景。今年4月,他们开始内测医疗专业GPT模型,并针对医生临床中“写病历”的刚需,快速推进应用。

张超表示,与通用大语言模型演示问答、写诗、做题不同,得益于对优质病历的学习,左手医生GPT在生成病历任务上效果超过OpenAI的GPT4。毕竟,国外病历更像医患沟通综述,大量患者描述会直接保留;而国内病历则讲究言简意赅,医生会总结患者表述,以医学维度重新表述。

回到医疗场景,张超认为,智慧医疗建设离不开信息化、数字化、智能化的发展。目前数字化是关键瓶颈,医生很难在短暂问诊中完成高质量诊断与记录。此外,在临床辅助环节,智能化程序应避免仅基于医生录入的文书进行辅助决策,而是要将数据采集前置。因为如果一个医生认为患者患有A病,那么写出的病历也特别像A病,机器从中很难分析出患者可能患有B病。

最后,张超指出,左手医生GPT模型和听译机器人是互相促进的一组产品。大模型效果的提升可以帮助听译机器人完成更多高质量的临床辅助功能,而听译机器人的成功应用又会为GPT带来更优质的训练数据,进而推动GPT自身模型的发展。

07/
周开波:康复治疗中的生成式AI模型应用探索

复动医疗首席技术官周开波从背景到展望逐一展开,并以复动医疗的产品——悦行动®举例来进一步分析生成式AI在医疗实践中的应用。

复动医疗成立于2018年,是专注于肌骨康复和骨与运动医学领域的科研型、专科型医疗创新企业。公司深度融合临床医疗、软硬件开发、人工智能和大数据处理等多学科的科研与临床应用,通过JOYMOTION悦行动®数字疗法产品、PhysioCloud™复康云服务平台和复动肌骨线下康复医疗中心三大产品线,提供一体化肌骨治疗综合解决方案。

作为国内率先将康复治疗与生成式AI结合应用的公司,基于医学价值、商业价值和降本增效的考虑,复动医疗的悦行动®,正是采用了AI技术赋能远程康复,为患者提供优质、高效、普惠的个性化、定制化的康复治疗。

悦行动®患者端App面向用户,帮助患者做评估和诊断;SaaS平台面向医生和康复师,在系统后台生成方案,配合自研的可穿戴动作捕捉器,可以远程指导患者完成康复训练;最后用数据和AI平台记录,用AI挖取价值。

利用复动医疗自研的MMGT模型(Multi-molal Generative Transformer),通过多样的Embedding,能够把更多模态的不同维度用户数据用到生成方案中,同时引入ChatGPT和专业人员进行数据增强。

最后,周开波提到,复动医疗未来将在数据层面不断提升广度和深度,在模型层面不断提升规模并优化训练过程,增强模型可解释性。在特定领域中,在通用大模型的知识能力上发展康复垂直领域更有效的专有模型。

08/
苏腾荣:AI赋能精神心理数字疗法

正岸健康联合创始人兼首席技术官苏腾荣与蛋壳研究院高级研究员叶艳妍在论坛上进行了深度对话,讨论了AI影响下的精神健康数字疗法及企业业务。

苏腾荣认为生成式AI并不是新鲜事物,但现在之所以会掀起热潮,有两个层面的原因。从普通用户视角而言,生成式AI有很强大的知识和逻辑能力,对于个人生产力的提升有很大的帮助;从企业角度而言,各行各业应用AI能力的门槛得到了大幅降低。

正岸健康是聚焦精神心理健康领域数字疗法的创业公司,以心理学理论和人工智能技术为基础打造数字疗法平台,并且以此平台来开发精神心理健康领域的数字疗法产品。目前正岸健康已有两款产品,面向失眠症的干预产品“如眠”,已经进入注册临床试验阶段;面向普通人的日常情绪管理产品“今日晴”,可以在各大应用市场免费下载。

苏腾荣认为传统意义上的心理治疗是由真人治疗师与患者对话来进行的,其供给和可及性都不足。数字疗法的产品正是希望通过软件的形态,借助移动互联网的便捷性来弥补这方面的不足。从产品形态而言,精神心理健康数字疗法产品至少有两种分类:一种是对话式的,一种是非对话式的。对话式的精神心理健康的数字疗法的产品,可以尝试模拟真人咨询师和患者交流的对话体验。

但生成式AI目前在心理治疗中的应用也存在一定的挑战。心理治疗需要实现基于对话的长程治疗。因此我们希望生成式AI可以记住与患者的对话历史,并能根据以往的记忆与患者交流。不过,目前即使是最领先的生成式AI在模型结构设计上就决定了长程记忆能力的缺失,因此需要根据业务场景设计实现单独的记忆模型来辅助生成式AI模型实现长程记忆。

苏腾荣认为好的精神心理健康的数字疗法产品不仅应该有拟人化的交互体验,更应该有专业的诊断能力和治疗能力,特别是能够针对个体的患者持续地提供个性化的治疗。无论有没有大模型,业务认知都是第一位的。AI大模型是用来赋能产品的,而不是来代替产品的,如何利用大模型的优势能力来设计产品非常关键。另一方面,在大模型时代,数字疗法企业在业务中积累的私域数据也非常关键。数字疗法企业积累的业务数据,不仅可以用于持续优化业务需要的小模型,积累到一定规模时也可以用于构建出符合业务需要的垂类模型,这也是未来的一个机会。

09/
刘岩斌:人工智能赋能的智慧病理

透彻未来联合创始人兼首席执行官刘岩斌在论坛上介绍了透彻未来目前所做的工作。

刘岩斌介绍道,在诊疗的行业里,病理学诊断对于临床治疗至关重要,被称为医学诊断的“金标准”,病理医师被称为“医生的医生”。但在全球范围内,均面临着病理医师极度短缺的现状。以我国为例,注册在案的并在一线工作的病理医师人数仅一万多人,相比于卫健委建议的至少十万名病理医师,有着近10倍的差距。且病理医生的培养周期较长,通常需要五至十年,如何通过技术创新来改变病理诊断现状成为当务之急。

智慧病理诊断平台能够极大减轻医师的工作负担,提高病理诊断的效率,从而能让病理医师有更多的时间进行复杂疾病的诊治和前沿领域的研究,推动医疗技术的发展。透彻未来的智慧病理诊断平台主要有三大点:一是产品与数据核心资产,二是核心算法,三是落地平台。

透彻未来目前积累了200T的精准标注的数字化病理切片,超过20万的肿瘤患者真实数据,根据深度学习算法做了很多迭代,总体来讲已经运行了近五年的时间。透彻未来智慧病理诊断平台目前GB级的影像分析少于20秒,切片敏感度接近100%,无漏诊发生,完全达到临床可应用级别。

谈及未来,刘岩斌表示透彻未来不光是AI辅助诊断提供商,还会通过AI应用把病理科的流程做优化,这是透彻未来目前的核心价值,而未来会以病理AI为切入点,将病人预后及用药靶点通过大数据分析相关联,为人类健康服务。