GPT即将模拟中医把脉。

坐在你面前的,是“赛博中医”:它的眼睛是摄像头,像老中医一样,要“扫描”你的舌苔、面色;它也能号脉,感应器构成的号脉终端不到2分钟,便能“摸个门清”。很快,这位赛博中医对你“了然于胸”了,它迫不及待地给你手机发了一份专属健康报告:阳虚or阴虚、寒湿or湿热,怎么应对,怎么开方,报告上一目了然。

“观察”到你挺感兴趣,这位赛博中医举起机械臂,想帮你立刻来一场赛博艾灸、赛博推拿。

这是许多医院和体检中心悄然推出的AI中医机器人,被戏称为“赛博中医”。

“赛博中医”广受欢迎,几乎在任何场合都是“人气王”。即便明知道它更偏向娱乐属性,长期身体亚健康的职场人也总是乐此不疲,忍不住要在赛博中医的摊位前排起长龙。

这股“中医+科技”热潮已经不仅仅局限于赛博中医。这股热潮已经渗透到了中医药大模型领域,只不过这次排队的人变成了产业界的“玩家”。

进入5月份以来,大洋彼岸的OpenAI的GPT-4o、谷歌的Gemini、Deepmind的Alphafold3等,都引起国内吃瓜群众一波又一波的狂欢,余韵之中,字节跳动、华为云、阿里云等也动作频繁。在光环之下,中医药大模型也没闲着。

5月初,华为云和天士力共同开发的“数智本草”大模型发布。在此前,在GPT推动的AI热潮中,早有扁鹊、华佗、神农、孙思邈、“数智岐黄”、“岐黄问道”“本草智库”、“天河·灵枢”……虎嗅根据公开信息统计,2023年以来至少已有三四十个中医药相关大模型相继亮相。

这些大模型都肩负着给产业发展摸脉、问诊、开药方的使命。在其背后,除了华为云、百度云、阿里云等科技公司,清华大学、中国中医科学院、天津大学等高校、科研院所,最重要的推动力量还要数云南白药、华润江中、太极集团、天士力医药等一众知名中药企业。

然而,长久以来,中医药一直被视作神秘的存在,就像一个“黑盒子”一样,尤其是中药,常常被形容为“丸散膏丹,神秘莫测”,对其数据和理论研究仍然远远不够。

人工智能能够对中医产生革命性的影响吗?

在中医药产业内部,越来越多专家学者已经达成共识,认为人工智能给中医药发展创造了一个“千载难逢的机遇期”。

“中医药与人工智能结合是必然趋势,不会受到个人意志的影响。”中国工程院院士、国医大师张伯礼在“数智赋能大健康产业新质生产力暨第四届中医药国际发展大会”上曾直言。

中医药大模型能够为“江湖水深”的中医带来哪些关键变化?AI是否能够让中医产业发生关键转向?

“重注”中医药大模型

中医药大模型的应用价值是什么?

根据现代中药创制全国重点实验室常务副主任、天士力医药集团董事长闫凯境博士的说法,他们发布的“数智本草”大模型的关键内容是“说理”和“寻药”,旨在打造“数智中药”研发新范式,为天然药物的发现和新方剂的生成提供支持,并推动中药全产业链的跨越性转型升级。

简单来说:将古代和现代名家名医的医学理论和传统中医药知识,结合天士力积累的中医药研发、生产和市场等数据,充分输入到大型模型中,从而打造出一个足够智能的人工智能系统,能够实现“从方到病、从病到方”的目标。

这里面的复杂性在于:既要从已有的方剂、产品中拆解出由药效组分、作用靶点、适应症等组成的复杂网络信息,用科学的语言解读中药产品,为异病同治打下基础;也要从中医药理论、企业数据等出发为新药研发提供助力。从而促使企业“不断进行创新性自我重塑和持续沉淀”。

实际上,这个过程就好比是在琢磨一把能够揭开中医药神秘面纱的“钥匙”,并利用这把“钥匙”揭示更多关于健康、疾病的奥秘,研发出更多新药和良药。

长期以来,外界对中国传统药企,特别是中药企业的印象,往往是重视营销而轻视研发,很多知名中药企业每年的研发投入都只有一两亿元,甚至更少,在总营收中的占比非常小。现在情况,发生了180度转变。

根据2023年的年度报告显示,多家企业的研发费用出现了大幅增长。例如,太极集团的研发投入同比增长了113.52%,华润江中的研发投入增长了33.37%,而天士力的研发投入则位居同类企业之首。年度报告还显示,天士力已成功推出了9款创新中药进入临床三期,其三期品种数量在整个行业中处于领先地位。除了新增产品线,公司还大力投入大型模型的研发。

研发中医大模型并非易事,训练过程中需要大量的样本数据来满足需求。

以天士力为例。该公司本次与华为云推出的“数智本草”大模型,是由天士力自2017年开始打造的“星斗云”系统不断迭代升级而来。它们也是天士力在“数智中药”创新领域的基础。

此次发布的“数智本草”涵盖了上千本中药古籍,超过9万份方剂,4万多份中成药配方,此外还包括4000万以上的文献摘要、300多万天然产物、2万多个靶点通路信息,以及10万多临床方案和超16万的中药专利、药典政策指南等,整体参数量达到380亿。

企业又为其提供了350万特有天然产物分子数据,并利用华为分子大模型进行训练,从而实现了中药计算大模型。这进一步实现了智能问答、交互计算、报告生成三大应用模式,以及上述提供的整个数智化闭环模式。

GPT即将模拟中医把脉。_图1

现代中药智能制造生产线一角

尽管从参数到训练数据的规模还都无法与GPT等知名大模型,甚至是生物制药领域的大模型相比,但是背后的转型之痛,对于传统的中医药企业来说,已经堪比脱胎换骨了。

要喂养大规模模型,就需要高质量的数据,这在传统的工厂、生产线、产业链里很难实现。因此,做中医药大规模模型最关键的一步就是对生产工厂、生产线、种植基地做数字化升级。

根据扬州大学马康宁、张斌对中医药企业供应链管理数字化转型模式的研究结果,天士力从2013年开始着手中药材全程质量追溯体系建设,已经进行了超过10年的数字化转型。他们对装备和产线进行了智能升级,实现了中药研发、种植、提取、生产、销售全产业链的标准化。

在这个基础上,如果想要每年采集2.1亿条数据,就需要设置超过2100个数据采集点。

另有某知名上市公司的公开信息显示,他们仅建设一个年产能1万多吨的智能化、数字化中药提取车间,就花费了3亿元,相当于该公司此前一年的研发投入的90%以上。

让药企们,对中医大模型“毫不犹豫地投入”的根本原因是,中医药市场正呈现爆发的趋势。根据中研普华产业院研究报告,预计到2026年中国中药市场的整体规模将达到1.5万亿元以上,整体平均增速12%左右,超过同期医药产业整体增速。

然而,要接受这样的好处也并非易事。

急需紧急救助的药品制造企业

中国医疗体系正从“治疗疾病”转向“健康管理”,这种变化为中医药以“治未病”为特点的传统医学带来了前所未有的机遇。

而中医药本身在市场上“形象”的变化,进一步强化了这个风口。过去三年,越来越多研究在一定程度上证实了中医药的价值。比如:张伯礼院士透露,在心脑血管等疾病治疗中,中医药将西医药治疗效果的“天花板”又提高了近30%。可以说,中医药拓展了疾病治疗的能力边界。

然而,面对这个难得的机会窗口,中医产业并没有完全做好准备。实际情况是,中药仍然面临着许多待解决的问题,比如:由于原料(主要是中药材)质量波动大而导致不同批次产品质量不一致,中药方剂本身物质组成复杂,毒副作用认识不足,作用机制不清等,这些使得许多中药产品难以获得市场认可,也无法走得更远。

在周围环境的影响下,一些中成药领域曾经备受瞩目的单品,如丹参川芎嗪注射液,已经不再像过去那样风光。曾经年销数十亿的这种药品,受到了重点监控和退出医保目录等因素的影响,导致市场逐渐萎缩,最终不得不退出市场。

“单品”销售额突然增加,导致药企的经营压力也越来越大。

根据2023年的年度报告显示,中国中药、华润三九、大理药业、龙津药业等多家中药上市公司的业绩出现了显著的下降。

GPT即将模拟中医把脉。_图2

来自:视觉中国

天士力积极推动数智化,但也面临着转型压力。

根据公司财报数据显示,天士力的主营业务收入增长率在2017年达到巅峰后,到2019年已经降至5.61%,2020年甚至出现了负增长。到了2023年,同比增幅不到0.5%,主要聚焦的医药工业板块,增幅仅为3.22%。该公司的核心产品复方丹参滴丸,受到了部分地区的重点监控、集采降价等影响。

据沈阳化工大学徐宏鑫在撰文中指出,主营业务收入增长率在5%以下的企业产品处于衰退期,主营业务利润有出现滑坡的风险。天士力的产品经过成长期与稳定期,开始进入衰退期。“应及时研发新产品,以避免丢失原有的市场份额”。

然而,如今要想以传统方法推出新的“爆款”药物已经变得非常困难。药品研发本来就非常复杂,即便是单一分子药物,其可选空间已经超过10的60次方,有效物质难以寻找,能够安全用于人体的更是少之又少,全球新药研发成功率仅约为2%。

中药作为大自然的产物,成分更加复杂,究竟是哪些成分在起效还没有研究清楚,方剂又有不同药材的配伍,更是叠加了不同药材间、同一药材不同成分间的相互作用等,复杂程度难以想象。

根据公开资料显示,从2018年到2023年,中国共批准了45种中药新药,相对于提交的注册申请数量来说,数量相当有限。到2023年,共有1163份中药注册申请,但获得批准的中药新药只有9种。

如果没有一项颠覆性的技术,彻底改变中医药的发展范式,确实很难后来居上、弯道超车。人工智能大模型显然就被寄予了这种力挽狂澜的期望,俨然成了产业界提振信心的“药神”。

不宜过分推崇大型模型

在一定程度上可以说,基于大型模型的数智化技术确实正在改变中医药。这种改变不仅仅局限于理论阐述和新药发现。

根据天士力描绘的愿景,即“数智中药”,数智化将通过三个方面来赋能整个中药产业链。

在研发中,可以通过多维度多模态数智中药研发技术深入分析药物与疾病特征;在生产中,可以利用智能制造技术保障中药产品质量的精准控制,实现高效、绿色和可持续发展;在使用环节,可以利用智慧中医大脑为数智中药个体化精准服务提供高效支持。目标是要“引领现代中药达到用药精准、生产精智、疗效精确的新高度”。

另外,一位科技领域的投资人曾向虎嗅透露,大型模型会以一种超越人类理解能力的高效方式来理解世界,然后再以人类可以理解的方式进行转述。从这个角度来看,它与中医药也有某种共同之处,确实有潜力揭开传统中医药的神秘面纱,打破长期困扰行业发展的束缚。

此外,人工智能在中医药领域的突破,还有可能进一步解决当前医学所面临的困境。

在《数智中药:现代中药数智化升级与创新发展》一文中,天士力的研究人员还指出,将现在生命科学和人工智能技术结合的研发体系,将分子信号通路作为分子本草技术的靶点,有机会“克服单一靶点药物开发难、周期长、停滞不前的困境”。

GPT即将模拟中医把脉。_图3

滴丸凝结过程模拟 

只不过,要实现这一点也还是说起来容易,但实际操作中还有一些待解决的问题。

举例来说,就数据而言,中药领域的数据非常复杂,种类繁多,质量参差不齐,缺乏统一的标准;同时也存在隐私保护措施不够完善的问题。在算法方面,也需要更多符合中医药特点的算法工具等。

此外,还有交叉人才的培养问题。中医药大模型的开发,需要融合中医、中药、计算机、统计学等多方面的知识,如果开发者缺少中医思维,很可能会出现误解或疏忽。且中医语言的一大特色就是隐喻,要正确理解和处理这类语言,对非专业人士和人工智能(AI)也是挑战。

上述问题的解决,绝大部分都不能单靠科技公司或制药企业,还需要政府、产业界、学术界共同努力。正因为此,天士力相关负责人也告诉虎嗅:“我们所做的这些也不是要在短期内颠覆行业。”更多还是在为中医药现代化发展的新范式打基础,是中医药领域的“数智化基建”。

尽管客观来看,中医药并非能够包治百病的“灵丹妙药”,但是,越来越多的中药企业积极投入这一新技术,这对于推动传统产业发展、揭开生命奥秘仍然是令人期待的好事。