斯坦福大学 HAI 发布 2025 年综合人工智能指数报告,重点介绍医疗保健人工智能领域的关键进展
- Association Secretary
- 4天前
- 讀畢需時 7 分鐘
4月7日,斯坦福大学以人为本人工智能研究所(HAI)发布了备受期待的《2025年人工智能指数报告》。这份长达456页的综合报告概述了过去一年人工智能领域的重大进展。HAI成立于2019年,由著名人工智能专家李飞飞共同领导,其年度报告已成为了解全球人工智能前沿发展的重要资源。
今年的报告分为八个主要章节,涵盖研发、技术性能、负责任的人工智能、经济影响、科学与医学、政策与治理以及教育等领域。值得注意的是,科学与医学部分长达43页,重点介绍了人工智能驱动的医疗行业转型过程中的关键里程碑。
李飞飞表达了她对人工智能与医疗保健日益增长的交叉领域的热情,她表示:“这是一个庞大的行业,涵盖从基础生物学研究到临床诊断、医疗服务和公共卫生。看到人工智能在这个系统的每个阶段都发挥着至关重要的作用,我感到非常兴奋。”

人工智能在医疗保健领域的乐观前景得到了行业领袖的认同。此前,凯西·伍德和甲骨文首席执行官拉里·埃里森等知名人士就曾指出,医疗保健将成为人工智能最深刻的应用之一。
AI 指数报告:2024 年 AI 医疗行业的里程碑
报告在“科学与医学”章节开篇,列举了过去一年人工智能在医疗健康、生物等领域取得的里程碑式成就。
蛋白质序列优化:语言模型来拯救
尽管并非有意为之,但语言模型最近获得了一项新的生物学能力:优化蛋白质序列。传统上,蛋白质工程需要大量的实验室研究来优化序列,从而提高其功能。然而,最近的研究发现,未经调整的语言模型在这项任务上却异常有效。
研究人员采用定向进化方法证明语言模型可以生成在合成和实验适应度景观中均优于传统算法的蛋白质序列。
Aviary:训练代理执行生物任务
FutureHouse 是一家致力于实现科学发现过程自动化的公司,去年发布了 Aviary,这是一个能够执行生物研究中多步骤任务的平台,并具有实现智能任务自动化的潜力。在 Aviary 框架下,人工智能代理已经可以执行具有挑战性的科学任务,例如操纵 DNA 结构进行分子克隆、通过科学文献综述回答研究问题以及构建蛋白质稳定性模型。

结果表明,在Aviary的支持下,基于开源大型语言模型构建的代理可以在多项任务上匹敌甚至超越人类专家,为科学探索的进一步自动化铺平了道路。
AlphaProteo:用于新型高亲和力蛋白质结合剂的人工智能
AlphaProteo 是由 Google DeepMind 开发的一个模型,专注于创建能够附着于特定目标分子的新型高亲和力蛋白质结合剂。
AlphaProteo 设计了第一种针对几种靶蛋白的结合剂,包括与癌症和糖尿病相关的 VEGF-A,在七种测试的靶蛋白中显示出比现有方法高 300 倍的有效性。
此外,AlphaProteo 开发的粘合剂比使用当前最先进的设计方法创建的粘合剂强度高出约十倍,标志着生物工程领域的重大突破。该模型正应用于药物开发、诊断和生物技术应用。
人类大脑图谱:重建部分人类大脑
谷歌的一个团队在突触层面重建了人类大脑的一小部分——被《连线》杂志誉为“迄今为止最详细的大脑连接组”。
该样本是在手术过程中用多光束扫描电子显微镜从一名癫痫患者的左前颞叶采集的。超过 5,000 个切片,每个切片约 30 纳米厚,捕获了约 57,000 个细胞(包括神经元、神经胶质细胞和血管)以及 1.5 亿个突触。

该项目代表着理解神经回路的重要一步,并可能为未来的神经疗法提供见解。
虚拟人工智能实验室:增强生物医学研究
斯坦福大学最近推出了一个虚拟人工智能实验室,其中多名专注于不同学科的“人工智能科学家”作为自主代理进行协作。
在实验中,人类研究人员委托这个人工智能实验室设计可以与病毒结合的纳米抗体片段,结果生成了 92 种纳米抗体,其中 90% 以上的抗体在验证研究中成功与病毒结合。

这项研究的意义不在于具体的发现,而在于证明一个完全自主的、语言模型驱动的实验室可以产生有意义的科学发现。
GluFormer:利用人工智能进行持续血糖监测
GluFormer 是由 Nvidia、魏茨曼研究所和其他机构开发的基础模型,通过对近 11,000 人的超过 1000 万次血糖测量进行训练,通过分析连续血糖监测 (CGM) 数据来预测长期健康结果。
GluFormer 能够在症状出现之前识别出有糖尿病风险或血糖控制恶化的个体。在一项为期 12 年、涉及 580 名成年人的研究中,它准确率高达 66% 的糖尿病新发病例和 69% 的心血管相关死亡病例。像 GluFormer 这样的模型将使糖尿病护理从被动治疗转变为主动预防,从而实现更早的临床干预。
ESM3:模拟进化以产生新蛋白质
EvolutionaryScale 的 ESM3 模型具有开创性,它基于 27.8 亿个蛋白质序列进行训练,并配备了 980 亿个参数,旨在通过模拟进化过程生成新的蛋白质类型。ESM3 最重要的成就之一是设计了 esmGFP,这是一种新型人工绿色荧光蛋白,预计自然界需要 5 亿年才能形成。
这是通过人类引导的思维链提示实现的。
ESM3 也是开源的,促进了合成生物学和蛋白质工程项目的合作,并应用于药物发现、材料科学和环境工程。
AlphaFold3:预测所有生命分子的结构和相互作用
Google DeepMind 和 Isomorphic Lab 的最新成果 AlphaFold 3 不仅可以预测蛋白质结构,还可以更准确地模拟它们与关键生物分子(DNA、RNA、配体、抗体)的相互作用。
AlphaFold 3 通过模拟小分子与蛋白质之间的相互作用,加速了药物开发,这对于疾病研究至关重要。此外,它的开源特性也赋能了全球科学家。
人工智能席卷医疗保健:从研发到临床应用
蛋白质是人工智能影响生命科学的核心,过去一年来,应用于蛋白质序列的人工智能模型取得了重大进展。
一个明显的趋势是模型训练的规模不断扩大,人工智能驱动的方法减少了对昂贵且耗时的实验方法的依赖,从而加速了对蛋白质功能和设计的探索。

在此过程中,各种公共蛋白质科学数据库中的条目数量持续增长。这些数据库已成为研究人员不可或缺的工具;然而,保持数据质量并防止模型偏差仍然是一个持续的挑战。
目前,人工智能驱动的蛋白质研究数量显著增加,集中在功能预测(8.4%)、蛋白质结构预测(7.6%)、蛋白质-药物相互作用(3.0%)等重点领域。
此外,图像和多模态人工智能应用也正应用于科学发现。低温电子显微镜、高通量荧光显微镜和全切片成像等技术的进步,使科学家能够精确地检查和分析原子、亚细胞和组织水平的结构,从而揭示复杂生物过程的新见解。
在药物研发过程中,临床试验是最耗时且成本最高的阶段。近年来,AI辅助临床试验的数量稳步增长。
去年,中国的AI临床试验数量达到105项,超过美国(97项)位居全球第一,其次是意大利(42项)、土耳其(30项)、英国(24项)。
在临床领域,医学成像中的人工智能应用正在迅速发展,扩展到新的数据模式并解决日益复杂的临床问题。

统计数据显示,超过 80% 的 FDA 批准的机器学习软件与医学图像分析相关。近年来,医学影像领域的大型模型数量急剧增加,尤其是在病理学领域,基础模型的数量显著增加。
然而,尽管在该领域取得了一些成就,但医学成像中的许多AI应用仍然依赖于非常有限的训练数据集,尤其是在三维成像领域。

为了训练更强大的医学影像 AI 模型,需要更大、更全面、更多样化的数据集。通过增强高质量、标注良好的训练数据的可用性,预计模型性能将得到提升。
此外,大型语言模型在临床实践中的兴起带来了医疗决策、辅助诊断、患者护理和病历管理等方面的变革。
一个代表性案例是人工智能在 MedQA 基准测试中的表现显著提高,该测试包含 60,000 多个临床问题。
近日,微软和OpenAI的研究团队对模型o1进行了测试,取得了96.0%的新高分,比2023年的纪录提升了5.8个百分点。自2022年底以来,基准性能已提升了28.4个百分点。

业界对医疗保健任务语言模型的兴趣激增,PubMed 中“大型语言模型”一词的搜索结果为 1,566 条,仅在 2024 年就发表了 1,210 篇论文。
目前,大型语言模型已在临床决策中展现出强大的能力。一项涉及92名医生的随机对照试验显示,GPT-4独立运行的决策水平与人类医生使用GPT-4进行辅助决策的水平相当。
临床文档长期以来一直是医生的沉重负担,而人工智能正在解决这一挑战。
斯坦福大学的研究人员进行了一项全面集成的自动化AI听写系统测试,结果显示医生的采用率高达55%。AI听写每条记录可节省约30秒,医生的负担和疲劳程度分别平均降低35%和26%。
这些发现表明,人工智能驱动的听写技术可以显著改善医生的工作流程和健康状况,节省时间并减轻行政负担。
报告进一步指出,将人工智能融入电子健康记录系统可以简化临床工作流程,提升医疗服务提供者和患者的体验,并减轻医疗系统的整体负担。Epic、Oracle Health、Meditech 和 TruBridge 等主要供应商已广泛采用人工智能解决方案。

近年来,人工智能在医疗健康领域的重大影响也体现在FDA的批准数量上。统计数据显示,自2015年以来,FDA批准的AI医疗器械数量呈指数级增长,到2023年将达到223种。
总而言之,该报告强调,人工智能技术的进步正在催化医疗保健领域的深刻变革,为创新疗法和改善患者预后铺平道路。随着人工智能的不断发展,其能力有望在未来数年彻底改变医疗和医疗保健服务的格局。