图说:“OpenMEDLab浦医”基础模型群将于近期逐步开源,覆盖10余种医疗数据模态 采访对象供图
大模型的快速发展突破了人工智能技术的边界,也为众多垂直领域带来新的发展机遇和挑战。在医疗领域,越来越多业内人士共同关注同一个课题——如何通过人工智能大模型为医生和研究人员提供新工具、新方法,以改善疾病诊断、治疗和预防。
(资料图)
6月29日,由上海人工智能实验室牵头,并联合国内外顶级科研机构、高校及医院共同发布全球首个医疗多模态基础模型群“OpenMEDLab浦医”。
“OpenMEDLab浦医”融合了全球顶尖的AI研发能力、海量医学数据以及医学专家知识,首批发布的基础模型群中,包含基于医学图像、医学文本、生物信息、蛋白质工程等10余种数据模态训练而成的基础模型。
近年来,超大参数深度学习基模型在计算机视觉、自然语言处理等领域获得突破性进展,能够基于大模型的超强泛化能力应用于许多下游任务的分析。然而医学数据在数据模态、成像模式、图像特征等方面种类繁多、差别较大,使得通用大模型难以在医学图像分析方面实现令人满意的性能。在高度关注数据私密性的医疗机构中,落地部署也存在较大困难,当前,针对特定任务进行单独模型训练依然是该领域主流的解决方案。然而,医疗下游长尾任务的数据样本少、标注难度高,这也限制了人工智能在更多医疗场景的应用。
如何将计算机视觉、自然语言处理通用大模型“为我所用”,并发展出更适合医疗场景的基础模型,上海人工智能实验室首创了多层级、多场景、高精度、可落地的医疗基础模型群“OpenMEDLab浦医”。
据介绍,基于计算机视觉、自然语言处理大模型对医疗图像和文本通用特征的学习,上海人工智能实验室首先针对不同医疗数据模态开发了一系列基模型,例如CT、MRI、超声、内镜、病理、医学文本等,以充分学习和利用不同数据模态独有的特征和模式。基于上述多层级、多场景的基础模型群,“OpenMEDLab浦医”可以将先前医学数据训练中学习到的特征,高效应用于海量医疗下游问题中,从而实现针对不同任务的小数据、弱标注、高效率的训练。同时,模型群兼顾性能与落地的平衡,在医疗场景中的部署应用更具便捷性,从而让基础模型在更多医疗长尾问题中得以落地应用。
上海人工智能实验室智慧医疗研究中心主任张少霆表示:“‘OpenMEDLab浦医’的问世,为人工智能大模型在医疗领域的快速发展、高效落地提供了坚实的基础,将带动医疗领域的一系列创新,如模型即服务等模式。”
记者了解到,“OpenMEDLab浦医”研发团队已与全国多家头部三甲医院及医药企业开展合作,全方位赋能医院诊疗及药物研发工作。在上海交通大学医学院附属瑞金医院,“医学数字人”已应用于全身多部位、多器官、多模态影像的智能辅助诊疗,覆盖十余个临床方向,全方位赋能患者诊疗愈全流程;在四川大学华西医院,双方合作打造基于自动提示词微调的视觉语言大模型,显著提高了小样本下的医学图像的检测性能,为视觉语言大模型在医疗图像领域提供了应用范式。在生物制药领域,也与多家知名药企合作,利用基础模型赋能蛋白质工程,助力药品研发。
据透露,“OpenMEDLab浦医”将于近期逐步开源,覆盖医学图像、医学文本、生物信息、蛋白质工程等10余种医疗数据模态,促进基于医疗基础模型的跨领域、跨疾病、跨模态科研突破,推动医疗大模型的产业落地。
新民晚报记者 郜阳