中外科学家呼吁用AI挖掘生物资源数据中国科学报

4/7/2026

4月2日,一场聚焦“人工智能(AI)时代下亚洲生物资源数据的有效挖掘与利用”的国际会议在北京召开。本次会议由亚洲研究资源中心网络(ANRRC)、中国科学院战略生物资源计划与中国科学院微生物研究所联合主办,吸引了来自中、日、韩以及乌兹别克斯坦等亚洲多个国家的科研机构代表参与。

会上,国家微生物科学数据中心主任、中国科学院微生物研究所研究员马俊才主持发布了“ANRRC微生物资源目录2026版本”。该目录汇聚来自6个国家14个保藏中心的83,166株菌株资源信息,并整理了与菌株资源相关的24,913篇论文、34,880个专利及47,256个基因组信息,可供全球科研人员应用。ANRRC是由亚洲、大洋洲14个国家及100余家科研单位和大学共同组成的国际合作组织,2009年由中、日、韩三国科学家联合发起,致力于成为亚洲地区研究资源中心间的合作与交流平台。

“数据要素就像数字经济的新石油,不仅驱动技术创新、优化资源配置,还能加速产业升级。”马俊才在接受《中国科学报》采访时说,国家微生物科学数据中心正在开展的“基于自主生物制造数据的氨基酸高产菌株改造示范场景建设”应用项目,通过构建生物制造科学数据共享平台,通过AI模型开发实现工业菌种优化,赋能生物制造。基于其大数据挖掘和AI设计,科学家首创的普瑞巴林手性中间体R-单酰胺一步酶法合成技术,已在国内多家企业转化落地,避免了有毒有机溶剂的使用,合成成本比传统化学拆分工艺大幅下降,为我国生物制造产业的可持续发展注入了强劲动力。

“在生命科学领域,微生物的多样性最为突出。凭借物种多样性与便捷的遗传操作,微生物成为生命科学研究的重要模型与生物技术基础材料。”国家微生物学数据中心副主任吴林寰说,传统微生物研究依赖“试错法”,而AI时代范式已转变:从实验试错转向计算设计驱动——以数据为起点,精准设计实验,效率大幅提升。

她介绍说,依托微生物所建立的世界微生物数据中心目前已经整合全球78个国家、100余个保藏中心数据,通过统一标准,提升了资源的可见性与数据质量。其开展的万株微生物基因组测序计划填补了微生物基因组测序空白,已完成6000余株,数据全部公开免费共享量。同时,基于AI驱动的调控元件挖掘,挖掘了1.4万株基因组数据,发现20.7万个新调控元件共42个新类型,而此前全球已知调控元件仅约200个,AI的加入实现了重大突破。此外,她表示,针对未培养的大量微生物“暗物质”,通过构建AI模型,输入基因组与表型数据,有助于预测培养条件,助力难培养微生物的分离培养。

“AI时代,从动物模型到生物模型正在发生范式转变。”会上,ANRRC主席、韩国科学家Je Kyung Seong说,受微生物组、环境因素等影响,传统动物实验存在明显局限:同一靶点、同一候选药物、同一小鼠模型,实验结果可能截然不同,通过AI实现标准化、统一化操作至关重要。同时,AI技术能大幅缩短研发周期,缩短新药靶点发现时间。

Seong表示,韩国政府正在全力打造AI生物经济,设立国家级AI中心,搭建“AI高速路”,得到英伟达(NVIDIA)等企业支持。AI落地的核心是数据库:韩国参照英国生物银行,构建了人类生物数据库,同时新增 KBD(生物数据站)、Bio One(生物资源数据库),设立了三大国家级平台,整合各实验室数据,实现生物资源+生物数据一体化。

日本理化所综合生物资源信息部主任Hiroshi Masuya在会上表示,资源至关重要,而数据对资源同样至关重要,支撑生物资源的数据整合,是实现生物资源广泛、高效、高质量利用的核心与基础。该中心正在与依托中国科学院微生物研究所的WDCM(世界微生物数据中心)合作,推动人类罕见疾病微生物数据库建设。他建议布局AI驱动的下一代生物资源基础设施,推动机构间数据互通,同时建立类似论文引用体系的生物资源引用机制,实现全球统一标识、规范使用、正确引用与溯源。

会上还发布了“中国科学院战略生物资源目录2026版本”。该目录涵盖6,966,445个标本、231,452个植物资源、433,334个生物遗传资源、31,756个实验动物资源及444,041个生物多样性网络观测资源。通过数据共享促进生物实物资源的共享,促进我国馆藏实物资源的社会全面共享。中国科学院于“十二五”期间启动“战略生物资源计划(BRP)”,集成植物园、标本馆、资源库、生物多样性监测网、实验动物平台等相关资源,构建整体化资源体系,并已形成“5+1”网络构架,包括5个资源收集保藏平台及战略生物资源信息中心。

Scroll for more