AI工具设计出全基因组序列
2008年,研究人员报道了全球首个活体生物的人工合成基因组。他们通过化学方法合成了生殖支原体具有58万个核苷酸的基因组。后续研究又在细胞中“重启”了这种基因组,创造出科学家所谓的首个合成生命。
如今,研究人员使用人工智能(AI)设计出全基因组序列,其中还包括一个受生殖支原体启发的序列。生成它们的Evo2 DNA语言模型,由生命之树中的生物的数万亿个DNA碱基训练而成。相关成果3月4日发表于《自然》。
尽管令人瞩目,但这些基因组设计只是迈向AI创造微生物的一步。“这很酷,但还远远不够。”荷兰瓦赫宁根大学的Nico Claassens说。
目前的一大障碍是需要大规模合成并测试AI生成的基因组。另一个难题是,要设计出能够指挥哪怕是最简单生命形式的所有基本功能的基因组,更不用说那些更复杂的细胞了。
然而,那些十多年来一直致力于从头设计基因组的科学家说,这个曾经大胆的目标如今已触手可及。
“这些AI模型是合成基因组学领域的‘ChatGPT时刻’。”英国曼彻斯特大学的蔡毅之说,“你可以创造自然界中从未有过的东西。”
此前编写基因组大多只是微调,相当于编辑现有书籍的某一章,或删掉所有的逗号。而Evo2这样的DNA语言模型,让创造与现有生命差异更大的合成生命成为可能。
2025年,美国Arc研究所的Brian Hie与同事使用Evo模型编写了感染细菌的病毒噬菌体的基因组。当研究人员将指令插入大肠杆菌后,285个设计中有16个产生了能够杀死细菌的功能性病毒。
不过,噬菌体基因组只有几千个碱基,仅编码了少数几个基因,比微小的细菌基因组还小得多、简单得多。而且大多数科学家认为病毒是遗传寄生物,缺少许多生命特征。
在最新研究中,Hie与Arc研究所Patrick Hsu带领的团队,用Evo2模型生成了受生殖支原体启发的基因组,以及人类线粒体和酵母染色体的基因组。计算机预测显示,这个仿照生殖支原体的序列中近70%的基因看起来很合理。
科普中国APP
科学素质竞赛
幸福肥东微信
合肥科普微信
肥东科协