如何降低蛋白质合成成本?OpenAI创建的GPT-5驱动自主实验室将成本降低40%
编辑丨%
过去,科学的相关领域已经见证过数学、物理等领域快速发展的 AI,这些领域下的想法往往可以在不涉及物理世界的情况下被评估。但生物学则不同。它需要在实验室内不断推进,这其中需要消耗科学家大量的时间与预算。
好在这种情况有所改善。Frontier 模型现在可以直接连接实验室自动化,提出实验方案,大规模运行,从结果中学习,并决定下一步行动。在生命科学的许多领域,瓶颈是迭代,自主实验室的建设正是为了消除这一限制。
在早期的研究中 ,OpenAI 展示了 GPT-5 能够改进湿实验室流程通过闭环实验。而现在,他们以同样的方法展示了如何降低蛋白质生产成本。
相关链接:https://openai.com/zh-Hans-CN/index/accelerating-biological-research-in-the-wet-lab/
OpenAI 与 Ginkgo 生物工厂将 GPT-5 连接到云实验室——一个通过软件远程运行的自动化湿实验室,机器人执行实验并返回数据——并利用这种实验室在环路的配置优化了广泛使用的生物过程:无细胞蛋白合成(CFPS)。

图 1:Ginkgo 官网。
经过六轮闭环实验,系统在 580 个自动化板块上测试了超过 36,000 种独特的 CFPS 反应组。在获得计算机、网页浏览器和相关论文访问权限后,GPT-5 经过三轮实验,确立了低成本 CFPS 的新技术水平,实现了蛋白质生产成本降低 40%(试剂成本提升 57%),包括对自主实验室常见反应条件更具稳健性的新型反应组分。
游细胞蛋白合成
游细胞蛋白合成(CFPS)是一种无需培养活细胞即可制造蛋白质的方法。CFPS 不是将 DNA 放入细胞等待它们产生蛋白质,而是在受控的混合物中运行蛋白质制造机制。这使得它成为快速原型制作和测试的实用工具,科学家得以快速进行多个实验,并在当天测量结果。
而无细胞蛋白合成需要复杂且相互作用的成分:编码被造蛋白的 DNA 模板、细胞裂解液(细胞内部的细胞机制混合物),以及大量生化成分,从能源来源到盐类。要对整个系统进行理性分析极其困难,而且许多不同的制作工艺应用了不同类型的机器学习以降低蛋白质生产成本。
标准的无细胞蛋白合成(CFPS)制剂和商业试剂盒通常定价适合人类配速工作。自主实验室可以在人类团队运行数十次的时间内运行数千种反应。在那个规模下,试剂成本成为限制因素。
CFPS也很难仅靠直觉优化。它是许多相互作用成分的混合。细微的变化可能很重要,但效果的方向并不总是明显的,而且最好的组合往往很难找到,除非做大量实验。以往的方法降低了成本,但进展往往是渐进式的,因为彻底探索空间需要大量劳动。
将 GPT-5 与机器人实验室连接起来
OpenAI 将 GPT-5 与 Ginkgo 的云实验室结合,构建了一个闭环自治系统,用于游细胞蛋白合成(CFPS)优化。GPT-5 设计了一批实验,交予实验室处理,并把结果反馈给模型。模型利用这些数据提出了下一轮。该循环共计重复六次。

图 2:AI 驱动的自主实验室。
为了让环路扎实于自主实验室的能力,OpenAI 在任何实验运行前都加入了严格的程序验证。该验证确保 AI 设计的实验在自动化平台上是可物理执行的。它阻止了那些在文字中看似合理但无法在机器人工作流程中完成的“纸上实验”。
在整个运行过程中,系统在 580 个自动化板块上执行了超过 36,000 次 CFPS 反应。在生物学中,单一实验具有较大噪声干扰,为了将信号与随机噪声分开,需要引入吞吐量和迭代。一旦 GPT-5 获得了相关论文和工具,经过三轮实验和两个月的时间,就建立了新的技术水平:蛋白质生产成本比最佳先前基线降低了 40%。

图 3:Ginkgo 的可重构自动化卡带。
一些发现
OpenAI 发现这些改进来自于高效高质量的识别协同且在高通量自动化现实中经得起考验的组合。
此外,他们还发现:
GPT-5 识别出了人类此前未曾在此配置中测试过的低成本反应组成;
高通量、基于板的实验通常与手动的台式实验不同;
缓冲、能量再生成分和聚胺的微小变化相对于其成本影响更大;
成本结构本身决定了什么才是关键。
不过,这些结果只在一种蛋白质、sfGFP和一种游细胞蛋白合成(CFPS)系统上得到了验证。仍需证明其推广到其他蛋白质及其他CFPS系统。含氧和反应几何形状会强烈影响产率,这些因素在不同尺度上也可能有所影响。有些改善可能对这些条件敏感,理解这些敏感性是接下来要做的部分。
想获取更多AI最新资讯与智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台 与 AI学习社区
本文来源:机器之心
原文链接:https://www.jiqizhixin.com/articles/5131d6d9-1c17-445b-b80d-c907facfd2ec