斯坦福华人研究火了:45分钟让你的论文变身AI智能体!
新智元报道
编辑:元宇
【新智元导读】斯坦福大学研究人员提出了Paper2Agent,将静态论文转化为可交互的福华分钟AI智能体,让学术成果可以直接被「调用」,人研让为科研知识传播开辟了新模式,究火并为构建AI共研生态奠定基础。论文
把论文,变身变成会动的斯坦智能体?
这样论文就不再是静态的PDF文件,研究成果不仅可以「开口说话」,福华分钟还能主动帮你把事做了。人研让
传统科研论文的究火阅读门槛很高,往往需要读者投入大量精力去理解论文内容。论文
为了解决这一难题,变身斯坦福大学研究人员提出了Paper2Agent,斯坦让论文一键变身AI智能体。福华分钟
这样一来,人研让学术成果可以直接被「调用」,而不用再经历从阅读、理解再到最终应用的漫长转化过程。
https://arxiv.org/abs/2509.06917
Paper2Agent是一个可将科研论文转化为「研究助手型」AI智能体的自动化框架。
而且,它还可以实现多智能体协同作业。
研究人员利用Paper2Agent成功构建了AlphaGenome智能体,用于解释基因组变异,还做了Scanpy与TISSUE智能体,用于开展单细胞和空间转录组分析。
结果显示,Paper2Agent不仅能复现原论文结果,也能准确处理新的用户请求。
Paper2Agent提供了将科研论文转化为智能体的自动化工作流。
它的核心思路,是把论文封装成一个MCP服务器。
转化流程共分为三步:
识别论文的关键贡献(数据集、方法、模型或工作流)。
将这些关键贡献封装为MCP服务器,并明确其输入、输出与使用说明。
将MCP服务器连接至LLM驱动的智能体,实现自然语言查询与自主执行。
Paper2Agent概述
Paper2Agent生成的论文智能体具有以下特点:
交互便捷:用户可用自然语言执行复杂科学分析,无需编程基础;
可靠易复现:每个论文智能体所使用的工具均会通过示例数据集,与论文代码库中报告的结果与图表进行验证,并锁定配置确保可复现性。
Paper2Agent基于MCP生态系统,构建了两个关键组件:
Paper2MCP:从论文及其代码库中提取信息,用以构建远程MCP服务器;
智能体层:将每个MCP服务器封装为上下文提供者,从而生成针对特定论文的AI智能体(见图1A)。
每个MCP服务器包括三个核心组件:
MCP工具:可执行函数,封装了论文中的方法学创新。这些工具运行在预配置环境中,确保无缝执行。
MCP资源:静态资源仓库,包含论文文本、关联代码库及补充材料,如数据集、表格、图像等。
MCP提示词:精炼的指令模板,引导AI智能体完成从论文文本或代码库中提取的多步骤科学工作流。
研究人员借助Claude Code完成了对Paper2Agent的对接与调用。
整个流程,从识别论文相关的代码库开始(图1B)。
随后,调用两个专用智能体和一个测试智能体。
环境智能体,用于配置所需的软件环境;
提取智能体,用于将核心方法转化为可执行工具。
测试智能体,通过自动测试不断优化代码与环境,直到结果与参考输出一致。
完成验证后,工具与环境将被打包为MCP Python文件,可部署至Hugging Face等远程服务器。
最后,通过将MCP服务器与AI智能体连接,生成一个功能完整的论文智能体,用户就可以通过自然语言访问该论文的方法。
研究人员通过三个案例,来展示Paper2Agent如何将不同类型的科研论文转化为可靠的交互式AI智能体。
AlphaGenome Agent
基因组数据解读
AlphaGenome是一款AI模型,用于预测人类DNA中单核苷酸变异(SNV)或突变对多种基因调控过程的影响。
Paper2Agent将AlphaGenome论文转化为可交互的智能体,使用户能够自动解读基因组数据。
在无人干预的情况下,Paper2Agent在一台普通笔记本上,仅用约3小时便生成了22个AlphaGenome MCP工具,全面覆盖论文中的方法创新。
这些MCP工具可复用于未来应用,它们涵盖了单变异与批量变异评分、序列级预测、组织本体探索以及丰富的可视化功能。
研究人员进一步对AlphaGenome智能体进行了基准测试,评估其在数值与图表输出上的表现,是否可以媲美人类专家手动配置与运行代码的结果(图2C)。
结果显示AlphaGenome智能体在这些查询中均实现100%准确率,所有结果与原报告完全一致。
研究人员还演示了AlphaGenome智能体在GWAS位点解读中的应用能力,并验证了其是否能复现原论文的分析过程。
以使用AlphaGenome来解释「chr1:109274968:G>T与低密度脂蛋白胆固醇(LDL-C)相关的原因」为例(图2D),智能体构建了解决此任务的详细计划,并最终输出一份综合解读报告。
在这一过程中,研究人员还发现了Paper2Agent的重要优势:
只需一个提示词,用户即可基于独立的模型证据重新评估已发表的研究结论。
TISSUE智能体
不确定性感知的单细胞空间转录组分析
TISSUE是一篇近期发表的研究论文,提出了一种用于不确定性感知的单细胞空间转录组分析的新方法(见图3A)。
研究人员通过Paper2Agent自动生成了TISSUE智能体。
这一案例,适用于这样一个常见科研场景:
研究人员希望将新方法应用于自己的数据,但由于时间有限,很难深入理解代码库、配置运行环境,或掌握方法的特性与输入要求。
TISSUE智能体可以提供问答支持,帮助用户准备输入数据、理解方法功能,从而解决了这一难题。
对于TISSUE MCP服务器,Paper2Agent共生成了6个工具,涵盖空间基因表达预测、预测区间构建,以及面向不确定性的下游分析等(见图3A)。
值得注意的是,TISSUE智能体还可作为交互式指南使用(见图3B)。
研究人员评估了TISSUE智能体在构建空间转录组预测的预测区间方面的能力,发现智能体无需用户额外干预,便自动执行了整个TISSUE流程(见图3C)。
这说明智能体不仅能使用单个工具,还能独立完成从数据加载、预处理、插补到不确定性估计的整套分析流程。
最后,研究人员还展示了如何通过将TISSUE论文中的「数据可用性」部分转化为结构化注册表,来进一步利用MCP资源(见图3D)。
用户可以通过查询筛选出特定物种的数据集,而无需手动浏览多个数据仓库。
Scanpy智能体
用于单细胞数据预处理
Scanpy是一个广泛使用、功能强大的单细胞转录组分析工具包。
在实际应用中,研究者往往只用到Scanpy功能的一部分。
Paper2Agent不仅支持将完整方法转化为工具,也能抽取其中的关键部分,以构建更针对性的智能体,聚焦于某一特定分析任务。
研究人员聚焦于Scanpy最常见的使用场景:单细胞数据的预处理与聚类。
Paper2Agent用了约45分钟,便在一台笔记本电脑上生成了7个工具(见图4A)。
通过这些工具,用户可以通过自然语言提示让Scanpy智能体对其单细胞数据进行质控处理。
许多用户偏好从头到尾的预处理与聚类流程,即工具按既定顺序依次执行。
这类分析流程不仅常见于单细胞研究,也普遍存在于科学领域的其他复杂数据处理中。
然而,执行这些流程通常很具挑战性:AI智能体要么必须「预先知道」正确的执行顺序,要么依赖用户输入结构化良好的提示词明确指定步骤。
为解决这个问题,研究人员使用MCP提示词来规范流程。
MCP提示词提供了一种标准化方法,这些提示词由Paper2Agent直接从论文和代码库中自动推理得出,无需人工整理。
这种机制显著提高了复杂分析任务的可复现性与易用性。
例如,Scanpy智能体的MCP提示词就完整编码了一套标准的预处理与聚类流程,包括质控、标准化、特征选择、降维、图构建、聚类和细胞类型注释,并确保其按正确顺序执行(见图4B)。
研究人员使用三个公开单细胞数据集对Scanpy智能体的性能进行了评估,结果显示智能体输出的结果与人类研究者处理同样数据时的结果一致(图4C)。
这表明基于MCP提示词驱动的Scanpy智能体,能够流畅运行完整流程,使先进的单细胞分析更加易用和可复现。
作者简介
Jiacheng Miao
Jiacheng Miao现为斯坦福大学博士后,与Jonathan Pritchard和James Zou合作。在这份工作中,Jiacheng Miao与其他研究者共同提出了Paper2Agent。
2025年,Jiacheng Miao在威斯康星大学麦迪逊分校获得博士学位,导师是Qiongshi Lu和Lauren Schmitz。2019年,Jiacheng Miao在南京大学数学系完成了本科学业。
Jiacheng Miao的研究方向是构建可靠的AI co-scientists以加速科学发现,并使用Perturb-seq解释与疾病相关的基因。
2025年,Jiacheng Miao获得了NOMIS & Science青年探索者奖。
参考资料:
https://arxiv.org/abs/2509.06917
(责任编辑:时尚)
-
近日,前中超门将王年将成转投影视圈在国内足坛引发热议。在拍摄短剧《中国球王》间隙,王年将成接受了九派新闻记者的专访。现在向外界介绍自己时,会提到前职业球员的身份吗?王年将成:那肯定的,我的演员资料里有 ...[详细]
-
周末高温 夏日热情迎中考在前日雷阵雨的降温下,昨天泉州37℃以上的高温区域减少,午后最高气温在33℃-36℃。这个周末是中考时间,泉州的天气情况也是大家非常关心的。预计中考期间泉州市以多云为主,山区局 ...[详细]
-
最近,女演员郭彤彤自曝打“白发针”2个月效果甚微,相关话题冲上热搜,引发了网友对“白发针”的讨论:钱花了,针扎了,罪受了,结果就这??所谓“白发针”,其实不是什么神秘黑科技,它的主要成分是腺苷钴胺一种 ...[详细]
-
泉州市上半年居民人均可支配收入21239元 同比增长1.8%
上半年,泉州物价涨幅回落,泉州市辖区居民消费价格同比上涨3.2%,涨幅比一季度回落0.8个百分点;全市居民人均可支配收入21239元,同比增长1.8%。从调查的八大类商品和服务价格来看,与上年同期相比 ...[详细]
-
随着休赛期的结束,25-26赛季的NBA季前赛开打,各支球队也是陆陆续续开始找回状态。就在不久之前,一场交流赛中,CBA的广州龙狮队得到了邀请,前往美国和马刺队展开了一场对决。这场比赛,最终由马刺队以 ...[详细]
-
来源:IC photo2025年10月3日,河南郑州黄河大堤万滩段,盛开的粉黛乱子草吸引了众多游人前来观赏。未经授权,请勿转载)2025年10月3日,河南郑州黄河大堤万滩段,盛开的粉黛乱子草吸引了众多 ...[详细]
-
近期,杭州一位52岁女性在空地散步时,误踩到废弃氢氟酸,送医后经抢救无效不幸身亡。公安机关已介入调查,生态环境部门已完成现场无害化处置。一个寻常的散步,一次不经意的踩踏,竟造成52岁的涂女士与家人永别 ...[详细]
-
爸妈高孩子就一定高?内分泌科专家破解身高八大谣言来源:网易健康) ...[详细]
-
海峡网8月21日讯福建日报新媒体·闽南网记者 王惠敏 通讯员 刘虹艳 文/图)时隔几个月,市民终于拿回了被骗款。8月20日上午,泉州市民陈先生到鲤城公安分局常泰派出所领取被骗款3万元,对 ...[详细]
-
晋江国际会展中心项目进入全面收尾阶段 林劲峰 陈凯 摄)本报讯 记者 许雅玲)记者近日从晋江国际会展中心项目部了解到,泉州市重点项目——晋江国际会展中心项目已进入全面收尾阶段, ...[详细]