Cycleresearcher:通过自动化评审改进自动化研究-结论

时间:2025-05-08 07:20:19

在本文中,我们介绍了一个使用大型语言模型(大型语言模型)自动化整个研究生命周期的新框架。我们的方法结合了旨在自主开展科学研究的政策模型CycleResearcher和模拟同行评议过程的奖励模型CycleReviewer。通过集成迭代SimPO,我们使模型能够在多个研究-审查-改进周期中自我改进。为了促进这一点,我们构建了两个新的数据集,review -5k和research -14k,它们捕捉了机器学习中同行评审和研究论文写作的复杂性。与评估的闭源模型相比,CycleReviewer显示出更高的评分一致性,而CycleResearcher在模拟评审中生成接近人类预印本质量的论文,具有竞争力的接受率。这些结果表明,使用大型语言模型对科学发现和同行评审过程都有意义的贡献是可行的。随着我们的发展,大型语言模型改变研究实践的潜力是巨大的。我们希望这项工作能激发对人工智能如何帮助研究人员的进一步研究,同时保持最高的学术诚信和道德责任标准。