首页 > AI头条  > 正文

西湖大学的 AI 科学家 DeepScientist,科研效率大幅提升

2025-10-11 08:49 · 来源: AIbase基地

近日,西湖大学推出了一款名为 DeepScientist 的 AI 科学家,这一系统在短短两周内完成了人类科学家三年的科研成果。DeepScientist 不仅自主产生了超过5000个科学想法,并对其中的1100个进行了验证,还在三个前沿 AI 任务中成功打破了人类的最新纪录,展示了其强大的科研能力。

image.png

在 AI 科研的历史上,虽然许多工具和系统已经相继问世,但它们大多只是辅助性工具,无法独立完成科研工作。早期的 AI 系统如 PaperBench 和 Agent Laboratory,主要帮助科学家复现论文或解决特定的机器学习问题,而 AlphaTensor 则通过大量试错来优化代码性能。然而,这些工具往往无法质疑现有的科研范式。

随着技术的进步,一些全自动的 AI 科学家系统如 AI Scientist 相继出现,它们证明了 AI 能够完成完整的研究循环,并发现新的科学成果,但仍缺乏明确的科学目标和方向。相比之下,DeepScientist 则以其闭环、迭代的流程,展现了探索的目标性和洞察力。该系统首先分析现有的研究方法,识别其短板,然后提出新颖且具有科学意义的想法。

image.png

DeepScientist 的工作流程被设计成一个三阶段的循环:首先是生成新想法的阶段,在这一阶段,系统会从庞大的记忆库中提取信息,并为新想法打分;接下来,系统会使用 “上置信界” 算法来决定验证哪一个想法,选择得分最高的想法进行实验;最后,在成功验证的基础上,系统会撰写详细的研究报告,形成闭环。

在具体任务上,DeepScientist 选取了三个前沿 AI 研究方向,包括代理失败归因、LLM 推理加速和 AI 文本检测。在这三个任务中,DeepScientist 分别提出了 A2P、ACRA 和 PA-Detect 等新方法,不仅超越了现有的 SOTA(State Of The Art)记录,还展示了其出色的自主学习和创新能力。

这一突破性的研究成果,标志着 AI 科学家在科研领域的潜力得到了进一步验证,未来可能会在更广泛的科学探索中发挥重要作用。

项目:https://github.com/ResearAI/DeepScientist

划重点:

- 🚀 DeepScientist 在两周内完成了人类科学家三年的科研量,展示出强大的科研能力。

- 💡 该系统通过闭环、迭代的流程,能够自主生成并验证科学想法,形成完整的研究闭环。

- 🧠 DeepScientist 在多个前沿任务中成功打破了人类最新科研纪录,展现出 AI 在科研领域的巨大潜力。

  • 相关推荐
  • 从MSCI评级到央视榜单,海尔智家ESG实践为何履获认可?

    海尔智家凭借系统性ESG实践获国内外双重认可:MSCI评级达AA级(国内行业最高),并入选央视“中国ESG上市公司先锋100”榜首。其核心经验在于将ESG融入企业战略与运营:通过全链路减碳(绿色设计、节能工厂、循环回收体系)、兼顾社会公益与员工成长、建立全球治理架构,使可持续理念转化为核心竞争力。这证明ESG非短期合规,而是长期价值创造的深层变革。

  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

  • 前DeepSeek研究员罗福莉已加入小米:全力奔赴AGI

    11月12日,“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议,拥有丰富AI研发经历,先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示,将与团队致力于推动AI从语言迈向物理世界,全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • TikTok Shop美区黑五重磅开启,黑五大战正式打响

    TikTok Shop美区黑五于11月13日启动,首次开展多市场联动大促。活动分三阶段:13-15日为开幕引爆期,16-27日为品类日蓄势期,28日至12月2日为冲刺高峰期。平台通过内容驱动增长,整合明星达人共创、千亿商品曝光及专项补贴资源,助力商家实现爆发。跨境与全托管模式提供结构化激励,多市场错峰接力延长热度,推动全球生意持续增长。

  • LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖,以科学创新推动脑健康产业升级

    LIFETOO品牌凭借核心产品"缩醛磷脂脑活素"荣获2025年TITAN健康奖神经健康领域奖项。该成分通过高效抗氧化、调节神经功能及改善认知等机制发挥作用,动物实验显示能显著提升学习记忆能力。奖项认证了品牌在科研转化与成分应用方面的实力,为应对全球老龄化趋势下的脑健康挑战提供了科学解决方案,推动功能性食品行业向专业化发展。

  • ​你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略,3步把曝光拉满

    GEO指数是AI搜索时代的品牌可见度衡量指标,量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同,GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示,高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明,企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控,把握AI搜索新机遇。

  • 蝉联江西首富!陈天石1800亿财富背后的“科学家情怀”

    寒武纪创始人陈天石以1800亿财富蝉联江西首富,展现科学家创业者的独特路径。他秉持"坐冷板凳"精神突破技术封锁,坚持科技报国初心,与兄长陈云霁组成"天才兄弟"创业典范。其企业不仅专注AI芯片研发,更构建创新人才培养体系,推动前沿科技普及。陈天石融合科学家严谨与企业家务实,重新诠释新时代赣商精神——既是财富创造者,更是科技创新引领者与文化推动者。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • 2025乌镇峰会:易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

    易鑫集团在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型具备300亿参数、响应延迟低于200ms等技术优势,能提升获客、风控与运营效率,优化用户体验。通过全链路智能决策能力,推动行业从"单点智能"转向"整体高效"。配套SaaS平台已覆盖超4万家经销商及百余家金融机构,显著提高融资通过率与业务质量,填补领域技术空白,引领汽车金融智能化发展。

今日大家都在搜的词: