首页 > AI头条  > 正文

劳德研究所启动“弹弓”AI资助计划:15个团队入选,重新定义AI评估标准

2025-11-07 09:20 · 来源: AIbase基地

周四,劳德研究所(Loud Institute)宣布启动首批“弹弓(Slingshot)”人工智能资助计划,旨在“推进人工智能的科学与实践”。该计划通过为研究人员提供传统学术机构难以匹配的资源——包括资金、计算能力以及产品和工程支持——以加速AI研究与落地创新。作为回报,受助者需产出可实际转化的成果,如初创公司、开源项目或其他形式的研究成果。

首批共有 15个项目入选,重点聚焦当前人工智能领域最具挑战性的议题之一——AI评估体系。其中多个项目已经在业界拥有知名度,如命令行编码基准测试工具 Terminal Bench,以及长期关注通用人工智能(AGI)能力测评的 ARC-AGI 项目最新版本。

机器人 人工智能 AI

与此同时,多支团队正尝试以全新视角解决评估瓶颈。加州理工学院与德克萨斯大学奥斯汀分校合作开发的 Formula Code 项目,旨在评估AI代理在优化现有代码时的表现;哥伦比亚大学团队推出的 BizBench,则面向“白领AI代理”构建综合测试标准,聚焦AI在商业和决策类任务中的真实表现。此外,还有部分项目探索强化学习与模型压缩的新方法,以建立更具普适性和可扩展性的评估框架。

值得关注的是,SWE-Bench 联合创始人 John Boda Yang 也加入了本轮计划,他将领导新项目 CodeClash。该项目受SWE-Bench成功经验启发,计划通过动态、竞赛式机制评估AI代码能力。

Yang在接受TechCrunch采访时表示:“我认为持续利用第三方核心基准进行开放评估,是推动整个行业进步的关键。但我也担心,未来的评测体系若被个别公司垄断,将可能削弱研究的开放性与可比性。”

通过“弹弓”计划,劳德研究所正试图在学术与产业之间搭建新的桥梁,使前沿AI研究成果能够更快地转化为实际应用。这一举措被视为当前AI领域评估体系重塑的重要一步。

  • 相关推荐
  • 微电影《记忆奇旅2》之外:真正的未来出行,正在系统里被重新定义

    九号公司推出科幻微电影《记忆奇旅2》,由易烊千玺主演,上线12小时播放量破亿,成为爱奇艺科幻榜第二。影片延续“科技×情感”风格,探讨未来出行主题,与九号发布的自主研发短途交通全域操作系统凌波OS相呼应。该系统重构行业逻辑,从硬件竞争转向系统能力,通过统一底层语言实现动力、电池等协同,提升安全与个性化体验,推动两轮车从工具向生活方式演进,标志行业进入“系统能力驱动”新阶段。

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • 告别清洁盲区!锐舞电动牙刷以97%菌斑清除率,重新定义洁净标准

    电动牙刷历经声波、旋转与扫振等技术演进后陷入创新瓶颈。锐舞气泡电动牙刷以超能气泡技术破局,通过高速气流驱动微米级气泡实现非接触清洁,牙菌斑清除率达97%,重新定义行业标准。该技术推动电动牙刷从物理摩擦时代跨入流体动力主导的喷气时代,标志着中国品牌首次从追随者转变为技术引领者。

  • 用了3个月GEO监控,我发现品牌在AI推荐中的5个真相

    文章探讨AI搜索时代企业面临的新挑战:用户转向ChatGPT、豆包等平台直接提问,导致传统搜索引擎询盘量下降。核心提出GEO品牌监控概念,需关注品牌在AI推荐中的曝光率、排名位置、提及场景等5个关键指标。通过工具持续监控并优化内容,可提升AI搜索可见性。数据显示GEO投入回报率达1:3.71,建议企业尽早布局抢占新兴流量入口。

  • 别担心相机操作复杂!佳能PowerShotV1重新定义“新手护航”,开机即拍是基本操作

    佳能PowerShot V1专为Vlog新手设计,定位“新手神器”,价格亲民约6000元。搭载一体化超广角变焦镜头,覆盖17-52mm焦段,智能场景识别自动匹配最佳参数,实现“开机即拍”。画质超越手机,支持5.7K超采和4K视频,配备散热系统与五轴防抖。操作界面极简,侧翻屏多角度取景方便。双十一提供丰富配件套餐,性价比突出,是零基础创作者轻松开启高质量Vlog记录的首选。

  • 星巴克“学步”麦当劳

    从去年底星巴克释放“探索战略合作伙伴”的信号,到今年5月正式启动出售中国业务程序,这场持续近一年的拉扯,终于尘埃落定。 博裕资本脱颖而出,以40亿美元价格成为星巴克的“中国合伙人”,双方将成立合资企业,共同运营星巴克在中国市场的零售业务。根据协议,博裕将持有至多60%的股权,星巴克保留40%,同时继续作为品牌与知识产权的所有者和授权方。 星巴克�

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 以AI算力赋能湾区智算未来,博大数据副总裁高辉受邀启动“AI算力+”行动倡议

    2025年10月29日,第四届数字基础设施高质量发展大会在深圳召开,聚焦“AI驱动+算赋未来”主题,推动人工智能与算力设施深度融合。博大数据作为核心企业参与启动“AI算力+”行动倡议,联合政产学研共建算力生态。其前海智算中心以20亿元投资、5万平米规模,支持4万P算力,成为辐射华南及港澳的算力高地,助力深圳打造全球数字先锋城市,为千行百业智能化转型提供核心支撑。

  • 陈天桥在AIAS上首提“发现式智能”,宣告AI研究新范式

    2025年10月27-28日,AI驱动科学研讨会(AIAS 2025)在美国旧金山举行。陈天桥发表主题演讲,首次提出“发现式智能”概念,指出这是真正的通用人工智能,强调AI应帮助人类发现未知而非替代人类。他提出实现路径需结合规模路径与结构路径,并分析大脑时间结构包含神经动力学、长期记忆、因果推理、世界模型和元认知五大能力。会议宣布投入超十亿美元建设算力集群,支持年轻科学家探索智能本质。

  • 逗哥配音团队:以硬核技术铺就AI创作未来,重塑短视频创作生态

    逗哥配音平台凭借AI语音技术革新,为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源,支持多语言合成,具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具,结合去水印、字幕生成等实用功能,实现一站式创作。已获超百位大V推荐,用户量破千万,累计播放量达十万亿级,显著降低创作门槛,助力各领域内容生产。团队将持续优化技术,拓展功能生态。

今日大家都在搜的词: