首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI科学家震惊TED大会:让AI模型思考20秒,提升10万倍性能!

2024-10-25 08:40 · 稿源: ​AIGC开放社区公众号

今天凌晨,知名科技媒体Venturebeat消息,OpenAI高级研究科学家、德扑AI之父Noam Brown,在美国旧金山举办的TED AI大会上提出了一个震惊的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。最初,Brown也被这个结果吓到了,还写了多

......

本文由站长之家合作伙伴自媒体作者“​AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 全球首个AI科学家天团出道!007做实验碾压人类博士,生化环材圈巨震

    非营利组织FutureHouse发布全球首个公开可用的AI科学家系统,包含四个专业AI智能体:通用智能体Crow、文献综述智能体Falcon、调研智能体Owl和实验智能体Phoenix。这些AI在科学文献搜索准确率上已超越GPT-4.5等主流模型,能访问完整科学文献并评估信息来源质量。平台提供透明推理过程和API接口,支持科研流程自动化。测试显示AI在PCOS疾病研究中,仅用几分钟就完成传统需数周的文献调研,并能生成可验证假设。创始人表示这些AI将大幅提升科研效率,未来两年内有望替代科学家大部分案头工作。

  • 超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

    超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!

  • 国产六大推理模型激战OpenAI

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。

  • 用户对离谱回答不满激增,OpenAI回应:将持续公开AI模型安全性评估

    OpenAI于5月14日上线"安全评估中心"网页,公开其AI模型在有害内容生成、越狱行为和幻觉等方面的安全测试结果。此举旨在回应外界对其模型透明度的质疑,此前GPT-4o更新因不当赞美引发争议,导致全面撤回。该平台将定期更新数据,CEO奥特曼也承认存在问题并承诺改进。通过公开安全指标,OpenAI希望提升行业透明度,重建用户信任。

  • o3模型基准测试分数仅为10%,远低于OpenAI宣传的25%

    OpenAI的新AI模型o3在第一方和第三方基准测试中存在差异,引发公众对其透明度和测试实践的质疑。去年12月,o3首次亮相时声称能解答超过25%的FrontierMath问题,但实际正确率仅为2%。内部测试发现,o3能达到超过25%的准确率,但其使用的计算资源比上周OpenAI推出的模型多得多。Epoch AI发布的独立基准测试结果显示,o3的得分约为10%,远低于OpenAI宣称的25%。尽管如此,这并不意味着OpenAI的说法有误,可能是因为OpenAI使用了更强大的内部架构进行评估,并采用了更多计算资源。此外,Epoch指出其测试设置可能与OpenAI不同,并且在评估中使用了更新版本的FrontierMath。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 最意外一笔万倍天使投资

    2012年,蔡浩宇、刘伟、罗宇皓花光了全部10万元启动资金,接连吃下很多VC的闭门羹。绝境之时,斯凯网络宋涛给这个初创团队投了100万元,解了几个年轻人的燃眉之急。这便是米哈游的天使投资故事。多年后《原神》爆火,米哈游一跃成为中国游戏行业让人望尘莫及的存在。宋涛,则是这个现象级公司的天使投资人,也是唯一的外部投资方。“VC集体错过了米哈游”。这段故�

  • AI实力排名洗牌:OpenAI、谷歌崛起,Anthropic下滑

    人工智能的格局正以前所未有的速度演变,但超越标准化基准或排行榜平台,了解需求和使用模式 仍然是一个挑战……

  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • AI日报:阿里通义相首尾帧生视频模型;豆包开源Seed智能体模型UI-TARS-1.5;OpenAI首发“智能体实践指南”

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源阿里巴巴的通义实验室在Hugging Face和GitHub上开源了Wan2.1-FLF2V-14B模型,标志着AI视频生成技术的重大进步。该模型支持高清视频生成