不对齐，反而性能爆表？130亿模型碾压650亿，Hugging Face大模型排行榜发布

2023-06-10 09:35 · 稿源：新智元公众号

对齐or不对齐，That is a question.我们知道，大多数模型都具有某种嵌入式对齐方式。随便举几个例子:Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vicuna等等。一般来说，对齐肯定是件好事。目的就是为了防止模型做坏事——比如生成一些违法违规的东西出来。但是

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

荐AI日报：快手推出AI视频制作助手Kwali；字节跳动推出USO模型；OpenAI推出ChatGPT开发者模式

本文介绍了AI日报栏目，聚焦AI领域最新动态。快手推出Kwali视频助手，简化视频制作流程；字节跳动发布USO模型，解决图像生成中风格与主题的矛盾；微软推出Copilot Audio音频模式，提供个性化语音交互；Stability AI升级Stable Audio 2.5，支持高质量音频生成；阿联酋推出开源大模型K2 Think，拥有320亿参数；微信上线智能回复功能，提升公众号运营效率；OpenAI推出ChatGPT开发者模式，支持AI控制外部工具；字节跳动Seed团队发布AgentGym-RL框架，提升语言模型决策能力；月之暗面开源Checkpoint Engine中间件，优化LLM推理效率；B站开源IndexTTS-2.0文本转语音系统，支持情感与时长控制；Replit推出Agent 3编程助手，自主性提升10倍。

AI视频制作快手Kwali 多Agent框架
OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核�

GPT-5-Codex 动态时间分配 AI编程模型
荐AI日报：苹果明年推出SiriAI搜索；OpenAI放开ChatGPT Projects功能；Kimi K2-0905 上线 Discord

本文汇总了AI领域最新动态：苹果与谷歌合作，计划在Siri中引入Gemini AI技术；OpenAI向免费用户开放Projects功能，提升任务管理效率；谷歌推出免费Gemini CLI工具，集成GitHub提升开发效率；OpenAI估值飙升至5000亿美元，二级股票售出103亿美元；苹果自研AI搜索引擎“世界知识问答”计划2026年上线；月之暗面发布Kimi K2-0905模型，提升编程与创意写作能力；Raycast推出Cursor Agent插件优化代码编辑；谷歌发布nano banana官方Prompt模板，助力创意设计。

AI Siri Gemini
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

StarRocks Connect 2025峰会圆满落幕，聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家，分享StarRocks在复杂业务场景中的实践，探讨技术演进方向。从性能引擎到AI原生平台，StarRocks 4.0将支持多智能体协作框架，提升数据分析效率。多家企业展示应用案例，覆盖电商、金融、旅游等领域，验证了其高性能与成本优势。开源精神推动技术创新，共同探索数据智能的无限可能。

StarRocks 数据分析 AI
赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

全球老龄化加速，大脑健康成为焦点。9月16日是中国脑健康日，9月21日是世界阿尔茨海默病日。数据显示，2020至2023年全球60岁以上人口增长40%，达14亿；中国60岁以上人口超3亿，占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制，企业合作举办高峰论坛，专家分享前沿研究成果，强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力，未来需跨学科协作推动大脑抗衰研究普及。

脑健康阿尔茨海默病老龄化
旧款Apple Watch也将支持高血压警报：涉及这三款

苹果在发布Apple Watch Series11与Ultra3两款新品之际，同步宣布了一项惠及旧款用户的重大更新——通过即将到来的watchOS26系统升级，Apple Watch Series9、Series10以及Ultra2三款旧机型也将新增高血压警报功能。这一举措意味着，部分持有旧款设备的用户无需更换新表，即可享受到这一前沿的健康监测服务。 watchOS26正式版定于9月15日正式向全球用户推送。新增的高血压警报功能依托于Appl

Apple Watch watchOS26
苹果Apple Watch高血压通知功能上线

苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能，该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验，但加拿大等部分市场尚未开放，中国大陆地区仍需等待监管审批。该功能依托光学心率传感器，可实时监测用户血管对心跳的反应，识别慢性高血压迹象，并在检测到异常时发出提醒。系统会分析用户最近30天的数据，通过先进算法判断是否需要发出通知。

苹果 Apple Watch
荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
苹果Apple Watch Series 11发布：新增高血压检测提醒

今日凌晨，苹果公司正式推出全新一代智能手表Apple Watch Series11。这款新品以“最薄、最舒适”为设计核心，同时显著提升了耐用性，起售价定为399美元。 Apple Watch Series11在材质上实现突破，采用全新玻璃材质并覆盖苹果特制陶瓷涂层，抗刮性能较前代提升两倍，为用户提供更可靠的日常使用体验。网络支持方面，该系列首次引入5G功能，中国电信、中国移动、中国联通三大运

Apple Watch Series11

今日大家都在搜的词：

热文

3 天
7天

不对齐，反而性能爆表？130亿模型碾压650亿，Hugging Face大模型排行榜发布

荐AI日报：快手推出AI视频制作助手Kwali；字节跳动推出USO模型；OpenAI推出ChatGPT开发者模式

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

荐AI日报：苹果明年推出SiriAI搜索；OpenAI放开ChatGPT Projects功能；Kimi K2-0905 上线 Discord

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

旧款Apple Watch也将支持高血压警报：涉及这三款

苹果Apple Watch高血压通知功能上线

荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

苹果Apple Watch Series 11发布：新增高血压检测提醒

今日大家都在搜的词：

热文

雷军公布小米17标准版外观：1.18mm窄边框、6.3英寸直屏

全新问界M7小订破22万：将于明晚上市公布价格

AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

雷军演讲主题《改变》官宣：聊玄戒芯片和小米汽车背后的故事

小米平板8系列搭载11.2英寸3.2K旗舰屏

iPhone17遭首批用户吐槽客服回应：建议新机带壳

realme真我GT8系列官宣10月发布

小米汽车：苹果授权Apple Music安卓版将陆续推送

鸿蒙智行尚界H5小订破15万台：明晚上市

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-A

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

鸿蒙智行秋季发布会定档9月23日：尚界H5、新问界M7来了

苹果 iPhone 17/Pro 系列今日发售多维度升级

京东：iPhone 17开卖4小时全国超3万人签收

苹果承诺修复iPhone17拍照黑色方块、白色曲线等问题

站长商机