首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

2025-09-30 15:40 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、豆包大模型1.6-vision正式发布,对比上一代综合成本降低约50%

豆包大模型1.6-vision的发布标志着其在多模态理解和推理能力上的重大突破,同时通过引入工具调用功能和优化性能,显著提升了开发效率和性价比。

image.png

【AiBase提要:】

🧠 调用工具,视觉理解更精准。

💻 应用开发更高效。

💰 更高模型性价比。

2、通义千问发布Qwen3-LiveTranslate-Flash3 秒同传延迟刷新行业纪录

通义千问推出的Qwen3-LiveTranslate-Flash系统,实现了多语言实时音视频翻译的突破。该系统支持 18 种语言及多种方言,并通过视觉上下文增强技术提升翻译准确性,同时实现最低 3 秒的同传延迟,显著优于其他主流模型。

image.png

【AiBase提要:】

🌍 支持 18 种语言及多种方言,覆盖广泛的语言需求。

🧠 引入视觉上下文增强技术,提升复杂语境下的翻译准确率。

⏱️ 实现最低 3 秒同传延迟,大幅提升实时翻译流畅性。

3、DeepSeek发布V3.2-exp模型,开创性稀疏注意力机制 将API 成本降低一半

DeepSeek发布了名为V3.2-exp的新实验模型,通过创新的‘稀疏注意力’机制显著降低了长上下文操作的推理成本。该模型结合了‘闪电索引器’和‘细粒度标记选择系统’,提高了处理长上下文片段的效率,并在初步测试中展示了API调用成本降低50%的优势。

QQ20250930-085622.png

【AiBase提要:】

⚡ DeepSeek推出V3.2-exp模型,采用稀疏注意力机制优化长上下文处理。

🔍 闪电索引器与细粒度标记选择系统协同提升模型效率。

💰 初步测试显示API调用成本降低达50%,为AI应用提供更经济的解决方案。

4、Anthropic放大招!Claude Sonnet4.5碾压GPT-5,编码界“新王者”诞生

Anthropic发布了Claude Sonnet4.5模型,该模型在编码任务和复杂任务处理上表现出色,成为当前最优秀的编码模型之一。其性能提升显著,支持多平台使用,并且在安全性和对齐性方面也有所增强。

image.png

【AiBase提要:】

✅ Claude Sonnet4.5在编码基准测试中表现优异,实现30小时以上的自主工作时长。

🔧 新增功能如检查点、上下文编辑和内存工具,提升了开发效率与实用性。

🔒 强调安全性,降低风险行为,适用于高风险企业场景。

5、ChatGPT 聊天即买!AI 革命电商:一键下单,告别浏览器跳转

ChatGPT 推出‘即时结账’功能,用户可在聊天界面直接完成单件商品购买,无需跳转链接或浏览器。该功能由 OpenAI 与 Stripe 合作开发的‘代理商务协议’驱动,支持多种支付方式,并将扩展至多件购物车和国际市场。

【AiBase提要:】

💡 ChatGPT 推出‘即时结账’功能,实现聊天界面直接下单。

🔒 ‘代理商务协议’确保交易安全、简易且兼容多种支付方式。

🌐 未来将扩展至多件购物车和国际市场,提升用户体验。

6、OpenAI 即将推出AI版TikTok,全网视频内容将由AI创造

OpenAI即将推出一款基于Sora2模型的社交应用,名为‘AI版TikTok’,所有内容均由AI生成。该应用设计类似TikTok,但视频时长限制为10秒,且支持用户身份认证和肖像使用。此外,OpenAI还注重安全与版权问题,以提升用户体验和防止用户流失。

【AiBase提要:】

🎥 Sora2模型生成的视频时长限制为10秒,专注于短小精悍的内容传播。

🔒 用户可认证身份,Sora2可使用其肖像进行视频生成,并允许其他用户标记使用。

🛡️ OpenAI将发送提醒,确保用户在使用肖像时知情,同时处理版权问题。

7、Claude Code 2.0震撼升级:检查点+VS Code插件,编程效率飙升3倍

Anthropic发布了Claude Code v2.0和Claude Sonnet4.5模型的更新,显著提升了AI在编程中的自主性和集成性。Claude Code通过检查点机制、终端与IDE的优化以及API扩展,为开发者提供了更高效的编程体验。

image.png

【AiBase提要:】

✅ Claude Code v2.0引入了检查点功能,使AI能自动保存状态并支持回滚,提升开发安全性。

🔧 VS Code原生扩展进入beta测试阶段,提供内联差异预览和图形化交互,提高协作效率。

📈 Sonnet4.5模型在OSWorld基准测试中得分高达61.4%,表现出色,尤其擅长构建复杂代理系统。

8、百度地图升级小度想想 2.0:出行智能助手全面进化

百度地图在第七届世界新能源汽车大会上发布了小度想想 2.0,这一版本作为行业首个深度融合的端到端语音语言大模型,为用户提供更智能、个性化的出行服务。其核心优势包括:引入地图出行知识库和实时搜索数据以提升复杂出行意图的理解;构建跨端记忆体以实现多设备间的无缝衔接;以及具备即时、近期及长期记忆能力,从而提供个性化的推荐服务。

【AiBase提要:】

🚗 百度地图引入地图出行知识库和实时搜索数据,提升复杂出行意图的理解与推理能力。

📱 跨端记忆体实现手机、车机等多场景无缝衔接,提升用户体验。

🧠 智能助手具备即时、近期及长期记忆能力,提供个性化推荐服务。

9、蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview

蚂蚁集团推出的Ring-1T-preview是全球首个开源的万亿参数推理大模型,在多项测试中表现优异,超越了多个已知开源模型,接近GPT-5。该模型在自然语言推理和代码生成方面展现出强大的能力,并且团队正在对其进行后续训练以进一步挖掘其潜力。

【AiBase提要:】

🌟 全球首个开源的万亿参数推理大模型 Ring-1T-preview 发布。

🚀 在 AIME25 和 CodeForces 测试中表现优异,接近 GPT-5 的水平。

🧠 团队正在对模型进行后训练,以提升其自然语言推理能力。

10、DeepMind 重磅推出 “帧链” 概念:视频模型或将实现全面视觉理解

DeepMind 提出的 '帧链'(CoF)概念,为视频生成模型带来了突破性进展。该技术使视频模型能够在时间和空间上进行推理,展现出类似语言模型的通用能力。Veo3模型在多个视觉任务中表现出色,显示出强大的感知、建模和操控能力。

image.png

【AiBase提要:】

🎥 帧链技术让视频模型具备了跨时空推理能力,提升了视频生成的智能水平。

🧠 Veo3模型展示了强大的通用视觉能力,能够处理多种未训练的任务。

🚀 DeepMind 预测未来通用视频模型可能取代专用模型,推动机器视觉的新时代。

详情链接:https://papers-pdfs.assets.alphaxiv.org/2509.20328v1.pdf

11、智谱发布开源大模型GLM-4.6:编程能力对齐Claude Sonnet4

智谱AI发布了新一代开源大模型GLM-4.6,其在Agentic Coding等关键能力上实现大幅提升,编程能力已对齐国际顶尖模型Claude Sonnet4,并超越DeepSeek-V3.2-Exp,成为国内最强代码生成模型。同时,GLM-4. 6 在国产化适配方面取得里程碑式进展,成功部署于寒武纪国产芯片和摩尔线程GPU,为构建自主可控的AI生态系统奠定了基础。

QQ20250930-155331.png

【AiBase提要:】

✨ GLM-4. 6 在编程能力上达到国际顶尖水平,对齐Claude Sonnet4。

🚀 成功在寒武纪国产芯片上实现FP8+Int4 混合量化部署,推动国产硬件发展。

🔧 基于vLLM框架,在摩尔线程GPU上以原生FP8 精度稳定运行,提升AI生态自主性。

举报

  • 相关推荐
  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • 东芝电视以顶尖音画破局“注意力消亡时代”,让客厅再成家庭声音主场

    文章探讨了当代家庭客厅中“注意力消亡”现象,即家人各自沉迷电子设备而缺乏交流。东芝电视与声音艺术博物馆合作,通过技术创新打造沉浸式音画体验,用顶级音质还原自然声音细节,旨在将家庭从碎片化信息中拉回,重建情感连接空间。技术不仅提升娱乐体验,更成为文化传承载体,让客厅重新成为有交流、有温度的家庭核心。

  • 华为FreeClip 2耳夹耳机发布:搭载自研NPU AI处理器 1299元

    华为于9月24日正式发布全新FreeClip 2耳夹式耳机,售价1299元,10月14日开启预售,10月20日正式上市。耳机主打独特设计、卓越性能与丰富功能,提供丹宁蓝、摩登黑、羽纱白三色可选。充电盒采用玲珑方盒设计,体积缩小17%,耳机本体重量减轻9%至5.1克,佩戴更轻盈舒适。搭载华为自研第三代音频芯片,首款集成NPU+AI处理器,算力提升10倍,支持超澎湃双擎单元,音质与低频动力均提升100%。具备IP57级防尘抗水抗汗能力,支持左右耳自适应技术,无需区分左右耳即可佩戴。AI功能方面,支持鸿蒙AI耳边助手,可实现随唤随应、连续对话等便捷操作,并具备实时听译功能,支持中文与20种语言互译。续航方面,单耳续航达9小时,整机续航长达38小时,满足长时间使用需求。此外,耳机还支持离线查找与楼层定位功能,充电盒新增近距离星闪精准查找,50米内轻松找回耳机。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • 京东推出AI购物APP京犀:帮你选出最心仪商品

    9月25日,2025京东全球科技探索大会在京开幕。京东宣布未来三年将持续加大投入,推动人工智能技术与实体产业深度融合,目标构建覆盖全产业链的万亿级AI生态体系。作为战略落地的关键一步,京东正式推出新一代购物与生活服务超级入口“京犀”App,通过AI技术重构消费体验,引发行业高度关注。该应用将AI深度嵌入购物全流程,基于用户行为与商品特征精准理解需求,智能推荐商品并优化结算路径,实现“无感式”顺畅下单。平台整合餐饮、票务、住宿等高频生活服务场景,用户通过语音指令即可完成全流程操作。此次将AI能力全面开放至消费端,标志着京东从“供应链技术提供商”向“生活服务生态构建者”的角色升级。

今日大家都在搜的词: