首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

2025-09-30 15:40 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、豆包大模型1.6-vision正式发布,对比上一代综合成本降低约50%

豆包大模型1.6-vision的发布标志着其在多模态理解和推理能力上的重大突破,同时通过引入工具调用功能和优化性能,显著提升了开发效率和性价比。

image.png

【AiBase提要:】

🧠 调用工具,视觉理解更精准。

💻 应用开发更高效。

💰 更高模型性价比。

2、通义千问发布Qwen3-LiveTranslate-Flash3 秒同传延迟刷新行业纪录

通义千问推出的Qwen3-LiveTranslate-Flash系统,实现了多语言实时音视频翻译的突破。该系统支持 18 种语言及多种方言,并通过视觉上下文增强技术提升翻译准确性,同时实现最低 3 秒的同传延迟,显著优于其他主流模型。

image.png

【AiBase提要:】

🌍 支持 18 种语言及多种方言,覆盖广泛的语言需求。

🧠 引入视觉上下文增强技术,提升复杂语境下的翻译准确率。

⏱️ 实现最低 3 秒同传延迟,大幅提升实时翻译流畅性。

3、DeepSeek发布V3.2-exp模型,开创性稀疏注意力机制 将API 成本降低一半

DeepSeek发布了名为V3.2-exp的新实验模型,通过创新的‘稀疏注意力’机制显著降低了长上下文操作的推理成本。该模型结合了‘闪电索引器’和‘细粒度标记选择系统’,提高了处理长上下文片段的效率,并在初步测试中展示了API调用成本降低50%的优势。

QQ20250930-085622.png

【AiBase提要:】

⚡ DeepSeek推出V3.2-exp模型,采用稀疏注意力机制优化长上下文处理。

🔍 闪电索引器与细粒度标记选择系统协同提升模型效率。

💰 初步测试显示API调用成本降低达50%,为AI应用提供更经济的解决方案。

4、Anthropic放大招!Claude Sonnet4.5碾压GPT-5,编码界“新王者”诞生

Anthropic发布了Claude Sonnet4.5模型,该模型在编码任务和复杂任务处理上表现出色,成为当前最优秀的编码模型之一。其性能提升显著,支持多平台使用,并且在安全性和对齐性方面也有所增强。

image.png

【AiBase提要:】

✅ Claude Sonnet4.5在编码基准测试中表现优异,实现30小时以上的自主工作时长。

🔧 新增功能如检查点、上下文编辑和内存工具,提升了开发效率与实用性。

🔒 强调安全性,降低风险行为,适用于高风险企业场景。

5、ChatGPT 聊天即买!AI 革命电商:一键下单,告别浏览器跳转

ChatGPT 推出‘即时结账’功能,用户可在聊天界面直接完成单件商品购买,无需跳转链接或浏览器。该功能由 OpenAI 与 Stripe 合作开发的‘代理商务协议’驱动,支持多种支付方式,并将扩展至多件购物车和国际市场。

【AiBase提要:】

💡 ChatGPT 推出‘即时结账’功能,实现聊天界面直接下单。

🔒 ‘代理商务协议’确保交易安全、简易且兼容多种支付方式。

🌐 未来将扩展至多件购物车和国际市场,提升用户体验。

6、OpenAI 即将推出AI版TikTok,全网视频内容将由AI创造

OpenAI即将推出一款基于Sora2模型的社交应用,名为‘AI版TikTok’,所有内容均由AI生成。该应用设计类似TikTok,但视频时长限制为10秒,且支持用户身份认证和肖像使用。此外,OpenAI还注重安全与版权问题,以提升用户体验和防止用户流失。

【AiBase提要:】

🎥 Sora2模型生成的视频时长限制为10秒,专注于短小精悍的内容传播。

🔒 用户可认证身份,Sora2可使用其肖像进行视频生成,并允许其他用户标记使用。

🛡️ OpenAI将发送提醒,确保用户在使用肖像时知情,同时处理版权问题。

7、Claude Code 2.0震撼升级:检查点+VS Code插件,编程效率飙升3倍

Anthropic发布了Claude Code v2.0和Claude Sonnet4.5模型的更新,显著提升了AI在编程中的自主性和集成性。Claude Code通过检查点机制、终端与IDE的优化以及API扩展,为开发者提供了更高效的编程体验。

image.png

【AiBase提要:】

✅ Claude Code v2.0引入了检查点功能,使AI能自动保存状态并支持回滚,提升开发安全性。

🔧 VS Code原生扩展进入beta测试阶段,提供内联差异预览和图形化交互,提高协作效率。

📈 Sonnet4.5模型在OSWorld基准测试中得分高达61.4%,表现出色,尤其擅长构建复杂代理系统。

8、百度地图升级小度想想 2.0:出行智能助手全面进化

百度地图在第七届世界新能源汽车大会上发布了小度想想 2.0,这一版本作为行业首个深度融合的端到端语音语言大模型,为用户提供更智能、个性化的出行服务。其核心优势包括:引入地图出行知识库和实时搜索数据以提升复杂出行意图的理解;构建跨端记忆体以实现多设备间的无缝衔接;以及具备即时、近期及长期记忆能力,从而提供个性化的推荐服务。

【AiBase提要:】

🚗 百度地图引入地图出行知识库和实时搜索数据,提升复杂出行意图的理解与推理能力。

📱 跨端记忆体实现手机、车机等多场景无缝衔接,提升用户体验。

🧠 智能助手具备即时、近期及长期记忆能力,提供个性化推荐服务。

9、蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview

蚂蚁集团推出的Ring-1T-preview是全球首个开源的万亿参数推理大模型,在多项测试中表现优异,超越了多个已知开源模型,接近GPT-5。该模型在自然语言推理和代码生成方面展现出强大的能力,并且团队正在对其进行后续训练以进一步挖掘其潜力。

【AiBase提要:】

🌟 全球首个开源的万亿参数推理大模型 Ring-1T-preview 发布。

🚀 在 AIME25 和 CodeForces 测试中表现优异,接近 GPT-5 的水平。

🧠 团队正在对模型进行后训练,以提升其自然语言推理能力。

10、DeepMind 重磅推出 “帧链” 概念:视频模型或将实现全面视觉理解

DeepMind 提出的 '帧链'(CoF)概念,为视频生成模型带来了突破性进展。该技术使视频模型能够在时间和空间上进行推理,展现出类似语言模型的通用能力。Veo3模型在多个视觉任务中表现出色,显示出强大的感知、建模和操控能力。

image.png

【AiBase提要:】

🎥 帧链技术让视频模型具备了跨时空推理能力,提升了视频生成的智能水平。

🧠 Veo3模型展示了强大的通用视觉能力,能够处理多种未训练的任务。

🚀 DeepMind 预测未来通用视频模型可能取代专用模型,推动机器视觉的新时代。

详情链接:https://papers-pdfs.assets.alphaxiv.org/2509.20328v1.pdf

11、智谱发布开源大模型GLM-4.6:编程能力对齐Claude Sonnet4

智谱AI发布了新一代开源大模型GLM-4.6,其在Agentic Coding等关键能力上实现大幅提升,编程能力已对齐国际顶尖模型Claude Sonnet4,并超越DeepSeek-V3.2-Exp,成为国内最强代码生成模型。同时,GLM-4. 6 在国产化适配方面取得里程碑式进展,成功部署于寒武纪国产芯片和摩尔线程GPU,为构建自主可控的AI生态系统奠定了基础。

QQ20250930-155331.png

【AiBase提要:】

✨ GLM-4. 6 在编程能力上达到国际顶尖水平,对齐Claude Sonnet4。

🚀 成功在寒武纪国产芯片上实现FP8+Int4 混合量化部署,推动国产硬件发展。

🔧 基于vLLM框架,在摩尔线程GPU上以原生FP8 精度稳定运行,提升AI生态自主性。

举报

  • 相关推荐
  • 前DeepSeek研究员罗福莉已加入小米:全力奔赴AGI

    11月12日,“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议,拥有丰富AI研发经历,先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示,将与团队致力于推动AI从语言迈向物理世界,全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

  • ​你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略,3步把曝光拉满

    GEO指数是AI搜索时代的品牌可见度衡量指标,量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同,GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示,高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明,企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控,把握AI搜索新机遇。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • DeepSeek崩了上热搜 页面显示“服务器繁忙”

    截至2025年11月3日,大量用户在微博话题#DeepSeek崩了#下集中反馈,DeepSeek平台出现服务异常状况,引发广泛关注。综合各方信息,此次故障呈现多方面表现,对用户使用造成显著影响。 众多用户表示遭遇服务全面中断问题,在尝试使用平台

  • 品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

    随着AI搜索普及,传统SEO正被GEO(生成式引擎优化)取代。GEO核心是提升品牌在AI生成答案中的可见度,而非获取点击流量。数据显示超60%用户已使用AI搜索,若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase,支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告,并提供内容权威性、语义化表达等GEO优化策略,帮助品牌在AI时代建立竞争优势。

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

  • 反诈从身边小事做起,WEEX的用户安全手册

    本文强调投资安全是智慧起点,提出三点防护建议:一、辨别信息真伪,警惕“内部消息”,通过官方渠道核实;二、养成账户安全习惯,如强密码、双重验证、定期检查设备;三、防范陌生人“帮助”陷阱,不轻信代操作承诺。安全非一时谨慎,而是持续意识,助力投资者理性成长。

  • 百度搜索推出“百度猎户座”AI引擎,涵盖基座模型、搜索AI API、 MCP、垂类优势能力

    2025年11月13日,百度发布“百度猎户座”AI引擎,全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力,基于多智能体架构统一连接信息、工具、服务与模型,融合搜索技术优势与全网MCP生态资源。即日起对外开放,支持企业快速接入打造专属AI应用。同时,文心助手上线个性化记忆功能,视频生成推出“参考生成”玩法,AI短剧创作平台免费提供超30万部IP资源及全流程工具。

  • 千问APP悄悄上线,阿里的AI超级入口也终于来了。

    阿里“千问”APP昨日在应用商店悄然上线,界面从通义APP的双色渐变变为简洁单色设计,功能大幅增强,支持Qwen全系列最新模型。此次品牌整合将阿里分散的AI触点统一为“千问”品牌,实现模型与产品名称对齐,让普通用户首次能在官方APP使用最强Qwen3-Max模型。APP默认开启联网搜索,集成图像编辑、视频通话等场景功能,通过智能意图识别实现一站式服务。这标志着阿里开始认真打技术+品牌两张牌,推动AI技术以更清晰方式触达用户。

  • 阿里千问APP宣布开启公测 号称打造最佳个人AI助手

    阿里巴巴11月17日启动“千问”项目,全面进军AI to C市场,标志着其在人工智能领域的新战略布局。APP公测版已上线各大应用商店,网页和PC版同步推出,国际版即将上线。基于Qwen模型在海外的影响力,“千问”将与ChatGPT等国际产品竞争,展现中国AI实力。Qwen系列模型全球下载量突破6亿次,性能超越Llama等,成为全球最强开源大模型。“千问”致力于打造“会聊天能办事”的个人AI助手,已具备生成报告、制作PPT等能力,未来计划接入地图、外卖、办公等生活场景,成为用户得力助手。

今日大家都在搜的词: