11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
今日AI领域亮点:Anthropic发布Claude Opus 4.8,性能提升且价格大降;小红书PC端上线AI搜索助手“点点”,基于真实笔记提供对话式交互;阶跃星辰开源Step 3.7 Flash模型,专注智能体生产化;拼多多加强AI治理,打击涉考作弊工具;Grok Build 0.2.7更新,新增多代理共享终端;小米宣布MiMo旧版模型2026年6月下线;阿里云百炼全面CLI化并开源;腾讯混元推出Hy-Memory智能记忆插件,提升记忆密度与效率。
根据OpenRouter最新数据测算,上周(5月18日至5月24日),全球AI大模型总调用量达28.9万亿Token,较此前一周增长7.4%,连续五周上涨,大模型调用需求仍在持续释放。 在主要上榜模型中,中国AI大模型周调用量达9.223万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量已连续四周超过美国,稳居全球首位,表明中国模型正更深入
本期AI日报聚焦六大热点:谷歌发布性能与效率显著提升的Gemini 3.5 Flash模型并免费开放;阿里云推出面向Agent时代的“千问云”平台,重构大模型服务链路;谷歌与三星联合推出两款集成Gemini的智能眼镜;苹果推出Apple Intelligence驱动的AI辅助功能及Vision Pro眼控轮椅;谷歌发布多模态交互模型Gemini Omni;通义实验室发布Qwen3.7-Max模型,采用正交解耦技术,多项评测国内第一。
谷歌在I/O 2026开发者大会上发布全新Gemini 3.5 Flash模型,宣布对全球用户免费开放。该模型被定义为迄今最强智能体与编程模型,在多项基准测试中超越前代旗舰Gemini 3.1 Pro,输出速度超每秒280 token,是GPT-5.5和Claude Opus 4.7的4倍。其使用成本不到其他前沿模型的一半,大幅缩短开发与审计耗时,兼具高性能与极致速度,对AI应用市场形成冲击。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、爆改漫画师?OpenAI 发布 ChatGPT Images 2.0,单次可生成8张连贯图像OpenAI 推出 ChatGPT Images 2.0,引入推理规划功能,使图像生成更加符合逻辑;支持单次生成8张连贯图像,适用于漫
今日,蚂蚁百灵正式推出 Ling-2.6-flash一款总参数量 104B、激活参数 7.4B 的 Instruct 模型。该模型主打Token 效率(Token Efficiency)”,在保持竞争力智能水平的同时,更快、更省以及更适合大规模真实应用。 据权威三方评测Artificial Analysis 数据,Ling-2.6-flash 展现了突出的 Token Efficiency 优势,以 15M output tokens 实现了 26 分 的 Intelligence Index,在保持较强智能水平的同时,将输出消耗控�
本期AI日报聚焦行业动态:OpenAI紧急上线GPT-5.3 Instant,重点解决“爹味说教”问题;Anthropic推出Claude Code语音编程模式,提升开发效率。马云带领阿里与蚂蚁核心层访问云谷学校,探讨AI浪潮下的教育变革。AReaL v1.0框架发布,降低智能体强化学习开发门槛。阶跃星辰开源Step3.5Flash模型,参数达1960亿。阿里通义千问负责人林俊旸离职,反映大模型人才高频流动趋势。谷歌发布Gemini
Soul AI Lab推出轻量化实时数字人生成模型SoulX-FlashHead,仅1.3B参数,在消费级显卡RTX 4090上实现96FPS高帧率,同时画质达SOTA水平。模型通过“先验”训练机制和时序音频上下文缓存技术,解决了小模型画质差和长视频身份漂移问题,支持电商直播、游戏NPC等广泛场景,权重与代码已全面开源。
本文汇总了AI领域最新动态:蚂蚁集团开源全模态大模型Ming-flash-omni 2.0,在多模态理解与生成方面表现优异;智谱AI的GLM-5模型引发关注,股价飙升;科大讯飞发布星火X2大模型,基于国产算力深耕专业场景;京东推出“AI付”语音支付产品,提升便捷与安全;DuckDuckGo上线注重隐私的免费AI语音聊天功能;阿维塔车载系统升级,融合大模型与华为智驾;ChatGPT上线保险比价应用,冲击传统中介;OpenAI升级研究工具,引入GPT-5.2驱动并新增全屏报告交互体验。
今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�