AI日报：通义开源AI编程大模型Qwen3-Coder；360将推智能眼镜和AI录音笔；谷歌发布Gemini 2.5 Flash-Lite 稳定版

2025-07-23 15:46 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、谷歌发布全新 Gemini 2.5 Flash-Lite 稳定版：速度与成本的完美平衡

谷歌发布了 Gemini 2.5 Flash-Lite 稳定版，该模型在速度和成本之间取得了良好的平衡，支持高达100万 token 的上下文，并提供了多种高级功能。其定价策略具有竞争力，同时在性能上超越了之前的版本。

【AiBase提要:】
⚡Gemini 2.5 Flash-Lite 是谷歌最新发布的速度最快、成本最低的 AI 模型，已进入稳定版本（GA）
💰每百万输入 token 定价为0.10美元，输出为0.40美元，音频输入价格降低40%
🔧开发者可通过指定模型名 gemini-2.5-flash-lite 使用新版本，原有预览版别名将于8月25日移除

2、腾讯混元自主研发ASR语音识别大模型接入ima平台

腾讯混元的ASR大模型在ima平台的应用，为用户提供了更高效的语音输入体验。该模型具备强大的语义理解能力，尤其在中英文混杂场景中表现突出，同时支持多种应用场景，如知识库问答和笔记创作。

【AiBase提要:】
✅ 腾讯混元ASR大模型实现手机App端语音输入功能，提升输入效率。
💡 采用基于双编码器的流式ASR架构，显著提升语义理解能力。
🌐 支持多语言及方言识别，未来将持续优化以满足多样化需求。

3、通义千问开源最新AI编程大模型Qwen3-Coder

阿里云宣布其最新AI编程大模型Qwen3-Coder全面开源，该模型在代码生成和Agent能力上达到顶尖水平，为智能编程技术带来新突破。Qwen3-Coder拥有强大的MoE架构和长上下文处理能力，适用于大规模代码库和动态数据处理。

【AiBase提要:】
🔥 Qwen3-Coder采用先进的MoE架构，参数量高达480B，支持256K上下文长度。
💡 预训练阶段通过多维度扩展策略提升代码能力，7.5T训练数据中70%为代码。
🚀 开源工具Qwen Code增强解析器和工具支持，提升开发者使用体验。
详情链接:https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507 Qwen Code GitHub:https://github.com/QwenLM/qwen-code

4、360将推智能眼镜和AI录音笔周鸿祎：眼镜带显示功能

360公司董事长周鸿祎透露，公司将发布AI录音笔与智能眼镜。AI录音笔能够智能分析场景并总结要点，而智能眼镜需要显示功能以创造新的应用场景，如提词器和翻译工具，提升沟通效率。

【AiBase提要:】
🧠 AI录音笔具备智能分析不同场景的能力，能精准总结要点。
👓 智能眼镜需配备显示功能以凸显优势，创造新应用场景。
🌐 智能眼镜可充当提词器和翻译工具，提升沟通效率。

5、国内首个通过主任医师评测的大模型，已在夸克AI搜索上线

夸克健康大模型成功通过主任医师笔试评测，展现了其在医学领域的强大推理能力，并已集成至AI搜索中。该模型通过构建“慢思考能力”和高质量数据训练体系，提升了复杂医疗问题的处理能力，同时拥有专业医师团队支持，确保了模型输出的专业性和准确性。

【AiBase提要:】
🧠 夸克健康大模型通过主任医师笔试评测，展现医学推理能力。
🔍 构建“慢思考能力”，提升复杂医疗问题的分阶段推导能力。
👩‍⚕️ 拥有千人规模专业医师标注团队，确保模型输出内容的专业性。

6、Hedra Live Avatars震撼发布！每分钟仅0.05美元，视频AI代理开启人机交互新纪元

Hedra Live Avatars的推出标志着AI视频生成技术的重大突破。其以超低成本、超低延迟和高度灵活性为核心优势，为内容创作、教育、客户服务和游戏等领域带来了全新的可能性。

【AiBase提要:】
⚡ 超低成本：每分钟仅0.05美元，大幅降低高质量视频AI代理的准入门槛。
⚡ 超低延迟：低于100毫秒的响应时间，确保实时交互的流畅性和沉浸感。
⚡ 高度灵活：兼容主流大语言模型和文本转语音技术，支持个性化交互体验。
详情链接:https://www.hedra.com

7、谷歌 Gemini2.5革新图像处理:不止识别物体，更能理解抽象概念与关系

谷歌推出的 Gemini2.5AI 模型创新功能“对话式图像分割”，能够通过自然语言提示分析和突出显示图像内容，超越传统图像分割技术，支持关系查询、基于逻辑的指令以及抽象概念的理解。该功能在图像编辑、工作场所安全和保险行业有广泛应用，并为开发者提供了便捷的 API 接口。

【AiBase提要:】
🧠 能够理解并响应更复杂、更具语义的自然语言指令
🌐 支持多语言提示，并可提供其他语言的物体标签
🔧 开发者可通过 Gemini API 直接访问该功能，返回 JSON 格式结果

8、Meta 推出创新模型 AU-Nets，革新文本处理方式

Meta 推出的 AU-Net 模型通过自回归的 U-Net 结构，实现了对文本的灵活处理，能够从原始字节开始学习并动态组合成多层次的序列表示，为大语言模型的发展提供了新的思路。

【AiBase提要:】
🚀 AU-Net 架构通过自回归方式，动态组合字节形成多层次的序列表示。
📊 采用收缩和扩张路径，确保宏观语义信息和局部细节的有效融合。
⏩ 自回归生成机制提高推理效率，确保文本生成的连贯性与准确性。
详情链接:https://github.com/facebookresearch/lingua/tree/main/apps/aunet

9、苹果 AI 团队内部风波：自主研发与开源梦碎，或将求助第三方大模型！

苹果AI团队因开源计划受阻引发内部不满，高级副总裁费德里吉认为市场已有足够开源模型，且苹果模型在设备端性能不足。同时，苹果推迟Siri更新并考虑与第三方大模型合作，凸显其在AI发展上的战略调整。

【AiBase提要:】
🍎 苹果AI团队开源计划被高层否决，担忧模型性能不足。
⚙️ 苹果坚持设备优先策略，限制AI技术发展潜力。
🤖 苹果或转向与OpenAI、谷歌等第三方大模型合作提升Siri功能。

10、一键生成教学动画！Fogsight AI革新教育演示，抽象概念变秒懂动画

Fogsight是一款基于大型语言模型的AI动画引擎，能够将抽象概念转化为直观、易懂的动画。它通过输入关键词或短语，自动生成包含双语旁白和电影级视觉效果的动画短片，适用于课堂教学、在线课程和科普内容创作。

【AiBase提要:
🎥 一键生成：用户输入关键词即可生成30秒至90秒的叙事完整动画。
🎨 视觉与趣味兼得：动画具备电影级视觉效果，提升学习兴趣。
🛠️ 交互式界面：支持多轮对话调整动画内容，满足个性化需求。
详情链接:https://github.com/fogsightai/fogsight

（举报）

相关推荐

关键词：

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative
荐MiniMax M2：所有坑都踩过，才能做出所有人都能用上的Agent

最近一个月，基础模型似乎又有点多起来。但若仔细去看这些模型厂商的动作，大体还是走出了两条路。一种是在诸多难点里选择一个死磕，成为这个单点上的SOTA。这种路线可以快速在开发者群体留下一个明确的印象，但也可能限制住了一家模型公司的“基座”属性。另一种则是在各个模态上全面前进，在一个最全面的基础模型蓝图里不停交出一个个关键拼图。已经有了全

基础模型 MiniMax M2
荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

视觉中国与多家AI公司合作开发可商用视觉大模型，已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频，引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人，仅保留Meta AI。宇树科技推出仿人机器人Unitree H2，具备拟人化设计。谷歌为Gemini集成地图数据工具，可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器，但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能，可分析手机未分享照片。

AI 视觉大模型版权合规
荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

谷歌Gemini 3.0 Pro开始小范围推送，强化推理与多模态能力；百度发布全球领先文档解析模型PaddleOCR-VL，重塑OCR技术格局；爱诗科技完成亿元B+轮融资，ARR突破4000万美元；Anthropic推出Claude“skills”功能，提升AI工作效率；Pinterest推出AI内容限制工具，用户可自定义减少生成式图像；开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL；OpenAI视频生成模型Sora 2上线微软Azure平台，进入公共预览阶段；旅行搜索引擎Kayak推出“AI模式”，简化旅行规划与预订流程。

谷歌Gemini AI日报 DeepMind
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
苹果iPad mini将支持防水：看齐iPhone

苹果正研发新一代防水iPad mini，采用无扬声器开孔设计降低进水风险，防水性能接近iPhone。与iPhone采用粘合剂密封不同，iPad mini通过全新扬声器系统实现防水。现售款无官方防水认证，而新款预计2026年上市，可能搭载OLED屏幕并涨价约100美元（现起售价499美元）。

iPad mini 防水性能
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%，创国产AI编程里程碑；杭州云深处推出全球首款IP66防护全候作业机器人DR02；谷歌Chrome将集成Gemini引发隐私担忧；学者指控苹果使用盗版书籍训练AI，版权争议再起；Liquid AI发布高效稀疏激活模型LFM2-8B-A1B；苹果拟收购Prompt AI布局智能家居视觉技术；AI伴侣应用泄露4300万条用户隐私对话；西湖大学DeepScientist显著提升科研效率。

AI日报快手72B代码模型 KAT-Dev
REDMI电视X 2026今晚发布！REDMI首款高阶分区Mini LED电视

小米10月23日宣布，Redmi电视X 2026系列新品今晚发布，这是Redmi首款高端分区Mini LED电视。相比传统液晶，Mini LED控光更精细，画面明暗对比度高，无烧屏风险，色彩还原更真实。85英寸版本官方定价4799元，补贴后3839.2元，配备640分区、1200nits峰值亮度，支持4K/144Hz及VRR可变刷新率。虽属入门级Mini LED，但相比普通液晶提升显著，适合普通消费者，将推动Mini LED普及。今晚还将发布全新投影仪产品。

小米 REDMI电视X 2026

今日大家都在搜的词：

热文

3 天
7天

AI日报：通义开源AI编程大模型Qwen3-Coder；360将推智能眼镜和AI录音笔；谷歌发布Gemini 2.5 Flash-Lite 稳定版

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

荐MiniMax M2：所有坑都踩过，才能做出所有人都能用上的Agent

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

苹果iPad mini将支持防水：看齐iPhone

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

REDMI电视X 2026今晚发布！REDMI首款高阶分区Mini LED电视

今日大家都在搜的词：

热文

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

一加Ace 6开启预售：售价2599元起

鸿蒙智行：全新问界M7上市36天交付破20000台

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨

20周年款iPhone将配自研相机并搭载自研定制LOFIC传感器

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

网信办宣布开展“整治网络直播打赏乱象”专项行动

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

华为MatePad Pro流金典藏版开卖：售价7799元

站长商机

AI日报：通义开源AI编程大模型Qwen3-Coder；​360将推智能眼镜和AI录音笔；谷歌发布Gemini 2.5 Flash-Lite 稳定版

今日大家都在搜的词：

热文

站长商机

AI日报：通义开源AI编程大模型Qwen3-Coder；360将推智能眼镜和AI录音笔；谷歌发布Gemini 2.5 Flash-Lite 稳定版