首页 > 原创 > 关键词  > 谷歌最新资讯  > 正文

AI日报:通义开源AI编程大模型Qwen3-Coder;​360将推智能眼镜和AI录音笔;谷歌发布Gemini 2.5 Flash-Lite 稳定版

2025-07-23 15:46 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、谷歌发布全新 Gemini 2.5 Flash-Lite 稳定版:速度与成本的完美平衡

谷歌发布了 Gemini 2.5 Flash-Lite 稳定版,该模型在速度和成本之间取得了良好的平衡,支持高达100万 token 的上下文,并提供了多种高级功能。其定价策略具有竞争力,同时在性能上超越了之前的版本。

image.png

【AiBase提要:】

⚡Gemini 2.5 Flash-Lite 是谷歌最新发布的速度最快、成本最低的 AI 模型,已进入稳定版本(GA)

💰每百万输入 token 定价为0.10美元,输出为0.40美元,音频输入价格降低40%

🔧开发者可通过指定模型名 gemini-2.5-flash-lite 使用新版本,原有预览版别名将于8月25日移除

2、腾讯混元自主研发ASR语音识别大模型接入ima平台

腾讯混元的ASR大模型在ima平台的应用,为用户提供了更高效的语音输入体验。该模型具备强大的语义理解能力,尤其在中英文混杂场景中表现突出,同时支持多种应用场景,如知识库问答和笔记创作。

image.png

【AiBase提要:】

✅ 腾讯混元ASR大模型实现手机App端语音输入功能,提升输入效率。

💡 采用基于双编码器的流式ASR架构,显著提升语义理解能力。

🌐 支持多语言及方言识别,未来将持续优化以满足多样化需求。

3、通义千问开源最新AI编程大模型Qwen3-Coder

阿里云宣布其最新AI编程大模型Qwen3-Coder全面开源,该模型在代码生成和Agent能力上达到顶尖水平,为智能编程技术带来新突破。Qwen3-Coder拥有强大的MoE架构和长上下文处理能力,适用于大规模代码库和动态数据处理。

image.png

【AiBase提要:】

🔥 Qwen3-Coder采用先进的MoE架构,参数量高达480B,支持256K上下文长度。

💡 预训练阶段通过多维度扩展策略提升代码能力,7.5T训练数据中70%为代码。

🚀 开源工具Qwen Code增强解析器和工具支持,提升开发者使用体验。

详情链接:https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507 Qwen Code GitHub:https://github.com/QwenLM/qwen-code

4、360将推智能眼镜和AI录音笔 周鸿祎:眼镜带显示功能

360公司董事长周鸿祎透露,公司将发布AI录音笔与智能眼镜。AI录音笔能够智能分析场景并总结要点,而智能眼镜需要显示功能以创造新的应用场景,如提词器和翻译工具,提升沟通效率。

【AiBase提要:】

🧠 AI录音笔具备智能分析不同场景的能力,能精准总结要点。

👓 智能眼镜需配备显示功能以凸显优势,创造新应用场景。

🌐 智能眼镜可充当提词器和翻译工具,提升沟通效率。

5、国内首个通过主任医师评测的大模型,已在夸克AI搜索上线

夸克健康大模型成功通过主任医师笔试评测,展现了其在医学领域的强大推理能力,并已集成至AI搜索中。该模型通过构建“慢思考能力”和高质量数据训练体系,提升了复杂医疗问题的处理能力,同时拥有专业医师团队支持,确保了模型输出的专业性和准确性。

image.png

【AiBase提要:】

🧠 夸克健康大模型通过主任医师笔试评测,展现医学推理能力。

🔍 构建“慢思考能力”,提升复杂医疗问题的分阶段推导能力。

👩‍⚕️ 拥有千人规模专业医师标注团队,确保模型输出内容的专业性。

6、Hedra Live Avatars震撼发布!每分钟仅0.05美元,视频AI代理开启人机交互新纪元

Hedra Live Avatars的推出标志着AI视频生成技术的重大突破。其以超低成本、超低延迟和高度灵活性为核心优势,为内容创作、教育、客户服务和游戏等领域带来了全新的可能性。

【AiBase提要:】

⚡ 超低成本:每分钟仅0.05美元,大幅降低高质量视频AI代理的准入门槛。

⚡ 超低延迟:低于100毫秒的响应时间,确保实时交互的流畅性和沉浸感。

⚡ 高度灵活:兼容主流大语言模型和文本转语音技术,支持个性化交互体验。

详情链接:https://www.hedra.com

7、谷歌 Gemini2.5革新图像处理:不止识别物体,更能理解抽象概念与关系

谷歌推出的 Gemini2.5AI 模型创新功能“对话式图像分割”,能够通过自然语言提示分析和突出显示图像内容,超越传统图像分割技术,支持关系查询、基于逻辑的指令以及抽象概念的理解。该功能在图像编辑、工作场所安全和保险行业有广泛应用,并为开发者提供了便捷的 API 接口。

image.png

【AiBase提要:】

🧠 能够理解并响应更复杂、更具语义的自然语言指令

🌐 支持多语言提示,并可提供其他语言的物体标签

🔧 开发者可通过 Gemini API 直接访问该功能,返回 JSON 格式结果

8、Meta 推出创新模型 AU-Nets,革新文本处理方式

Meta 推出的 AU-Net 模型通过自回归的 U-Net 结构,实现了对文本的灵活处理,能够从原始字节开始学习并动态组合成多层次的序列表示,为大语言模型的发展提供了新的思路。

【AiBase提要:】

🚀 AU-Net 架构通过自回归方式,动态组合字节形成多层次的序列表示。

📊 采用收缩和扩张路径,确保宏观语义信息和局部细节的有效融合。

⏩ 自回归生成机制提高推理效率,确保文本生成的连贯性与准确性。

详情链接:https://github.com/facebookresearch/lingua/tree/main/apps/aunet

9、苹果 AI 团队内部风波:自主研发与开源梦碎,或将求助第三方大模型!

苹果AI团队因开源计划受阻引发内部不满,高级副总裁费德里吉认为市场已有足够开源模型,且苹果模型在设备端性能不足。同时,苹果推迟Siri更新并考虑与第三方大模型合作,凸显其在AI发展上的战略调整。

【AiBase提要:】

🍎 苹果AI团队开源计划被高层否决,担忧模型性能不足。

⚙️ 苹果坚持设备优先策略,限制AI技术发展潜力。

🤖 苹果或转向与OpenAI、谷歌等第三方大模型合作提升Siri功能。

10、一键生成教学动画!Fogsight AI革新教育演示,抽象概念变秒懂动画

Fogsight是一款基于大型语言模型的AI动画引擎,能够将抽象概念转化为直观、易懂的动画。它通过输入关键词或短语,自动生成包含双语旁白和电影级视觉效果的动画短片,适用于课堂教学、在线课程和科普内容创作。

image.png

【AiBase提要:

🎥 一键生成:用户输入关键词即可生成30秒至90秒的叙事完整动画。

🎨 视觉与趣味兼得:动画具备电影级视觉效果,提升学习兴趣。

🛠️ 交互式界面:支持多轮对话调整动画内容,满足个性化需求。

详情链接:https://github.com/fogsightai/fogsight

举报

  • 相关推荐
  • 智慧养老预告| 让养老更有AI!作为科技邀您共赴WAIC 2025世界人工智能大会

    2025世界人工智能大会(WAIC2025)将于7月26-28日在上海举办,主题为"智能时代 同球共济"。本届大会展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品,涵盖40余款大模型、50余款AI终端、60余款智能机器人及80余款"全球首发"新品。12位诺贝尔奖与图灵奖得主、80余位中外院士、30余国1200位重磅嘉宾将齐聚申城,围绕大模型革命、算力新基建等十大方向展开对话。大会首次将"AI+医疗"列为核心议题,中国主导制定的全球养老机器人国际标准将在会上发布。面对中国3亿老年人口(其中失能半失能老人超4500万)的养老需求痛点,大会将探讨AI赋能智慧养老解决方案,推动"全域数据贯通→精准需求洞察→资源动态调度"闭环,重塑养老产业生态。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 果粉期待五年新品终于有消息!苹果HomePod mini 2有望今年底发布

    苹果于2020年10月推出了第一代HomePod mini,凭借其小巧的体积、出色的音质以及对Siri语音助手和HomeKit智能家居控制的支持,赢得了众多果粉的喜爱。 不过自发布以来,HomePod mini的核心硬件一直维持在五年前的水平,这让许多用户对其升级换代充满期待。 据Mark Gurman最新透露,苹果计划在今年底推出第二代HomePod mini,预计发布时间将在9月iPhone发布会之后至11月之间。 新一代产�

  • 加速AI场景落地和产业赋能 云谷“论数”之人工智能产业应用大会圆满举办

    7月16日,云谷"论数"之"AI·场景落地+产业崛起 就在浙里"人工智能产业应用大会在杭州举行。活动由浙江省工程师学会等多家单位联合主办,聚焦AI规模化落地与科技成果转化。与会专家指出,2025年是AI发展关键年,浙江将深化场景落地实践,打造"应用实践-技术优化-价值创造"闭环。企业代表分享了AI在智能制造、智慧交通等领域的应用案例,强调技术需扎根产业需求。活动还成立了大数据与人工智能专委会,未来将促进产学研协同创新,推动AI在千行百业规模化应用,助力浙江打造全球AI创新高地。

  • 金融壹账通智能客服赋能普惠金融,人工智能+助力新质生产力

    金融壹账通"小壹智能客服机器人"在第七届数字普惠金融大会上入选创新成果。该系统采用"大模型+小模型"组合策略,实现60%以上人工替代率,月均处理客户咨询数千万次。其创新点在于:1)通过自动问答与坐席辅助双模块设计,解决传统金融服务效率瓶颈;2)具备智能化运营能力,可自动生成优化方案、构建训练数据;3)已覆盖银行、保险等20余家金融机构,显著降低运营成本。该成果为中小金融机构提供了可复制的数字化解决方案。

  • 人工智能行业每日资讯汇总:国内值得关注的AI资讯网站推荐

    本文介绍了在AI技术快速发展的当下,如何高效获取行业资讯的方法。推荐了国内5个优质AI资讯平台:量子位(专注国内AI企业动态)、机器之心(学术与产业并重)、AI科技评论(深度行业分析)、AIbase(综合信息聚合)和新智元(聚焦AI产业化)。文章建议通过关注公众号、使用RSS工具、创建浏览器书签等方式提升信息获取效率,强调持续关注权威资讯源能保持知识更新、提

  • 世界人工智能大会SAIL奖TOP30出炉!天鹜科技荣登榜单!

    世界人工智能大会SAIL奖TOP30榜单发布,天鹄科技凭借蛋白质大模型项目入选。该项目通过90亿条极端环境蛋白质序列数据和5亿条酶功能数据,训练出能跨越结构直接预测功能的AI模型AIACCLBIO™。该模型已服务30余家生物医药企业,成功优化30余款蛋白质,其中8款实现产业化应用。典型案例包括:将抗体稳定性提升4倍,每年为企业节省上千万元成本;优化后的急性胰腺炎检测酶成本仅为国际同类产品的10%,并实现千公斤级量产。SAIL奖是世界人工智能大会最高奖项,旨在激励技术创新和产业融合。

  • REDMI Pad 2将于8月1日开售:2.5K屏+9000mAh电池

    红米7月25日发布新一代入门平板Redmi Pad2,主打2.5K高清屏和超长续航,8月1日开售。该产品定位学生和轻办公人群,配备11英寸2.5K LCD护眼屏,通过莱茵低蓝光认证,支持DC调光;内置9000mAh大电池,续航达16小时视频播放或70天待机。硬件升级外,还配备四扬声器、全金属机身和MIUI Pad 14系统,支持多任务分屏等功能,延续品牌高性价比路线,瞄准网课学习、移动办公等场景需求。

  • 日均外卖2.5亿单,MAD都赢麻了

    ​MAD(美团、阿里、京东)外卖大战,经历了连续两个“疯狂星期六”后,正演变为一场颇为罕见的没有输家的战争。 从今年2月11日京东外卖上线算起,外卖“三国杀”已经打了150天。美团、淘宝和京东三大平台你来我往,远未分出胜负,却把整个外卖(含非餐饮品类)市场的总规模打到了战前的三倍以上。 根据各平台的最新战报,美团即时零售订单已达1.5亿单,淘宝闪购

  • INDEMIND:停止堆功能,扫地机器人需要回归第一性原理

    文章批评当前扫地机器人行业过度追求"花哨"功能而忽视核心清洁能力的问题。厂商为差异化竞争不断叠加视频通话、机械手等创新功能,却导致产品复杂化、故障率上升,用户体验未获实质提升。指出行业应回归本质,聚焦感知、规划、决策三大核心能力升级,解决避障不佳、覆盖率低等基础痛点。介绍INDEMIND公司通过立体视觉技术构建三维语义地图,实现厘米级障碍