首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

2025-09-28 16:20 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、快手发布KAT系列Agentic Coding大模型 代码表现出色

快手旗下的 Kwaipilot 团队发布了两款革命性的大模型 —— KAT 系列中的 KAT-Dev-32B 和 KAT-Coder。这两款模型在 Code Intelligence 领域表现出色，分别针对不同的用户需求和应用场景。KAT-Dev-32B 在 SWE-Bench Verified 测试中解决率达到了62.4%，而 KAT-Coder 的解决率则高达73.4%。

image.png

【AiBase提要:】

🧠 KAT-Dev-32B 是一个开源的32亿参数模型，解决率达到了62.4%。

💻 KAT-Coder 作为闭源旗舰模型，解决率高达73.4%，表现卓越。

🌐 KAT-Dev-32B 已在 Hugging Face 平台上线，KAT-Coder 可通过 StreamLake 平台获取 API 调用。

详情链接:https://kwaipilot.github.io/KAT-Coder/

2、腾讯重磅发布 “混元图像 3.0”，开创多模态图像生成新时代

腾讯重磅发布“混元图像3.0”，标志着其在多模态图像生成领域的重大突破，为人工智能生成内容（AIGC）技术的发展注入了新的活力。

image.png

【AiBase提要:】

🧠 混元图像3.0是首个开源的工业级多模态生图模型，具备强大的语义解析能力。

🚀 3.0版本在2.0基础上进一步增强了模型的复杂性与表现力，实现毫秒级响应速度和超写实图像质量。

💡 腾讯混元系列已形成完整的AIGC技术矩阵，涵盖3D生成、定制化图像生成等工具，推动行业创新。

3、苹果悄然研发ChatGPT式应用，Siri即将重大改版

苹果公司正在研发一款类似 ChatGPT 的 iPhone 应用，用于测试 Siri 的重大改版。该应用将提升 Siri 在个人数据搜索和操作方面的效率，同时增强其语音识别和理解能力，为用户提供更智能、人性化的服务。

【AiBase提要:】

🍎 Siri 将通过新应用提升搜索和操作能力，如查找歌曲和编辑照片。

🤖 苹果正在开发类似 ChatGPT 的应用，用于测试 Siri 的全新功能。

📈 未来 Siri 的语音识别和理解能力将显著提升，提供更自然的对话体验。

4、谷歌更新Gemini 2.5 Flash Lite，成为最快的专有模型

谷歌对Gemini系列大型语言模型进行了重要更新，尤其是Gemini2.5Flash和Flash Lite，强调了速度和效率的提升。这些改进展示了谷歌在AI领域的持续进步，并为开发者提供了更多灵活性。

image.png

【AiBase提要:】

🌟 Gemini2.5Flash Lite 成为最快的专有模型，输出速度达每秒887个 token。

🚀 新模型在输出质量和成本效率上显著提升，尤其是 Flash Lite 减少了50% 的输出 token。

🗣️ Gemini Live 的更新增强了语音助手的功能，提高了函数调用的准确性和自然对话的能力。

5、苹果推出新图像模型 Manzano 实现理解与生成双重能力

苹果公司推出的 Manzano 图像模型能够同时处理图像理解和生成，解决了当前开源模型在两者之间选择的难题。该模型采用混合图像标记器，减少了冲突，并在文本密集型任务中表现出色。

image.png

【AiBase提要:】

🌟 Manzano 是一种新型图像模型，能够同时进行图像理解和生成。

🔍 苹果的研究显示，Manzano 在处理复杂文本任务时表现优异，接近商业系统的水平。

⚙️ 该模型采用混合图像标记器，减少了图像理解与生成之间的冲突。

详情链接:https://arxiv.org/abs/2509.16197

6、YouTube Music测试AI音乐主播功能：提供曲目故事和粉丝趣闻，正面迎战Spotify AI DJ

YouTube Music正在测试AI音乐主播功能，为用户播放的音乐提供相关故事、粉丝趣闻和评论解说。这一功能是对Spotify AI DJ的回应，旨在提升用户的沉浸式听觉体验。

【AiBase提要:】

🎥 YouTube Music推出AI音乐主播功能，为用户提供音乐背后的故事和趣味内容。

🎧 Spotify的AI DJ已提供语音评论，YouTube Music试图通过类似功能进行竞争。

🌐 YouTube Labs向所有用户开放，但目前仅限部分美国用户参与测试。

7、从粗糙几何到逼真3D视频：VideoFrom3D重塑图形设计新纪元

文章介绍了VideoFrom3D框架，这是一种通过融合图像和视频扩散模型来生成高度逼真且风格一致的3D场景视频的技术。该框架无需依赖昂贵的配对3D数据集，极大地简化了设计流程，提升了生成效率，并在复杂动态场景下表现出色。

image.png

【AiBase提要:】

🧠 稀疏锚视图生成（SAG）模块利用图像扩散模型，基于参考图像和粗糙几何，生成高质量的跨视图一致锚视图。

🎥 几何引导生成插帧（GGI）模块借助视频扩散模型，在锚视图基础上插值中间帧，实现流畅的运动和时间一致性。

🚀 VideoFrom3D无需依赖昂贵的配对3D数据集，极大简化了设计流程，让设计师和开发者能够更高效地探索创意并快速产出高质量成果。

详情链接:https://kimgeonung.github.io/VideoFrom3D/

8、Moondream3.0发布，多项基准测试超越了 GPT-5 等顶尖模型

Moondream3.0凭借其高效的混合专家架构和轻量化设计，在视觉推理能力上表现出色。它在多个基准测试中超越了GPT-5、Gemini和Claude4等顶级模型，展现了强大的性能。此外，该模型支持开放词汇物体检测、结构化输出以及多场景应用，如安防监控、医学影像和文档处理。开源特性使其易于部署和使用，适合边缘计算环境。

image.png

【AiBase提要:】

🧠 Moondream3.0采用高效混合专家架构，仅激活2亿参数，实现轻量化设计。

🔍 支持开放词汇物体检测和结构化输出，适用于多种复杂场景。

💻 开源设计，适合边缘计算，开发者可轻松解锁其强大功能。

举报

  • 相关推荐
关键词：

  • 拼多多做不成的，快手能成吗？

    快手电商，正式踏入“自营”的河流。 据媒体报道，8月初，快手在APP内上线“快手官方自营旗舰店”，店内销售金豆、金条类产品，主要来自领丰金、紫金、翠绿珠宝三个品牌，它们在快手都开设了官方旗舰店，粉丝量均超过10万。 据了解，旗舰店采用工厂直发模式，减少中间环节，运营方是成都品农科技有限公司，由快手关联公司——北京达佳互联信息技术有限公司100%控

    ​快手电商 ​自营业务 ​工厂直发

  • GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

    随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

    ​AI大模型 ​GEO排名查询 ​生成引擎优化

  • AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

    AI日报今日聚焦多项技术突破：可灵AI推出图片转视频功能，腾讯混元SRPO技术提升图像真实感，IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban，DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能，抖音上线“AI求真”辟谣工具，通用DeepResearch开源模型性能超越国际知名模型。

    ​AI日报 ​数字人 ​视频生成

  • AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

    ​AI ​DeepSeek ​稀疏注意力

  • 困境中的热爱与坚守 快手助推困境非遗传承人打造数字传承新场景

    非物质文化遗产是我国优秀传统文化的文脉基因，快手平台通过“短视频+直播”为非遗传承提供新机遇。数据显示，非遗相关视频年播放量达1780亿次，国家级非遗戏剧项目覆盖率98.2%。年轻群体的广泛参与为传统技艺注入活力，但偏远地区传承人仍面临收入低、传播渠道窄等困境。快手公益基金会发起“非遗传习学堂”项目，通过系统性帮扶助力传承人提升数字化能力、拓展市场。例如，青海果洛的藏文书法传承人登德日、扎木念演奏者汉措等通过平台扩大传播，实现技艺传承与收入增长。未来，快手将持续探索“科技+公益”模式，推动非遗在新时期焕发活力。

    ​非物质文化遗产 ​传统文化 ​非遗传承

  • 快手联名《武林外传》推出中秋礼盒 邀你重返同福客栈

    快手携手经典喜剧IP《武林外传》推出中秋主题礼盒，包含“吃喝礼”与“玩乐礼”两款。礼盒设计复古精致，融入剧中元素如铜锁、同福餐具、定制麻将等，唤起剧迷集体记忆。这不仅是一份节日礼物，更是对近二十年情怀的致敬，邀请“老铁”重温江湖温情。快手借此连接数字社区与现实情感，传递简单真挚的陪伴与欢乐。

    ​中秋礼盒 ​武林外传 ​快手

  • AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

    ​AI日报 ​美团大模型 ​LongCat-Flash-Thinking

  • AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态：阿里云开源轻量级AI代理DeepResearch，性能媲美OpenAI；夸克推出国内首个全阶段医师考试大模型测试集；微软Copilot将上线类ChatGPT记忆管理功能；迪士尼等巨头起诉MiniMax侵犯版权；OpenAI提升ChatGPT搜索准确性；Notion推出个性化AI助手；谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5；Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

    ​AI ​开源 ​轻量级

  • 快手联合健康中国发起心理健康问题征集 将邀请专家直播解答

    快手联合健康中国发起心理健康问题征集活动，9月15日起向全国网友征集心理困扰，10月10日世界精神卫生日当天邀请专家直播答疑。活动通过短视频+直播形式传播心理健康知识，并首次在直播前征集问题针对性设计内容。快手还组建心理危机干预小组，通过AI预警系统识别并联动警方7×24小时干预有轻生倾向用户。2024年5月上线的“种太阳计划”借助平台技术优势识别干预风险人群，联动媒体、专家和创作者开展心理健康科普直播，帮助公众走出心理阴霾。

    ​心理健康 ​精神卫生 ​专业指导

  • 无语哥中国行快手独家直播圆满落幕，超1亿人次共同鉴跨文化幽默盛宴

    意大利网红“无语哥”通过快手平台在中国天津、重庆、广州三城展开直播活动，累计观看人次突破1亿。活动以地方特色为载体，如天津街头歌唱、重庆火锅烟火气、广州咏春拳等，展现真实市井生活。平台策划话题互动、达人联动，推动内容裂变传播，成功构建“幽默无国界”的文化对话。此次实践凸显“直播+短视频+文旅”融合模式的潜力，印证了真实生活场景是最动人的传播语言，民间互动能架起坚固的文化桥梁。

    ​无语哥 ​快手直播 ​文化对话

今日大家都在搜的词：

热文

  • 3 天
  • 7天

站长商机

广告

商务合作 侵权投诉 广告服务 版权声明 招聘

©CopyRight 2002-2020 CHINAZ.COM