AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

2025-11-05 15:45 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、OpenAI Sora 正式登陆 Android 并推“付费角色”新功能

OpenAI 的 AI 视频应用 Sora 已正式登陆 Android 平台，扩展了其在全球短视频创作领域的影响力。该应用在 Google Play 商店上架，并引入了‘角色 Cameo’功能以应对深伪和版权问题，同时计划未来实现商业化。

【AiBase提要:】
🚀 Sora 在 Android 平台上推出，拓展了全球短视频创作领域。
🎥 引入‘角色 Cameo’功能，允许用户创建可重复使用的虚拟角色。
💰 OpenAI 计划通过角色商业化，为创作者生态系统提供新商业模式。
详情链接:https://play.google.com/store/apps/details?id=com.openai.sora&pli=1

2、网易云音乐正式推出大模型音效“AI调音大师”

网易云音乐推出的“AI调音大师”功能，利用AI技术动态解析歌曲特征，实现智能适配音效。用户可实时查看音效波谱，并根据个人喜好选择不同的调音关键词，提升听感体验。

【AiBase提要:】
✨ AI技术解析歌曲特征，智能适配音效。
📊 用户可实时查看音效波谱并进行个性化调节。
🎧 提供“厚重”、“清亮”等调音关键词，满足不同需求。

3、字节火山引擎启动高薪招聘，实质性进军“人形具身机器人”赛道

字节跳动通过火山引擎团队启动高薪招聘，显示出其在人形具身机器人领域的实质性布局。该职位要求极高，薪资远超行业平均水平，表明字节跳动正积极争夺顶尖人才，以推动具身智能的发展。

【AiBase提要:】
🔥 字节跳动启动高薪招聘，聚焦人形具身机器人研发。
💰 薪资高达9.5万至12万元，凸显对顶尖人才的重视。
🚀 布局具身智能，与特斯拉、OpenAI等科技巨头竞争。

4、谷歌Gemini平台即将推出Nano Banana2，图像生成技术再升级

谷歌Gemini平台即将推出Nano Banana2，图像生成技术再升级。该模型将优化视觉生成速度与艺术风格多样性，同时与Gemini3.0系列深度整合，进一步提升多模态处理能力。此外，所有生成图像都将标注水印以确保透明度和合规性。

【AiBase提要:】
🍎 Nano Banana2将优化视觉生成速度与艺术风格多样性，满足专业创作者需求。
🖼️ 与Gemini3.0系列深度整合，提升多模态处理能力。
🔒 所有生成图像均标注水印，确保透明度和合规性。

5、llama.cpp彻底进化！本地AI迎来多模态革命，Ollama恐被“降维打击”

llama.cpp通过史诗级更新，实现了多模态输入、结构化输出与并行交互等突破，重新定义了本地大模型的使用体验。其现代化Web界面和强大的功能使其成为普通用户也能轻松上手的全能AI工作台。

【AiBase提要:】
🖼️ 多模态能力全面落地，支持图片、音频、PDF等文件解析。
💬 交互体验优化，支持并行聊天、Prompt编辑及移动端友好设计。
⚙️ 创新功能如URL直连对话和JSON结构化输出提升效率。

6、马斯克秘密实验室：收集人类行为数据以训练机器人

特斯拉在加州帕洛阿尔托的秘密实验室正在通过大量数据收集来训练其优化型机器人Optimus。数据收集者每天重复执行各种日常任务，以帮助提升机器人的性能。尽管目前的演示效果不佳，但马斯克计划到年底生产5000台Optimus机器人。

【AiBase提要:】
🤖 特斯拉秘密实验室正在收集人类行为数据，以训练其优化型机器人Optimus。
📋 数据收集者每天重复多次执行日常任务，工作内容包括擦桌子、举杯等。
🚀 马斯克计划到年底生产5000台Optimus机器人，但目前的演示效果不佳，通常需要远程操控。

7、上海首例AI著作权案落槌，美杜莎形象抄袭惹争议

上海首例人工智能大模型著作权侵权案判决结果公布，法院认定被告李某侵犯了原告公司《斗破苍穹》中‘美杜莎’角色的著作权，并要求其停止侵权行为并赔偿经济损失。此案为未来AI创作和著作权保护提供了重要的法律依据。

【AiBase提要:】
📌 被告李某利用平台功能生成与‘美杜莎’角色相似的图片模型，被判定侵犯著作权。
📌 法院认为‘美杜莎’一词不具备独特的商品名称保护，驳回部分原告诉求。
📌 判决结果对AI创作和著作权保护具有重要参考意义。

8、微软正式推出首款自家 AI 图像生成器 MAI-Image-1

微软推出了其首款自主研发的 AI 图像生成器 MAI-Image-1，已在 Bing 图像创作工具和 Copilot 平台上线。该模型在食品、自然场景以及光影效果上表现出色，并且在速度和质量之间取得了平衡，提升了用户的创意实现效率。

【AiBase提要:】
🌟 微软推出了首款自家开发的 AI 图像生成器 MAI-Image-1，现已在 Bing 和 Copilot 中上线。
🍔 MAI-Image-1特别擅长生成食品和自然场景的图像，并且在光影效果上表现优异。
🔄 微软的 Copilot 正逐步转向使用自家 AI 模型，减少对 OpenAI 的依赖。
详情链接:https://www.bing.com/images/create

（举报）

相关推荐

关键词：

荐Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

小米14 Pro系列10月29日迎来副屏重大更新，新增动态大头贴、实时对话翻译功能，并上线5款动态壁纸及2款复古风格掌机游戏。动态大头贴支持通过副屏拍摄并应用模板增添趣味，对话翻译实现正屏输入与副屏多语言同步显示。壁纸库新增萌系与科技自然主题，掌机游戏搭配专属保护壳提升沉浸体验。此次更新分阶段推送，预计11月中旬覆盖全部用户，持续拓展副屏交互场景。

小米17Pro 动态大头贴实时对话翻译
小米17 Pro系列妙享背屏新功能上线：包括对话翻译、新游戏等

小米17系列妙享背屏功能将于10月29日正式上线，包含四大亮点：动态大头贴支持拍摄生动瞬间并新增明亮风格模板；对话翻译实现正屏输入、背屏即时显示译文；新增动态壁纸提升界面趣味性；配合游戏手机壳可畅玩《愤怒的小鸟》等经典游戏。该背屏还支持倒计时、音乐控制等实用功能，尺寸设计合理，投入超10亿元研发，体现小米对用户体验的重视。

小米17系列妙享背屏动态大头贴
荐短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
荐狂奔20天，全网“追赶”Sora2

Sora2的发布，再次搅动了全球人工智能行业的神经。 9月30日，OpenAI正式推出其视频生成模型的重大升级版本——Sora2，以及基于该模型的社交应用Sora App。与前一代相比，Sora2在物理模拟的精确度、画面逼真度和生成可控性上显著提升，并实现了音频与人物对话的同步生成。这不仅让AI视频更“像真的”，也让视频生产“像写字”一样简单。短短五天，Sora App下载量便突破百万�

Sora2 人工智能视频生成模型
苹果悄然在iOS 26.1中引入新功能：第三方App可以后台备份照片了！

苹果在iOS 26.1中引入用户期待已久的后台自动备份照片功能，允许第三方应用在后台自动上传图像。此前，Google相册、OneDrive等应用因系统限制只能在应用活动时上传，导致备份中断、体验糟糕。新功能通过PhotoKit框架支持，引入后台资源上传扩展协议，确保应用未活动或设备锁定时也能持续上传。系统会控制功耗和网络访问以保障备份一致性和电池效率。开发者需完成配置扩展目标、处理上传任务等步骤来集成此功能，部分操作需用户明确同意。

iOS 26.1 第三方应用备份
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
荐AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；Canva免费放出Affinity专业设计套件

本期AI日报聚焦多项技术突破：OpenAI调整Sora免费额度并推出付费计划，标志视频生成进入商业化；Figma收购Weavy推出AI设计工具；OpenAI发布基于GPT-5的安全研究助手Aardvark；全球首款AI字体生成器Dr Fonts上线；中国信通院发布大模型一体机应用报告；月之暗面推出Kimi Linear架构实现推理速度6倍提升；Canva免费发布Affinity设计套件挑战Adobe；Chrome新增Gemini驱动的图像生成与深度搜索功能。

Sora OpenAI 视频生成

今日大家都在搜的词：

热文

3 天
7天

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

荐Sora App的AI视频社交，给了百度们新希望

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

荐OpenAI也来了，巨头为何决战AI浏览器？

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

小米17 Pro系列妙享背屏新功能上线：包括对话翻译、新游戏等

荐短视频加速跑入AI时代

荐狂奔20天，全网“追赶”Sora2

苹果悄然在iOS 26.1中引入新功能：第三方App可以后台备份照片了！

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

荐AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；Canva免费放出Affinity专业设计套件

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

何小鹏回应机器人IRON里是真人质疑：感谢认可

华为路由X3 Pro今日开启预售：售价1299元起

文件传输工具奶牛快传宣布12月8日正式停止服务

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

站长商机