首页 > 原创 > 关键词  > OpenAI最新资讯  > 正文

AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

2025-11-05 15:45 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、OpenAI Sora 正式登陆 Android 并推“付费角色”新功能

OpenAI 的 AI 视频应用 Sora 已正式登陆 Android 平台,扩展了其在全球短视频创作领域的影响力。该应用在 Google Play 商店上架,并引入了‘角色 Cameo’功能以应对深伪和版权问题,同时计划未来实现商业化。

image.png

【AiBase提要:】

🚀 Sora 在 Android 平台上推出,拓展了全球短视频创作领域。

🎥 引入‘角色 Cameo’功能,允许用户创建可重复使用的虚拟角色。

💰 OpenAI 计划通过角色商业化,为创作者生态系统提供新商业模式。

详情链接:https://play.google.com/store/apps/details?id=com.openai.sora&pli=1

2、网易云音乐正式推出大模型音效“AI调音大师”

网易云音乐推出的“AI调音大师”功能,利用AI技术动态解析歌曲特征,实现智能适配音效。用户可实时查看音效波谱,并根据个人喜好选择不同的调音关键词,提升听感体验。

image.png

【AiBase提要:】

✨ AI技术解析歌曲特征,智能适配音效。

📊 用户可实时查看音效波谱并进行个性化调节。

🎧 提供“厚重”、“清亮”等调音关键词,满足不同需求。

3、字节火山引擎启动高薪招聘,实质性进军“人形具身机器人”赛道

字节跳动通过火山引擎团队启动高薪招聘,显示出其在人形具身机器人领域的实质性布局。该职位要求极高,薪资远超行业平均水平,表明字节跳动正积极争夺顶尖人才,以推动具身智能的发展。

【AiBase提要:】

🔥 字节跳动启动高薪招聘,聚焦人形具身机器人研发。

💰 薪资高达9.5万至12万元,凸显对顶尖人才的重视。

🚀 布局具身智能,与特斯拉、OpenAI等科技巨头竞争。

4、谷歌Gemini平台即将推出Nano Banana2,图像生成技术再升级

谷歌Gemini平台即将推出Nano Banana2,图像生成技术再升级。该模型将优化视觉生成速度与艺术风格多样性,同时与Gemini3.0系列深度整合,进一步提升多模态处理能力。此外,所有生成图像都将标注水印以确保透明度和合规性。

image.png

【AiBase提要:】

🍎 Nano Banana2将优化视觉生成速度与艺术风格多样性,满足专业创作者需求。

🖼️ 与Gemini3.0系列深度整合,提升多模态处理能力。

🔒 所有生成图像均标注水印,确保透明度和合规性。

5、llama.cpp彻底进化!本地AI迎来多模态革命,Ollama恐被“降维打击”

llama.cpp通过史诗级更新,实现了多模态输入、结构化输出与并行交互等突破,重新定义了本地大模型的使用体验。其现代化Web界面和强大的功能使其成为普通用户也能轻松上手的全能AI工作台。

【AiBase提要:】

🖼️ 多模态能力全面落地,支持图片、音频、PDF等文件解析。

💬 交互体验优化,支持并行聊天、Prompt编辑及移动端友好设计。

⚙️ 创新功能如URL直连对话和JSON结构化输出提升效率。

6、马斯克秘密实验室:收集人类行为数据以训练机器人

特斯拉在加州帕洛阿尔托的秘密实验室正在通过大量数据收集来训练其优化型机器人Optimus。数据收集者每天重复执行各种日常任务,以帮助提升机器人的性能。尽管目前的演示效果不佳,但马斯克计划到年底生产5000台Optimus机器人。

【AiBase提要:】

🤖 特斯拉秘密实验室正在收集人类行为数据,以训练其优化型机器人Optimus。

📋 数据收集者每天重复多次执行日常任务,工作内容包括擦桌子、举杯等。

🚀 马斯克计划到年底生产5000台Optimus机器人,但目前的演示效果不佳,通常需要远程操控。

7、上海首例AI著作权案落槌,美杜莎形象抄袭惹争议

上海首例人工智能大模型著作权侵权案判决结果公布,法院认定被告李某侵犯了原告公司《斗破苍穹》中‘美杜莎’角色的著作权,并要求其停止侵权行为并赔偿经济损失。此案为未来AI创作和著作权保护提供了重要的法律依据。

【AiBase提要:】

📌 被告李某利用平台功能生成与‘美杜莎’角色相似的图片模型,被判定侵犯著作权。

📌 法院认为‘美杜莎’一词不具备独特的商品名称保护,驳回部分原告诉求。

📌 判决结果对AI创作和著作权保护具有重要参考意义。

8、微软正式推出首款自家 AI 图像生成器 MAI-Image-1

微软推出了其首款自主研发的 AI 图像生成器 MAI-Image-1,已在 Bing 图像创作工具和 Copilot 平台上线。该模型在食品、自然场景以及光影效果上表现出色,并且在速度和质量之间取得了平衡,提升了用户的创意实现效率。

image.png

【AiBase提要:】

🌟 微软推出了首款自家开发的 AI 图像生成器 MAI-Image-1,现已在 Bing 和 Copilot 中上线。

🍔 MAI-Image-1特别擅长生成食品和自然场景的图像,并且在光影效果上表现优异。

🔄 微软的 Copilot 正逐步转向使用自家 AI 模型,减少对 OpenAI 的依赖。

详情链接:https://www.bing.com/images/create

举报

  • 相关推荐
  • AI日报:Medeo AI新版视频Agent上线:OpenAI正式发布GPT-5.2;钉钉AI功能大升级

    本期AI日报聚焦多款AI产品更新:Medeo AI新版视频Agent支持自然语言一键改剧本,降低创作门槛;钉钉8.1.10将AI融入职场沟通,提升效率;OpenAI低调上线GPT-5.2,延迟显著降低,逻辑一致性提升,并推出支持私有化部署的成人模式;迪士尼投资100亿美元与OpenAI合作,推动IP在生成式AI中的创新应用;谷歌Gemini Deep Research开放API,供开发者构建研究应用;Cohere推出Rerank 4,上下文窗口扩展至32K,提升企业搜索精度;拓竹科技推出3D手办生成器“印你”,依托腾讯混元3D模型,简化3D建模流程;谷歌NotebookLM升级,为Ultra会员提供更高权限,优化智能笔记体验。

  • Sora的AI TikTok梦迅速破产了

    ​说“ Sora的60日留存率是0”有点夸张,毕竟这个说法诞生时,Sora App上线还不满60天。不过这款明星产品的发展的确不怎么乐观。 根据a16z合伙人前段时间贴出的一组对比,Sora留存率远不如TikTok,首日留存率只有10%,30天留存率只有1%。对比来看,TikTok对应的留存率分别是50%和32%,差距明显。 同时从用户反馈来看,浏览这个App,可能很快会感到厌倦。去看看网络社区讨论,会�

  • 苹果代码泄密:iOS 26.4、iOS 27新功能揭晓

    苹果今天推送了iOS 26.2的正式版,这次很反常,以往一般都是周二的凌晨发布新版本。 这次不仅在周末推送,而且与上次的RC2候选版本是同一周发布,这种情况以往非常罕见。 除了iOS 26.2正式版之外,还有媒体通过新系统泄露的代码,发现了接下来的更新计划,包括iOS 26.4、iOS 27的新功能。 根据报道,苹果对iOS 26.4的计划如下: -推出由苹果智能(Apple Intelligence)驱动的改进

  • 小米17 Pro系列背屏上线电子宠物、动态/视频壁纸功能

    小米17 Pro系列背屏功能迎来新一波更新,新增电子宠物、动态壁纸等玩法,极大丰富了交互体验。用户可个性化设置,支持内容分享、截屏及AI生成壁纸保存。自发布以来,小米持续优化背屏功能,新增动态大头贴、对话翻译、掌机游戏等实用特性,使其兼具趣味性与实用性。此次升级体现了小米的创新实力和对用户需求的精准把握,预计将吸引更多用户体验背屏的独特魅力。

  • OpenAI调查:AI工具使员工日均节省1小时

    OpenAI近期一项针对9000名员工的大型调查显示,其AI工具已帮助许多员工每天节省40至60分钟的专业工作时间,其中数据科学、工程、传播与会计等岗位的感受尤其明显。整体而言,四分之三的受访者认为AI提升了自己的工作速度或输出质量。 尽管AI热潮已持续三年,外界对其是否真正带来生产力红利仍存质疑。MIT今年8月的研究指出,绝大多数企业在生成式AI上的投入未能获得回�

  • OpenAI发布GPT最新升级版本:GPT-5.2来了 OpenAI最新发布

    OpenAI于12月12日正式推出新一代大模型GPT-5.2,付费用户端及API同步开放。该模型首次采用“三版本细分”策略,针对不同需求精准匹配:Instant版主打低延迟、高响应,适合日常交互;Thinking版聚焦复杂任务,如编程、长文档分析,担当企业“智能助手”;Pro版面向高难度专业场景,强调极致准确性与可靠性。技术性能上,GPT-5.2在编程、数学计算、事实准确性及多模态处理等方面均有突破,能直接生成表格、制作PPT、编写多语言代码,显著提升职场效率。据预测,重度用户每周可减少10小时以上重复性工作。此外,OpenAI计划于2026年第一季度上线成人模式,并将所有版本的知识库更新至2025年8月,确保信息贴近现实。此次发布标志着AI开始深入专业场景,成为推动行业变革的核心力量。

  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • 离谱!顾客买鞋仅退款发AI视频钻空子 客服一眼识破

    近日,有顾客网购鞋子后以开线为由申请仅退款,客服要求剪坏鞋子再退款,顾客却用AI生成剪鞋视频蒙混,被客服识破。此事引发热议,网友感叹AI成双刃剑,钻空子现象频现。此前央媒曾曝光利用AI造假图骗退款乱象,不少商家因此困扰。专家提醒,商家需保存聊天记录、假图凭证等证据,若金额较大,此类行为可能构成刑事犯罪。

  • 英特尔创新引领AI NAS:软硬结合引领本地数据智慧管理与多场景创新应用

    2025年12月3日,英特尔在西安成功举办AI NAS解决方案峰会。会议以“芯生万象 智存未来”为主题,携手生态伙伴及渠道客户,共同探讨AI NAS发展方向,并展示面向中小企业、消费者和专业用户的最新方案。会上,绿联、极空间、铁威马、畅网、飞牛等厂商发布了一系列基于英特尔酷睿Ultra处理器和锐炫B60显卡的多场景AI NAS解决方案,旨在打造智能本地数据存储创新模式,为用户提供集存储、管理、算力于一体的智能本地算力中心。英特尔表示,AI NAS正迈入前所未有的发展阶段,通过为NAS注入AI活力,推动其实现颠覆性重塑,成为AI普及的关键载体。

  • AI日报:可灵AI全量上线O1视频大模型;千问APP接入万相Wan2.5

    本文汇总了AI领域的最新动态:可灵AI发布O1视频大模型,支持多模态输入一键生成视频;千问APP接入万相Wan2.5,提升视频创作能力;PixVerse V5.5实现音画同步,简化视频制作;深度求索推出DeepSeek-V3.2,引入稀疏注意力机制降低成本;Runway发布Gen-4.5模型,增强视觉质量;谷歌优化AI搜索体验,Gemini 3 Pro扩展国际市场;Lovart推出Touch Edit功能,实现零门槛图像编辑;蚂蚁数科Agentar入选中国智能体开发赛道第一梯队,展现技术实力。

今日大家都在搜的词: