首页 > 原创 > 关键词  > AI应用开发最新资讯  > 正文

AI日报:Meta开源可交互3D模型SAM 3D;联想将推出个人超级智能体;华纳音乐与 Udio 达成版权和解

2025-11-20 15:29 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、火山引擎登顶 Gartner 中国区“落地能力”榜单,全球排名第五

火山引擎凭借豆包大模型与火山方舟平台,在Gartner发布的《AI 应用开发平台魔力象限》中位列‘挑战者’象限首位,并在‘落地能力’维度全球排名第五、中国第一。其优势在于模型-工具-算力-场景闭环完整,已帮助多个行业头部客户构建多模态应用

【AiBase提要:】

🔥 火山引擎在Gartner的AI应用开发平台魔力象限中跻身‘挑战者’象限首位。

📊 2025年上半年,火山引擎国内公有云大模型服务市场份额达49.2%。

🌐 火山引擎计划继续扩大多模态应用工具链投入,加速海外落地。

2、OpenAI 推出免费 ChatGPT,为美国 K-12 教师提供支持

OpenAI 推出了专为美国 K-12 教师设计的免费 ChatGPT 工具,旨在帮助教育工作者更高效地准备课程材料、进行合作以及掌握人工智能技术。该工具提供了安全的工作环境和隐私保护功能,并与学校管理功能相结合。此外,OpenAI 还推出了青少年 AI 素养蓝图,以促进伦理化的人机协作使用。

【AiBase提要:】

📚 OpenAI 免费提供 ChatGPT 给认证的 K-12 教师,服务至 2027 年。

⏰ 使用 AI 工具的教师平均每周节省约 6 小时的工作时间。

🛡️ OpenAI 推出青少年 AI 素养蓝图,推动伦理化的 AI 使用。

3、谷歌地图Gemini升级:AI行前指南+地标导航+充电桩预测

谷歌地图引入Gemini模型,推出四项AI功能,提升用户体验,包括行前须知、地标导航、充电桩预测和匿名评论,所有功能免费开放。

image.png

【AiBase提要:】

🚗 行前须知功能可自动汇总评论与网络信息,提供预订方式、隐藏菜单及最佳停车位提示。

🧭 地标导航通过实时交叉比对地点数据与街景图像,提供更直观的导航指引。

🔋 充电桩预测结合历史与实时数据,帮助电动车主避开充电高峰。

4、联想将推出个人超级智能体 杨元庆称并不认为存在人工智能泡沫

联想在2025/26财年第二财季实现了显著增长,各业务板块均表现亮眼。同时,联想计划推出个人超级智能体,并对AI的发展前景持乐观态度。

【AiBase提要:】

🧠 联想IDG智能设备业务集团营收达1081亿元人民币,同比增长12%。

🤖 联想将推出个人超级智能体,实现听你所听、见你所见、记你所记。

💡 杨元庆认为AI不会出现泡沫,下一阶段将是AI的普及化阶段。

5、华纳音乐与 Udio 达成版权和解,推出 AI 音乐创作平台

华纳音乐集团与 Udio 达成版权侵权案件的和解,并计划在2026年推出一个全新的 AI 音乐创作服务。该平台将利用授权音乐训练生成式 AI 模型,允许用户使用艺术家的声音和作品进行混音、翻唱及新歌曲创作,同时确保艺术家获得应有的信用和报酬。

【AiBase提要:】

🌟 华纳音乐与 Udio 达成版权和解,计划推出 AI 音乐创作平台。

🎶 新平台将允许用户创作混音和翻唱,并确保艺术家获得报酬。

💰 Suno 宣布完成2.5亿美元融资,表明 AI 音乐技术受投资者青睐。

6、QQ浏览器电脑端发布v19.8.5版本 AI+小窗功能全面升级

QQ浏览器电脑端v19.8.5版本更新,重点优化了菜单布局、AI+小窗功能和标签页管理,同时新增网页语音朗读功能,提升了用户的浏览体验和工作效率。

微信截图_20251120135802.png

【AiBase提要:】

🔧 菜单与功能区布局优化,常用工具一键可达。

🧠 AI+小窗支持多任务处理,提升工作效率。

🔊 新增网页语音朗读功能,满足多样化需求。

7、Meta开源SAM 3D:单图秒生可交互3D模型,空间理解刷新SOTA

Meta AI发布了Segment Anything系列的最新模型SAM3D,能够通过单张2D照片生成高质量的3D资产。该模型在物体和人像重建方面表现出色,并且在多个基准测试中优于现有方法。

【AiBase提要:】

🍎 SAM3D Objects与SAM3D Body分别面向通用物体/场景和人像重建,仅需一张2D照片即可生成高质量3D模型。

🧠 核心采用“空间位置-语义”联合编码,为每个像素预测3D坐标与表面法向,提升物理正确性。

🚀 Meta已将SAM3D集成至Quest3与Horizon Worlds创作工具,并计划推出实时手机端推理SDK,支持开发者调用API。

详情链接:https://ai.meta.com/blog/sam-3d/

8、Prime Video上线AI视频回顾:自动生成“剧场级”季度精华,首批覆盖《辐射》《杰克·瑞安》

亚马逊Prime Video推出了AI生成功能‘Video Recaps’,利用大模型自动剪辑、同步旁白与配乐,为观众制作‘剧场级’季度精华短片。该功能以Beta形式上线,首批支持《辐射》《杰克·瑞安》等Prime Originals,并计划扩展至更多内容。

image.png

【AiBase提要:】

🎥 Prime Video推出AI视频回顾功能,自动生成2-5分钟的季度精华短片。

🔄 AI模型可识别关键场景、角色弧与高潮冲突,自动生成脚本并匹配套路音乐。

🔒 当前AI仅用于‘回看辅助’,不参与正片创作,缓解艺术家对版权与就业的担忧。

举报

  • 相关推荐
  • vivo S50全系标配3D超声波指纹

    vivo S50系列将于12月发布,全系标配第二代3D超声波指纹识别技术,成为同档位首款普及该功能的机型。该技术具备三大优势:湿手解锁灵敏、暗光无强光刺激、解锁区域上移更符合人体工学。防护性能突破行业常规,支持IP69与IP68双认证防水,可承受1.5米水深浸泡及高温高压冲洗。产品含标准版与Pro+mini版,搭载潜望式长焦镜头,其中Pro+mini版采用第五代骁龙8平台,跑分超300万。机身内置5500mAh电池,配合120W闪充,实现"充电10分钟,游戏3小时"的续航表现。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 华为Mate 80标准版首次支持3D人脸识别:看齐Pro

    博主数码闲聊站爆料,华为Mate 80全系支持3D人脸识别,包括标准版,这在Mate系列史上还是第一次。 已知Mate 70 Pro系列支持3D人脸识别,其正面采用三挖孔形态,预计Mate 80系列正面也将是三挖孔设计,而且该机还将支持侧边指纹识别。 据悉,全新的华为Mate 80系列共有4款机型,分别是Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS非凡大师。 其中Mate 80和Mate 80 Pro屏幕尺寸是6.75英寸,M

  • 遇到平板电池问题,试试联想想帮帮AI服务智能体的AI智修功能

    联想推出“想帮帮AI服务智能体”,通过AI智修功能解决手机/平板常见故障。用户只需在APP中输入问题,AI即可自动检测电池耗电快、断触、游戏卡顿等异常,结合知识库智能诊断并执行修复。系统具备主动预警、自动修复能力,严重故障时可协助预约售后。该服务覆盖设备全生命周期,提供快速定位、即时处理的一站式解决方案,让用户告别手动排查烦恼。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 1299元起售!iPhone Pocket发布:采用3D 针织一体结构

    今日下午,苹果发文称,三宅一生携手苹果正式推出新配件iPhone Pocket。 其中短带款提供八种色彩外观:柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。 长带款提供三种色彩外观:宝石蓝色、肉桂色和黑色。 短带款iPhone Pocket售价为1299元,长带款售价为1899元。

  • AI日报:谷歌Gemini 3 Pro Preview模型上线;Cloudflare文件异常致全球宕机;百度Q3 AI收入96亿元

    谷歌发布Gemini 3大模型及Antigravity AI开发平台,支持参数灵活调整;Cloudflare因配置异常致全球服务中断6小时;微软测试AI文件连接器,允许Claude直接读取本地文件;百度Q3 AI收入96亿元,萝卜快跑订单激增;小米AI眼镜新增直播与语音控制功能;TikTok推出AI内容推荐调节选项;微软将Copilot全面集成至Office应用;谷歌推出实时生成交互界面的Generative UI技术;Manus发布Browser Operator,将浏览器升级为全功能AI代理。

  • 告别电脑与线缆!Toucan无线一体式3D扫描仪双十一首发特惠,锁定11550元尝鲜价

    积木易搭发布新款无线一体式3D扫描仪Toucan,已在京东、天猫旗舰店首发上线。新品具备无线一体设计,无需连接电脑即可独立完成扫描建模全流程,支持大、中、小不同幅面物体扫描,精度达0.03mm,并搭载双镜头模组与双功率模式,适应多种作业场景。首发期间优惠价11550元,活动持续至11月30日,助力3D创作者高效完成数字内容制作。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 数据分析迎来“智能体”时代,火山引擎披露多智能体架构性能优化关键

    在2025智能大会暨第18届中国R会议上,火山引擎专家分享了Data Agent在业务数据分析中的性能调优实践。报告指出,数据分析正从传统商业智能向数据智能体跃迁,其核心能力扩展到复杂任务的自主执行与决策。Data Agent通过工具生态、运行时管理与安全环境设计,实现全场景覆盖,具备多步骤任务规划与动态调整能力,显著降低企业数据分析门槛并提升洞察效率。未来该技术将融合多模态理解与实时计算能力,在金融、制造、医疗等领域形成规模化落地,成为企业数据价值释放的核心引擎。

今日大家都在搜的词: