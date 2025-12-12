首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报：Medeo AI新版视频Agent上线：OpenAI正式发布GPT-5.2；钉钉AI功能大升级

2025-12-12 16:06 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、Medeo AI新版视频Agent震撼登场：自然语言一键改剧本，内容创作从此零门槛！

Medeo AI新版视频Agent通过引入智能Agent架构和自然语言编辑功能，实现了视频创作的动态互动和高效迭代，极大降低了创作门槛并提升了输出品质。

image.png

【AiBase提要:】

🧠 支持复杂提示词和自然语言实时修改，提升视频创作灵活性。

🔄 实现无限迭代编辑，缩短生产周期50%以上。

🌐 多模态融合与智能资产库，优化输出品质并覆盖多语言市场。

详情链接:https://www.medeo.app/

2、钉钉8.1. 10 重磅升级：AI搬进每条消息、每场会议、每台录音设备

钉钉8.1.10版本通过三大核心功能将AI深度融入职场沟通，提升工作效率与跨语言协作体验。

image.png

【AiBase提要:】

🧠 AI灵动回复：智能生成多风格回复建议，提升沟通效率。

🎙️ AI听记AI问答：会议记录升级为可交互协作伙伴，提高信息处理能力。

🌐 DingTalk A1硬件升级：支持实时多语种翻译，助力跨国协作。

3、OpenAI凌晨甩出GPT-5.2：一份PPT三分钟写完，打工人每周直接多出 10 小时“摸鱼额度”

OpenAI在凌晨两点将最新模型GPT-5.2推上生产环境，没有发布会，仅通过一段12分钟的实测视频展示其强大功能。GPT-5.2在多个高频场景中表现出色，如写代码、画表格和做PPT，延迟显著下降，逻辑一致性测试分数提升。同时，OpenAI还宣布了成人模式，支持高风险领域的私有化部署，并强调合规性。

【AiBase提要:】

🚀 GPT-5.2在写代码、画表格和做PPT等高频场景中延迟分别下降42%、37%、51%。

💰 OpenAI的定价策略极具竞争力，一篇3000字行业报告最低只需0.8美分。

🔒 成人模式支持医疗、法律、金融等高风险领域的私有化部署，并满足欧盟AI法案与中国深度合成规定的双重合规。

4、迪士尼押注10亿美元换AI门票：米老鼠、钢铁侠、达斯·维达集体入驻OpenAI Sora

迪士尼与OpenAI达成战略合作，投入10亿美元换取AI技术应用，推动IP内容在生成式AI中的创新使用，标志着传统娱乐巨头首次将核心IP接入AI平台。

【AiBase提要:】

✅ 迪士尼与OpenAI签署三年战略协议，成为Sora短视频生成平台的首个“主要内容授权合作伙伴”。

✅ 迪士尼向OpenAI注入10亿美元现金，并获得追加股权认购权，同时集成ChatGPT API开发新一代交互式内容。

✅ 双方计划在2026年初上线功能，包括Disney+订阅用户可观看官方精选的Sora粉丝生成视频。

5、谷歌Gemini Deep Research大升级:首次开放API让开发者自主构建AI研究应用

谷歌发布了基于Gemini3Pro的Gemini Deep Research研究代理，首次开放API供开发者嵌入SATA模型研究功能，并将其集成到多个核心服务中，展现了其在专业领域的实用价值。

image.png

【AiBase提要:】

🧠 谷歌发布Gemini Deep Research，首次开放API让开发者嵌入SATA模型研究功能。

📊 新型智能代理能处理大量上下文数据，应用于企业尽职调查和药物毒性研究等领域。

🔥 谷歌将深度研究代理集成到谷歌搜索、谷歌财经等核心服务中，推动AI代理代替人类执行搜索任务的未来愿景。

6、Cohere 推出 Rerank 4：四倍扩展上下文窗口，提升企业搜索精准度

Cohere 推出 Rerank 4，其上下文窗口扩展至32K，显著提升了企业搜索的精准度。该模型分为快速版和专业版，适用于不同的应用场景。此外，Rerank 4具备自学习能力，用户可以根据常见用例自定义模型，无需额外标注数据。

image.png

【AiBase提要:】

🌟 Rerank4的上下文窗口扩展至32K，显著提高了检索准确性。

🚀 提供快速版和专业版，以满足不同场景需求。

📈 首个自学习的重排序模型，用户可自定义以提升模型性能。

7、轻松打造 3D 手办！拓竹旗下3D模型平台 MakerWorld接入腾讯混元3D 3.0 大模型

文章介绍了拓竹科技推出的全新3D手办生成器「印你」，该工具依托腾讯混元3D3.0大模型，使用户能够通过上传一张图片快速生成高质量、可打印的3D模型。传统上，制作真人3D手办需要专业设备或大量人工建模，而「印你」将流程简化为三个步骤，极大降低了创作门槛。同时，该技术首次引入3D-DiT分级雕刻，提升了建模精度和细节表现，使得生成的模型更加逼真。

image.png

【AiBase提要:】

🎨 用户只需上传一张图片，即可快速生成专属3D 手办。

🚀 生成器基于腾讯混元3D3.0技术，提升建模精度与细节呈现。

🛠️ 创作过程简化为三步，降低了3D 建模的门槛。

详情链接:https://makerworld.com.cn/zh/makerlab/printU?from=makerlab

8、谷歌NotebookLM升级在即：Ultra会员享50倍限额+无水印PPT，AI笔记革命加速

谷歌旗下AI笔记工具NotebookLM迎来重大更新，针对Ultra会员的权限大幅扩充，这一举措标志着AI辅助生产力工具向高端用户倾斜的趋势愈发明显。NotebookLM作为一款智能笔记生成平台，此次升级不仅提升了生成能力，还优化了用户体验，助力专业人士和创作者高效处理复杂信息。

【AiBase提要:】

🧠 生成限额暴增50倍，告别瓶颈

🤖 接入顶级Gemini模型，智能跃升

📄 笔记来源扩展至600个，数据包容性大增

举报

  • 相关推荐
关键词：

  • 可灵2.6模型上线！语音、音效与画面一键直出 重构AI视频创作工作流

    可灵视频生成2.6模型推出“音画同出”功能，彻底改变了传统AI视频“先无声画面、后人工配音”的工作流程。它能在单次生成中，输出包含自然语言、动作音效及环境氛围的完整视频，重构了AI视频创作工作流，极大提升创作效率。该模型在中文语音生成效果上保持全球领先，支持生成最长10秒的视频，可广泛应用于广告营销、自媒体、电商等内容创作场景。

    ​视频生成模型 ​音画同出 ​AI视频创作

  • 声网对话式 AI Studio 零代码也能快速开发对话式 Agent

    声网在RTE2025大会上发布对话式AI Studio 1.0，定位“零代码生产级智能体工厂”，旨在降低开发门槛。平台通过可视化编排、模块化设计及生态资源整合，让非技术用户也能快速打造专属智能体。它提供场景化模板与插件商店，覆盖智能客服、情感陪伴等热门场景，并支持第三方资源一键集成。平台还与模型评测平台联动，为用户推荐最优模型组合。新增的AI外呼功能支持SIP接入与PSTN连接，便于企业部署智能外呼/内呼。目前产品已上线，新用户可获免费体验包，助力企业低成本快速落地项目。

    ​对话式AI ​智能体工厂 ​零代码

  • 中兴通讯星云AI斩获手机GUI Agent测评榜三项第一

    近日，SuperCLUE发布第二期手机GUI+Agent（离线）评测结果。中兴通讯星云AI凭借卓越性能，在基准评测总榜、应用场景榜和综合指令执行质量三大榜单均获第一，展现了其在AI领域的强劲实力。评测聚焦中文原生场景，贴合用户操作习惯，全面考察智能体在九大核心场景及拓展场景的表现。报告显示，在12个代表性智能体产品中，星云AI以基准评测总分92.27分、应用场景88.18分、综合指令执行质量88.18分的成绩全面霸榜。其搭载的星云AIOS2系统实现全面进化，支持全模态交互与超级搜索，集成多种实用功能，覆盖生活、娱乐、工作等多个场景。未来，中兴通讯将持续引领AI技术创新，推动智能终端体验的进化与升级。

    ​AI测评 ​中兴通讯 ​GUI

  • AI日报：北京发布人工智能产业白皮书；字节发布视频编辑模型Vidi2；快手将发布Kling Omni

    本期AI日报聚焦多项AI领域进展：北京发布人工智能产业白皮书，预计2025年核心产值超4500亿元；字节跳动推出120亿参数视频模型Vidi2，实现视频编辑自动化；西藏首个千亿参数藏语大模型“阳光清言”问世，助力高原AI发展；快手Kling Omni即将发布，支持导演级精准控制，可生成2分钟带原生音频长视频；Meta推出Matrix框架，革新多智能体合成数据生成；国产家庭机器人F1亮相，具备多项家务能力，计划明年上市；豆包App升级语音功能，支持四种方言对话，提升老年人使用体验；豆包手机助手技术预览版发布，旨在提供更高效交互。

    ​人工智能 ​产业白皮书 ​北京

  • 火山引擎分享Data Agent评测体系，提出“评估驱动开发”新范式

    字节跳动数据平台在AICon大会上分享了其Data Agent自动化评测技术。面对大模型在数据行业应用广泛但评估标准不一的挑战，团队提出覆盖技术选型、研发迭代至业务验证的“三层评测框架”，并倡导以“评估驱动开发”新范式推动大模型在数据分析等领域的深度赋能。针对Text-to-SQL等核心任务，团队创新采用基于“语义等价”的自动化评测方法，通过Apache Calcite将SQL转换为抽象语法树，结合图匹配网络计算逻辑相似度，显著提升评估可靠性。未来自动化评测将更注重线上线下一致性、多模态能力覆盖及与模型训练的深度结合，推动大模型应用更精准高效地创造业务价值。

    ​大模型评测 ​Data ​Agent

  • Testin XAgent 智能测试系统：首款通过信通院泰尔实验室认证的AI测试平台

    我国正处于信创深化与数字基础设施重塑的关键时期，软件质量保障面临传统自动化测试维护成本高、稳定性低的痛点。Testin云测自主研发的AI测试平台XAgent通过三大技术突破：融合领域知识的RAG技术提升业务贴合度，基于意图的测试生成降低使用门槛，结合视觉大模型的智能自愈将脚本稳定性从70%提升至95%以上。该平台已获中国信通院泰尔实验室权威认证，标志着AI测试从技术探索迈向规模化应用，为信创产业提供高效可靠的质量保障新范式。

    ​信创 ​新基建 ​质量保障

  • ETC助手宣布行业首款AI智能体助手Agent全面上线！

    近日，ETC助手推出业内首款AI智能体“助手Agent”，标志着ETC服务从“人找功能”的机械操作时代迈入“服务懂需求”的智能伙伴时代。该智能体自4月内测以来已服务超百万用户，将传统服务中繁琐的搜索查询、层层操作革新为“你说它来做”的主动式智能体验。基于8年服务超1.52亿微信用户的实践经验，它精准解决OBU设备安装调试、通行记录查询等高频场景的操作难题，通过三层智能架构实现自然交互，提升用户体验。未来，ETC助手将持续深化AI技术应用，共建智慧交通生态。

    ​AI智能体 ​ETC服务 ​用户体验

  • 智能硬件走进即构，共同提升实时音视频体验

    12月5日，即构科技与深圳市高科技企业协同创新促进会在深圳共同举办“走进即构+AI+智能硬件专场”活动。活动汇聚智能硬件领域创业者、从业者与技术探索者，通过技术探访、主题分享与深度对话，共同探讨AI硬件创新可能。即构科技展示了实时音视频核心技术及AI算法优化能力，并针对行业痛点提出针对性解决方案，包括超低延迟、复杂场景识别、广泛硬件适配及多模态与Agent生态支持。与会嘉宾围绕AI硬件落地中的技术瓶颈、场景拓展与成本控制等核心议题展开讨论，即构技术团队与行业同仁积极互动，为后续技术迭代与方案优化收集宝贵反馈。

    ​AI+智能硬件 ​实时音视频 ​技术探索

  • 离谱！顾客买鞋仅退款发AI视频钻空子 客服一眼识破

    近日，有顾客网购鞋子后以开线为由申请仅退款，客服要求剪坏鞋子再退款，顾客却用AI生成剪鞋视频蒙混，被客服识破。此事引发热议，网友感叹AI成双刃剑，钻空子现象频现。此前央媒曾曝光利用AI造假图骗退款乱象，不少商家因此困扰。专家提醒，商家需保存聊天记录、假图凭证等证据，若金额较大，此类行为可能构成刑事犯罪。

    ​仅退款 ​AI造假 ​电商乱象

  • 易鑫开源汽车金融业首个Agentic大模型,加速AI生态共建

    易鑫集团（02858.HK）宣布开源其自主研发的Agentic大模型YiXin-Agentic-Qwen3-14B，成为汽车金融行业首个开源此类模型的企业。该模型基于通义千问Qwen3-14B深度优化，具备卓越推理、复杂任务处理及多方协作的智能体能力，在多项性能测试中位列榜首，推理成本较行业平均水平降低三分之一。模型搭载金融领域专属知识体系与工具集，覆盖语音交互、车辆评估、风控、欺诈识别等功能，形成全链路智能支撑体系。易鑫提出“底座开放-社区共建-能力迭代-企业部署-生态繁荣”的开源共建模式，通过提供低代码私有化模板，帮助企业快速落地AI应用。此次开源与之前发布的行业首个开源推理大模型YiXin-Distill-Qwen-72B形成“垂直底座+Agentic大脑”双轮技术矩阵，填补了汽车金融领域专业开源AI工具链的空白。

    ​易鑫开源大模型 ​汽车金融AI ​YiXin-Agentic-Qwen3-14B

今日大家都在搜的词：

热文

  • 3 天
  • 7天

站长商机

广告

商务合作 侵权投诉 广告服务 版权声明 招聘

©CopyRight 2002-2020 CHINAZ.COM