AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

2025-07-08 16:26 · 稿源：aibase

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、腾讯混元推出业界首个美术级3D生成大模型Hunyuan3D-PolyGen

腾讯混元3D团队推出的Hunyuan3D-PolyGen模型，通过创新的BPT技术和自回归网格生成框架，解决了传统3D生成算法中布线质量差、面数过高和后期编辑难的问题，显著提升了美术师建模效率。

【AiBase提要:】
🔥 实现上万面复杂几何模型的精准生成，提升建模效率超70%。
💡 采用‘网格序列化-自回归建模-序列解码’三步框架，压缩单个面的表征Token数量74%。
🎯 引入强化学习训练框架，提升模型生成优质结果的概率40%以上。
体验网址:3d.hunyuan.tencent.com

2、阿里HumanOmniV2震撼发布:多模态AI新王者，准确率飙升至69.33%

阿里巴巴集团推出的多模态大语言模型HumanOmniV2在AI领域引发广泛关注。其强大的全局上下文理解能力和多模态推理能力显著提升了复杂场景的理解能力，并在多个权威基准测试中表现出色，展现了其在日常对话、复杂场景感知和用户意图理解方面的优势。

【AiBase提要:】
🧠 HumanOmniV2引入强制性上下文总结机制，提升多模态推理能力。
📊 在Daily-Omni、WorldSense和IntentBench等数据集上表现优异，准确率分别达到58.47%、47.1%和69.33%。
🌐 支持多种语言输入，增强国际化适用性，推动AI在教育、医疗、金融等领域的应用。
详情链接:https://github.com/HumanMLLM/HumanOmniV2

3、钉钉AI表格重磅来袭:1小时处理1000个任务，零门槛搞定数据分析

钉钉AI表格的发布标志着企业办公进入AI驱动的新时代，其智能化优势体现在智能字段处理、零门槛数据分析和自动化流程创建三个方面，同时首创‘表格即文档’功能，大幅提升数据处理效率和用户体验。

微信截图_20250708113649.png

【AiBase提要:】
🧠 智能字段处理:内置80多种字段模板，支持智能提取、分类和匹配信息。
📊 零门槛数据分析:自然语言描述需求，AI自动生成计算公式和图表。
🔄 自动化流程创建:设定触发条件与执行动作，实现全天候智能协作。

4、百度AI团队推出PaddleOCR3.1版关键能力支持MCP

百度AI团队推出的PaddleOCR3.1版本在多语种识别、复杂文档翻译和大模型连接能力上实现了显著升级，为开发者提供了更高效、精准的AI工具。

微信截图_20250708091203.png

【AiBase提要:】
🧠 PP-OCRv5多语种模型支持37种语言，提升识别准确率超30%。
📄 PP-DocTranslation翻译产线可处理复杂文档并实现专业术语精准翻译。
⚙️ MCP服务器功能简化AI应用开发流程，支持标准化协议接入。
详情链接:https://github.com/PaddlePaddle/PaddleOCR

5、微软推出 Deep Research:自动化研究助力科研和商业分析

微软推出了 Deep Research，这是一款支持 API 和 SDK 的智能体，能够自动化研究流程，提高科研和分析效率。它适用于多个领域，如金融和医疗，并且其 API 已经开放，方便开发者集成到自己的应用中。

【AiBase提要:】
🔍 Deep Research 自动化研究流程，显著提升科研和分析效率。
📊 支持多领域应用，金融和医疗报告生成同样适用。
🔗 API 现已开放，开发者可将其能力集成到自有应用中。
详情链接:https://customervoice.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR7en2Ais5pxKtso_Pz4b1_xUQ1VGQUEzRlBIMVU2UFlHSFpSNkpOR0paRSQlQCN0PWcu

6、DLoRAL:开源视频高清化框架，香港理工与OPPO联合打造

文章介绍了由香港理工大学与OPPO研究院联合推出的开源框架DLoRAL，该框架基于扩散模型，实现一步生成高质量视频，突破传统视频超分辨率方法的瓶颈。其双LoRA架构和双阶段训练策略显著提升了视频清晰度和流畅性，为视频内容创作提供了高效工具。

【AiBase提要:】
🎥 DLoRAL采用双LoRA架构，C-LoRA确保时间一致性，D-LoRA增强空间细节。
🔄 双阶段训练策略优化时间连贯性和高频信息，提升画面细节表现。
⚡ 推理速度提升约10倍，性能超越传统方法，助力视频内容创作。

7、谷歌开源MCP Toolbox for Databases:10行代码解锁AI与数据库的无限可能

文章介绍了谷歌推出的MCP Toolbox for Databases，该工具通过模型上下文协议（MCP）简化了AI智能体与SQL数据库的集成流程。它具备极简集成、内置安全机制和广泛的应用场景，为开发者提供了高效、可靠的解决方案。

【AiBase提要:】
🔐 内置连接池管理和身份验证机制，提升数据库交互安全性。
🧩 支持多种数据库，如AlloyDB、Spanner、Cloud SQL等，满足多样化需求。
📦 开源特性，提供详细安装指南和示例代码，便于快速上手使用。
详情链接:https://github.com/googleapis/genai-toolbox

8、微软 Win11即将推出 AI 动态壁纸功能，预览版代码已现

微软在最新 Windows11预览版中引入了 AI 动态壁纸功能的代码，虽然该功能尚未激活，但其潜在的智能更新和时间响应机制引发了广泛关注。这一功能可能为用户带来更加个性化和智能的桌面体验，同时延续了微软在视觉设计方面的探索。

【AiBase提要:】
🌟 微软 Win11新增 AI 动态壁纸功能，已在预览版中添加代码但尚未激活。
🖼️ 用户可选择主题，系统将自动更新壁纸，可能包含时间响应机制。
🔍 相关功能曾在其他设备和系统中探索，当前开发旨在提升 Windows11的视觉体验。

（举报）

相关推荐

关键词：

荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

本期AI日报聚焦多项技术突破：豆包推出全自动有声剧系统，实现98%角色识别准确率；Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成；Soul发布90分钟无中断播客生成模型；360推出全球首款L2-L4全栈智能平台；IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面，移动端AI用户突破7亿，豆包领跑原生应用；PayPal与OpenAI合作使ChatGPT集成支付功能；谷歌推出AI营销工具Pomelli，可基于URL自动生成营销内容。

AI有声剧豆包语音多角色语音合成
荐为什么飞书多维表格成为了品牌进入AI时代的理想切口

今年的双11已经进入正赛阶段，除了往年大家都会关心的优惠玩法、销量增长，AI在电商领域的大规模落地应用也成为一个焦点议题。一个最直观的感受是，电商平台在这个双11开始大规模地推介自家的AI购物功能，向消费者展示更具创新性的购物体验，给到他们尝鲜机会。有用户和朋友体验过之后，在网上给出了「有用」的评价。虽然普及度依然有限，但AI导购走向大众已经�

AI购物双11 电商平台
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

阿里云启动双十一“AI智慧季”大型优惠活动，聚焦企业多元AI场景落地需求，推出7000万tokens大模型免费体验、GPU新客特惠等政策，助力企业降低开发成本。同时提供标准化AI产品与解决方案，覆盖内容创作、智能客服等高频应用场景，并举办系列技术分享活动，携手企业拥抱AI新时代。

AI技术阿里云双十一优惠
荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

本期AI日报聚焦多领域技术突破：美团发布全模态交互模型LongCat-Flash-Omni；阿里通义千问Qwen3-Max上线深度思考功能；百度文心5.0升级多模态生成能力；谷歌确认Gemini3年内发布并整合至苹果Siri；OpenAI向多国开放Sora2视频工具；云存储与AI开发工具持续优化，展现行业加速迭代态势。

AI 多模态实时交互
京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

京东在双11期间升级直播技术，推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示，用户无需额外设备即可旋转查看产品细节；JoyAI生成虚拟偶像Aura，与真人明星跨次元互动，提升趣味性。AI工具还简化直播运营，支持智能脚本和选品。这些技术打破传统直播边界，增强沉浸感和互动效率，引领电商直播创新方向。

京东11.11 立影3D技术 JoyAI大模型
AI日报：腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新；阿里夸克AI眼镜开启预售

本文汇总近期AI领域重要动态：月之暗面再获数亿美元融资，显示资本对国产大模型的信心；Anthropic为Claude推出记忆功能，兼顾个性化与隐私保护；中科大与字节发布MoGA长视频生成模型，实现分钟级高质量生成；腾讯ima2.0升级任务模式，可自主拆解复杂流程；阿里夸克AI眼镜开启预售，融合拍摄与智能功能；微软Copilot新增群聊、记忆与Edge AI模式；Opera推出深度研究代理ODRA提升�

AI 大模型 Kimi
京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

京东在11.11大促期间升级直播技术，推出“立体3D技术”和“JoyAI大模型”等创新，打破传统直播边界。立体3D技术实现裸眼360度商品展示，用户无需额外设备即可旋转查看产品细节；虚拟偶像Aura等跨次元互动增强趣味性。AI全链路工具简化主播运营，提升内容创作效率。这些举措为用户带来沉浸式购物体验，引领直播电商技术革新方向。

京东11.11 立影3D技术 JoyAI大模型
华为官方文档确认：Mate 80全系支持3D人脸

华为Mate80系列预计11月发布，含标准版、Pro版及RS大师版四款。官方文档显示全系支持3D人脸识别，但标准版配置待确认。后摄模组采用居中圆形设计，搭载首发的麒麟9030芯片及鸿蒙OS 6系统，性能将提升。顶配RS版配备6.9英寸双层OLED屏，亮度更高功耗更低，并可能支持eSIM功能。

HarmonyOS 华为Mate80 3D人脸识别

今日大家都在搜的词：

热文

3 天
7天

AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

荐为什么飞书多维表格成为了品牌进入AI时代的理想切口

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

AI日报：腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新；阿里夸克AI眼镜开启预售

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

华为官方文档确认：Mate 80全系支持3D人脸

今日大家都在搜的词：

热文

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

何小鹏：小鹏X9超级增程是全球续航最长的大七座车

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

真我GT8 Pro阿斯顿马丁F1限量版将于11月10日正式开售

真我GT8 Pro阿斯顿马丁F1限量版外观公布

卢伟冰评Air手机：大胆创新但极致薄牺牲用户体验

OPPO ColorOS 16正式版推送：首批适配11款机型

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

vivo OriginOS 6启动公测招募：支持10款机型

魅族22月白天青配色发布：2999元起

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

iQOO Neo11开售2小时销量超前代全天

REDMI官方：REDMI K90超级像素新国屏比2K屏更强

站长商机