首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

2025-09-02 15:29 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、腾讯开源具备原生3D重建能力的超长程世界模型:HunyuanWorld-Voyager

腾讯发布的HunyuanWorld-Voyager是一种创新的视频扩散框架,能够基于单张输入图像生成具有世界一致性的3D点云,并支持沉浸式探索。该模型在视频生成质量和场景重建效果上表现出色,展现了其在AI驱动的VR、游戏和仿真空间智能领域的潜力。

【AiBase提要:】

🌍 HunyuanWorld-Voyager能基于单张输入图像生成具有世界一致性的3D点云,支持用户沉浸式探索。

🎥 模型同时生成精确对齐的深度信息和RGB视频,适用于高质量三维重建。

🏆 在多个测试中,HunyuanWorld-Voyager在视频生成质量和场景重建效果上均优于其他模型。

2、通义实验室推出新一代智能体开发框架AgentScope 1.0

通义实验室推出的AgentScope 1.0是一个专注于多智能体开发的开源框架,提供全生命周期解决方案,包括开发、部署和监控。其三层技术架构(核心框架、Runtime和Studio)支持独立使用,具备实时介入控制、智能上下文管理和高效工具调用三大能力,确保了智能体的安全性和运行效率。

image.png

【AiBase提要:】

🌟 AgentScope 1.0是新一代智能体开发框架,专注于多智能体的开发,提供全生命周期解决方案。

🚀 具备实时介入控制、智能上下文管理和高效工具调用三大能力,提高智能体的开发和运行效率。

🔒 AgentScope Runtime 提供安全的工具沙箱和高效的部署运行引擎,确保智能体的安全与稳定。

详情链接:https://github.com/agentscope-ai/agentscope

3、即梦AI系列模型开放API,为开发者提供一站式图像与视频生成服务

即梦AI与火山引擎全面开放API服务,为企业提供强大的图像和视频生成能力,助力创意转化为现实。

【AiBase提要:】

🎨 文生图3.0、文生图3.1等模型开放API服务,助力企业高效生成图像和视频内容。

🎬 视频生成3.0pro与动作模仿DreamActor M1等模型支持多样化的创作需求。

💼 即梦AI通过火山引擎赋能企业级市场,推动商业应用的创新发展。

4、腾讯开源翻译巨头 Hunyuan-MT-7B:斩获 WMT2025 三十项冠军,翻译界的新霸主!

腾讯推出的 Hunyuan-MT-7B 在 WMT2025 中表现卓越,成为翻译领域的佼佼者,展现了其在多语言处理上的强大实力,并通过开源方式推动技术的广泛应用和发展。

【AiBase提要:】

🧪 Hunyuan-MT-7B 在 WMT2025 中斩获 30 个语种的第一名,展现强大的翻译能力。

🌐 支持 31 种语言,包括多种小众语言,体现腾讯在自然语言处理领域的技术积累。

🚀 开源模式推动技术发展,助力全球交流与合作。

5、苹果推出 STARFlow:全新 AI 图像生成技术想力压 DALL-E 与 Midjourney

苹果公司推出的 STARFlow AI 图像生成系统在技术上实现了突破,结合了正则化流和自回归变换器,提高了高分辨率图像生成的效率和质量。该系统通过深浅设计和潜在空间操作优化模型性能,并且与学术机构合作推动 AI 技术的发展。

image.png

【AiBase提要:】

🧠 STARFlow 结合正则化流和自回归变换器,提升图像生成效率。

💡 通过深浅设计和潜在空间操作优化模型表现。

🚀 苹果与学术机构合作推动 AI 技术发展,未来应用前景广阔。

详情链接:https://arxiv.org/pdf/2506.06276

6、苹果 FastVLM 上线:5分钟体验85倍速视觉 AI,数据永不出设备

苹果推出的 FastVLM 视觉语言模型现已向公众开放,基于 Apple Silicon 芯片的 Mac 可直接体验。FastVLM 在视频字幕处理速度上提升了85倍,同时体积缩小了3倍以上,支持在浏览器中加载轻量级版本,无需复杂安装过程。其本地化运行设计确保数据永不离开设备,为隐私保护提供了理想解决方案。

【AiBase提要:】

🍎 FastVLM 提供近乎即时高分辨率图像处理能力,提升视频字幕处理速度85倍。

💻 支持在浏览器中加载轻量级版本,无需复杂安装即可体验强大功能。

🔒 数据完全在本地运行,确保隐私安全且支持离线使用。

7、新模型 CoMPaSS-FLUX.1:提升Flux文本到图像生成的空间理解能力

CoMPaSS-FLUX.1是一种基于 FLUX.1 文本到图像扩散模型的 LoRA 适配器,旨在显著提升生成图像时对物体空间关系的理解能力。该模型在多个基准测试中表现出色,特别是在处理物体之间的空间关系方面取得了显著进展。

image.png

【AiBase提要:】

🌟 CoMPaSS-FLUX.1提升了文本到图像生成的空间理解能力,尤其在处理物体之间关系上表现突出。

📊 性能评估显示该模型在多个基准测试中都有明显提升,同时保持了高质量的生成效果。

📚 模型训练使用了严格筛选的数据集,确保生成图像在视觉上具有良好的空间关系和清晰度。

详情链接:https://huggingface.co/blurgy/CoMPaSS-FLUX.1

8、Cherry Studio 与硅基流动深度合作,免费提供 Qwen38B 模型

Cherry Studio 与硅基流动深度合作,为用户提供免费的 Qwen38B 模型,进一步丰富其多模型支持能力,提升 AI 交互体验。

【AiBase提要:】

🧠 Cherry Studio 与硅基流动合作,免费提供 Qwen38B 模型,提升 AI 交互体验。

💻 支持多平台及多种主流大语言模型,简化用户使用流程。

🚀 提供跨行业智能助手,增强生产力和个性化功能。

9、谷歌推全新Gemini API URL Context 功能 可详解网页内容

谷歌推出的 Gemini API URL Context 功能,让 AI 能够精准解析和理解网页内容,极大简化了开发者的流程,提高了信息提取效率。

【AiBase提要:】

🌐 专为开发者设计的 API,可解析和理解网页中的所有内容,包括 PDF、图片等多种格式。

📊 支持处理高达34MB 的网页内容,能够提取关键数据如“总资产”和“总负债”。

🔒 无法突破付费墙,且对专用工具如 YouTube 视频和 Google Docs 不进行处理。

详情链接:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/

10、Youtu-Agent 智能体框架正式开源,引领 AI 发展新潮流

腾讯优图实验室开源了Youtu-Agent框架,该框架专为构建、运行和评估自主AI智能体而设计,具备高性能、灵活性和对开源模型的支持。其在多项基准测试中表现优异,成为AI社区的重要工具。

image.png

【AiBase提要:】

✅ Youtu-Agent框架支持多种任务,如数据分析和文件处理,提升开发效率。

🚀 模块化设计使开发者能够灵活调整智能体行为,便于定制化应用。

🌐 开源策略鼓励全球开发者参与,推动AI技术的创新与协作。

详情链接:https://github.com/TencentCloudADP/Youtu-agent

举报

  • 相关推荐
  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • MYSKI发布全球首款3D动捕AI滑雪传感器重构滑雪训练量化分析范式

    MYSKI团队推出全球首款基于3D动捕与AI算法的滑雪智能传感系统,通过高精度传感器与AI深度融合,实时捕捉、三维重现并深度解析滑雪动作,将主观“体感”转化为可量化数据。系统仅重18克,支持-30℃环境10小时续航,提供实时语音陪练、3D姿态回放、多维数据解析等功能,从纠错到肌肉记忆形成完整训练闭环,推动滑雪教学从经验驱动转向数据驱动。

  • AI日报:Claude Opus 4.8上线;小红书PC端上线AI搜索助手点点;阶跃星辰开源Step 3.7 Flash 大模型

    今日AI领域亮点:Anthropic发布Claude Opus 4.8,性能提升且价格大降;小红书PC端上线AI搜索助手“点点”,基于真实笔记提供对话式交互;阶跃星辰开源Step 3.7 Flash模型,专注智能体生产化;拼多多加强AI治理,打击涉考作弊工具;Grok Build 0.2.7更新,新增多代理共享终端;小米宣布MiMo旧版模型2026年6月下线;阿里云百炼全面CLI化并开源;腾讯混元推出Hy-Memory智能记忆插件,提升记忆密度与效率。

  • AI日报:千问全面开放第三方Agent与Skill;字节开源统一框架 Bernini;OpenAI 推出 Sites 功能

    AI日报今日要点:1. 阿里千问全面开放第三方Agent与Skill,瑞幸、东航等首批接入,升级为"超级Agent"个人助手;2. 字节跳动开源Bernini框架,通过"先理解、再生成"机制解决视频编辑画面失控问题;3. OpenAI推出Sites功能,可将创意秒变互动网站;4. 微软Win11隐藏AI卸载选项,可释放超2.5GB硬盘空间;5. DeepSeek首轮融资估值或达4000亿元,腾讯、宁德时代拟参投;6. OpenAI发布六行业Codex工作流插件;7. 谷歌推出Android虚假来电检测功能;8. 亚马逊Ring门铃人脸识别功能遭集体诉讼。

  • AI日报:小米上线招聘Agent;腾讯发布AI创作平台Craft;抖音严打AIGC违规带货

    今日AI领域亮点:小米上线招聘Agent,基于大模型提升校园招聘效率;腾讯发布AI游戏创作平台“代号Craft”,支持自然语言一键生成游戏世界;科大讯飞推出讯飞AI眼镜,内置GlassClaw助手,售价4299元;抖音生活服务公布“消保”成绩单,先行赔付2.4亿元,严打AIGC违规带货;国产具身大模型Wall-OSS-0.5开源,实现零样本部署;阿里语音大模型Fun-Realtime-TTS-Preview获全球第五、国产第一;ElevenLabs发布Music v2,支持多风格切换与商业授权;OpenAI扩大广告平台访问,向更多广告主开放免费ChatGPT精准投放。

  • 国际评测夺冠,考拉悠然无界世界模型打造空间智能核心竞争力

    2026年5月29日,WorldArena视频质量赛道最终结果揭晓。考拉悠然联合上海码极客、同济大学空间智能团队打造的悠然无界世界模型,开源版BLM获全球第一,闭源版BWM-Fast获全球第二。该模型以数据增强、智能增广策略提升数据利用效率,基于DiT架构引入首帧引导、动态记忆及双通路动作控制,在时空连贯性、动作可控性与物理一致性上全面领先,大幅降低训练成本。WorldArena从六大

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • AI日报:快手App上线AI购物助手;Kimi Work开启内测;微信互联多厂商推A2A助手

    本期AI日报聚焦多项创新:快手App上线AI购物助手,提升导购效率;月之暗面推出本地Agent工具Kimi Work,助力知识工作者;微信与多家手机厂商合作A2A助手,提升操作效率;豆包计划推出付费专业版,提供六大垂直服务;亚马逊App新增AI生成图片功能,深化视觉搜索;中兴通讯与腾讯达成战略合作,AI云电脑搭载原生Work Buddy;谷歌AI Edge Gallery登陆Mac,支持本地离线运行大模型;红魔游戏平板5 Pro搭载185Hz高刷屏,集成豆包大模型。

  • AI日报:字节联合港科大发布MMProLong;腾讯ima宣布开放Copilot;红果短剧取消AI仿真人短剧保底政策

    本期AI日报聚焦八大热点:1. 字节跳动联合港科大发布MMProLong模型,显著提升长文档LMM训练效率;2. 蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收,实现边推理边行动;3. 腾讯ima全面开放Copilot并推出知识技能分享平台;4. 红果短剧取消保底政策,行业转向内容竞争;5. 面壁智能联合清华发布中国首个1.58-bit大模型BitCPM-CANN;6. xAI推出1.5万亿参数Grok V9-Medium,专注编程AI赛道;7. 高德“问店选址”Skill接入钉钉悟空,赋能商家开店决策;8. OpenAI斥巨资在新加坡建立首个海外AI实验室。

  • 海尔智慧家庭“3D家庭视图”亮相天津智博会

    智能家居交互正从平面列表转向立体空间,通过3D户型还原真实家居,用户可直观操控全屋设备。2026世界智能产业博览会上,海尔展示了3D家庭视图2.0、车家互联及主动提醒服务,支持一键关灯、设备故障预警、耗材更换等,实现所见即所控。车家互联打通出行与居家,车辆驶离自动启动离家模式,归家提前开启空调,生活更便捷。

今日大家都在搜的词: