首页 > 热点 > 关键词  > 正文

阿里通义XR实验室开源文生3D模型

2023-12-26 08:17 · 稿源:站长之家

站长之家(ChinaZ.com) 12月26日 消息:阿里通义实验室 XR 实验室开源了文生3D 新模型,可以通过一句文本描述生成对应的3D 模型及纹理。

开源的模型包括 Text-to-ND (文本生成深度、法向图) 和 Text-to-ND-MV (文本生成多视角的深度、法向图) 两个大模型。

微信截图_20231226082207.png

为了满足不同开发者的需求,通义实验室XR实验室开源了Text-to-ND的基础版本以及Multi-View版本,满足不同细粒度的算法开发需求。

不仅如此,还同步开源了从大模型中蒸馏出(Score Distillation Sampling)3D模型的优化代码,串联可以完成文本直接到3D模型的生成。

模型链接:

Text-to-ND、Text-to-ND-MV大模型:

https://modelscope.cn/models/Damo_XR_Lab/Normal-Depth-Diffusion-Model/summary

新鲜AI产品点击了解https://top.aibase.com/

举报

  • 相关推荐
  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • Panduit 泛达网络无锡光纤实验室盛大启幕,打造全球领先的光通信测试中心

    2025年9月19日,泛达网络在无锡工厂隆重举行光纤实验室开幕典礼,50余位行业嘉宾共同见证。实验室分三期建设,首期投资1500万,占地200平方米,专注于光纤连接器、光跳线、分光器等产品的综合性验证。该实验室严格遵循国际标准,具备全方位测试能力,旨在提升产品一致性与可靠性,缩短开发周期,以超越国际标准的品质响应AI及数据中心光通信的激增需求。此举彰显泛达对中国市场的坚定信心,进一步巩固其在光通信领域的领先地位。

  • 海尔智家建成行业首个FA实验室提升用户体验

    家电主控板是产品核心,直接影响用户体验。随着智能化发展,提升主控板质量可靠性成为行业重点。但企业普遍缺乏自主分析故障能力,难以快速定位失效原因。海尔智家建立行业首个失效分析实验室,输出59种非标验证方法,系统性定位失效根本原因并提出改进方案。这填补了行业空白,标志着中国家电企业在该领域拥有话语权,并通过溯源分析推动研发制造端持续优化,形成质量改善良性循环,提升用户体验。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • 香港科技大学(广州)&点动科技行业智能体联合实验室签约仪式圆满举行

    2025年9月8日,香港科技大学(广州)与广州点动信息科技股份有限公司共建行业智能体联合实验室正式揭牌。该实验室聚焦量化金融、数字文娱与智能调度三大战略课题,旨在推动人工智能领域的前沿技术研发与产业化应用。双方将依托各自优势,促进科研成果转化,培养高素质人才,标志着校企合作迈入新阶段,为区域产业高质量发展注入新动能。

  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

  • 苹果iOS 26普通照片秒变3D照上热搜 “空间场景”功能引热议

    苹果正式推送iOS 26系统,支持iPhone 11及以上机型。新系统引发用户吐槽,如LiquidGlass设计被指“丑出新高度”,升级后出现发烫、卡顿等问题。但“空间场景”功能广受好评,可将普通照片转换为裸眼3D效果,操作便捷,还能设为动态壁纸。不过该功能在不同屏幕上的表现存在差异,低刷屏会出现卡顿,高刷屏则效果更流畅逼真。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

今日大家都在搜的词: