首页 > 业界 > 关键词  > 正文

文字生成3D模型CSM 支持文本、图像、视频转3D

2023-08-14 14:02 · 稿源:站长之家

站长之家(ChinaZ.com)8月14日 消息:CSM(Common Sense Machines)是一家来自美国的支持使用 AI 从视频、图像或文本创建3D 资产。用户只需上传任意一张2D 图像即可获得对应的3D 模型。

image.png

体验地址:https://3d.csm.ai/

此前 CSM 仅在 Discord 频道上开放,今年6月底发布了网页版本,用户可以直接在官网上免费体验。使用邮箱登录后,点击 “Image to3D” 按钮,上传本地图像,再点击生成,很快训练完成后就能看到3D 模型效果。推荐上传白色背景、立体感较强的图像,这样模型生成速度更快、效果更好。

最后点击右上角的 “download” 按钮可下载保存 GLB 或 USDZ 格式的模型文件。创建的模型也会发布在官网的 “Show Case” 页面上,任何人都可以免费下载使用。

举报

  • 相关推荐
  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • 昇腾赋能三维生成新突破!浙大团队实现跨模态可控3D CAD建模

    浙江大学与魔芯科技团队合作,基于昇腾平台NPU开发了首个三维模型生成算法Img2CAD。该技术突破性地将草图、图片等多模态输入通过Transformer结构高效转化为三维几何信息,无需可微渲染器,完整在NPU上实现训练和推理。研究成果可生成高精度3D模型,直接导入CAD软件编辑,已应用于3D打印、数字制造等领域。项目完成3篇论文,包括1篇中科院1区期刊和2篇CCF-A类会议论文,部分成果实现商业化落地。该技术标志着智能三维内容创作进入"低门槛、高效率、高质量"新阶段,未来将为工业设计、AR/VR等行业提供创新动能。

  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • OPPO Find X9参数曝光:3D超声波指纹终于下放

    具体来说,OPPO Find X9标准版将旗舰级的3D超声波指纹模块下放至标准版,这一功能在去年发布的OPPO Find X8系列机型中,只有X8 Ultra超大杯才搭载,其余机型包括X8、X8s、X8s 、X8 Pro均搭载短焦指纹识别,在解锁体验方面存在一定的短板。 据悉,目前的旗舰机型普遍采用了3D超声波指纹模块,相比短焦指纹模块,超声波指纹方案更加安全易用,其优点包括:穿透性强,抗水渍、污渍

  • 视觉中国战投企业景致三维:启动深圳首家3D数字技术订单班

    视觉中国战略投资企业景致三维联合深圳携创高级技工学校,于2025年7月22日启动深圳首家"3D梦工场订单班"。该项目针对3D数字技术人才缺口,定向培养逆向工程师、动画师、渲染师等紧缺人才。课程引入亚马逊、京东等真实商业项目案例,学生将系统学习3ds Max、Maya等主流工具,并考取职业资格证书。学习期间企业提供奖学金和带薪实习,毕业生考核合格可直接入职景�

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • 曝iPhone 18相机巨变:首发三星全新图像传感器

    据媒体报道,三星在得克萨斯州的一家工厂为即将推出的iPhone生产下一代图像传感器芯片,这标志着三星将会打破索尼在果链一家独大的局面,是苹果历史上的一次重大转变。 爆料称这颗芯片是三层堆叠图像传感器,通过垂直堆叠多个传感器层,能实现更高的像素密度和更出色的暗光性能,堆叠传感器架构还能提高读取速度、降低功耗并提升动态范围,这种制造工艺尚未实现

  • 小米智能摄像机4C 3.5K发布:支持600万像素 售价199元

    小米8月8日发布智能摄像机4C 3.5K,售价199元,8月11日开售。该产品搭载600万像素传感器,支持3.5K高清画质,配备8颗940nm红外补光灯,夜间成像清晰。创新性加入物理隐私遮蔽功能,镜头可收入机身实现物理遮挡,支持定时自动遮蔽。内置1T算力AI芯片,支持人形追踪、宠物检测等功能,识别更快更准。支持双频Wi-Fi6技术,内置米家安全芯片保障数据安全。深度接入米家生态,可智能联动空调、灯具等设备,提升家居智能化体验。

  • 男子编造2岁女儿被抱走遭处罚:为博关注 由AI大模型生成

    近日,一则细节详尽的“2岁女儿王喵喵被抱走”的寻人启事在网络上疯狂传播,引发超百万次点击与大量转发,众多网友纷纷加入转发助力寻找的行列。 启事中描述走失者王喵喵为2岁女性,眼睛大大的,笑时会露出两颗小虎牙,在嘉兴市南湖区新丰镇乌桥超市被一大妈抱走,还附上了“父亲”与“母亲”的联系电话,字里行间满是焦灼,让人感觉是心急如焚的家长发出的求�

  • 昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题

    浙江大学朱凌霄团队基于昇腾AI平台,研发出首个无需训练的长序列视觉指令生成框架LIGER,解决了视频生成领域长期存在的时序一致性难题。该技术通过历史提示和视觉记忆机制保持内容连贯性,并采用基于DDIM反演的记忆校准技术提升准确性。团队还提出引导式渐进蒸馏方法,在保持视频质量基础上实现8倍加速。研究成果入选ICLR2025,构建了包含569个任务的评估数据集。未来将深化多模态生成技术研究,构建自主创新的技术生态体系。