生数科技发布自研多模态通用大模型同时推出PixWeaver、VoxCraft等工具

2023-09-21 08:14 · 稿源：站长之家

站长之家（ChinaZ.com）9月21日消息:9月20日，生数科技发布了自主研发的多模态通用大模型，并同时推出了两款应用产品:视觉创意设计平台 PixWeaver 和3D 资产创建工具 VoxCraft。

生数科技的多模态通用大模型采用底层融合的思路，将 Transformer 架构引入扩散模型，实现文本、图像、3D、视频等多模态知识的融合。该大模型具备语义理解强、训练速度快、可控性突出和兼容性出色的优点，基于自研的分布式架构，训练速度快、通信消耗低，研发效率提高。

微信截图_20230921081446.png

经过多次迭代，大模型在图像生成、3D 模型生成和视频编辑等任务中展现出领先效果。图像生成支持中文语义理解，画面细节丰富;3D 模型生成在分辨率和多样性方面表现出色;视频生成支持逐帧级的元素编辑和风格迁移。

基于大模型的能力，生数科技推出了两款应用产品。PixWeaver 是一款视觉创意设计平台，支持根据文字描述生成多种风格图像，具备通用性强、中文理解准确和画面细节丰富的特点。VoxCraft 是一款支持快速创建3D 图像的工具，通过输入文本描述或上传2D 图像，可以高效自动化生成多元3D 资产。

此外，生数科技的大模型还面向游戏制作、影视制作、广告营销等多个行业提供服务能力，支持各类创意内容的生成。

体验地址:https://pw.shengshu-ai.com/

（举报）

相关推荐

关键词：

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

10月15日，荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力，结合火山引擎与豆包大模型技术，支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景，提供图文、语音、视频等多种输入输出形式，实现秒级响应与沉浸式交互体验，成为用户“口袋里的万能管家”。

荣耀Magic8系列 MagicOS10操作系统 YOYO助理
【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

阿里云启动双十一“AI智慧季”大型优惠活动，聚焦企业多元AI场景落地需求，推出7000万tokens大模型免费体验、GPU新客特惠等政策，助力企业降低开发成本。同时提供标准化AI产品与解决方案，覆盖内容创作、智能客服等高频应用场景，并举办系列技术分享活动，携手企业拥抱AI新时代。

AI技术阿里云双十一优惠
从工具到数智中枢：DocuVerse云办公的生态价值与企业数智化未来

飞天云DocuVerse云办公系统通过"ECM+AI"双轮驱动，将数字化工具从效率工具升级为企业"数智中枢"。其核心价值在于沉淀分散的员工经验、项目流程等数字资产，构建可复用的知识库，实现个人经验向组织能力的转化。系统突破传统文档管理局限，连接数据、流程与人员，支持快速接入第三方工具并兼容现有设备。产品兼顾中小企业快速部署与大型企业个性化需求，已服务教育、制造等多行业客户，推动企业内容管理从效率提升向价值创造跨越，成为数字化转型的可靠伙伴。

数字化工具 DocuVerse 云办公
如何检查你的网站是否被大模型引用？AI排名查询工具推荐

本文探讨AI搜索时代网站流量获取新逻辑：传统SEO因Google搜索"零点击"现象失效，而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口，并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议：建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代，内容被LLM引用已成为新的流量生命线。
“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈，而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试，可提升测试效率300%、降低成本30%，并将产品发布周期从"月"压缩至"周"。这不仅是技术升级，更是重构IT成本结构、实现降本增效的战略支点，助力IT部门从成本中心转型为价值创造中心。

IT预算规划数字化战略 AI大模型
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行

今日大家都在搜的词：

热文

3 天
7天

生数科技发布自研多模态通用大模型同时推出PixWeaver、VoxCraft等工具

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

易鑫正式发布汽车金融行业首个Agentic大模型

荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

从工具到数智中枢：DocuVerse云办公的生态价值与企业数智化未来

如何检查你的网站是否被大模型引用？AI排名查询工具推荐

“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机

生数科技发布自研多模态通用大模型 同时推出PixWeaver、VoxCraft等工具

今日大家都在搜的词：

热文

站长商机

生数科技发布自研多模态通用大模型同时推出PixWeaver、VoxCraft等工具