首页 > 关键词 > 轻量模型最新资讯
轻量模型

轻量模型

灵初智能发布新一代具身大模型Psi-R2与Psi-W0,并开源首个1000小时人类手部操作全模态数据集。该数据集总储备达10万小时,为当前行业最大的开源人类手部操作数据集,标志着具身智能从实验室走向产业化的关键一步。Psi-R2是首个使用10万小时量级人类数据预训练的World Action Model,输入图片和语言即可输出预测的未来视频和机器人动作。Psi-W0作为Action-Conditioned World Model,核心功能是对Policy进行评估与提升,并通过强化学习将人类数据的dynamic迁移至机器人dynamic。此次开源的数据集具备三大亮点:全模态覆盖视觉、语言、关节角度、触觉四类信息;通过自研外骨骼手套采集,3D轨迹精度达亚毫米级;涵盖工业装配、生活操作、物体抓取等多场景任务。该数据集可广泛应用于智能制造、物流仓储、商业服务等商业化场景,加速具身智能在千行百业的落地应用。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“轻量模型”的相关热搜词:

相关“轻量模型” 的资讯10篇

  • 灵初智能双模型亮相,全球最大人类手部数据集正式开源

    灵初智能发布新一代具身大模型Psi-R2与Psi-W0,并开源首个1000小时人类手部操作全模态数据集。该数据集总储备达10万小时,为当前行业最大的开源人类手部操作数据集,标志着具身智能从实验室走向产业化的关键一步。Psi-R2是首个使用10万小时量级人类数据预训练的World Action Model,输入图片和语言即可输出预测的未来视频和机器人动作。Psi-W0作为Action-Conditioned World Model,核心功能是对Policy进行评估与提升,并通过强化学习将人类数据的dynamic迁移至机器人dynamic。此次开源的数据集具备三大亮点:全模态覆盖视觉、语言、关节角度、触觉四类信息;通过自研外骨骼手套采集,3D轨迹精度达亚毫米级;涵盖工业装配、生活操作、物体抓取等多场景任务。该数据集可广泛应用于智能制造、物流仓储、商业服务等商业化场景,加速具身智能在千行百业的落地应用。

  • 软硬协同的力量:新芯航途X7大算力芯片释放10倍模型参数的技术解密

    新芯航途X7大算力芯片通过原生软硬协同设计,显著提升模型参数部署效率,以效率突破重构智驾芯片核心价值。该芯片专为大模型时代智驾需求定制,采用专用超大核NPU架构与创新微架构深度融合,四项关键设计共同支持10倍模型参数释放能力:专属NPU单元精准匹配大模型需求;原生软硬协同打通效率瓶颈;车载智能调度系统保障稳定运行;安全架构兼顾性能与合规。X7单芯片满足城区NOA全栈需求,支持丰富传感器接入与处理,并通过AEC-Q100可靠性验证及国际权威双认证,树立“油电同智”标杆,推动高阶智能驾驶普及。

  • 谷歌Gemini再升级!解锁新玩法:输入提示词即可生成交互式3D模型

    近日,谷歌Gemini AI推出最新升级,用户只需输入提示词,就能让聊天机器人生成交互式3D模型和实时模拟。 这一新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或输入数值改变模拟结果。 例如,用户询问月球绕地球轨道时,Gemini会创建一个3D模型,并提供轨道速度滑块、路径线切换开关以及暂停按钮。

  • 车主放心 小米辅助驾驶并未放弃世界模型 反而更强了

    小米汽车官方回应了车主关心的技术路线问题,明确XLA与世界模型并非二选一,而是互相配合,共同提升辅助驾驶能力。 不少用户担心小米转向XLA架构后,会放弃之前的世界模型技术。官方直接说明,两者不是对立关系,在全新的Xiaomi XLA架构里,已经无缝接入了强化学习加世界模型技术。 这里的XLA,就是小米给新一代SU7做的辅助驾驶底层大模型架构(Xiaomi XLA认知大模型)�

  • 国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

    3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能

  • AI 音乐赛道再进阶:音潮V3.0全链路自研模型突围,平民创作时代已至

    2026年,AI音乐赛道进入“好用”的专业进阶阶段,竞争焦点转向音乐审美、情感表达与创作平权。音潮音乐大模型V3.0凭借全链路自研技术与“音乐平权”理念,成为国产AI音乐工具中的全能选手。它通过三大核心技术实现演唱质量、旋律悦耳度、编曲多样性的突破,解决了AI音乐“顺畅易忘、质感单薄”的行业痛点。产品定位跳出“专业辅助”,以降低创作门槛为核心,支持文字、图片、哼唱等多模态输入,让零基础用户也能通过极简操作在短时间内生成带有人声演唱、情感饱满的完整歌曲,实现“人人皆可写歌”。音潮V3.0已完成全平台覆盖,生成歌曲版权归用户所有,通过技术实力与人文温度双线突围,重新定义了一键生成歌曲软件的体验标准。

  • 字节跳动发布全双工语音大模型Seeduplex!豆包率先接入:打电话可边听边讲

    字节跳动正式推出原生全双工语音大模型Seeduplex,基于边听边说”的全新架构,彻底打破传统AI语音交互一问一答”的局限,实现自然实时对话。 目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。 Seeduplex的核心突破的是改变了传统半双工听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破: 精准抗干扰:

  • 全球首个影视行业大模型!PixVerse C1发布:最高1080P、15秒直出

    爱诗科技正式推出PixVerse C1,这是全球首个影视行业大模型,主打专业级视频生成,最高可直接输出1080P、15秒视频,还能做到音画同步、自动分镜,普通人也能快速做出影视级短片。 C1支持文生、图生、参考生成、首尾帧控制多种方式,不用复杂操作,按提示词就能自动完成分镜和剪辑,把创意一步变成成片。 多宫格分镜图可以直接转成连贯视频,自带专业镜头感,省去大�

  • 上线华为云!智谱最新模型GLM-5.1:支持8小时自主长程任务 多产品体验

    智谱AI近日发布新一代旗舰模型GLM-5.1,其Day0”版本在发布当天即正式上线华为云平台。 模型在长程任务处理上实现重大突破,单次自主持续工作长达8小时,并交付完整工程级成果。 智谱GLM-5.1在华为昇腾算力上通过Layer级MOE绝对均衡、框架优化专家Token产出均衡,并结合昇腾Attention算子与推理框架硬件协同优化,大幅提升算力均衡和HBM访存能力,经华为云系统级加速后整体推

  • 3年1亿模型,年收入2.8亿:当AI大佬开始做游戏

    过去一年多,游戏行业对AI的态度渐渐回归理性。最初大家惊叹于各种大模型的生成效果,现在大家往往更关心现实问题:能嵌入开发管线吗?工作流是什么样?成本和效果又如何? Meshy AI创始人兼CEO胡渊鸣在今年GDC上用一组对比强烈的数据作为开场,向大家展示了3D生成工具Meshy(meshy.ai)的生产力: “Meshy拥有超过1000万注册用户,三年内用AI生成了超过1亿个3D模型;相比之下,在整�