11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
灵初智能发布新一代具身大模型Psi-R2与Psi-W0,并开源首个1000小时人类手部操作全模态数据集。该数据集总储备达10万小时,为当前行业最大的开源人类手部操作数据集,标志着具身智能从实验室走向产业化的关键一步。Psi-R2是首个使用10万小时量级人类数据预训练的World Action Model,输入图片和语言即可输出预测的未来视频和机器人动作。Psi-W0作为Action-Conditioned World Model,核心功能是对Policy进行评估与提升,并通过强化学习将人类数据的dynamic迁移至机器人dynamic。此次开源的数据集具备三大亮点:全模态覆盖视觉、语言、关节角度、触觉四类信息;通过自研外骨骼手套采集,3D轨迹精度达亚毫米级;涵盖工业装配、生活操作、物体抓取等多场景任务。该数据集可广泛应用于智能制造、物流仓储、商业服务等商业化场景,加速具身智能在千行百业的落地应用。
新芯航途X7大算力芯片通过原生软硬协同设计,显著提升模型参数部署效率,以效率突破重构智驾芯片核心价值。该芯片专为大模型时代智驾需求定制,采用专用超大核NPU架构与创新微架构深度融合,四项关键设计共同支持10倍模型参数释放能力:专属NPU单元精准匹配大模型需求;原生软硬协同打通效率瓶颈;车载智能调度系统保障稳定运行;安全架构兼顾性能与合规。X7单芯片满足城区NOA全栈需求,支持丰富传感器接入与处理,并通过AEC-Q100可靠性验证及国际权威双认证,树立“油电同智”标杆,推动高阶智能驾驶普及。
近日,谷歌Gemini AI推出最新升级,用户只需输入提示词,就能让聊天机器人生成交互式3D模型和实时模拟。 这一新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或输入数值改变模拟结果。 例如,用户询问月球绕地球轨道时,Gemini会创建一个3D模型,并提供轨道速度滑块、路径线切换开关以及暂停按钮。
小米汽车官方回应了车主关心的技术路线问题,明确XLA与世界模型并非二选一,而是互相配合,共同提升辅助驾驶能力。 不少用户担心小米转向XLA架构后,会放弃之前的世界模型技术。官方直接说明,两者不是对立关系,在全新的Xiaomi XLA架构里,已经无缝接入了强化学习加世界模型技术。 这里的XLA,就是小米给新一代SU7做的辅助驾驶底层大模型架构(Xiaomi XLA认知大模型)�
3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能
2026年,AI音乐赛道进入“好用”的专业进阶阶段,竞争焦点转向音乐审美、情感表达与创作平权。音潮音乐大模型V3.0凭借全链路自研技术与“音乐平权”理念,成为国产AI音乐工具中的全能选手。它通过三大核心技术实现演唱质量、旋律悦耳度、编曲多样性的突破,解决了AI音乐“顺畅易忘、质感单薄”的行业痛点。产品定位跳出“专业辅助”,以降低创作门槛为核心,支持文字、图片、哼唱等多模态输入,让零基础用户也能通过极简操作在短时间内生成带有人声演唱、情感饱满的完整歌曲,实现“人人皆可写歌”。音潮V3.0已完成全平台覆盖,生成歌曲版权归用户所有,通过技术实力与人文温度双线突围,重新定义了一键生成歌曲软件的体验标准。
字节跳动正式推出原生全双工语音大模型Seeduplex,基于边听边说”的全新架构,彻底打破传统AI语音交互一问一答”的局限,实现自然实时对话。 目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。 Seeduplex的核心突破的是改变了传统半双工听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破: 精准抗干扰:
爱诗科技正式推出PixVerse C1,这是全球首个影视行业大模型,主打专业级视频生成,最高可直接输出1080P、15秒视频,还能做到音画同步、自动分镜,普通人也能快速做出影视级短片。 C1支持文生、图生、参考生成、首尾帧控制多种方式,不用复杂操作,按提示词就能自动完成分镜和剪辑,把创意一步变成成片。 多宫格分镜图可以直接转成连贯视频,自带专业镜头感,省去大�
智谱AI近日发布新一代旗舰模型GLM-5.1,其Day0”版本在发布当天即正式上线华为云平台。 模型在长程任务处理上实现重大突破,单次自主持续工作长达8小时,并交付完整工程级成果。 智谱GLM-5.1在华为昇腾算力上通过Layer级MOE绝对均衡、框架优化专家Token产出均衡,并结合昇腾Attention算子与推理框架硬件协同优化,大幅提升算力均衡和HBM访存能力,经华为云系统级加速后整体推
过去一年多,游戏行业对AI的态度渐渐回归理性。最初大家惊叹于各种大模型的生成效果,现在大家往往更关心现实问题:能嵌入开发管线吗?工作流是什么样?成本和效果又如何? Meshy AI创始人兼CEO胡渊鸣在今年GDC上用一组对比强烈的数据作为开场,向大家展示了3D生成工具Meshy(meshy.ai)的生产力: “Meshy拥有超过1000万注册用户,三年内用AI生成了超过1亿个3D模型;相比之下,在整�