首页 > 关键词 > 具身大模型最新资讯
具身大模型

具身大模型

OpenAI正研发新型双向语音模型BiDi,旨在让用户与ChatGPT的对话更自然流畅。其核心突破在于,当用户在AI发言过程中打断时,AI能实时调整回应,而非突然停止。目前ChatGPT的高级语音模式采用回合制对话机制,用户需先说完话,AI才会处理语音并生成回答。BiDi模型能持续处理说话者的语音输入,因此在被打断时可以立即调整响应。相比之下,现有的语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。这项技术目前仍处于开发阶段,原计划今年第一季度发布,但最新发布时间可能推迟到第二季度或更晚。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“具身大模型”的相关热搜词:

相关“具身大模型” 的资讯10篇

  • OpenAI开发双向语音模型:被打断也能秒回 让通话更自然顺畅

    OpenAI正研发新型双向语音模型BiDi,旨在让用户与ChatGPT的对话更自然流畅。其核心突破在于,当用户在AI发言过程中打断时,AI能实时调整回应,而非突然停止。目前ChatGPT的高级语音模式采用回合制对话机制,用户需先说完话,AI才会处理语音并生成回答。BiDi模型能持续处理说话者的语音输入,因此在被打断时可以立即调整响应。相比之下,现有的语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。这项技术目前仍处于开发阶段,原计划今年第一季度发布,但最新发布时间可能推迟到第二季度或更晚。

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • OpenAI最强模型GPT-5.4重磅发布 首次支持原生操控电脑 超越人类

    今日,OpenAI正式发布全新大模型GPT-5.4,号称目前能力最强、效率最高的专业工作前沿模型。 相比此前的GPT-5.2,GPT-5.4在推理能力、编程能力以及处理专业办公任务方面都有明显提升,尤其是在电子表格、PPT等复杂办公场景中的表现更加出色。 此次更新带来了两个版本:更擅长复杂推理任务的GPT-5.4 Thinking,以及性能更强、面向企业高端需求的GPT-5.4 Pro。 其中,GPT-5.4 Thinking主�

  • OpenClaw中文版Molili开放自定义大模型接入 国产AI智能体再突破

    3月5日,OpenClaw中文版Molili正式上线自定义接入大模型功能。该产品以极致自由度、全链路本土化适配与零门槛操作为特点,为个人及企业用户提供全新AI自动化解决方案,推动桌面AI智能体从“对话交互”向“落地执行”深度转型。核心亮点包括自定义大模型接入、全场景使用自由,支持企业无缝接入私有模型,个人用户可自主选择偏好模型,打破传统AI工具模型绑定限制。产品突破“重对话、轻执行”行业痛点,实现真实电脑端操作,覆盖文件处理、信息搜索等重复性任务,支持微信、钉钉等多平台远程指挥,并搭载8000+技能矩阵,全方位保障用户隐私与数据安全。

  • 小度全产品矩阵亮相 AWE,看大模型时代如何让 AI 真正走进千家万户

    3月12日,中国家电及消费电子博览会(AWE2026)将在上海开幕。作为行业领先的AI助手硬件品牌,小度科技将首次携全系产品矩阵亮相,展示其“场景+AI+硬件”战略的落地成果。从智能音箱、智能屏到AI眼镜、智能摄像头等硬件,以及AI酒店、AI养老等行业解决方案,小度将呈现一个完整的AI生态。这一切的背后,是2025年底升级的“超能小度”——基于大模型打造的多模态AI智能助手,让小度产品真正具备了“看见”世界、“思考”需求的能力。在AWE现场,观众将有机会亲身体验多模态AI如何重塑家庭看护、随身办公、智能交互等场景。小度正以实际行动回答:大模型时代,AI应如何走进千家万户。

  • 阿里已批准林俊旸离职 将成立基础模型支持小组

    今天上午,阿里巴巴内部流传出一封CEO吴泳铭的邮件,该邮件针对林俊旸离职一事作出回应。 3月4日(周三)凌晨,阿里Qwen(千问)团队技术负责人林俊旸在社交媒体上发布状态“me stepping down.bye my beloved qwen.”(我辞职了,再见了我爱的Qwen),这一动态引发了内部关注。

  • 海尔智家发布行业首个AI+细分岗位能力模型

    随着AI 应用迈入规模化落地的关键阶段,兼具数字化思维与AI 技术能力的复合型人才成为行业发展的刚需。数据显示,2030年全球AI人才缺口预计达500万,中国占比超过40%。基于这一现状,3月5日,海尔智家率先发布了行业首个AI+细分岗位能力模型,涵盖AI产品经理与AI技术开发工程师岗位能力模型。该模型涵盖6大核心能力维度、24项细分能力指标,通过“标准制定—人才培养—�

  • 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能

    随着大模型技术规模化落地,AI应用的实时性正成为企业竞争力的核心。然而,在算力持续升级的同时,模型从存储层加载至计算单元的环节却日渐成为制约系统效率与弹性的关键瓶颈。缓慢或波动的加载过程,不仅会导致昂贵算力资源的闲置,更直接影响业务响应质量。由此可见,构建高效、稳定的数据供给通道,已成为AI基础设施演进的关键方向。为验证企业级SSD在真实AI�

  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。