首页 > 传媒 > 关键词  > AI最新资讯  > 正文

即构对话式AI重磅升级,新增用户情绪识别

2026-02-11 19:31 · 稿源: 站长之家用户

当下AI Agent赛道的核心诉求,已经超越了单纯的工具属性。

无论是让AI能够与人类高效协作,还是使其“能看、能听、会说、会动”,本质上,都是让AI更像“人”。

但这份“活人感”并不是为了替代人类,而是通过贴近真人的互动逻辑,让AI精准适配人类需求,真正做到为人所用。

近日,即构科技实时互动AI Agent2.10版本正式上线,强化智能体的“自然拟人”效果——支持用户情绪识别多情感TTS让AI不仅能“听懂”你说的话,更能“读懂”你的情绪,并给予情感化的回应。

同时,优化了教育场景下的口语练习场景和数字人驱动效果,在场景适配和视觉呈现上进行了精细化打磨。

强化AI“活人感”:支持用户情绪识别、多情感TTS

以往和AI角色实时语音时,AI难以察觉用户语气中蕴含的情绪,更别说用饱含情绪的语言来回应用户。

现在,ZEGO实时互动AI Agent突破性地支持用户情绪识别和多情感TTS,让AI捕捉到用户的情绪波动,并根据用户当下的情感状态和角色人设,提供更加人性化、带有温情的反馈。

    用户情绪识别:智能体可精准捕捉用户语音中的情绪波动,无论是愤怒的语调、惊喜的语气,还是低落的声音状态,都能快速识别并匹配对应情绪标签,让AI与用户产生“共鸣”。

    在开启即构自研的语音情绪识别能力后,AI Agent会根据用户的原始音频分析其中的情绪,例如恐惧、开心、愤怒等,并将识别结果添加到本次请求LLM的用户提示词中,从而让AI更好地理解用户情绪。

    现已支持识别7种用户情绪:生气、中性、惊讶、害怕、开心、厌恶、悲伤。

    多情感TTS:AI能根据识别到的用户情绪,生成不同情绪且符合AI角色人设的语音回应。

    在使用语音合成(TTS)能力时,直接调用支持多情感多风格的音色或通过配置emotion调用多情感多风格,从而实现TTS的多情感音色。

    现已支持多种情绪的语音合成:中性、开心、生气、悲伤、恐惧、厌恶、惊讶、冷漠等。

这些更新,让AI智能体从有求必应但冷冰冰的“助手”,真正升级成了有共情能力的“陪伴者”。

在社交场景下,AI角色能配合剧情人设和对方情绪,让对话流畅衔接,增强社交沉浸感。

陪伴场景下,AI伴侣能察觉用户情绪变化,及时给予情感支持。

在教育场景下,AI老师则能够“察言观色”,根据学生学习状态、情绪状况循循善诱,告别“人机感”。

深耕教育场景:升级口语练习与数字人互动体验

此前,即构推出的AI伴学方案结合“图片数字人”技术,仅需一张照片,即可生成唇形准确、表情自然、动作生动的1080P高清互动形象。该方案已在大型直播课落地并取得了显著成果。

为了适配更多场景,本次ZEGO数字人的更新,优化增强了数字人的真实感和互动感。

    优化高年级/成人1V1情景口语练习场景:基于AI和数字人实时互动,在情景口语练习中更好融入对话主题,提供贴近真实对话的低延迟对话体验,支持中英文识别与回复语言智能切换,AI老师还会根据上下文给用户提示回复内容。

    更生动的数字人驱动效果:数字人能够根据设定好的关键词自然地引导动作触发,数字人驱动效果更生动。支持生动的头部、身体动作,和“点赞”“打招呼”“OK”等指向性手势动作。

比如在教学场景中,数字人教师会以招手动作与学生亲切问好;当学生答对问题时,数字人教师还会竖起大拇指点赞鼓励,相较传统纯语音教学,更能吸引学生注意力,有效提升学习效率。

除了教育场景,以上这些更丰富、更生动的数字人效果同样适用于AI陪伴AI客服等场景,让用户与数字人的互动更真实、更沉浸。

多维能力迭代:强化跨场景灵活性与兼容性

除了以上优化亮点外,还在互动逻辑优化、生态适配拓展、交互方式升级等方面进行了多重升级,强化了ZEGO AI Agent的灵活性与兼容性:

    互动轮次迭代优化:用户明显没有说完时,AI不会回复。为防止误判,可设置超时时间。

    忽略短语/语气词,避免打断:AI在说话时,不被用户的短语气词、应和等所打断。

    支持百炼智能体:百炼应用上可配置智能体,直接引用知识库等。

    新增硬件厂商支持:支持在RTOS-博通集成,可在硬件上进行高识别准确率的互动。

    支持微信小程序:可在小程序上与AI进行对话。

    支持“按住说话”:可进行类似微信语音消息“按住说话”的交互方式。

无论你是想为泛娱乐产品添加情感陪伴“搭子”,还是为AI教育场景打造真人级口语助教,或者是想让智能硬件更有“人情味”,都能在这里找到解决方案。

即构始终致力于用AI+实时互动技术推动人机交互向更真实、自然、有温度的方向进化。

ZEGO AI Agent新版本现已发布,并提供了体验Demo深度试用。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 从展示信息到行为数据:森森 Gensen 探索 AI 社交的新匹配逻辑

    过去十年,互联网社交产品的匹配逻辑经历了从依赖地理位置、照片展示到兴趣标签的变化。如今,AI生成内容使照片、文字等传统信息载体可信度下降,社交匹配面临新挑战。一些产品开始尝试从“展示型信息”转向“行为数据”,通过游戏化场景(如语音社交产品“森森”)让用户在自然互动中产生真实行为数据,并利用语音的实时性捕捉副语言信号,进行匿名化建模分析,从而优化匹配。这反映出社交产品正从信息展示竞争转向行为理解能力的竞争,真实互动数据可能成为下一代社交平台的核心。

  • AI日报:微信秘密研发AI Agent;Fish Audio发布S2;荣耀Magic V6首发端侧AI智能体内测

    本期AI日报聚焦多领域进展:微信秘密研发AI Agent,计划2026年测试并接入数百万小程序;Fish Audio发布开源TTS模型S2,实现词级情绪控制;荣耀推出“龙蜥宇宙”,将端侧AI整合进多设备协同体系;知乎发布品牌AI竞争力指数,探讨生成式AI对品牌影响;百度智能云推出零部署AI服务DuClaw,降低应用门槛;谷歌发布多模态嵌入模型Gemini Embedding 2,支持跨模态检索;OpenAI升级Atlas浏览器,支持多账号登录以提升隐私安全;小米18系列曝光,将新增AI实体按键并搭载骁龙8 Gen6芯片。

  • AI日报:腾讯版“小龙虾”WorkBuddy上线;AI冲击红果真人制作保底或取消;智谱发布一键部署Agent工具AutoClaw

    本期AI日报聚焦多领域AI进展:腾讯推出智能体WorkBuddy,兼容企业微信,提升职场效率;短剧行业面临调整,真人制作保底机制或取消;腾讯与清华联合发布SongGeneration2,AI音乐生成技术突破;智谱发布本地化Agent工具AutoClaw,降低使用门槛;网易开源LobsterAI,覆盖主流即时通讯工具;深圳龙岗联合Kimi举办千人大会,推动AI技术普及;微博接入KimiClaw,实现私信远程指挥AI智能体;腾讯SkillHub社区上线,收录超1.3万个AI技能,优化中国用户体验。

  • 飞书CEO谢欣:未解决安全问题的Agent越强大越危险

    飞书CEO谢欣近日分享了对当前养虾”热潮的观察。 他表示,最近OpenClaw实在太火,很多朋友都在飞书上养虾。春节前后短短几周,已经有人的工作方式悄然改变。 在谢欣看来,个人电脑上跑agent和企业里用agent,是完全不同的事情。个人玩agent是探索,企业用agent是责任。个人场景出了错,大不了重来;企业场景出了错,可能是文件被删,数据泄露。 他强调,agent的能力上限�

  • 为情绪买单 你踩过多少“坑” 网友:容易冲动购物

    最近,“为情绪买单”这个话题在网上火了起来,不少网友纷纷吐槽自己在情绪消费上踩过的“坑”。原来,很多人在心情好或不好的时候,都容易冲动购物,结果买回一堆不实用的东西,钱包受损不说,还可能影响心情。 据了解,情绪消费现象在年轻人中尤为普遍。有的人因为工作压力大,就通过疯狂购物来释放情绪;有的人则因为一时开心,就大肆购买奢侈品来奖励自己�

  • 雷军回应小米手机龙虾:只是小米探索Agent的一小步

    小米公司有了新动作,其基于小米MiMo大模型构建的AI交互测试产品——Xiaomi miclaw正式官宣,并开启小范围封闭测试。这款产品作为小米在Agent领域探索的初步成果,引发了外界关注。 当下养龙虾热潮正盛,而小米创始人雷军在谈及相关话题时,将重点引到了AI领域。他表示,AI的发展肯定会带来诸多新机会,同时也会替代不少现有工作。面对这样的形势,每个人都应该积极拥�

  • 董明珠:反对无效加班 企业也不该利用年轻人情绪营销

    近日,全国人大代表、格力电器董事长董明珠在访谈中,围绕职场加班、年轻人工作生活平衡、青年消费等热点话题发声,观点鲜明且直击当下社会痛点。 谈及企业加班文化,董明珠明确表示:在格力电器内部,我们看到很多员工这种加班是无效的,所以我们不允许加班。但有一些研发的部门工作可能要有延续性,像这种加班才可以允许。” 针对下班后需随时待命回复消息�

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • AI 搜索时代:跨境电商的流量命门与 GEO 实操指南

    文章指出,传统SEO在AI搜索时代已失效,Google SGE等生成式AI直接提供答案,导致网站自然流量与转化率断崖式下跌。作者提出,跨境卖家需转向GEO(生成式引擎优化),通过系统化工程优化品牌在AI模型中的语义理解、信源权重和引用逻辑。文章重点推荐了GEObase平台,它能实时监控品牌在主流AI中的提及与推荐位,分析竞品动态,并追踪AI回答的底层信源,帮助卖家量化优化,抢占AI推荐列表的先发优势,避免未来流量彻底流失。

  • MOZA魔爪模拟器率先布局AI赛道,发布全球首个支持硬件反馈的AI驾驶教练

    在GDC2026上,MOZA魔爪发布了旗舰级运动平台伺伏电缸HMA150,并推出两大自研AI技术:AI Coach(Racing Lab)与AI Motion。HMA150以4轴3自由度设计,具备150mm长行程、300mm/s运动速度及超1G峰值加速度,支持150Hz高频振动反馈,实现超低延迟与高精度力反馈。AI Coach是全球首个支持硬件反馈的AI驾驶教练,通过强化学习训练,为不同赛道与车辆组合提供极限驾驶策略与实时数据对比,帮助车手提升水平。AI Motion则通过AI实时解析游戏画面与音频,将3A游戏中的视觉与音频元素转化为运动与触觉反馈,扩展了运动平台在《GTA》《荒野大镖客》等主流游戏中的应用场景。此次发布标志着MOZA在硬件性能与AI生态整合上的全面升级。

今日大家都在搜的词: