11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
腾讯公关总监张军今日宣布,微信PC端4.1.7版本正式推出语音输入功能,目前正通过内测版向全体用户逐步推送。这项被用户称为"办公神器"的新功能,不仅支持全局调用,更通过智能优化技术将口语转化为规范书面语,重新定义了电脑端文字输入方式。 据实测体验,用户只需点击聊天框左侧麦克风图标或按下Ctrl+Win组合键即可激活语音输入,系统实时将语音转化为文字
当前AI+Agent的核心诉求已超越单纯工具属性,旨在让AI更贴近人类。即构科技实时互动AI+Agent 2.10版本强化了智能体的“自然拟人”效果,支持用户情绪识别和多情感TTS,使AI不仅能“听懂”话语,更能“读懂”情绪并给予情感化回应。同时,优化了教育场景下的口语练习和数字人驱动效果,在场景适配与视觉呈现上进行了精细化打磨。此外,新版本在互动逻辑、生态适配、交互方式等方面进行了多重升级,强化了跨场景灵活性与兼容性,致力于推动人机交互向更真实、自然、有温度的方向进化。
本期AI日报聚焦多领域AI新进展:淘宝天猫上线AI假图识别模型,打击恶意售后;Inworld推出低延迟多语言TTS-1.5,革新游戏对话体验;百川智能发布医疗大模型Baichuan-M3+Plus,医学幻觉率降至2.6%;Remotion Skills实现自然语言生成专业视频动画;苹果内部AI工具Enchanté和Enterprise Assistant曝光,提升办公效率;YouTube计划推出“AI个人形象”功能,变革短视频创作;微软为Windows 11记事本与画图注入AI新能力;苹果拟将Siri重塑为类ChatGPT聊天机器人,代号“Campos”。
《每日邮报》报道,英国7岁边境牧羊犬哈维能记住220个玩具的名字,并按指令准确找回对应物品,被称为英国最聪明的狗狗”。 研究人员称,全球仅约10只狗具备类似能力,目前哈维已受到布达佩斯、朴次茅斯等多家天才犬”研究机构关注。 哈维的主人、52岁的艾琳休
,近日,英国7岁边境牧羊犬能记住220个玩具的名字引发热议。 据狗狗主人艾琳介绍,它能按指令准确找回对应物品,还被称为英国最聪明的狗狗”。 研究人员称,全球仅约10只狗具备类似能力,目前它已受到布达佩斯、朴次茅斯等多家天才犬”研究机构关注。 艾琳表示,从幼犬时期起,她就以游戏方式训练它识别单词。
今日,火山引擎发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合专家大语言模型架构构建。 据介绍,2.0版本模型推理能力提升,可以通过深度理解上下文完成精准识别,上下文整体关键词召回率提升20%。 同时支持多模态视觉识别,不仅听懂字”还能看懂图”,通过单图和多图等视觉信息输入让文字识别更精准。
AI假图泛滥淘宝出手了“想买件衣服,结果好多模特图都是AI生成的,根本与实物不符。”“那些用AI图的店铺,整个详情页就这一张图变来变去,为什么给这种店铺流量,不仅对买家体验不好,浪费买家时间拉低了平台的品质。我们有理由相信,淘宝出手后,将会有更多的平台跟进,共同推动行业回归品质竞争的正轨,让电商市场回归健康、有序的轨道上来给消费者一个真实�
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义千问开源发布新一代端到端多模态模型Qwen2.5-Omni阿里云通义千问团队推出了Qwen2.5-Omni,这是一个新一代的多模态旗舰模型,旨在实现文本、图像、音频和视频的无缝处理。这项技术为视频生成领域带来了新的发展机遇,尤其是在文本到视频生成等应用场景中,展现了巨大的潜力。
岚图汽车宣布,其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。该系统具备快速的车控响应能力,响应时间小于1秒,同时拥有超过98%的唤醒识别率。岚图汽车的座舱AI技术研究目前集中在三个主要方向:深度优化整车智能座舱系统,提供便捷的用户体验;结合deepseek的CoT训练方案,增强系统的思考与分析能力,确保在面对复杂指令时AI能精准响应;基于下一代芯片算力,设计研发新一代离线基于大模型的整体架构,提高系统稳定性,确保在网络不稳定时也能正常工作。
目前发生在帕西菲克帕利塞兹社区和阿尔塔迪纳地区的野火仍处于完全失控状态,超过1500名消防人员正奋战在野火现场。受当地持续干燥和强风天气影响,火势预计将会继续蔓延。这也提醒我们,如今AI发展迅速,但用途还需要进行规范,比如某些AI会在生成图片中加入隐藏水印帮助人们辨别,AI不该是传播谣言的工具。