首页 > 业界 > 关键词  > 机器人最新资讯  > 正文

AI日报:会颠勺的国产机器人Astribot S1来了;Synthesia推能读懂文字情绪的数字人;OpenVoice V2版本发布;DeepFacelive让你在直播中实时换脸

2024-04-26 15:19 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Synthesia推出新型数字人Expressive-1正式版 能看懂你文字里的情绪

Synthesia公司推出Expressive-1AI Avatars,一款能根据文本内容自动展现丰富表情的AI虚拟形象技术。该技术提升视频表现力和吸引力,具有增强的表现力、情绪反应的同步、模仿人类微表情和身体语言等特点。

image.png

【AiBase提要:】

✨ 增强的表现力: Expressive-1根据文本语义变化自动展现适应的语调、面部表情和身体语言,更自然地表达情绪。

😊 情绪反应的同步: 虚拟形象能准确展示与情感状态相匹配的表情和语调,提高情感表达准确性。

🎤 声音和口型同步: 每个虚拟形象配备匹配的声音和出色的口型同步技术,确保声音和嘴唇动作一致性。

详情链接:https://top.aibase.com/tool/synthesia

2、讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型

科大讯飞发布了讯飞星火大模型V3.5升级,引入多情感超拟人合成技术,推出长文本、长图文、长语音大模型,以及星火智能体平台,为招投标应用和合同应用提供强大技术支持。

image.png

【AiBase提要:】

🚀 科大讯飞发布讯飞星火大模型V3.5升级,引入多情感超拟人合成技术。

🔥 推出首个长文本、长图文、长语音大模型,提供更强大的技术支持。

💡 星火大模型在通用长文本处理方面表现优异,甚至超越了GPT-4Turbo。

详情链接:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

3、科大讯飞:讯飞星火V4.0版6月27日发布

科大讯飞发布了首个支持长文本、长图文、长语音的大模型,提供了一系列新功能,包括图文识别、合同助手、智能评标助手等,实现更生动、个性化的表达,解决企业落地问题,助力员工提升工作效率。刘庆峰表示,讯飞星火V4.0将于6月27日正式发布。

【AiBase提要:】

🚀 科大讯飞发布首个支持长文本、长图文、长语音的大模型,提供更专业、更精准的行业场景回答。

📝 推出合同助手和智能评标助手,提高合同审核效率,使评标更便捷、更高效、更准确。

🌟 发布全新的智能体平台,解决大模型企业落地问题,为员工打造专属助理,帮助企业解放生产力。

详情链接:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

4、会颠勺的国产机器人来了!星尘智能推AI机器人Astribot S1

一款颠覆家务机器人领域的国产AI机器人Astribot S1问世,具备模仿学习、大模型加持、软硬件协同等核心特点。其操作性能卓越,展示了在家居和工作场景中的多任务能力,预示着未来生活中AI机器人的广泛应用潜力。

image.png

【AiBase提要:】

🤖 模仿学习:Astribot S1能模仿人类行为,执行复杂任务,展现出成年人的敏捷和灵活性。

🧠 大模型加持:接入大模型测试,预计在2024年内实现商业化,旨在建立新的AI机器人标准。

🔧 软硬件协同:研发团队取得关键突破,使S1具备智慧的“大脑”和敏捷的“身体”。

6、OpenVoice V2 版本发布 能对声音风格进行精细控制

OpenVoice V2版本是一项创新的声音克隆技术,能够精确复制参考发言者的声音并生成多种语言的语音。该版本具有更好的音频质量和原生多语言支持,集成了MeloTTS技术,支持免费商业使用。技术方法包括声音样式和语言的解耦设计,基础发音者TTS模型与音色转换器,以及训练策略和数据处理。

image.png

【AiBase提要:】

✨ 准确的音色克隆: OpenVoice能精确克隆参考音色并生成多种语言的语音。

🔧 灵活的声音风格控制: 用户可以详细调整声音的情绪、口音、节奏、停顿和语调,实现个性化声音输出。

🌐 高效的计算性能: OpenVoice在保持高性能的同时,计算成本大大降低。

官网:https://research.myshell.ai/open-voice

项目地址:https://top.aibase.com/tool/openvoice

创建自己的语音机器人:https://myshell.ai/

7、英特尔第一季度业绩表现强劲

英特尔第一季度营收达到127亿美元,同比增长9%,主要受到计算、人工智能和边缘产品的推动。英特尔推出新的 Gaudi3AI 加速器,挑战竞争对手 Nvidia 和 AMD,在人工智能领域取得进展。英特尔加速推出 AI PC 产品,预计到2024年底将超过4000万台 AI PC 出货量。

【AiBase提要:】

⭐ 英特尔第一季度营收达到127亿美元,同比增长9%。

⭐ 英特尔推出新的 Gaudi3AI 加速器,挑战竞争对手 Nvidia 和 AMD,在人工智能领域取得进展。

⭐ 英特尔加速推出 AI PC 产品,预计到2024年底将超过4000万台 AI PC 出货量。

8、科技巨头工程师薪酬大揭秘:OpenAI工程师年薪达90万美元

在科技巨头公司,工程师的年薪高达数百万美元,其中OpenAI工程师年薪可达90万美元。不同公司的工程师薪资水平各异,但均在百万美元以上。晋升至高级职位后,工程师年薪更可达数百万美元。人工智能领域的人才因知识而被慷慨报酬。

【AiBase提要:】

⭐️ OpenAI工程师年薪高达90万美元

⭐️ 谷歌、苹果、Facebook、微软等公司工程师薪资均在百万美元以上

⭐️ 工程师晋升至高级职位后,年薪可达数百万美元

9、IntrinsicAnything:调整图片光照 保持物体材质

这篇文章介绍了一种通过生成模型学习材料,规范优化过程的方法,以提高在未知静态照明条件下拍摄的姿势图像中恢复物体材质的准确性。研究者通过漫反射和镜面反射着色项的模型基础,采用从粗到精的训练策略,实现稳定且准确的材质回收结果。

image.png

【AiBase提要:】

⭐ 生成模型学习材料,规范优化过程,提高准确性

⭐ 模型基于漫反射和镜面反射着色项,增加准确性

⭐ 采用从粗到精的训练策略,实现稳定且准确的材质回收结果

详情链接:https://top.aibase.com/tool/intrinsicanything

10、Align Your Steps:低步数推理保持高质量结果

本文介绍了一种名为“步调齐整(Align Your Steps)”的全新方法,旨在优化深度学习领域中的扩散模型(DMs)的采样计划,提升生成过程中的效率和质量。通过严格的定量实验,发现优化计划在图像生成基准测试中显著提升图像质量,同时适用于文本到图像和视频生成领域。

image.png

【AiBase提要:】

✨ 优化采样计划提升生成模型效率和质量

🔧 可适用于多种数据合成基准测试,包括图像、视频等

🚀 提供用户友好的插拔式优化计划应用,提升生成过程中的稳定性和质量

详情链接:https://top.aibase.com/tool/align-your-steps

11、新ID保持项目PuLID:图像背景、光线、风格等均保持高度一致

PuLID是一个新兴的ID保持项目,致力于提升ID保持效果并最小化对原始模型的影响。其核心优势包括高度一致性、多功能性、高保真度、稳定性和准确性,应用广泛。PuLID的发布将推动技术的创新和发展,展现出独特的优势和价值。让我们共同期待PuLID的发布,见证其在技术领域的辉煌表现。

image.png

【AiBase提要:】

🔍 高度一致性: 身份信息加入前后,图像的背景、光线、布局和风格等元素保持一致。

🛠 多功能性: 支持样式更改、IP融合、配件修改、属性编辑和ID混合等多种操作,展现强大功能和效果。

🔒 高保真度: 通过对比对齐,自定义ID的同时保持高保真度,为用户提供更多可能性和选择。

详情链接:https://top.aibase.com/tool/pulid

12、体育老师使用人工智能克隆校长声音进行报复被捕

这篇文章报道了马里兰州巴尔的摩县体育老师达中·达里恩使用人工智能语音克隆服务陷害派克斯维尔高中校长的事件。这起事件揭示了人工智能技术被滥用的风险,引发了社会对个人信息安全和隐私保护的关注。

【AiBase提要:】

🔍 人工智能克隆校长声音事件:体育老师达里恩因涉嫌制作虚假录音被捕。

⚠️ 风险警示:人工智能语音克隆技术滥用引发社会关注,OpenAI限制公众使用其平台。

🔒 隐私保护:立法者努力制定法律保护个人信息免遭科技公司未经许可使用。

举报

  • 相关推荐
  • 科沃斯“机器人核心部件及机器人本体制造项目”签约南浔

    7月28日,科沃斯集团机器人核心部件及机器人本体制造项目签约仪式在湖州市南浔区举行。该项目聚焦机器人未来产业相关的传动、减速、关节等核心部件及各类智能机器人本体的研发制造,计划投资2亿元,投产后预计可年产机器人关键核心部件约2000万件、产值超10亿元。南浔区领导表示将全力打造最优营商环境,科沃斯集团董事长钱东奇称该项目将成为集团第四大供应链板�

  • 2025WAIC大会上演“机器人科技春晚”,微美全息按下AI人形机器人垂直应用快进键

    2025世界人工智能大会(WAIC)于7月26-29日在上海举办,主题为"智能时代同球共济"。展会吸引了800余家企业参展,展示3000余项前沿产品,包括100余款全球首发和中国首秀新品,覆盖大模型、AI终端、智能机器人等核心领域。人形机器人成为亮点,现场机器人TA能扮演多种角色,与观众互动。特斯拉人形机器人TeslaBot和傅利叶智能GR-3等产品备受关注。数据显示,2025年上半年中国人形机器人行业融资达87起,披露金额109亿元。微美全息等企业展示了AI视觉人形机器人领域的技术突破。本届大会超150台人形机器人集体亮相,展现中国在该领域的强大实力。WAIC见证了中国AI企业从单点突破到百花齐放的发展历程,成为技术与资本对接的重要平台。

  • 气象巡检“新哨兵”!视源股份四足机器人亮相首届气象经济博览会

    首届气象经济博览会上,视源股份展示的MAXHUB四足机器人成为全场焦点。该机器人能灵活应对崎岖地形和恶劣天气,完成巡检任务,展现出色运动性能。视源股份依托"三院一站"研发体系,在机器人视觉感知、运动控制等核心技术领域持续投入。专家认为,该产品有望成为未来智慧气象应急协同体系的重要节点,其音视频直连能力可实现三级指挥系统高效协同。未来,视源股份将通过智能终端和协同平台,推动气象作业从经验驱动向数字赋能升级,助力气象服务精准化和防灾减灾能力提升。

  • 曝特斯拉Gen3机器人明年入华量产:普通人也能买

    特斯拉第三代Optimus人形机器人已在美国工厂开始实测,预计2025年面向中国消费市场推出,2026年实现量产,5年内计划年产能达100万台。相比前两代,第二代产品减重10公斤,行走速度提升30%,手部自由度增至22个,新增颈部活动能力。第三代将重点提升执行复杂任务能力,如叠衣服、照顾小孩等。特斯拉计划2025年生产1-1.2万台零部件,2026年量产10万台,2027年提升至50万台。中国市场规模预计2030年突破千亿元,全球市场2035年有望达1.12万亿元。

  • 马斯克:特斯拉Optimus机器人将采用消费者从未见过的设计

    特斯拉的Optimus机器人已进入生产阶段,但未来交付给消费者的版本很可能与当前形态大不相同,消费者从未见过的设计,埃隆马斯克在最近的公司第二季度财报电话会议上对此做出了暗示。 近年来,特斯拉持续展示了Optimus机器人的迭代升级,最终推出了目前正在生产的V2版本。在2025年第一季度的公司全体会议上,马斯克曾向员工表示,特斯拉将力争在今年生产首批Optimus机器

  • 小小峨眉山拿下 外骨骼机器人启用:80元可租用3小时

    感觉腿好轻,它帮我把腿提起来上台阶很轻松!”在峨眉山景区,一位刚体验完外骨骼机器人的游客难掩惊喜。 这款能减负”的黑科技于7月25日正式在峨眉山景区投用,仅需80元就能租用3小时,让登山不再是体力挑战。 据景区工作人员介绍,此次上线的外骨骼机器人专为山地徒步设计,设备自重仅4斤左右,轻便的机身不会给使用者增加额外负担。

  • 普渡机器人发布大载重工业配送机器人PUDU T600系列,助力工业物流市场革新

    普渡机器人7月24日发布全新工业配送机器人PUDU T600系列,提供标准版和潜伏版两种形态。该系列具备600kg超大运载能力,支持智能货架识别、自主乘梯调度和多机协作功能,兼容VDA5050通信协议。创新配备灾害避险模块,支持私有化部署保障数据安全。产品适用于电子、半导体、新能源等工业场景,助力构建高效智能物流体系。作为全球服务机器人领军企业,普渡科技专注移动�

  • INDEMIND:停止堆功能,扫地机器人需要回归第一性原理

    文章批评当前扫地机器人行业过度追求"花哨"功能而忽视核心清洁能力的问题。厂商为差异化竞争不断叠加视频通话、机械手等创新功能,却导致产品复杂化、故障率上升,用户体验未获实质提升。指出行业应回归本质,聚焦感知、规划、决策三大核心能力升级,解决避障不佳、覆盖率低等基础痛点。介绍INDEMIND公司通过立体视觉技术构建三维语义地图,实现厘米级障碍

  • 从数字世界迈向物理世界!清华×生数发布最新成果Vidar,基于视频大模型实现机器人物理操作

    清华大学生数科技团队研发的Vidar模型实现具身智能重大突破,首次让通用视频大模型具备"手脚"功能。该模型通过三级数据架构(海量通用视频+中等规模具身视频+少量机器人特定数据),仅需20分钟机器人真机数据即可快速泛化到新机器人本体,数据量仅为行业领先方法的1/80-1/1200。Vidar创新性地将任务解构为上游视频预测和下游动作执行,结合逆动力学模型实现视觉-

  • 普渡机器人发布AI扫吸推机器人PUDU MT1 Vac,重新定义智能吸尘新标准

    普渡科技7月15日发布AI扫吸推机器人PUDU MT1Vac,专为大面积吸尘场景设计。产品采用双独立风道系统,吸尘效率提升200%,配备20L超大容量尘污分离系统,单次作业可覆盖1000㎡酒店地毯清洁需求。机器人具备55cm超宽吸尘宽度,集成HEPA级过滤系统,能识别不同地面材质自动调节吸力。搭载激光SLAM+视觉VSLAM融合定位系统,适应酒店、商超等复杂场景。该产品填补了大容量高效吸尘机器人市场空白,推动行业智能化升级。