首页 > 业界 > 关键词  > 机器人最新资讯  > 正文

AI日报:会颠勺的国产机器人Astribot S1来了;Synthesia推能读懂文字情绪的数字人;OpenVoice V2版本发布;DeepFacelive让你在直播中实时换脸

2024-04-26 15:19 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Synthesia推出新型数字人Expressive-1正式版 能看懂你文字里的情绪

Synthesia公司推出Expressive-1AI Avatars,一款能根据文本内容自动展现丰富表情的AI虚拟形象技术。该技术提升视频表现力和吸引力,具有增强的表现力、情绪反应的同步、模仿人类微表情和身体语言等特点。

image.png

【AiBase提要:】

✨ 增强的表现力: Expressive-1根据文本语义变化自动展现适应的语调、面部表情和身体语言,更自然地表达情绪。

😊 情绪反应的同步: 虚拟形象能准确展示与情感状态相匹配的表情和语调,提高情感表达准确性。

🎤 声音和口型同步: 每个虚拟形象配备匹配的声音和出色的口型同步技术,确保声音和嘴唇动作一致性。

详情链接:https://top.aibase.com/tool/synthesia

2、讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型

科大讯飞发布了讯飞星火大模型V3.5升级,引入多情感超拟人合成技术,推出长文本、长图文、长语音大模型,以及星火智能体平台,为招投标应用和合同应用提供强大技术支持。

image.png

【AiBase提要:】

🚀 科大讯飞发布讯飞星火大模型V3.5升级,引入多情感超拟人合成技术。

🔥 推出首个长文本、长图文、长语音大模型,提供更强大的技术支持。

💡 星火大模型在通用长文本处理方面表现优异,甚至超越了GPT-4Turbo。

详情链接:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

3、科大讯飞:讯飞星火V4.0版6月27日发布

科大讯飞发布了首个支持长文本、长图文、长语音的大模型,提供了一系列新功能,包括图文识别、合同助手、智能评标助手等,实现更生动、个性化的表达,解决企业落地问题,助力员工提升工作效率。刘庆峰表示,讯飞星火V4.0将于6月27日正式发布。

【AiBase提要:】

🚀 科大讯飞发布首个支持长文本、长图文、长语音的大模型,提供更专业、更精准的行业场景回答。

📝 推出合同助手和智能评标助手,提高合同审核效率,使评标更便捷、更高效、更准确。

🌟 发布全新的智能体平台,解决大模型企业落地问题,为员工打造专属助理,帮助企业解放生产力。

详情链接:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

4、会颠勺的国产机器人来了!星尘智能推AI机器人Astribot S1

一款颠覆家务机器人领域的国产AI机器人Astribot S1问世,具备模仿学习、大模型加持、软硬件协同等核心特点。其操作性能卓越,展示了在家居和工作场景中的多任务能力,预示着未来生活中AI机器人的广泛应用潜力。

image.png

【AiBase提要:】

🤖 模仿学习:Astribot S1能模仿人类行为,执行复杂任务,展现出成年人的敏捷和灵活性。

🧠 大模型加持:接入大模型测试,预计在2024年内实现商业化,旨在建立新的AI机器人标准。

🔧 软硬件协同:研发团队取得关键突破,使S1具备智慧的“大脑”和敏捷的“身体”。

6、OpenVoice V2 版本发布 能对声音风格进行精细控制

OpenVoice V2版本是一项创新的声音克隆技术,能够精确复制参考发言者的声音并生成多种语言的语音。该版本具有更好的音频质量和原生多语言支持,集成了MeloTTS技术,支持免费商业使用。技术方法包括声音样式和语言的解耦设计,基础发音者TTS模型与音色转换器,以及训练策略和数据处理。

image.png

【AiBase提要:】

✨ 准确的音色克隆: OpenVoice能精确克隆参考音色并生成多种语言的语音。

🔧 灵活的声音风格控制: 用户可以详细调整声音的情绪、口音、节奏、停顿和语调,实现个性化声音输出。

🌐 高效的计算性能: OpenVoice在保持高性能的同时,计算成本大大降低。

官网:https://research.myshell.ai/open-voice

项目地址:https://top.aibase.com/tool/openvoice

创建自己的语音机器人:https://myshell.ai/

7、英特尔第一季度业绩表现强劲

英特尔第一季度营收达到127亿美元,同比增长9%,主要受到计算、人工智能和边缘产品的推动。英特尔推出新的 Gaudi3AI 加速器,挑战竞争对手 Nvidia 和 AMD,在人工智能领域取得进展。英特尔加速推出 AI PC 产品,预计到2024年底将超过4000万台 AI PC 出货量。

【AiBase提要:】

⭐ 英特尔第一季度营收达到127亿美元,同比增长9%。

⭐ 英特尔推出新的 Gaudi3AI 加速器,挑战竞争对手 Nvidia 和 AMD,在人工智能领域取得进展。

⭐ 英特尔加速推出 AI PC 产品,预计到2024年底将超过4000万台 AI PC 出货量。

8、科技巨头工程师薪酬大揭秘:OpenAI工程师年薪达90万美元

在科技巨头公司,工程师的年薪高达数百万美元,其中OpenAI工程师年薪可达90万美元。不同公司的工程师薪资水平各异,但均在百万美元以上。晋升至高级职位后,工程师年薪更可达数百万美元。人工智能领域的人才因知识而被慷慨报酬。

【AiBase提要:】

⭐️ OpenAI工程师年薪高达90万美元

⭐️ 谷歌、苹果、Facebook、微软等公司工程师薪资均在百万美元以上

⭐️ 工程师晋升至高级职位后,年薪可达数百万美元

9、IntrinsicAnything:调整图片光照 保持物体材质

这篇文章介绍了一种通过生成模型学习材料,规范优化过程的方法,以提高在未知静态照明条件下拍摄的姿势图像中恢复物体材质的准确性。研究者通过漫反射和镜面反射着色项的模型基础,采用从粗到精的训练策略,实现稳定且准确的材质回收结果。

image.png

【AiBase提要:】

⭐ 生成模型学习材料,规范优化过程,提高准确性

⭐ 模型基于漫反射和镜面反射着色项,增加准确性

⭐ 采用从粗到精的训练策略,实现稳定且准确的材质回收结果

详情链接:https://top.aibase.com/tool/intrinsicanything

10、Align Your Steps:低步数推理保持高质量结果

本文介绍了一种名为“步调齐整(Align Your Steps)”的全新方法,旨在优化深度学习领域中的扩散模型(DMs)的采样计划,提升生成过程中的效率和质量。通过严格的定量实验,发现优化计划在图像生成基准测试中显著提升图像质量,同时适用于文本到图像和视频生成领域。

image.png

【AiBase提要:】

✨ 优化采样计划提升生成模型效率和质量

🔧 可适用于多种数据合成基准测试,包括图像、视频等

🚀 提供用户友好的插拔式优化计划应用,提升生成过程中的稳定性和质量

详情链接:https://top.aibase.com/tool/align-your-steps

11、新ID保持项目PuLID:图像背景、光线、风格等均保持高度一致

PuLID是一个新兴的ID保持项目,致力于提升ID保持效果并最小化对原始模型的影响。其核心优势包括高度一致性、多功能性、高保真度、稳定性和准确性,应用广泛。PuLID的发布将推动技术的创新和发展,展现出独特的优势和价值。让我们共同期待PuLID的发布,见证其在技术领域的辉煌表现。

image.png

【AiBase提要:】

🔍 高度一致性: 身份信息加入前后,图像的背景、光线、布局和风格等元素保持一致。

🛠 多功能性: 支持样式更改、IP融合、配件修改、属性编辑和ID混合等多种操作,展现强大功能和效果。

🔒 高保真度: 通过对比对齐,自定义ID的同时保持高保真度,为用户提供更多可能性和选择。

详情链接:https://top.aibase.com/tool/pulid

12、体育老师使用人工智能克隆校长声音进行报复被捕

这篇文章报道了马里兰州巴尔的摩县体育老师达中·达里恩使用人工智能语音克隆服务陷害派克斯维尔高中校长的事件。这起事件揭示了人工智能技术被滥用的风险,引发了社会对个人信息安全和隐私保护的关注。

【AiBase提要:】

🔍 人工智能克隆校长声音事件:体育老师达里恩因涉嫌制作虚假录音被捕。

⚠️ 风险警示:人工智能语音克隆技术滥用引发社会关注,OpenAI限制公众使用其平台。

🔒 隐私保护:立法者努力制定法律保护个人信息免遭科技公司未经许可使用。

举报

  • 相关推荐
  • 小鹏机器人会走猫步太像人了!小鹏发布新一代人形机器人IRON

    在第七届小鹏科技日上,小鹏汽车发布全新人形机器人IRON,其拟人化程度领先,拥有仿生脊柱、肌肉及柔性皮肤,配备3D曲面显示与灵巧双手,实现22个自由度。搭载3颗图灵AI芯片,算力达2250TOPS,支持对话、行走等智能交互,并采用全固态电池提升安全性。集成自研物理世界模型与VLT/VLA/VLM能力,实现环境感知与反馈。IRON将优先应用于商业场景,并与宝钢合作探索工业巡检。小鹏宣布开放SDK,邀请全球开发者共建机器人应用生态。

  • 何小鹏再回应机器人里藏真人质疑:现场展示内部结构

    小鹏公司研发的人形机器人IRON首秀后引发“真人操控”质疑。为回应舆论,董事长何小鹏不仅发布机器人脱衣视频,更在科技日现场剪开腿部覆盖件,直接展示内部仿生结构。该机器人搭载自研物理世界模型,融合三大核心能力,实现环境感知与实时反馈。目前IRON仍处科研阶段,计划明年4月量产,展现中国科技企业在机器人领域的创新实力。

  • 何小鹏回应机器人IRON里是真人质疑:感谢认可

    在第七届小鹏科技日上,小鹏汽车自主研发的人形机器人IRON首次亮相,其逼真步态引发网友惊叹“100%真人在里面”。面对质疑,董事长何小鹏以“感谢认可”巧妙回应,展现技术自信。IRON采用类人“骨骼-肌肉-皮肤”结构,搭载仿生肌肉驱动系统和22自由度拟态双手,能精准感知环境变化。团队历时7年研发,计划明年4月进入量产阶段。该机器人还融合物理世界模型体系,集成VLT/VLA/VLM三大核心能力,实现实时环境交互。此次展示既体现小鹏技术积累,也引发对科技真实性的思考。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 马斯克称未来人类意识能上传至机器人 可用于月球和火星基地建设

    在2025年11月7日举行的特斯拉年度股东大会上,埃隆马斯克系统阐述了公司在人形机器人、自动驾驶、芯片研发与生产扩张等方面的战略规划,并更新了企业使命,展现出将技术愿景转化为现实应用的清晰路径。 马斯克指出,随着Neuralink等脑机接口技术的发展,人类有望在20年内实现将意识快照”上传至特斯拉人形机器人,使其具备类人意识。 人形机器人将被部署于月球与火�

  • 何小鹏:人形机器人进工厂不划算 做家务不安全

    今日,小鹏汽车发布旗下全新一代人形机器人IRON。 作为最拟人的人形机器人,IRON拥有骨骼-肌肉-皮肤”:仿人脊椎、仿生肌肉、全包覆柔性皮肤、头部3D曲面显示、仿生灵动双肩、实现22个自由度的灵巧手。 据何小鹏介绍,它的猫步走得像人一样轻柔,还拥有像人一样思考的大脑”,它不光是世界上最高算力的人形机器人,明年更会是最聪明的机器人之一。 现场,何小鹏还

  • “超脑+机器人”重构物流新生态!京东物流“狼族”机器人全阵容亮相世界物联网博览会

    10月31日,世界物联网博览会在无锡开幕,京东物流"狼族"智能机器人军团成为焦点。展会首次完整呈现"超脑+狼族"智能系统,展示天狼四向车、智狼扩展版、自动分播墙等新产品及成熟产品矩阵。系统实现全流程智能作业,分拣准确率超99.99%,存储坪效提升240%,作业人员减少58%。通过仓-站-人高效协同,昆山亚一智能物流园已实现近半数订单由机器人处理。京东物流计划未来5年采购300万台机器人,持续强化智能供应链技术底座,推动行业向科技驱动转型。

  • 女性人形机器人里藏真人?何小鹏回应:并亲自证清白

    小鹏汽车董事长何小鹏发布视频,回应网友对Iron机器人流畅步态真实性的质疑。视频中,团队通过一镜到底展示机器人行走,并解开上衣拉链展示内部机械结构,证明无人操控。何小鹏解释机器人模拟肌肉结构,头部为麦克风阵列,行走时伴有电机声。他透露团队七年研发成果,目前仍处科研阶段,计划明年4月实现软硬件量产。

  • 触觉增强世界模型引关注,一目科技IROS首秀定义机器人感知新维度

    在2025年IROS大会上,中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器,厚度大幅缩减,实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式,指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术,突破传统数据收集限制,显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务,验证了触觉感知在精细操控中的核心价值,为"操控即服务"产业愿景提供技术支撑。

  • 新时达人形机器人新达“入职”海尔工厂,机器人真的开始进厂打工了?

    人形机器人新达在重庆海尔冰箱互联工厂成功落地,标志着具身智能机器人从实验阶段迈向场景实训。相比传统工业机器人,新达具备更高场景适应性和工序协同能力,能完成涂润滑油、物料搬运、智能巡检等复杂任务。其核心技术“大脑-小脑-本体”深度协同,通过视觉语言模型实现自主决策,全栈自研运动控制系统确保精准操作。这不仅是技术突破,更验证了工业制造从自动化向智能化升级的可行路径。

今日大家都在搜的词: