首页 > 业界 > 关键词  > 生成式人工智能最新资讯  > 正文

Meta 的 Voicebox 生成式 AI 可以让任何人都能说多门外语

2023-06-19 11:40 · 稿源:站长之家

站长之家(ChinaZ.com) 6月19日消息:ChatGPT 和 Google 的Bard 等生成式人工智能使用自然语言处理和机器学习生成特定文本以响应提问。Meta 的新生成人工智能 Voicebox 做事有点不同——生成任意音频。

Meta,元宇宙,Facebook

Facebook 的母公司 Meta 在日前宣布了一项名为 Voicebox 的新型生成式人工智能技术。Voicebox 可以利用一段 2 秒钟的音频样本合成语音。通过这个样本,它可以匹配音频风格,并进行文本转语音生成,或重新创建可能被外部噪音打断的语音部分。Voicebox 还可以利用这个样本,将英文文本朗读成其他语言,比如法语、德语、西班牙语、波兰语或葡萄牙语。

Meta 表示,Voicebox 可以为虚拟助手或元宇宙中的非玩家角色提供自然真实的语音。元宇宙是人们在其中聚集工作、娱乐和交流的数字世界。它还可以被视力受损的人使用,让他们听到朋友们的声音来朗读信息。

Voicebox 仍处于研发阶段,尚未向公众提供。Meta 表示,他们意识到这种人工智能技术可能带来的潜在危害,并正在努力找到一种有效的方式来区分真实语音和由 Voicebox 生成的音频。

举报

  • 相关推荐
  • Meta高薪挖人!苹果AI大牛跳槽了

    Meta首席执行官扎克伯格正以高薪挖角竞争对手的AI人才,苹果一名核心工程经理已决定跳槽加入。 据悉,负责苹果基础模型团队的Ruoming Pang从苹果跳槽至Meta,他曾在苹果管理着约100名员工的团队,该团队致力于苹果大型语言模型的研发。 Ruoming Pang团队开发的模型已经应用到iPhone中,比如邮件摘要、生成式表情(Genmoji)等等。 Meta以每年数千万美元的待遇成功吸引了Ruoming Pan

  • 微软以Maia 280开启新局对垒英伟达,Meta/微美全息开源联动引领AI创新

    微软自研AI芯片Braga因设计问题延期至2026年,将推出过渡产品Maia280,性能或提升30%。微软原计划2025年量产Braga芯片以减少对英伟达的依赖,但延期导致后续产品线同步推迟。面对英伟达在AI芯片领域的主导地位(市占率超80%,年销售额增长10倍),微软正调整战略转向更务实的迭代路线。与此同时,Meta成立"超级智能团队"加速AI研发,微美全息押注量子计算等前沿技术。行业分析师认为,由于英伟达技术迭代速度极快(年增长32%),多数企业自研芯片计划可能最终难以抗衡其市场领导地位。

  • Meta 抢占AI霸权争夺加剧,微美全息(WIMI.US)布局产业生态应对市场竞争

    Meta斥资数十亿美元争夺AI领域主导权,包括从OpenAI挖走三名研究员,甚至开出1亿美元签约费。同时,Meta同意以148亿美元收购AI初创公司Scale AI 49%股份,这是其史上最大外部投资。中国AI领域也快速发展,已有433款大模型完成备案上线。专家指出,开源模式推动了大模型创新生态,形成"技术-数据-场景"循环迭代。微美全息(WIMI.US)通过搭建高性能AI算力基地,集成国际先进�

  • 苹果智能眼镜布局全面加速,Meta/微美全息产业生态协同撬动万亿市场

    苹果计划2025年推出搭载M5处理器的Vision Pro智能眼镜,2027年将发布主打拍摄和AI功能的Vision Air,以及更轻便的头显设备。彭博社透露苹果还在探索有线版Vision Pro。Meta与Ray-Ban合作的智能眼镜取得市场成功,即将推出高端版Hypernova眼镜,配备神经腕带控制器。微美全息积极布局智能眼镜领域,通过技术创新推动AR眼镜发展。随着AI技术进步,智能眼镜市场迎来爆发式增长,互联网巨头、硬件厂商纷纷入局,推动办公、影视、游戏等场景应用升级。

  • 加速Robotaxi部署 滴滴自动驾驶进入爆发前夜

    滴滴自动驾驶在第十七届国际交通技术设备展上亮相新一代L4级量产车型,配备33个传感器,展现技术突破。公司宣布将持续加大研发投入,与广汽埃安成立合资公司加速无人驾驶商业化落地。目前滴滴Robotaxi车队已在北京、广州等城市稳定运营超1800天无重大事故,并计划年内部署千台车辆。凭借多年技术积累和资本支持(累计融资超15.5亿美元),滴滴正迈向规模化商业运营新阶段。近期与广州市政府达成战略合作,进一步拓展智慧交通应用场景,标志着其自动驾驶技术进入爆发前夜。

  • Perplexity推出AI浏览器Comet:想用得开1400元/月的订阅

    由英伟达支持的Perplexity AI推出了一款名为Comet的AI驱动网络浏览器。 Comet浏览器的核心卖点是其AI驱动的交互体验,公司表示它将整个浏览会话转变为单一、无缝的交互,将复杂的工作流程简化为流畅的对话。

  • 神州数码 x 嘉岳数智:以生成式AI打造绿色低碳行业的“懂碳帝”

    在"双碳"战略推动下,绿色转型成为产业升级和企业发展的重要方向。神州数码与嘉岳数智科技合作,探索AI技术在碳评估智能化领域的应用,解决传统碳评估面临的数据分散、专业性强等痛点。通过构建EPAG专家流程增强生成框架、Agent场景分类机制和自动化评估学习流程,显著提升专业术语理解准确率至95%以上,大幅减少人工编辑工作量。双方打造的智能评估产品已进入预发布阶段,为生成式AI在垂直行业落地树立标杆,助力企业实现绿色低碳转型目标。

  • BYDFi 亮相首尔Meta Week 2025,聚焦Web3愿景与全球合规战略

    韩国首尔,2025年6月26日 —— 全球领先的加密货币交易平台 BYDFi 将参与2025年首尔 Meta Week:METACON(SMW2025),活动于6月26–27日在首尔 COEX 会展中心三楼礼堂举行。BYDFi 是 SMW2025官方合作伙伴之一,同列的还有三星、谷歌、英特尔、Spotify、Kakao、NAVER Cloud 和 GitHub 等知名科技公司。BYDFi 在 SMW2025 的参展亮点作为 SMW2025官方合作伙伴之一,BYDFi 的参与体现了其在不断发展的 Web3和数字�

  • 向“新”发力!itc保伦股份“分布式+AI边缘计算”赋能警务工作提升档升级

    ITC推出分布式综合管理平台V3.6,深度融合AI边缘计算技术,打造智慧警务指挥系统。该平台具备四大核心功能:1)支持50余种场景的实时监测与AI预警,准确率达95.3%;2)内置可视化编辑工具,实现数据快速分析呈现;3)采用深度学习技术,支持人脸识别、轨迹追踪等智能分析;4)创新拼墙信号管理,支持多业务协同。平台优势包括低延时(16ms)、超强FEC抗丢包(10%)、国密算法加密等,已成功应用于城市治安防控、应急指挥调度等场景,助力公安部门实现精准防控和快速响应。

  • 都能洗净碗筷,卡萨帝抽屉式洗碗机还不弯腰

    2025年6月25日,卡萨帝在重庆举办"AI致远 爱不凡"主题发布会,推出搭载AI深度科技的抽屜式洗碗机。该产品采用创新设计,用户无需弯腰即可完成餐具清洗,配备双变频电机和360°瀑布式喷淋系统,实现20套超大容量清洗。产品还内置软水系统,可7天无菌储存餐具,解决传统洗碗弯腰劳累、水垢残留等问题。卡萨帝通过这款产品,从高端家电领导者转型为"艺术生活缔造者",展现品牌对用户需求的深度洞察,引领洗碗机行业向高端化发展。