首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等

2023-12-01 09:48 · 稿源:站长之家

**划重点:**

1. 🌐 **Ego-Exo4D:** Meta发布支持视频学习和多模态感知的数据集,涵盖运动、音乐、烹饪等复杂人类活动,可用于增强现实、机器学习和社交网络。

2. 💬 **Seamless Communication:** 推出四个AI研究模型,旨在跨越语言界限实现更自然、真实的表达和快速翻译,包括保留语音表达和语境的SeamlessExpressive等功能。

3. 🎶 **Audiobox:** Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,以创造定制的音频文件,为研究人员和学术机构提供先进的音频生成研究支持。

站长之家(ChinaZ.com)12月1日 消息:为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。

Meta's AI lab turns 10 with three new AI projects and an impressive demo

Ego-Exo4D:

官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/

image.png

该项目以数据集及基准测试的形式呈现,旨在支持视频学习和多模态感知的人工智能研究。由Meta的FAIR、Project Aria,以及来自全球15所大学的合作伙伴在两年内共同收集,Ego-Exo4D捕捉了佩戴Project Aria头戴设备的参与者的“自我中心”视角和周围摄像机的“外部中心”视角。

这一数据集聚焦于复杂的人类活动,如运动、音乐、烹饪、舞蹈和自行车维修。Meta认为,该数据集在增强现实系统、机器人学习以及社交网络等领域具有广泛应用前景。1,400多小时的视频数据将于12月以开源形式发布,并计划于明年进行Ego-Exo4D公开基准竞赛。

Seamless Communication:

官方项目介绍网址:https://ai.meta.com/blog/seamless-communication/

该项目旨在通过四个AI研究模型实现更自然、真实的跨语言交流。包括保留语音表达和语境的SeamlessExpressive,以及提供约两秒延迟的语音和文本翻译的SeamlessStreaming。此外,SeamlessM4T v2是一个多语言、多任务的模型,用于轻松实现语音和文本之间的交流。最终,Seamless将集成SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能于一个模型中。

image.png

Meta还发布了SeamlessExpressive的演示,用户可以在其中将其语音翻译成其他语言,增强了跨语言沟通的交互性。

官方演示网址:https://seamless.metademolab.com/expressive/

Audiobox:

官方项目介绍网址:https://ai.meta.com/blog/audiobox-generating-audio-voice-natural-language-prompts/

这是Meta全新的音频生成模型,通过结合语音输入和自然语言文本提示,能够生成声音和音效,从而更轻松地创建用于不同用途的定制音频文件。相比其前身Voicebox,Audiobox通过允许用户使用自然语言提示来创建所需的声音或语音类型,提供了更强的可控性。

image.png

Meta表示,该模型将首先提供给一组选择的研究人员和学术机构,以推动音频生成研究的发展,并确保人工智能的负责任发展。

这三个项目的推出标志着Meta FAIR团队十年来在人工智能领域取得的巨大成就,并为未来的技术发展和创新奠定了坚实基础。

举报

  • 相关推荐
  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • 小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

    小鹏汽车在2025科技日宣布,将于2026年推出三款全栈自研L4级Robotaxi,同步开启试运营。该车型搭载4颗图灵AI芯片,算力达3000TOPS,配备第二代VLA模型,具备强大泛化学习能力,能自适应全球不同交通习惯。作为中国首款全栈自研Robotaxi,无需额外改装,不依赖高精地图即可实现量产。车辆提供两套智驾方案,分别侧重通勤效率与极致安全,并在六大关键系统采用双冗余设计,确保行驶安全。小鹏还将开放Robotaxi SDK,与高德地图等伙伴共建全球服务生态。

  • 理想汽车为车辆起火事件致歉!李想:这次MEGA是主动召回 生命只有一次我们不能等

    10月31日,北京理想汽车主动召回部分车辆。因冷却液防腐蚀性能不足,极端情况下可能导致动力电池和电机控制器冷却铝板腐蚀泄漏,引发故障灯亮、动力受限或无法充电,甚至电池热失控。CEO李想称此为主动召回,强调即便事故概率仅万分之一,但生命只有一次,必须及时处理安全隐患。

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • REDMI Turbo 5 1月登场:首发天玑8500

    博主爆料称,天玑8500芯片预计1月亮相,Redmi Turbo 5将首发搭载。该芯片采用台积电4nm工艺,配备8核A725全大核设计,主频达3.4GHz,GPU为Mali-G720,性能超越骁龙8 Gen3与8s Gen4,安兔兔跑分达220万。新机还将配备1.5K直屏与大容量电池,成为Redmi Turbo系列最强机型,值得期待。

  • 进博会“全勤生”三星的AI全景图:AI Home中国首秀

    三星在进博会上首次展出AI+Home智能家庭解决方案,通过Bespoke AI、Vision AI和Galaxy AI三大模块,实现全场景智慧生活。AI正从"会语言"向"会行动"演进,软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势,打破端侧AI的性能、算力与存储"不可能三角",构建起覆盖手机、电视、家电的生态闭环。未来,AI将全面接管生活,让科技真正服务于人。

  • 绿舟EUDR合规已成功交付!4周完成,领先行业!

    绿舟成为行业首批成功交付欧盟零毁林法规(EUDR)合规申报的服务商,最快4周完成合规,率先提供全流程服务。距法规执行仅剩两个月,绿舟凭借专业团队、标准化流程和全链路支持,帮助企业快速应对合规挑战,规避货物扣留、高额罚款等风险,抢占欧盟市场先机。

  • 卢伟冰:REDMI K系列持续向上 Turbo系列会逐步接棒K系列

    小米集团总裁卢伟冰转发博主对Redmi K90 Pro的评测,称K系列将通过科技创新持续提升体验,Turbo系列将逐步接棒。Redmi产品经理表示Turbo系列将在性能和性价比上带来惊喜。今年1月发布的Turbo 4起售价1999元,4月发布的Turbo 4 Pro同样1999元起。卢伟冰强调,随着小米高端化发展,K系列定位将持续上探,去年独立的Turbo系列正是为承接K系列上移后的定位空间。据悉,Redmi Turbo 5将于今年第四季度登场,首发联发科天玑8500,定位高性能、长续航,并升级金属中框和大R角设计,质感大幅提升。

  • 首发科天玑8500!REDMI Turbo 5获认证:支持100W闪充

    继工信部入网之后,REDMI Turbo 5近日又获得了国内的3C认证,距离上市不远了。 认证信息显示,REDMI Turbo 5支持100W有线闪充,这个规格目前已经成为小米旗下主流标配。

  • REDMI Turbo 5参数出炉:首发天玑8500

    REDMI Turbo 5采用6.5英寸LTPS中尺寸直屏,电池是7500mAh,支持100W有线闪充,配备金属中框、光学屏下指纹,支持IP68级防尘防水。 另外,REDMI Turbo 5将会首发搭载天玑8500处理器,这将是联发科最强悍的天玑8系芯片。 在去年12月,天玑8400正式亮相,由REDMI Turbo 4首发,这颗芯片采用了旗舰同款全大核架构设计,拥有8个主频至高达3.25GHz的Arm Cortex-A725大核,并且二级缓存翻倍,三级缓�

今日大家都在搜的词: