首页 > 业界 > 关键词  > Meta最新资讯  > 正文

首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

2024-11-22 13:50 · 稿源:新智元公众号

【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

    今天凌晨3点,全球社交巨头Meta分享了一个创新研究——Memorylayers。Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。这样的设计既简化了维护流程,又提高了系统的灵活性和适应性。

  • AI日报:阿里通义开源多模态推理模型QVQ-72B;OpenAI考虑自研人形机器人;QQ音乐上线首个AI大模型音效

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里发布多模态推理模型QVQ-72B!视觉、语言能力双提升阿里巴巴最近推出的QVQ-72B多模态推理模型在语言和视觉能力上实现了显著提升,能够处理复杂的推理和分析任务,尤其在多步推理和数学推理方面表现突出。尽管o1-preview在某些方面表现优秀,但在实际应用中仍面临高成本和不切实际的测试建议等问题。

  • AI+教育:Meta Dot携手GPTBots,打造教育行业智能化新标杆

    在教育领域,人工智能的应用正日益深入,彻底颠覆了传统的教学模式。MetaDotLimited,作为一家领先的STEAM教育服务提供商,选择与GPTBots合作,打造了ZenseAI平台。随着技术的不断进步,MetaDot计划继续深化与GPTBots的合作,不断优化ZenseAI的功能,探索出更多的教育行业应用场景,为教育注入AI新活力。

  • CapCutTikTok停止服务:Meta火速推新应用抢市场!

    随着TikTok在美国的业务面临不确定性,字节跳动旗下的剪映国际版CapCut等多款应用日前也向美国用户推送了停止服务的通知。在此背景下Meta迅速出击,Instagram主管AdamMosseri宣布推出一款名为Edits的视频编辑应用,旨在填补CapCut下线后的市场空白。Edits将于2025年3月13日正式上线,目前已经在iOS应用商店开放预购,虽然Mosseri没有透露更多,但目的很明显是为了让人们记住这款应用程序。

  • 智象多模态生成大模型3.0发布 离幻觉更远与离落地更近

    12月28日,智象未来科技有限公司在安徽人工智能产业先导区启动仪式中,正式发布智象多模态生成大模型3.0版。启动仪式上,智象未来创始人兼首席执行官梅涛总结了2024年人工领域技术发展的五个标志性事件,分别是以Sora为代表的视觉生成物理世界模拟器、以ChatGPT4o为代表的多模态模型、以GPT-o1为代表的从预训练到后训练推理优化、多模态大模型赋能具身智能实现软硬件结合,以及人工智能学者荣获诺贝尔化学奖表明AI赋能科研范式变革。本次活动现场,智象未来与人民网、上海电影集团、彩讯科技、捷成华视网聚、安徽联通、中国移动咪咕音乐等12家生态伙伴企业代表签约,共同打造集技术研发、产业化应用、市场推广于一体的生态体系。

  • 扎克伯格:Meta今年将开发AI编程智能体 媲美中级软件工程师

    Meta公司创始人马克扎克伯格在采访中透露,今年Meta等大厂可能会研发出一种能力媲美中级软件工程师的AI,这种AI将能够完成大部分编码工作,甚至包括AI系统本身的开发。扎克伯格设想在不久的将来,Meta的代码编写和AI系统开发将更多地依赖于AI工程师非传统的人类工程师。o3基准测试已经突破了之前的壁垒;特定领域的AI智能体已经能够进行复杂的研究工作;多模态系统也能够创造出越来越精妙的内容。

  • Meta劲敌!雷鸟V3 AI拍摄眼镜正式发布:1799元

    今日,2025年国际消费电子展在美国拉斯维加斯举办,在CES期间,雷鸟创新举行发布会,正式发布雷鸟V3AI拍摄眼镜,售价1799元,1月7日预售,1月10日发售。作为Meta劲敌,雷鸟V3AI拍摄眼镜是集成出色画质相机、快速准确AI、高音质耳机、舒适佩戴眼镜于一体的新物种。雷鸟V3采用高密度3C电池,搭配充电盒使用,拥有30小时超长续航时间。

  • 多模态交互+健康新突破,歌尔发布新一代智能指环参考设计

    传感器技术、大数据、云计算、物联网以及人工智能技术的蓬勃发展,为智能穿戴设备集成更多健康监测功能提供技术支持。智能指环作为新型可穿戴终端,可将最新技术与生活方式结合,凭借其便携和实时性在健康监测、交互领域展现出独特优势。歌尔自2013年进入智能穿戴领域,可根据客户需求提供不同产品形态的智能穿戴整体技术制造方案,未来,歌尔将继续推动技术革新,不断探索智能穿戴设备的新可能,助力用户实现便捷、智能、健康的生活方式。

  • 苹果Powerbeats Pro 2曝光:支持空间音频 还能心率监测

    苹果公司即将推出的PowerbeatsPro2耳机近日在FCC美国联邦通信委员会的监管文件中曝光。这款耳机预计将主打运动功能,配备心率传感器,具备心率监测的能力,并支持空间音频和ANC降噪功能。苹果PowerbeatsPro2耳机的推出将进一步丰富苹果在运动耳机市场的布局,为消费者提供更多选择,特别是对运动爱好者来说,这将是一款值得期待的产品。

  • 年货零食NO1!劲仔深海小鱼,美味与营养“一网打尽

    大家的年货零食买好了吗?挑选年货零食可不是件容易事,既要满足家里从老人到小孩各个成员的口味,又要保证产品健康营养,最好还带有好寓意。劲仔深海小鱼不仅拥有能满足全家老少喜好的多元口味还拥有超高营养价值,寓意也很好——年年有“鱼”,简直是年货零食NO1!