11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
周二,Meta宣布推出SeamlessM4T,一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络,它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译,支持「最多100种语言」,Meta表示,它的目标是帮助说不同语言的人更有效地交流。关于SeamlessM4T如何运作的更多技术细节可以在Meta的网站上获得,其代码和权重可以在HuggingFace上找到�
Meta发布了一种多模态语音翻译模型SeamlessM4T,可以无缝地在语音和文本之间进行翻译和转录。该模型支持近100种语言的自动语音识别、语音到文本翻译、语音到语音翻译、文本到文本翻译以及文本到语音翻译等任务。Meta还提供了SONAR、stopes和fairseq2等工具和库,用于数据挖掘、多模态数据处理和序列建模。