阿里达摩院推大语言模型PolyLM：通晓18种语言拥有1.7B和13B两种参数版本

2023-07-18 15:23 · 稿源：站长之家

站长之家（ChinaZ.com）7月18日消息:最近，阿里巴巴达摩院发布的一个名为 POLYLM 的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是，PolyLM 能够在理解、推理和生成自然语言指令方面表现出显著的能力，该模型拥有1.7B和13B两种参数版本可选。

官方的介绍是这样的:

PolyLM是一个通晓多语言的大语言模型，涵盖中文、英文、西班牙语、法语、德语、俄语、葡萄牙语、意大利语、阿拉伯语、日语、韩语、泰语、越南语和印尼语等18种语言。该模型可以应用于对话问答、文本生成、机器翻译和情感分析等领域，能够自动生成高质量的多语言文本，从而为跨语言、文化的交流提供便利。

据了解，POLYLM 使用了包含640B 个token 的庞大数据集进行训练，数据集来源于维基百科、mC4和 CC-100等公开可访问的资源。

研究团队提出了一种课程学习技术，逐渐增加高质量、资源较少的语言在训练中的比例，重点是从英语向其他语言转移通用知识。

团队还开发了一个名为 MULTIALPACA 的多语言指令数据集，用于监督微调阶段。为了评估 POLYLM 的多语言能力，团队还开发了一个基准测试，包括十个任务和十五种语言。研究表明，POLYLM 在非英语语言上的表现优于同等规模的开源模型。总的来说，POLYLM 提供了一个具有多语言能力的开源模型，有助于解决现有模型在非英语语言上的局限性。

团队总结了 POLYLM 的表现:

已经执行了熟练的13B 比例模型，在西班牙语、俄语、阿拉伯语、日语、韩语、泰语、印度尼西亚语和中文等主要非英语语言中表现良好。该模型补充了现有的开源模型，这些模型要么缺乏对这些语言的熟练程度，要么具有较小的版本而没有相同的功能。

提出了一种先进的课程学习方法，有助于将主要通过英语获得的一般知识转移到各种非英语语言和特定的自然语言处理任务（例如机器翻译）。

人们提出了一个名为 MULTIALPACA 的数据集，它补充了现有的教学数据集，使大语言模型能够更好地遵循多语言教学，特别是非英语母语人士的教学。

论文网址:https://arxiv.org/abs/2307.06018

项目网址:https://modelscope.cn/models/damo/nlp_polylm_13b_text_generation/summary

（举报）

相关推荐

关键词：

从巴别鱼到技术突围：W4Pro以体验领先定义跨语言沟通新标杆

时空壶W4Pro开放式AI同传耳机通过技术创新，将科幻构想变为现实产品。在跨语言沟通核心指标上实现双重突破：响应延迟仅0.2秒，较行业平均提速75%；翻译延迟控制在3秒内，实测平均2.8秒，较竞品提速38%-53%。搭载骨声纹识别+矢量降噪双技术方案，在85分贝嘈杂环境中语音识别准确率仍保持98%以上。支持43种语言及96种口音实时互译，覆盖全球98%主流区域，新增孟加拉语等小语种适配。单设备即可实现双向跨语言交流，打破多数竞品需配对使用的局限。单次充电支持6小时翻译使用，综合续航达18小时，开放式挂耳设计仅重12克。该产品精准解决了跨语言沟通中的延迟、降噪、场景适配等核心痛点，推动行业向"无感沟通"迈进。

跨语言沟通 AI同传耳机技术创新
OPPO ColorOS 16正式版推送：首批适配11款机型

ColorOS 16正式版于10月30日启动推送，首批覆盖11款OPPO和一加热门机型。该系统引入极光引擎、潮汐引擎与繁星编译器三大流畅技术，实现感官、性能与底层的全方位提升。极光引擎打造业内首个“无缝隙架构”，确保全场景丝滑交互；潮汐引擎首发芯片级动态追帧技术，系统重载流畅度提升37%，功耗降低13%；繁星编译器首创安卓跨级融合编译技术，大幅提升低算力芯片性能。此次升级将增强品牌市场竞争力，为用户带来更出色的使用体验。

ColorOS16 OPPO Find
Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型
OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

ColorOS 16正式版11月升级计划公布，涵盖OPPO Find X7/N3系列、一加Ace 5系列等23款机型。系统引入极光引擎、潮汐引擎及自研繁星编译器，显著提升流畅度并降低功耗。新增一键闪记功能，支持复杂图文与超长视频录制。生态互联实现突破，全面打通Apple Watch生态，支持打车、外卖等信息跨设备显示。通过软硬协同优化，为用户打造更流畅持久的操作体验。

ColorOS16 OPPO Find
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

国家广电总局宣布自2026年3月起全面整治AI生成内容，要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》，提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro，集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX，实现文本化语音编辑。Grok新增纯文本生成视频功能，17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠，并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型，优化开发者体验。

AI动画广电总局 AIGC审核
Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

Soul App近日开源其播客语音合成模型SoulX-Podcast，专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言，可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外，在通用语音合成及克隆任务中表现优异，能灵活调节节奏与副语言元素（如笑声），提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

语音合成模型 SoulX-Podcast 多轮对话
百惠金控：全球 IPO 重现热度 AI 股料再受热捧

毕马威报告显示，全球IPO市场正逐步回暖，2025年第三季度超400宗IPO，创投市场连续四季稳健增长。AI领域成为主要驱动力，OpenAI等企业筹备上市推动热潮，美股与港股表现活跃。投资者更趋理性，聚焦企业商业模式与盈利潜力。香港凭借国际金融中心地位，吸引中资科创企业上市，需满足财务披露与ESG高标准。机构建议企业尽早寻求专业支持，把握资本窗口期。

资本市场 IPO市场人工智能投资
荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

本期AI日报聚焦多项技术突破：豆包推出全自动有声剧系统，实现98%角色识别准确率；Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成；Soul发布90分钟无中断播客生成模型；360推出全球首款L2-L4全栈智能平台；IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面，移动端AI用户突破7亿，豆包领跑原生应用；PayPal与OpenAI合作使ChatGPT集成支付功能；谷歌推出AI营销工具Pomelli，可基于URL自动生成营销内容。

AI有声剧豆包语音多角色语音合成

今日大家都在搜的词：

热文

3 天
7天

阿里达摩院推大语言模型PolyLM：通晓18种语言拥有1.7B和13B两种参数版本

从巴别鱼到技术突围：W4Pro以体验领先定义跨语言沟通新标杆

OPPO ColorOS 16正式版推送：首批适配11款机型

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

百惠金控：全球 IPO 重现热度 AI 股料再受热捧

荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

今日大家都在搜的词：

热文

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

鸿蒙智行：智界R7累计交付量破10万台

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

何小鹏回应机器人IRON里是真人质疑：感谢认可

iPhone Air 2或新增1颗镜头：继续沿用6.5英寸高刷中屏

站长商机

阿里达摩院推大语言模型PolyLM：通晓18种语言 拥有1.7B和13B两种参数版本

今日大家都在搜的词：

热文

站长商机

阿里达摩院推大语言模型PolyLM：通晓18种语言拥有1.7B和13B两种参数版本