首页 > 动态 > 关键词 > 华为最新资讯 > 正文

华为推出AI诗人“乐府”:唐诗宋词都不在话下

2019-09-09 08:43 · 稿源:量子位公众号

人工智能 AI 机器人

声明:本文来自于微信公众号 本文来源于微信公众号量子位(ID:QbitAI),作者:乾明,授权站长之家转载发布。

理科生文艺起来,可能真没文科生什么事了。

不信?你看下这首七言绝句:

华为推出AI诗人“乐府”:唐诗宋词都不在话下

有网友读完之后表示:

真啊,押韵,意境,内涵都很赞。

不仅能够写诗,还能作词,比如这首满江红:

华为推出AI诗人“乐府”:唐诗宋词都不在话下

而且,还能写藏头诗:

华为推出AI诗人“乐府”:唐诗宋词都不在话下

你能想象,这是完全不懂写诗的理工生的杰作吗?

但它就是。

这些诗来自华为诺亚方舟实验室新推出的写诗AI“乐府”。

问世之处便引发了不少关注。

对于它的作品,有人称赞:

蕴意丰富的诗,工整不乏意趣,程序做的实在牛逼,给开发人员点赞

还有人“搞事情”,表示:

一声塞雁江南去,几处家书海北连。莫道征鸿无泪落,年年辛苦到燕然。要说这个 AI 写的没有北大中文系平均水平好我是不信的。

华为推出AI诗人“乐府”:唐诗宋词都不在话下

甚至有人说“李白看了会沉默,杜甫看了会流泪”。

华为推出AI诗人“乐府”:唐诗宋词都不在话下

当然,也有人指出问题:

很工整,不过感觉目前大多还是syntax层面的,没有到semantics层面。稍微欠缺些灵魂。

也有“真相帝”出来发声:

辛弃疾的流水散文式用典,老杜的沉郁顿挫拗救法,都是AI比较难学会的。问题不是AI太厉害,而是读者已经看不出格律诗里面比较精密的手法了…

华为推出AI诗人“乐府”:唐诗宋词都不在话下

对于这些问题,华为诺亚方舟实验室语音语义首席科学家刘群也在微博进行了答疑,披露了不少这只AI背后的故事:

其实我们也不懂诗,我们也没有用诗的规矩去训练这个系统,完全是系统自己学到的。

那么,这一AI到底是如何学的?论文已经公布。

华为推出AI诗人“乐府”:唐诗宋词都不在话下

理工男の文艺源自GPT

与自由生成文本不同,生成中国的古诗词是一个挑战,通常需要满足形式和内容两个方面的要求。

中国的古诗词有各种各样的形式,比如五绝、七绝、五律、七律、满江红、西江月、水调歌头等各种词牌以及对联,每一种都有相应的字数、押韵、平仄、对仗等规定;

内容方面虽然简单,但要求更加难以琢磨:一首诗要围绕着一个主题展开,内容上还要具有连贯性。

华为提出的“乐府”系统,与当前大多数解决方案不同,不需要任何人工设定规则或者特性,也没有设计任何额外的神经元组件。

华为推出AI诗人“乐府”:唐诗宋词都不在话下

整个研究中,需要做的就是把训练用的诗词序列化为格式化的文本序列,作为训练数据。

然后通过对语言模型token的抽样,生成满足形式和内容要求的诗词,比如绝句、律诗、词,以及对联等等。

而且,他们还提出并实现了一种对模型进行微调以生成藏头诗的方法。

这背后的能量来自GPT,一个由OpenAI提出的预训练自然语言模型,核心理念是先用无标签的文本去训练生成语言模型,然后再根据具体的任务通过有标签的数据对模型进行微调。

乐府AI是首个基于GPT打造的作诗系统,而且与谷歌提出的BERT息息相关。

整体的GPT模型是在BERT的源代码基础上实现的,Transformer大小的配置与BERT-Base相同,也采用了BERT中发布的tokenization 脚本和中文 vocab。

具体来说,训练诗歌生成模型的过程如下:

华为推出AI诗人“乐府”:唐诗宋词都不在话下

整个模型训练过程一共有两个阶段: 预训练和微调。

华为的这个GPT模型,是用一个中文新闻语料库进行预训练的,然后通过收集了公开可得的中国古诗词进行微调。

如上图所示,首先将示例诗歌转换为格式化序列。序列包括三个主要部分:格式、主题和诗体,中间用标识符分开。

在对联中,因为没有主题,就上句为主题,第二行为正文。所以,在生成对联的时候,就成了给出上联,生成下联的模式,也符合了“对对子”的习惯。

华为推出AI诗人“乐府”:唐诗宋词都不在话下

整体的数据集规模并不小,预训练用的中文新闻语料库,有2. 35 亿句子。微调用的数据集有 25 万绝句和律师, 2 万首词以及 70 万对对联。

预训练是在华为云上完成的,使用 8 块英伟达V100(16G) GPU训练了 4 个echo,一共耗费了 90 个小时。

微调的过程是将所有诗歌序列输入Transformer,并训练一个自回归语言模型。目标是观测任何序列的概率最大化:

华为推出AI诗人“乐府”:唐诗宋词都不在话下

微调的过程,不需要特别长的时间,如果训练过长,这个模型就在生成过程中,就会倾向于从语料库中直接用原始句子了。

训练完成后,先将要生成的诗歌的格式和主题转化为一个初始序列,然后将初始序列输入到模型中,然后对诗体部分的剩余字段按token进行解码。

在解码过程中,并不使用硬约束来保证格式的正确性,而是让模型自动为特定位置分配逗号和句号,在识别到token为“EOS”的时候,解码过程结束。

而且,采用截断 top-k 抽样策略来获得不同的诗歌,而不是束搜索。具体是每次采样一个Token时,首先选择具有 top-k 最大概率的Token,然后从 top-k Token中采样一个特定的token。

他们说,即使采用截短的 top-k 抽样策略,生成的诗歌仍然是正确的形式。

  • 相关推荐
  • 大家在看
  • 永中移动Office华为“耀星计划”上榜,共同引领AI办公新航向

    日前,华为开发者联盟公布了“耀星计划”第二十一批入选名单,永中移动Office经过评委组的严格审查名列其中,通过了HMS Core能力接入—AI领域认证。 “耀星计划”是华为于 2017 年底宣布启动的一项全球激励计划,旨在围绕HMS的AI、AR/VR、IoT、服务直达等领域,提供人才培养、开发支持、创新支持、品牌营销辅助、云资源优惠等举措,构筑创新生态沃土,多维度激励和扶持开发者,支持创新应用的落地。 截至 2020 年 5 月,“耀星计?

  • 共建AI生态,捷通华声完成双项华为鲲鹏云服务认证

    近日,捷通华声自主研发的灵云智能语音识别完成华为云鲲鹏云服务兼容性以及华为云Stack 6.5(鲲鹏)兼容性双项认证。用户可基于华为鲲鹏云服务和捷通华声相关人工智能技术、产品和解决方案快速构建高效运营的智能化平台,实现产业新升级。多元架构已成为智能时代之选在新基建成为国家战略的大形势下,智能社会、智能经济正加速到来,智能化、数字化、云化已经成为企业正常运转的标配。政府、金融、电信、能源等各行各业都在逐步从传?

  • 台积电称如果不能向华为销售芯片 其他订单可取代华为空缺

    6月9日消息,据国外媒体报道,台积电周二表示,如果美国禁令禁止公司向华为销售芯片,其他订单可以很快取代华为空缺。台积电在年度股东会上,台积电董事长刘德音表示,我们希望(禁止公司向华为销售芯片)不要发生。如果发生,我们会在很短时间补上。但刘德音也表示,很难预测多快能立刻补上华为旗下海思的市场空缺。此前,台湾媒体也曾报道,台积电将华为海思原本预订的第四季先进制程产能已开放给其它客户,包括苹果

  • 美国修改华为禁令是怎么回事?华为5G最新消息

    6 月 16 日,据路透社援引知情人士的消息称,美国商务部和其他机构已经批准了修改禁止美国公司与中国华为公司开展业务的规定,允许合作制定5G网络标准,美国政府的正式消息在等候《联邦公告》公布。这一规定已于上周五提交给《联邦公报》,最早将于本周二公布。

  • 华为Mate40系列发布时间 华为Mate40系列配置详细介绍

    今天推特爆料人 @Teme 带来了 Mate40 Pro 的更多爆料。爆料指出,Mate40 Pro 将采用专为折叠屏和超弯曲显示屏手机设计的 UTD 屏幕 。据屏幕分析机构 DSCC 的 CEO Ross young 此前曝光了一份 2020 年将采用 120Hz 高刷新率屏幕的手机列表。列表中出现了华为 Mate40、iPhone 12 Pro 系列、华硕 ROG Phone 2、一加 8 Pro、OPPO Find X2 等机型。

  • 美国允许美企与华为合作5G 华为:愿同美国厂商合作为人类做贡献

    美国政府一方面在严厉打压中国华为公司,另一方面美国的政策似乎又有矛盾之处,今天美国政府正式允许高通等美国企业跟华为合作制定5G标准。根据报道,美国商务部和其他政府机构准备修改规则,

  • 想要全面禁止华为?英国电信运营正确保华为设备库存是否充足

    对于英国运营商来说,想要彻底抛弃华为,并不是随便说说喊个口号那么容易。据外媒报道称,由于担心美国的制裁会破坏华为公司维持关键供应的能力,英国安全官员已告知英国电信运营商和沃达丰,

  • 解读华为和荣耀的关系 技术同源定位不同

    有人称荣耀是华为的“亲儿子”,实际上两者是并肩作战的“亲兄弟”。华为和荣耀的关系可以这样形容:“在同一面军旗下作战,又同属华为战斗序列,大家当以兄弟相称”。从诞生之初,荣耀就走的是和华为不同的路线。荣耀作为华为集团的骑兵,主攻线上市场。这支奇兵没过几年也变成了一个大兵团,用短短4年时间夺过来线上市场的头把交椅。近几年,荣耀正在全场景、全球化、全渠道快速拓展,如今已经发展为全渠道品牌。2019年,华为和?

  • 安芯网盾获得华为技术认证证书

    近日,安芯网盾内存保护系统V3. 0 与华为Stack8.0(鲲鹏)、鲲鹏云服务完成兼容性认证,并获得华为技术认证证书,这也意味着安芯网盾内存保护系统全面适配X86、ARM架构以及部分国产化系统。 华为云具备从芯片到服务器到云平台的全栈自主创新能力,软硬件深度协同使华为云鲲鹏云服务涵盖裸机、容器等不同形态,具备多样的计算能力,并保持开放的架构,更好地满足客户不同场景的需求, 目前华为云鲲鹏的行业解决方案集中在对安全有特?

  • 美国修改华为禁令 为什么要修改禁令

    据美国媒体报道,美国在6月15日周一确认要修改对华为的禁令,该禁令修改后将允许美国公司企业与华为合作制定下一代5G通信标准。对于修改该禁令,美国商务部长威尔伯·罗斯称,美国不会放弃全球创新领导地位,鼓励美国业界全面参与国际标准。

  • 美国修改华为禁令,允许美国公司与华为合作制定5G网络标准

    美国宣布已修改禁止与华为开展业务的美国公司的禁令。此举意味着允许美国公司与华为共享有关下一代5G技术的信息,以制定联合标准,同时无需得到美国商务部出口许可证。

  • 华为与荣耀不同在哪里?一个稳重,一个潮酷

    618 大促已经开启,荣耀不出意外地再次拔得头筹,截至 6 月 2 日23:59,荣耀手机斩获全平台手机累计销量冠军。如今的荣耀,不仅牢牢霸占线上头把交椅,也已成为全渠道一线品牌,与“大哥”华为,被公认为手机行业最成功的双品牌。但由于一母同源,很多人不清楚这对兄弟的关系,也好奇荣耀和华为的区别。同:荣耀华为技术同源,同样的高品质荣耀和华为同在华为集团CBG(消费者业务)旗下,就像一棵大树上的两个分支,基础的部分有很多

  • 华为新专利:相机UI移到侧边屏幕

    DoNews 6月16日消息(记者 刘文轩)LetsGoDigital发现华为的一项侧边触摸UI设计专利,并且有望应用到预计今年推出的Mate 40系列中。华为在专利中描述了一种侧边屏幕的触控方案,涵盖调节参数设置的±、闪光灯、白平衡、翻转摄像头图标,以及一个虚拟快门按钮。另一套方案则是从参数设置±图标开始,之后分别是HDR、闪光灯、白平衡、PIC图库。其实华为已经为Mate 30带来侧边虚拟快门键,不方便点按屏幕正下方的快门键时,可以将手指

  • 台积电:不希望失去华为、但已做好最坏准备

    据外媒报道,在今天上午(6月9日)举办的年度大会上,台积电董事长刘德音谈到了美国禁令和华为的问题。有记者问道,美方禁令生效后,台积电能否弥补华为的订单缺口,刘德音首先表示,我们不希

  • 华为“爵士”之父空降小米,MIX 4要成了?!

    小米突然宣布了一则重磅消息。官方宣布,杨柘将以小米集团副总裁,中国区首席营销官(CMO)的身份加入小米,成为常程之后又一名“空降”高管。在官方声明中小米明确表示,杨柘将来会负责中国区市场营销战略制定、品牌建设等工作,也算是填补了小米在这些方面的空缺。

  • 荣耀和华为有何不同?荣耀更能彰显年轻特质

    近期珠峰之巅打通第一个5G电话的消息刷屏了。 5 月 27 日,中国登山队队员在珠峰峰顶使用荣耀X10 进行了首次5G连线,荣耀成为首个登顶珠峰的5G手机品牌。在众多相关的报道当中,你可能还时不时看到华为的字眼。不少人会有疑问,荣耀手机跟华为公司是什么关系?荣耀手机跟华为手机又有什么区别呢?先看下这个图。我们通常说的华为有两层含义,一个是华为集团,是知名企业家任正非 1987 年创立的公司,华为集团旗下有运营商业务、企业?

  • 为了对抗华为5G 美国拼了:要收购爱立信

    在全球电信设备市场上,华为以28%的份额位列第一,同时在5G专利上20%的份额也是最多的。华为的强大让美国如坐针毡,不仅极限打压华为生存空间,还想着各种政策支持华为的竞争对手,甚至考虑收购

  • 一加和华为哪个玩游戏好 成为王者用它

    随着手游行业的发展,像王者、吃鸡等大型游戏对手机性能的要求越来越高,而手机性能经常被拿来对比的一加手机和华为,在玩游戏方面也经常被网友拿来一较高下。那么一加和华为哪个玩游戏好呢?我们从以下几个方面来看下。性能上,华为P40 Pro+ 所用芯片为麒麟990 5G 芯片,麒麟的9905G采用的是A76。而一加8系列搭载高通骁龙865处理器,高通骁龙865是一颗基于7纳米DUV工艺打造的旗舰芯片,不仅采用了全新的CPU架构设计,并且还集成了更强大的

  • 华为与比亚迪签订合作?比亚迪:暂无可披露的信息

    近日,有知情人士透露称华为方面正与比亚迪高层进行沟通合作,欲将麒麟芯片植入汽车。麒麟芯片是华为海思半导体公司自研的手机芯片,目前只面向华为和荣耀手机供货。如果能够用到汽车身上,无疑是对麒麟芯片适用性的扩展。

  • 京东手机3日竞速华为霸气全开 华为P40 Pro强势夺得5G销量榜冠军

    京东 618 年中购物节正在紧张激烈的进行中,各大手机品牌不断推出各种福利优惠,作为今年首个大型购物节,不少消费者纷纷晒出自己的购物车,互相分享种草好物,力求最优惠入手潮流新品。在消费者持续高涨的购物热情下,也使得各大品牌厂商的角逐战战况持续升级,变得异常激烈。在京东 618 手机竞速排行榜第三日,管中窥豹,各大品牌势头依然强劲!截止 6 月 3 日12:00,Redmi Note8 Pro经过了前两日的蓄势,厚积薄发冲进单品销量榜

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议