首页 > 评论 > 关键词 > 维基百科最新资讯 > 正文

维基百科上最高产的作者,是一个机器人

2020-03-14 11:32 · 稿源:爱范儿
文章目录

正如整个互联网上最常用的语言是英语,英语版维基百科同样也是全球 309 个语言版本维基百科中内容最丰富的一个。今年 1 月,英语版维基百科上的条目正式突破 600 万条。

出奇的是,拥有全球第二多条目的语言版本,并不是西班牙、法语等「大语种」维基,而是宿雾语(Cebuano)版的维基,一共有 538 万个条目。

如果你没听过这种语言,也是正常的。

宿雾语是一种在菲律宾使用的小语种,懂得讲宿雾语的人合计都没超过两千万。而且,宿雾语版维基的虽然有五百多万条条目,但管理员只有六人,活跃用户也只有 14 人;相比之下,英语版单单是管理员就有 1143 人,活跃用户更是超过了十万人。

事实上,宿雾语版维基那五百多万个条目,99% 的内容是一个名为「Lsjbot」的机器人所完成的。同时,它也是维基百科上最高产的作者。

状态好,一天能创立 10 万个条目

Lsjbot 的「爸爸」Sverker Johansson 是一位瑞典物理学家,而且还拥有语言学、经济学和土木工程的学位。他的太太是菲律宾人,通晓宿雾语,因此 Lsjbot 在瑞典语和宿雾语版本的维基百科中都有创作内容。

Johansson 表示,自己一直以来都对「一切事物的起源」充满兴趣,并认为维基百科在未来应该可以「让所有人了解所有事」。于是乎,他花了几个月时间编写了 Lsjbot,想用一种更快捷的方式将维基百科推向「囊括一切」的美好愿景。

Lsjbot 做的事情有点像「开荒牛」,将 0 变成 0.5。

它不会撰写系统丰盈的条目,只会简单地创立一个条目,放上最基本的信息,这种条目被称为「小条目(stub)」,有待用户进一步补充和丰富内容。Lsjbot 专注的领域也比较窄,主要都是生物物种和地理相关的内容。

▲ Lsjbot 一般生成的小条目都是这样的,图片来自维基百科

Lsjbot 生成内容的过程也非常程式化。首先,Johansson 会先就一个特定领域内容编写模板,然后寻找可信、机器可读的数据库作为信息来源,再让 Lsjbot 根据模板来「填空」,并完成后期的发布工作。效率高的时候,Lsjbot 一天能完成十万条小条目。

听着这个工作描述,大家也能感觉到,Lsjbot 虽冠名几百万条条目,但内容其实都只是干巴巴的「骨干」,缺乏人类的创造力和思考,自然惹来了部分活跃维基作者的不满。

总的来说,我反对机器人生成的小条目。(它们)只包含或多或少正确的分类信息,但却缺乏像动物外观等重要信息。

41 岁的 Achim Raschka 说,他是德语版维基百科的积极贡献者,常常会花好几天时间来完成一篇关于某种植物的深度条目。

Johansson 也承认,Lsjbot 创造的内容的确很无趣,但也坚持这些内容也有自己的价值。在他看来,Lsjbot 的条目能补充一些在原本维基社区中缺乏代表的领域。

维基百科作者的多样性已被诟病许久,有研究发现在维基百科上撰写内容的人大部分都是居住在北半球发达国家的男性白领,擅长科技产品。Johansson 指出,在瑞典语版的维基百科里,关于《指环王》中角色的条目就有超过 150 条,但关于越南战争的内容却少于 10 条:

我对托尔金没意见,而且相对于(越战中的)「春节攻势」,我也更熟悉(《指环王》中)索伦发起的战争,但这样真的是一个均衡的百科吗?

虽然 Lsjbot 的内容「干巴巴」,但 Johansson 希望这些知识骨干能抛砖引玉,启发未来的维基作者探讨原有社区「舒适区」以外的内容。

这也是为什么我认为 Lsjbot 这个「开荒牛」只将 0 做成了 0.5,因为得有人类作者的创造性参与,0.5 才能走向 1。

事实上,维基百科上除了 Lsjbot 外,还有大量承载着不同职能的机器人,它们已经成为了这个社区不可或缺的成员。

维基百科的「机器人军团」

我们常开玩笑说,机器人得来一次大罢工,所有人才会懂得感恩它们对社区做出的奉献。

(如果没有机器人)这个网站将需要我们做更多工作,编辑的工作过载率也会大大提升。

生活在澳洲的 Chris Grant 说道,他是维基百科社区中专门负责管理机器人的组织「机器人审批组(Bot Approvals Group,以下简称为 BAG)」的成员。

是的,机器人在维基百科上应用的历史悠久广泛得内部在 2006 年就已经设立了专门审核和管理机器人的 BAG。

从流程来看,如果有维基作者想在社区应用机器人,他们必须先向 BAG 提交申请,阐述机器人的功能、编程语言以及它预计会涉及的页面数等信息。随后,BAG 的成员会综合多方面预估其可能带来的影响,并决定是否通过。即便是已经通过审核的机器人,开发者每为它增加一个功能,机器人都必须重新提交审批。

截至 2018 年,维基百科上应用的机器人数早已破千,并且仍在不断发展。一篇 2019 年的论文 《The Roles Bots Play in Wikipedia》研究分析了维基百科上的机器人,并以职能将其分为九个大类:像 Lsjbot 般用其它数据来源生成页面的「生成者(Generator)」、负责修复超链接、文档之类的「维修者(Fixer)」、更新数据,记录用户状态的「文员(Clerk)」、向维基作者提供建议的「顾问(Advisor)」等等。

▲ 维基百科上机器人的九大分类

这些机器人大部分都帮人类编辑完成了社区中非常繁复的批量工作,同时也为新加入的成员在编写内容时提供帮助建议,清除各类恶性内容。当然,机器人也有犯错的时候,鉴于维基的编辑系统对修改记录的透明化,管理者也能及时更正错误和优化机器人。

没有机器人,维基百科将是一片混乱。

一位自称为 Hersfold 的维基百科管理员在接受 BBC 采访时说道。

当人们在反对 Lsjbot 时,他们在反对什么?

既然机器人在维基百科上的存在已经历史悠久,其中像 Lsjbot 这总内容生成型的也不少,为什么人们一直仍在就 Lsjbot 的存在合理性争辩?

事实上,维基百科诞生次年,首个被应用的机器人 「rambot」就已经诞生,而且它还是和 Lsjbot 类似的内容生成型机器人。

当时,rambot 从美国人口普查公开资料里提取地理信息,在英文版维基创建了三万条关于美国城镇的小条目,同时,这也是维基百科上第一个机器人。后来,这些条目逐渐由人类作者完善丰富,增添了各种历史事件和旅游资讯。

截至 2009 年,英文版维基百科中由机器人和辅助性程序参与的编辑占到了总数的 28.49%。

为什么做类似事情的 Lsjbot 却一直被攻击?

主要还是个占比的问题。

正如文章开头提及,宿雾语版维基的活跃用户只有十多人,而 Lsjbot 生成的条目有 500 多万条,部分人认为这个小社群没有可能能够去完成如此大量的完善工作。

因此,当一个新用户来到这个语言版本的维基百科时,他们所看到的就只有质量低下的条目,并会因此离开,或失去动力参与编辑贡献。

2017 年,因宿雾语版维基上大部分都是机器生成的内容,用户 KATMAKROFAN 提出关闭该语言版本维基。

最终,委员会在就该议题讨论的公开页面宣布驳回提议,表示「理解该项目中机器人生成内容的问题的确需要关注」,建议「收紧内容质量把控」。

所以说,人们在争辩的其实是社区运营的问题,同时,也在讨论机器人产生的内容如何影响人创作的积极性,并不涉及机器人创作内容质量本身。

Johansson 于今年接受 Vice 采访时表示,出于对社区 「态度改变」的考虑,现在 Lsjbot 已经不会再在宿雾语版维基创建新条目,只负责执行维护类工作。

虽然 Lsjbot 现在已经不创建新条目,而它们这类机器人的作品也许也称不上「创作」,但人类对写作机器人的探索一直没停过。

有的算法在写作,有的算法在默默影响人类写作

去年,华盛顿大学的团队突然想到一个曲线打击假新闻的方法 —— 想要创造最好的检测假新闻的算法?也许我们得先写一个擅长写假新闻的算法。

于是乎,Grover 诞生了。

只需要输入标题,Grover 就能生成一段假新闻。《Fastcompany》编辑曾以《为什么特朗普一天要做 100 个俯卧撑?》为题,让 Grover 发挥:

当你想到俯卧撑时,第一个想到的形象绝对并不是美国总统。

作为三军统帅,特朗普的健康状况并不怎样。他承诺一旦当选总统就会锻炼身体,而且在《飞黄腾达》中,他曾对阿诺德・施瓦辛格的技术大加嘲讽,如果没有什么能阻止特朗普不做「特朗普式的俯卧撑」。

不过就连特朗普自己也承认,不管你的工作多么适合你,要想驾驭自己的身体都是极其困难的。那么,是什么让三军统帅走上正轨呢?答案是 100 个俯卧撑。

虽然这段话看着看着让人觉得不妥,但仍无法否认它对特朗普言论风格的掌握不错,还挺「创造性」的。看到这里,你也许也会想起小爱同学写的诗句。Grover 论文的第一作者 Zellers 很好地总结出算法写作存在的普遍问题:

尽管书写看起来很流畅,但 Grover 和其他神经语言生成器所写的文章包含了机器独有的语言怪癖,这暴露了它们的机器起源。

正是因为算法写出来文章的「古怪」,它们正成为人类作家的一个寻找灵感的工具。

小说家 Sigal Samuel 最开始因好奇试玩了 OpenAI 的写作算法 GPT-2。这个算法能基于人输入词语或句子来「接话」。

Samuel 觉得,虽然算法反馈的东西很随机,但不时能冒出一些她意想不到的内容,激发她的灵感。所以,现在当她「灵感便秘」时,有时会用 GPT-2 进行「畅想」:

作为一名作家,你没法随时都身处创作研讨会或找到合适的朋友讨论想法。所以有这样的人工智能做参谋兼合作者还挺好的。

与此同时,也有自己不写作的算法,很有可能在更潜移默化地塑造人类未来的写作。

在美国,采用算法来为学生文章打分的学校至少遍布了 21 个州。这些算法的「底子」是数百篇经人类教师批改的文章和反馈。就和面试算法一样,这些改作文的算法同样被指存在偏见。

有家长反馈,算法批改文章的方式没有让自己的孩子更懂写作,只是鼓励了他们用各种浮夸的词语来换取高分。

不过,算法批改文章和人工批改间的最重要差别还是在于透明度——当文章是由人工批改,当你遇到困惑或不同意的结果,你可以去问改这个文章内容的人为何会作出这样的决定,但如果换做是算法,我们永远无法知道它的评价标准和原因。

无论是自己去写作的算法,还是被用于辅助人类写作的算法,未来这些工具只会有增无减。

也许它们的「语言怪癖」非常明显——这可以是像 Lsjbot 创造的小条目的「干巴巴感」,也能是 Grover 的「乍一看顺畅,细看觉得不妥」,但这不应该成为我们忽视它们的理由。无论喜欢与否,它们都将在不同程度上影响人类写作的创作。

当尼采开始用打字机写作后,他的朋友发觉他的散文变得更紧实,拥有了一种「强悍力道」。而他自己也认为「我们的写作工具会参与塑造思考」。在和机器人同行的算法时代,我们的写作又会如何演化?

  • 相关推荐
  • 大家在看
  • Facebook在测试将维基百科信息添加到搜索结果中

    Facebook正在测试一项新功能,该功能可以在一些搜索结果中显示维基百科的真实信息。现在Facebook搜索栏中输入某些主题时,结果将在页面右侧的一个框,包含相关主题的维基百科片段。这项功能类似于谷歌的知识面板(Knowledge Panels)。Facebook称,这项功能正在移动端网络、iOS应用程序和PC桌面上进行测试,并非每个用户都能看到。目前还不清楚测试将持续多久。

  • 糗事百科回应被字节跳动收购:暂无相关计划

    今日,针对“糗事百科被字节跳动收购”的事情,糗事百科的产品总监龚勋回应媒体称,我们最近有关注到相关新闻报道,也有很多行业人士和用户过来询问,在此简单做个回应,糗事百科没有被收购,近期也暂无这方面的计划。字节跳动方面对此暂无回应。

  • 京东数科智能机器人业务部总经理姚秀军:AI机器人在“新基建”背景下大有可为

    【TechWeb】6月12日消息,据京东数科方面发布的消息,目前,由京东数科自主研发的机房巡检AI机器人、铁路巡检AI机器人,正在机房场景和铁路场景代替传统人力完成重复性、高强度、高风险等精度作业,其中机房巡检机器人可在平均30秒内完成单个机柜的巡检,且检测准确率达到98%以上,SLAM自主导航精度误差在20毫米以内;铁路巡检机器人则节省铁路巡检运维成本50%。清华经管学院教授朱岩指出,当下人工智能效用存在夸大,机器人应该?

  • “生活有百科”百家号有什么作用?企业品牌必须知道的推广渠道

    备注:本文数据来自站长之家移动传媒平台,文章涉及的数据依托平台大数据计算所得,非百度官方数据,仅供参考。生活有百科是当前百家号中的普通号,目前账号百家号权重为3,综合排名位列67853名,社会分类排名位列8618名,领先了93.9%的百家号。 生活有百科百家号概况 生活有百科的简介为专注生活搞笑,生活自拍,生活常识。,是一家主旨明确、领域专注的自媒体作者,截止目前为止他们已经在百家号上发布了超过66篇的游戏内容,最?

  • “奇闻大百科”百家号财经领域排行,新作者选择哪个领域好?

    备注:本文数据来自站长之家移动传媒平台,文章涉及的数据依托平台大数据计算所得,非百度官方数据,仅供参考。奇闻大百科是当前百家号中的普通号,目前账号百家号权重为2,综合排名位列556060名,财经分类排名位列11869名,领先了50.2%的百家号。 奇闻大百科百家号概况 奇闻大百科的简介为最热的奇闻轶事,奇人逸事,是一家主旨明确、领域专注的自媒体作者,截止目前为止他们已经在百家号上发布了超过99篇的游戏内容,最近该作者?

  • “杂七杂八说百科”自媒体权重排名,做自媒体怎么从零开始?

    备注:本文数据来自站长之家移动传媒平台,文章涉及的数据依托平台大数据计算所得,非百度官方数据,仅供参考。杂七杂八说百科是当前百家号中的普通号,目前账号百家号权重为2,综合排名位列558284名,体育分类排名位列20430名,领先了50.0%的百家号。 杂七杂八说百科百家号概况 杂七杂八说百科的简介为尚不知天文,下还知地理,是一家主旨明确、领域专注的自媒体作者,截止目前为止他们已经在百家号上发布了超过4篇的游戏内容,最

  • 扫地机器人哪个牌子好?十大口碑扫地机器人品牌精选

    从实用角度来看,扫地机器人是都市家庭必不可少的一件清洁家电,好用的扫地机器人能帮助用户彻底搞定家居地面清洁工作。扫地机器人哪个牌子好呢?现如今,扫拖合一的智能扫地机器人成为了大众家庭的购机首选,市场里有哪些口碑好的机型呢?下面我们就来看看扫拖合一扫地机器人排名前十的品牌有哪些吧。第一名:斐纳TOMEFON扫地机器人德国斐纳TOMEFON品牌创立于 1976 年,已有超过 40 年的室内净化行业的成功发展历史。除了品牌实力雄

  • 普渡科技送餐机器人喜获2019机器人优秀应用案例奖

    2020 年 5 月 29 日,深圳市经信委、中国科学院深圳先进技术研究院共同指导,深圳市机器人协会主办的" 2019 年深圳市机器人产业发展白皮书发布仪式暨 2019 年深圳市机器人年度颁奖典礼"在深圳举行。此次典礼上,普渡科技被授予“ 2019 年度深圳市机器人优秀应用案例”奖。本次 2019 深圳机器人年度评选活动从技术创新、市场竞争力、市场口碑、规模实力等多维度进行综合考核,旨在通过奖项的评选,表彰在机器人领域有突出表现以及贡

  • 扫地机器人好用吗?看看主持人李湘怎么讲解浦桑尼克扫地机器人

    扫地机器人好用吗?这是很多人都想要了解的,特别是扫地机器人价格不菲,如果选择到的扫地机器人不好用,会让本来就不富裕的家庭变得雪上加霜了。在最近的李湘直播间李湘就说过,扫地机器人肯定是好用的,如果家里的面积非常大,扫地机器人清扫不会感觉到累,如果是人力来打扫,会感觉到累,而且打扫完以后可能还会有点小情绪,但是扫地机器人就不会。特别是家里养宠物的,毛发清理起来也非常麻烦,如果每天回家都清理一遍就不用休

  • 创通联达基于Qualcomm®机器人RB5平台助力5G+AI机器人商用

    2020 年 6 月 17 日,Qualcomm Technologies, Inc.推出专门面向机器人领域的先进、高集成度整体解决方案——Qualcomm?机器人RB5 平台。该平台融合了高通在5G和AI领域的深厚技术,具备领先的连接、高精准度AI和机器学习推理特性,能够支持开发者和终端厂商打造下一代具备高算力、低功耗的机器人和无人机产品,满足消费级、企业级、工业级和专业服务领域的要求,可广泛应用于各种机器人细分领域的产品。Qualcomm?机器人RB5 平台将在

  • 扫地机器人哪个牌子好?扫地机器人十大品牌排行榜全新揭晓

    扫地机器人发展至今,已经是非常智能的实用清洁神器,受到很多家庭的欢迎。然而,伴随着扫地机器人的热销和各类品牌的不断涌现,目前市场上已经有数百款不同的品牌扫地机器人产品,令人无从选择。扫地机器人哪个牌子好?毕竟扫地机器人价格不便宜,如果选到不满意的就非常吃亏。为了帮助大家选购到高性价比放心产品,接下来对扫地机器人十大品牌一一做个介绍。一、斐纳TOMEFON斐纳TOMEFON扫地机器人作为德国顶尖制造工艺的结晶,是世界公认?

  • 服务机器人崛起年:“鲶鱼”temi的谋变与进击

    科技专栏作者、独立评论员 王小琉2020 年一开始,突如其来的新冠疫情再次将机器人推向“风口”。无人配送、无人巡检等“无接触工作”的需求大增,更多人也体会到了机器人在“少人化”、“无人化”场景中的特殊作用。经济下行之时,服务机器人行业却迎来逆周期增长,赢得了 2020 年的“开门红”。无疑,疫情是一针催化剂。不仅让普通人认识到服务机器人的能力,也让更多身在其中的企业看到了前景。而经过这个特殊时间节点的洗礼,从

  • 扫地机器人哪个牌子好?实用机型用实力说话

    在智能家居领域,快速迭代的创新性技术带来了智能家电的革命性升级,也驱动着扫地机器人等高科技电子产品的飞速发展。特别是在近几年,扫地机器人在我国普及率非常之高,很多消费者已经将它列入家居生活必购的十大小家电之一的行列。那么,扫地机器人到底好不好用呢?不少人由于对新事物不够了解,担心买回家的产品不够实用。为了打消大家的疑虑,我们专门对市面上的几款主流扫地机器人进行了评测,最终发现,来自德国的斐纳(TOMEFO

  • 韩国首家机器人咖啡馆开业 不需要任何员工

    近日韩国首家机器人咖啡店开业,这家咖啡店主打完全的自动化系统,店内从咖啡制作到送餐都由机器人完成,不需要任何一名员工就可以完成。

  • 扫地机器人好用吗?李湘3分钟秒空的浦桑尼克扫地机器人真的好用吗?

    扫地机器人好用吗?这个问题一直困惑着很多刚认识扫地机器人的人,借用最近李湘直播时候安利的一款扫地机器人,我们来说一说扫地机器人到底好用吗?也来分析一下,为什么李湘直播安利的浦桑尼克扫地机器人,会在 3 分钟就被一扫而空呢,其中究竟有什么隐藏的故事呢? 扫地机器人真的好用吗?李湘在直播间推荐浦桑尼克扫地机器人的时候,也回答了这个问题,她表示:扫地机器人肯定是好用的,首先它不会累,阿姨可能打扫久了会累,会有情

  • 为什么猎豹移动的CCRSE能够受到众多机器人爱好者的喜爱?看看就知道了!

    最近,猎豹移动成功完成了第 15 期“猎豹机器人方案专家认证培训(CCRSE)——线上训练营”,又一批我们的行业合作伙伴,不出家门完成了业内面向服务机器人行业首推的人才培养认证体系课程,并通过考试,获得证书,成为“机器人方案专家”。这也是疫情发生以来,猎豹移动连续举办的第 7 场线上培训。新颖的课程设计,简便安全的培训形式,全程干货和细致讲授,受到众多参加培训的伙伴们十分积极的肯定和欢迎。CCRSE是猎豹移动推出的?

  • 被Angelababy、周震南等摸头杀?这个机器人为什么受宠

    6 月 20 日 22 点,中国首档原创手作解密互动体验秀节目《巧手神探》迎来了第 10 期的人机对抗挑战。机器人“大黄蜂”“擎天柱”联手出击抓捕神探、机械手精准弹击乒乓球、格斗机器人代替人进行实况对战……多款机器人精彩亮相、各显绝技。然而,在观看了长达 2 个小时的节目后,细心的观众却发现:只有机器人“贝拉”频频被Angelababy等众多明星“摸头杀”。节目里,Angelababy毫不掩饰对“贝拉”的喜爱,称赞道:“它很可爱,还?

  • 扫地机器人哪个牌子好?亲测好物选它不亏

    扫地机器人从诞生起发展至今已经不再是什么稀奇物件,当下消费者对扫地机器人的功能也提出了更高要求。什么样的扫地机器人才最值得入手?面对亘古不变的话题,一些商家找来评测机构加大宣传,力推旗下产品。但渐渐地有人发现,这些评测结果权威性不够,所起到的帮助消费者购机效果不明显。最终,笔者决定亲测一下,对比市场上销售情况不错的几款智能扫地机器人,最终选定商城价格在千元之间的德国斐纳TOMEFON智能扫地机器人。一、为

  • 专解家居清洁难题 扫地机器人哪个牌子好?

    在现代生活中,讲到家居清洁必定离不开扫地机器人这一新型智能家电。智能规划、智能扫拖是扫地机器人的拿手好戏,它在很大程度上解放了用户的双手,实现了更加高效、更省心的家居清洁体验。而扫地机器人中的代表产品就是斐纳(TOMEFON)扫地机器人。行业领军品牌德国斐纳(TOMEFON)注重技术研发、创新打造优质产品,运用硬核研发与生产力量打造出了更具实力的家居清洁神器。该款斐纳(TOMEFON)扫地机器人具备扫吸拖一体的清洁实力,拥有超强

  • 抗击疫情机器人迎来突破,猎豹移动携手猎户星空10000名机器人雇员上岗20场景

    由创业家&i黑马联合《证券日报》、新浪财经、财联社旗下科创板日报等多家媒体,携手 60 家投资机构,共同发起的“新基建产业独角兽TOP100” 榜单评选正式发布。本次评选共计 362 家企业通过初筛, 205 家企业通过复选,层层筛选后,最终决出了 100 家。在智能服务机器人行业表现突出的猎户星空作为人工智能领域独角兽成功入围本次TOP100 榜单。对于本次参加评选的企业,各项指标均有较为严格的条件。首先行业必须是分布在5G、特高?

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议

热文

  • 3 天
  • 7天