站长之家首页 > 评论 > 维基百科最新资讯 > 正文

维基百科上最高产的作者,是一个机器人

2020-03-14 11:32 · 稿源:爱范儿

正如整个互联网上最常用的语言是英语,英语版维基百科同样也是全球 309 个语言版本维基百科中内容最丰富的一个。今年 1 月,英语版维基百科上的条目正式突破 600 万条。

出奇的是,拥有全球第二多条目的语言版本,并不是西班牙、法语等「大语种」维基,而是宿雾语(Cebuano)版的维基,一共有 538 万个条目。

如果你没听过这种语言,也是正常的。

宿雾语是一种在菲律宾使用的小语种,懂得讲宿雾语的人合计都没超过两千万。而且,宿雾语版维基的虽然有五百多万条条目,但管理员只有六人,活跃用户也只有 14 人;相比之下,英语版单单是管理员就有 1143 人,活跃用户更是超过了十万人。

事实上,宿雾语版维基那五百多万个条目,99% 的内容是一个名为「Lsjbot」的机器人所完成的。同时,它也是维基百科上最高产的作者。

状态好,一天能创立 10 万个条目

Lsjbot 的「爸爸」Sverker Johansson 是一位瑞典物理学家,而且还拥有语言学、经济学和土木工程的学位。他的太太是菲律宾人,通晓宿雾语,因此 Lsjbot 在瑞典语和宿雾语版本的维基百科中都有创作内容。

Johansson 表示,自己一直以来都对「一切事物的起源」充满兴趣,并认为维基百科在未来应该可以「让所有人了解所有事」。于是乎,他花了几个月时间编写了 Lsjbot,想用一种更快捷的方式将维基百科推向「囊括一切」的美好愿景。

Lsjbot 做的事情有点像「开荒牛」,将 0 变成 0.5。

它不会撰写系统丰盈的条目,只会简单地创立一个条目,放上最基本的信息,这种条目被称为「小条目(stub)」,有待用户进一步补充和丰富内容。Lsjbot 专注的领域也比较窄,主要都是生物物种和地理相关的内容。

▲ Lsjbot 一般生成的小条目都是这样的,图片来自维基百科

Lsjbot 生成内容的过程也非常程式化。首先,Johansson 会先就一个特定领域内容编写模板,然后寻找可信、机器可读的数据库作为信息来源,再让 Lsjbot 根据模板来「填空」,并完成后期的发布工作。效率高的时候,Lsjbot 一天能完成十万条小条目。

听着这个工作描述,大家也能感觉到,Lsjbot 虽冠名几百万条条目,但内容其实都只是干巴巴的「骨干」,缺乏人类的创造力和思考,自然惹来了部分活跃维基作者的不满。

总的来说,我反对机器人生成的小条目。(它们)只包含或多或少正确的分类信息,但却缺乏像动物外观等重要信息。

41 岁的 Achim Raschka 说,他是德语版维基百科的积极贡献者,常常会花好几天时间来完成一篇关于某种植物的深度条目。

Johansson 也承认,Lsjbot 创造的内容的确很无趣,但也坚持这些内容也有自己的价值。在他看来,Lsjbot 的条目能补充一些在原本维基社区中缺乏代表的领域。

维基百科作者的多样性已被诟病许久,有研究发现在维基百科上撰写内容的人大部分都是居住在北半球发达国家的男性白领,擅长科技产品。Johansson 指出,在瑞典语版的维基百科里,关于《指环王》中角色的条目就有超过 150 条,但关于越南战争的内容却少于 10 条:

我对托尔金没意见,而且相对于(越战中的)「春节攻势」,我也更熟悉(《指环王》中)索伦发起的战争,但这样真的是一个均衡的百科吗?

虽然 Lsjbot 的内容「干巴巴」,但 Johansson 希望这些知识骨干能抛砖引玉,启发未来的维基作者探讨原有社区「舒适区」以外的内容。

这也是为什么我认为 Lsjbot 这个「开荒牛」只将 0 做成了 0.5,因为得有人类作者的创造性参与,0.5 才能走向 1。

事实上,维基百科上除了 Lsjbot 外,还有大量承载着不同职能的机器人,它们已经成为了这个社区不可或缺的成员。

维基百科的「机器人军团」

我们常开玩笑说,机器人得来一次大罢工,所有人才会懂得感恩它们对社区做出的奉献。

(如果没有机器人)这个网站将需要我们做更多工作,编辑的工作过载率也会大大提升。

生活在澳洲的 Chris Grant 说道,他是维基百科社区中专门负责管理机器人的组织「机器人审批组(Bot Approvals Group,以下简称为 BAG)」的成员。

是的,机器人在维基百科上应用的历史悠久广泛得内部在 2006 年就已经设立了专门审核和管理机器人的 BAG。

从流程来看,如果有维基作者想在社区应用机器人,他们必须先向 BAG 提交申请,阐述机器人的功能、编程语言以及它预计会涉及的页面数等信息。随后,BAG 的成员会综合多方面预估其可能带来的影响,并决定是否通过。即便是已经通过审核的机器人,开发者每为它增加一个功能,机器人都必须重新提交审批。

截至 2018 年,维基百科上应用的机器人数早已破千,并且仍在不断发展。一篇 2019 年的论文 《The Roles Bots Play in Wikipedia》研究分析了维基百科上的机器人,并以职能将其分为九个大类:像 Lsjbot 般用其它数据来源生成页面的「生成者(Generator)」、负责修复超链接、文档之类的「维修者(Fixer)」、更新数据,记录用户状态的「文员(Clerk)」、向维基作者提供建议的「顾问(Advisor)」等等。

▲ 维基百科上机器人的九大分类

这些机器人大部分都帮人类编辑完成了社区中非常繁复的批量工作,同时也为新加入的成员在编写内容时提供帮助建议,清除各类恶性内容。当然,机器人也有犯错的时候,鉴于维基的编辑系统对修改记录的透明化,管理者也能及时更正错误和优化机器人。

没有机器人,维基百科将是一片混乱。

一位自称为 Hersfold 的维基百科管理员在接受 BBC 采访时说道。

当人们在反对 Lsjbot 时,他们在反对什么?

既然机器人在维基百科上的存在已经历史悠久,其中像 Lsjbot 这总内容生成型的也不少,为什么人们一直仍在就 Lsjbot 的存在合理性争辩?

事实上,维基百科诞生次年,首个被应用的机器人 「rambot」就已经诞生,而且它还是和 Lsjbot 类似的内容生成型机器人。

当时,rambot 从美国人口普查公开资料里提取地理信息,在英文版维基创建了三万条关于美国城镇的小条目,同时,这也是维基百科上第一个机器人。后来,这些条目逐渐由人类作者完善丰富,增添了各种历史事件和旅游资讯。

截至 2009 年,英文版维基百科中由机器人和辅助性程序参与的编辑占到了总数的 28.49%。

为什么做类似事情的 Lsjbot 却一直被攻击?

主要还是个占比的问题。

正如文章开头提及,宿雾语版维基的活跃用户只有十多人,而 Lsjbot 生成的条目有 500 多万条,部分人认为这个小社群没有可能能够去完成如此大量的完善工作。

因此,当一个新用户来到这个语言版本的维基百科时,他们所看到的就只有质量低下的条目,并会因此离开,或失去动力参与编辑贡献。

2017 年,因宿雾语版维基上大部分都是机器生成的内容,用户 KATMAKROFAN 提出关闭该语言版本维基。

最终,委员会在就该议题讨论的公开页面宣布驳回提议,表示「理解该项目中机器人生成内容的问题的确需要关注」,建议「收紧内容质量把控」。

所以说,人们在争辩的其实是社区运营的问题,同时,也在讨论机器人产生的内容如何影响人创作的积极性,并不涉及机器人创作内容质量本身。

Johansson 于今年接受 Vice 采访时表示,出于对社区 「态度改变」的考虑,现在 Lsjbot 已经不会再在宿雾语版维基创建新条目,只负责执行维护类工作。

虽然 Lsjbot 现在已经不创建新条目,而它们这类机器人的作品也许也称不上「创作」,但人类对写作机器人的探索一直没停过。

有的算法在写作,有的算法在默默影响人类写作

去年,华盛顿大学的团队突然想到一个曲线打击假新闻的方法 —— 想要创造最好的检测假新闻的算法?也许我们得先写一个擅长写假新闻的算法。

于是乎,Grover 诞生了。

只需要输入标题,Grover 就能生成一段假新闻。《Fastcompany》编辑曾以《为什么特朗普一天要做 100 个俯卧撑?》为题,让 Grover 发挥:

当你想到俯卧撑时,第一个想到的形象绝对并不是美国总统。

作为三军统帅,特朗普的健康状况并不怎样。他承诺一旦当选总统就会锻炼身体,而且在《飞黄腾达》中,他曾对阿诺德・施瓦辛格的技术大加嘲讽,如果没有什么能阻止特朗普不做「特朗普式的俯卧撑」。

不过就连特朗普自己也承认,不管你的工作多么适合你,要想驾驭自己的身体都是极其困难的。那么,是什么让三军统帅走上正轨呢?答案是 100 个俯卧撑。

虽然这段话看着看着让人觉得不妥,但仍无法否认它对特朗普言论风格的掌握不错,还挺「创造性」的。看到这里,你也许也会想起小爱同学写的诗句。Grover 论文的第一作者 Zellers 很好地总结出算法写作存在的普遍问题:

尽管书写看起来很流畅,但 Grover 和其他神经语言生成器所写的文章包含了机器独有的语言怪癖,这暴露了它们的机器起源。

正是因为算法写出来文章的「古怪」,它们正成为人类作家的一个寻找灵感的工具。

小说家 Sigal Samuel 最开始因好奇试玩了 OpenAI 的写作算法 GPT-2。这个算法能基于人输入词语或句子来「接话」。

Samuel 觉得,虽然算法反馈的东西很随机,但不时能冒出一些她意想不到的内容,激发她的灵感。所以,现在当她「灵感便秘」时,有时会用 GPT-2 进行「畅想」:

作为一名作家,你没法随时都身处创作研讨会或找到合适的朋友讨论想法。所以有这样的人工智能做参谋兼合作者还挺好的。

与此同时,也有自己不写作的算法,很有可能在更潜移默化地塑造人类未来的写作。

在美国,采用算法来为学生文章打分的学校至少遍布了 21 个州。这些算法的「底子」是数百篇经人类教师批改的文章和反馈。就和面试算法一样,这些改作文的算法同样被指存在偏见。

有家长反馈,算法批改文章的方式没有让自己的孩子更懂写作,只是鼓励了他们用各种浮夸的词语来换取高分。

不过,算法批改文章和人工批改间的最重要差别还是在于透明度——当文章是由人工批改,当你遇到困惑或不同意的结果,你可以去问改这个文章内容的人为何会作出这样的决定,但如果换做是算法,我们永远无法知道它的评价标准和原因。

无论是自己去写作的算法,还是被用于辅助人类写作的算法,未来这些工具只会有增无减。

也许它们的「语言怪癖」非常明显——这可以是像 Lsjbot 创造的小条目的「干巴巴感」,也能是 Grover 的「乍一看顺畅,细看觉得不妥」,但这不应该成为我们忽视它们的理由。无论喜欢与否,它们都将在不同程度上影响人类写作的创作。

当尼采开始用打字机写作后,他的朋友发觉他的散文变得更紧实,拥有了一种「强悍力道」。而他自己也认为「我们的写作工具会参与塑造思考」。在和机器人同行的算法时代,我们的写作又会如何演化?

  • 大家在看
  • 相关推荐
  • 格力获得多项机器人专利 对弈机器人专利被授权

    近日,珠海格力智能装备有限公司新增“对弈机器人”专利。据专利摘要显示,本发明公开了一种对弈难度等级的处理方法及装置、机器人。其中,该方法包括:在本局人机对弃过程中,记录对弈人的下棋过程;根据记录的下棋过程

  • 雷神山机器人上岗

    昨日,医疗机器人在湖北武汉雷神山医院上岗,主要进行病区消毒、医用物品配送等工作。据介绍,该医疗机器人是一家深圳企业为雷神山医院量身定制,该机器人身高1. 5 米,一次充电可以 8 小时连续工作。

  • 互动百科:将于4月30日下线用户服务及百科商城

    昨日,互动百科发布《关于互动百科网站服务升级的公告​》称,将于 2020 年 4 月 30 日进行网站改版升级。其中, 2020 年 4 月 30 日起,原互动百科网站用户服务将下线,用户可通过申请新的账号使用百科产品。用户可在 2020 年 4 月 30 日前登陆互动百科网站,备份文档。

  • 瑞云渲染为《爱,死亡和机器人》之《三个机器人》提供云渲染服务

    IMDb 9.0,豆瓣9. 4 的充满血腥、暴力、黑色幽默又引人深思的成人动画短片选集《爱,死亡与机器人》第一季(Love,Death & Robots以下简称《爱死机》),由《死侍》导演Tim Miller与知名导演David Fincher(代表作《纸牌屋》《七宗罪》《龙纹身的女孩》等),两大鬼才联手监制,号召来自世界各地的动画团队制作,包括获奖无数的《蜘蛛人:平行宇宙》的前艺术总监Alberto Mielgo。这选集不仅故事吸引人,动画风格多变,视觉效果更是为人

  • 疫情期间无接触配送机器人崛起,九号机器人已率先抢跑一年

    疫情之下的中国,每天都在书写传奇。突如其来的疫情打乱了所有生活常态,却也在倒逼中国各行各业突破创新,各大物流公司乃至科技创新企业都加快了将无人配送车投入实际场景的脚步,机器人产业终于迎来发展新机遇 ,而九号机器人在这一赛道已抢跑了一年,走在了行业的最前列。过去的一两年,无人配送机器人行业极为“低调”,整个行业都处于从0到1的阶段,大家都在默默地研发、测试着低速无人物流车,期待尽快度过黎明前的黑暗期。?

  • 雷神山医院医疗机器人上岗 雷神山医院医疗机器人主要用途介绍

    随着技术的不断进步,人工智能在新冠疫情的这场战斗中发挥着不可忽视的重要作用。据新京报消息, 3 月 5 日,医疗机器人正式在武汉雷神山医院上岗。机器人搭载的消毒箱喷出雾化消毒液,可达到手术室消毒级别标准,每分钟可覆盖消杀面积 120 平方米,可以替代 4 个专业消杀人员的工作,机器人还可实现对自身进行消毒。机器人还能够自动换上装有药品、医疗器械等物品的配送箱,到多个感染科病区内进行配送,减轻医护人员工作负担的同

  • 融云创:智能语音机器人将成为金融机构“AI数字员工”

    在这个以“客户为王”的时代,谁能提供更优质的服务,谁能抓住用户的心,谁才能成为行业中的“王者”。伴随着人工智能、云计算、区块链等高新技术的崛起,中国人工智能在金融行业异军突起备受关注,人工智能为金融业拓展更多丰富的应用场景之外,也在推动金融业迈向高质量发展。 从前端营销的客户交互到系统后台的业务工单流转、分发,用户反馈与满意度调研,以及更深度的用户画像与精准营销,人工智能正在驱动客户旅程的变革。智

  • 格力跨界申请专利:弹奏钢琴的机器人

    天眼查专利数据显示,近日,格力电器的运营主体珠海格力电器股份有限公司公布了 2019 年 11 月 20 日申请的专利——机器人弹奏钢琴的控制方法、装置、存储介质和机器人。

  • 达观RPA溯源机器人助力乌海公安防控管理

    在当下复工阶段,相关公共部门对复工人员的信息采集工作尤为重要。近日达观数据联合乌海市公安局,通过引入RPA机器人,在疫情防控监测点对通行人员的轨迹进行溯源识别,帮助防控指挥部对复工人员的流动信息进行自动化采集、识别与判断,为疫情防控和维护社会稳定提供保障。疫情防控期间,乌海市公安局巡逻防爆分局所负责跟踪的进出口人口流量巨大,每日货车流量在 3000 人左右,流动人员接近 4000 人,大量繁杂的登记内容为基层工?

  • 哈工大机器人联手大学仕 实力跨界助推口罩生产

    疫情就是命令,需求即是号角。全球新冠肺炎疫情形势严峻,医用口罩需求量近一个月环比增长 137 倍,全世界都在等着“中国制造”,生产汽车的五菱转产了,生产空调的格力转产了,生产饮料的旺旺也转产了。在大学仕平台上同样有一家跨界转产的自动化设备服务商,它就是哈工大机器人系统(佛山)有限公司。哈工大机器人系统(佛山)有限公司(以下简称HRS)是哈工大机器人集团特种事业部的全资子公司,HRS专注于完美的自动化工厂解决方案,?

  • 度小满金融智能语音机器人凭AI优势 助力高效复工

    当下,全国各地已经按下复工加速键,各行各业在做好防控疫情的同时,全面进入复产复工期。如何让企业做到战疫复工两不误?近期,度小满发挥人工智能等技术优势,推出多项举措助力各行业企业抗击疫情,快速高效复工。其一,为金融机构提供1个月免费的智能语音机器人服务,更大限度降低金融机构部署在线智能服务的成本;其二,针对疫情中出现的新问题,针对性推出特殊版本机器人,增加疫情识别的多种意图。其实,语音机器人在客服领域?

  • 扫地机器人哪个牌子好?维持洁净生活非它不可

    家里脏乱差对有洁癖的人来说那简直是要她们的命,所以就算是再忙也都要挤出时间把家务做好,而现在智能家电的兴起,简直就是洁癖者们的福星。就拿智能扫地机器人来说,全自动运行的清洁产品无论何时都能对全屋进行打扫,让家居环境时刻保持干净整洁。那么据了解,在市场上许多消费者都选择来自德国品牌的斐纳TOMEFON-TF-G808 智能扫地机器人,到底它有怎样出色的能力能获得这么多消费者的信赖呢?下面就让我们一起来看一看吧!斐纳TO

  • 日本餐厅引进煮面机器人 1小时能煮40碗面

    疫情期间,为了防止病毒传染,近日,日本东京位于车站的一家面馆引进“煮面机器人”。该机器人拥有长长的机械臂,可以自动完成煮面和过水等等步骤。机器人煮一碗面大约需要 2 分钟,每小时可煮 40 碗面。而安装这样一台机器人需要需要花费 300 万日元(约合人民币 20 万元)。

  • AI学习机器人阿尔法蛋大蛋2.0上新多项学习技能

    “盼望着,盼望着,东风来了,春天的脚步近了。”春天来了,阿尔法蛋大蛋2. 0 春日上新也如约而至。为了让还在家中的孩子们更好地“停课不停学”,培养良好学习习惯,此次大蛋2. 0 的更新带来了更多的实用学习技巧。记得打开你家的大蛋2.0,更新后一一体验下哦!大蛋2. 0 此次主要更新一览:.“学习工具”板块中,成语解释、近反义词、查单词和中英互译上线全新界面,可查看历史记录,前三个功能中新增“大家都爱问”,中英互译增加

  • 互动百科公告将于 2020 年 4 月 30 日进行网站改版升级

    互动百科网站公告表示,为改善网站用户体验,为用户提供更好的百科产品,互动百科将于 2020 年 4 月 30 日进行网站改版升级。

  • 如何确保全屋的整日洁净?扫地机器人哪个牌子好?

    随着科技的发展,人们的生活水平不断提高,在生活质量上也发生了很大的变化。尤其体现在家务上,过去需要人工操劳的家务,现在只需“动动手指”在手机APP上就能轻松实现。如今备受大众青睐的智能扫地机器人已经能实现手机远程智能操控,就连实时清扫轨迹都能看得清清楚楚。扫地机器人哪个牌子好呢?来自德国的斐纳TOMEFON现在可以说是国内电商平台的大热品牌,非常值得推荐给大家。了解斐纳TOMEFON的朋友都知道,它来自精工德国,有

  • 扫地机器人哪个牌子好?暖春好物首选德系机型

    草长莺飞二月天,万物悄然复苏,让人们沉重的心稍感宽慰。所谓明日有明日的希望,危机过后,大多数人仍然会选择向前看。迎来疫情拐点后,不少人都有为自己选购新衣,或是为家中添置些小物件,以期扫去心中阴霾,带来积极的新气象。如果确实烦闷无趣,却又不知如何放松,不如就将目光放开些,着手提升下家居幸福感吧。举例来说,如果家中仍然在使用扫帚、拖布等传统清洁工具,那么不如就尝试下更新换代,为家中添置一款扫地机器人。

  • 扫地机器人哪个牌子好?大数据统计十大销量品牌

    在科学技术越来越先进的今天,扫地机器人凭借高精尖科技进入了人们的生活,在全覆盖的功能下,为人们的日常清扫带来了极大的便捷。小编总结了当下销量最高的扫地机器人十大品牌,大家一起来看看吧。第一名:斐纳TOMEFON1976 年问世的德国斐纳TOMEFON,凭借自身超前沿的研发技术,成为了扫地机器人市场的销量第一,是名副其实的的最为领先的室内净化产品。斐纳TOMEFON在自身砥砺发展的四十余年里,不断将自己的技术革新,以走在最前

  • 助力餐厅实现密闭无接触配送,普渡科技全新封闭式送餐机器人亮相

    今日,配送机器人领域的头部企业普渡科技宣布将推出封闭式送餐机器人“欢乐送 BOX”,该机器人拥有航空级铝合金打造的全封闭式箱体结构,能保证配送过程中的卫生性和安全性,帮助餐饮行业建立高效安全的无接触配送体系,更快走出疫情阴霾。“网红”送餐机器人全新进化据了解,“欢乐送”是普渡科技 2017 年推出的旗舰配送机器人产品。凭借着极简化、高效率的设计,“欢乐送”获得了当年设计界奥斯卡之称的“德国红点奖”中“最佳设

  • 科技抗疫 猎豹移动推出“机器人医疗系统疫情防控解决方案”

    此时的中国,举国上下都在关注抗击新冠肺炎疫情前线战斗的消息。而在后方,一场同样重要的经济保卫战也全面打响。2 月 8 日,国务院应对新冠疫情联防联控机制印发《关于切实加强疫情科学防控 有序做好企业复工复产工作的通知》。《通知》指出,要按照科学、合理、适度、管用的原则制定针对性措施,既要切实做好春节后返程和复工复产后的疫情防控工作,确保人民生命安全和身体健康;又要及时协调解决复工复产中的困难和问题,尽早恢?

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议

热文

  • 3 天
  • 7天