首页 > 传媒 > 关键词  > 网易易盾最新资讯  > 正文

从“衤果耳卯”到藏头诗,网易易盾如何实现文本鉴黄?

2016-10-18 16:48 · 稿源: 站长之家用户

今年以来,智能鉴黄行业的兴起,让传统的人工审核、鉴黄师等逐渐相形见绌,互联网创业者、中小型企业寻求第三方反垃圾云服务成为一种新的趋势。这其中凝聚着网易公司十余年反垃圾技术和安全经验的“网易易盾”成为佼佼者,并率先在全国发起成立了头个互联网内容安全联盟,在文本、图片等智能反垃圾方面树立了标杆。

仅以最基础的文本鉴黄技术,记者采访了网易易盾的工程师,为大家揭秘文本鉴黄背后的机制:

记者:文本反垃圾尤其是文本鉴黄主要在哪些场景被应用?

网易易盾:主要是在新闻、社交、论坛、博客、小说等UGC产品中的应用,除了正常产品信息,这些UGC中还存在大量的色情淫秽、广告诈骗、暴恐谣言、政治敏感等垃圾文本内容。其中广告和色情是文本垃圾的主力军。

(2015年网易323亿条反垃圾数据统计)

记者:能举个直观点的例子吗?

  网易易盾:那就拿“裸聊”这个词来举例吧,在垃圾内容里有非常多的演变。比如下面这一系列的字符:

光一个“裸聊”就有几十种变形。但实际上在很多论坛尤其是跟帖评论区,甚至会会出现把垃圾内容隐藏在藏头诗中这样更复杂的情况。

记者:那易盾是怎么解决问题的呢?

  网易易盾:常规的审核方法是关键词识别和算法规则,算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让常规审核方法也束手无策。一方面除了要识别出垃圾文本,另外一方面不能把正常内容也判定成垃圾信息,举个比较污的例子:

比如“口交”一词,通过常规审核肯定是认定为垃圾内容,但当它出现在“港口交通”、“串口交接线”这样的语境里却是正常内容,很容易造成误判。

记者:那怎么避免或降低这种复杂语义下的垃圾文本呢?

  网易易盾:这时候我们就要依托语义分析来处理辨别。语义分析是依托深度学习技术和大数据技术,从网易19年沉淀的亿级垃圾特征库中提取和不断添加新特征,通过反复学习更有用特征,来达到对复杂语义钟垃圾内容的比较准确判定。通过这两项关键技术,目前易盾文本反垃圾的准确率可以达到99.6%

记者:那怎么接入易盾呢?

  网易易盾:很方便啊,在易盾官网10分钟就可调用接入易盾sdk和开放API, 现在七牛平台上的用户也可以直接在文本反垃圾服务中直接调用易盾接口。

与网易易盾工程师的聊天让人感叹处理垃圾的不易,10万汉字丰富的排列组合,延伸出不同语境下的复杂语义,同时演变出大量高深莫测的垃圾变种,智能反垃圾需要的是大量的、长期积累的特征库,这远非一般的创业公司所能实现。

关于深度学习,这是近两年非常热门的词汇,其具体含义如下:

据网易易盾的工程师介绍,深度学习技术之所以近两年取得飞跃,源于云计算、大数据的深入发展。他同时认为,机器智能鉴黄代替人工审核将是未来的趋势。

据了解,网易易盾自推出以来,服务的产品包括网易系过亿用户的网易云音乐、网易跟帖等知名产品,同时拥有足记、美食杰、春雨医生等海量外部客户,成为同类产品中最有实力的大企业背景第三方云服务,同时也代表着行业技术的比较高水准。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 第五人格崩了上热搜 网易旗下多款游戏回应:紧急排查中

    今日上午,网易旗下多款热门手游集体出现无法登录的异常情况,包括《阴阳师》《第五人格》《七日世界》《一梦江湖》等游戏的玩家纷纷在社交平台反馈登录受阻。相关话题“网易游戏崩了”迅速登上微博热搜榜,引发广泛关注。

  • 网易MuMu模拟器亮相 2025 ChinaJoy:技术革新赋能全平台手游生态

    2025年8月,网易MuMu模拟器5.0版本在ChinaJoy展会亮相,成为首个支持Windows、Windows ARM和macOS的全平台安卓模拟器。该版本通过ARM架构深度适配等核心技术,实现"不挑设备、秒开秒用"的流畅体验,可运行超220万款手游。MuMu 5.0同步推出海外版,支持多语言切换,助力网易游戏全球化布局。在高通展区,MuMu展示了基于ARM架构的移动应用解决方案,解决Windows ARM设备运行安卓模拟器的需求。现场玩家可通过搭载骁龙芯片的电脑体验《蛋仔派对》等热门手游的PC端极致表现。此次升级标志着MuMu从工具向跨端智能枢纽的转型,重新定义"无界交互"的游戏体验边界。

  • 渣打中国与网易数帆展开合作,探索数据开发智能化升级

    7月23日,渣打银行(中国)与网易数帆在上海举行线下交流会,探讨金融行业数据治理、AI技术与银行数字化发展等议题。渣打中国首席信息官乔建新等高管出席。作为历史悠久的国际银行,渣打持续加大金融科技投入,加快数字化转型。网易数帆基于20余年技术沉淀,以数据应用为核心,助力金融机构释放数据价值。2022年双方合作升级EasyData平台,此次进一步探讨AI技术提升数据开发效能的新路径,展示自然语言生成代码等功能。未来双方将继续深化合作,推动前沿科技在金融领域的创新应用。

  • 80岁网红凯凯爷爷去世 温馨日常成网友珍贵回忆

    ​8月2日下午,河南知名网红账号“凯凯的幸福生活”发布讣告,宣布其爷爷梁怀诚于7月24日在家中安详离世,享年80岁。该账号以分享凯凯与爷爷奶奶的温馨日常生活而走红,积累了超过250万的忠实粉丝。 今年3月,凯凯爷爷在全家人的祝福声中迎来了80岁大寿,四代同堂的温馨画面让无数网友动容,纷纷在评论区留言祝福。在凯凯发布的众多视频中,凯凯奶奶总是以高情商�

  • 夫妻离婚分鸡多出一只被判吃掉再离 网友:“吃鸡”后再离婚

    ​近日,四川省广安市前锋区法院代市镇法庭成功调解了一起特殊的离婚财产分割案。这起案件中,双方争议的焦点不是房产或存款,而是共同饲养的53只家禽:29只鸡、22只鹅和2只鸭子。 今年5月,杨大哥(化名)将涂大姐(化名)诉至法院要求离婚。当事人均为农村居民,以务农、养殖牲畜为主要收入来源,男方农闲时会在周边打零工。承办法官陈茜介绍,两人除农村自建房外�

  • 基孔肯雅热患者会痛一辈子?专家回应 网友:放心了

    针对近期网友对基孔肯雅热可能引发长期病痛的担忧,有网友称感染后“一感冒就要疼一辈子”,甚至“关节会被毁掉”,相关专家给出了专业回应。 专家指出,感染基孔肯雅热后,患者确实可能出现关节疼痛,尤其是小关节疼痛,且部分病例的疼痛症状持续时间较长。不过,仅有少数人的症状会延续至2-3年,且多为间歇性发作。通过医学影像检查可见,关节本身很少出现像

  • 网易易盾升级,可定制专属反垃圾方案

    随着互联网技术的日渐发展,相继诞生了垂直社区、社交平台、短视频应用、网络直播等越来越多样的产品。但在内容爆炸式增长的同时,海量UGC中也夹杂着各种违规垃圾信息,包括垃圾广告、诈骗信息、色情信息等违法违规信息等,让不少互联网产品和广大网民深受其害。

  • 创办5周年,网易易盾与用户在一起

    10月15日与22日,网易易盾5周年“数字内容行业”闭门会分别在北京与杭州成功举行。闭门会由网易易盾举办,吸引了来自娱乐社交、游戏、数字阅读等各个行业的客户代表、企业合作伙伴、媒体记者共100余人参加,围绕数字内容的生产、传播与风控等热点议题进行讨论。闭门会旨在促进行业交流,更好地了解客户群体不断变化的需求,从监管政策分析、风控产品进阶与品牌成立初衷等角度出发,易盾向客户输送了深度风控知识,回顾与企业之间的

  • 对话网易易盾人工智能教员组:一次消除歧视的尝试

    当数据被错误使用,算法模型可能会进一步强化种族主义和性别歧视等刻板印象,得出带有偏见和歧视的错误结论...在岗位上,孔杰首先要输出自己的判断,一遍遍不厌其烦地教育着工程师搭建的 AI 机器模型,让机器模型知道这些内容数据中存在这样或那样的问题...AI 系统中的不公平性也显著暴露出来,简单来说,就是作为人工智能大脑的“黑箱”中出现的各类偏见,如性别歧视、种族偏见、就业歧视、教育歧视、价格歧视、犯罪行为预测偏见等......

  • 男子用AI造谣“女儿被抱走”:内容是编的 图是网上找的

    近日,一则用AI生成的寻人启事”引发关注。 该则寻人启事”配文为寻找我最爱的宝贝:王喵喵。亲爱的朋友们,此刻我们全家怀着万分焦急的心情,恳请您帮忙留意一位走失的小女孩。” 其中细节详实,还附上了女孩”的照片及其父亲”与母亲”的联系电话。 然而事实上,这其实是一男子为博取关注,用AI生成的假寻人启事。 在看到寻人启事后,民警曾尝试拨打其所谓�

热文