TOXCL：用于检测和解释隐性有毒言论的统一AI框架

2024-03-28 09:31 · 稿源：站长之家

划重点:
🔍 社交媒体上的毒性言论可能会像野火般蔓延，针对个人和边缘化群体。
🔍 研究人员提出了名为TOXCL的新框架，旨在检测和解释隐含毒性言论。
🔍 TOXCL采用多模块方法，将问题分解为不同步骤，取得了较好的效果。

站长之家（ChinaZ.com）3月28日消息:社交媒体上的毒性言论可能会像野火般蔓延，特别是针对个人和边缘化群体。明显的仇恨言论相对容易被发现，但隐含毒性——依赖于刻板印象和编码语言而不是明显的侮辱——提出了更为棘手的挑战。如何训练人工智能系统不仅能够检测到这种隐晦的毒性，还能解释为何它是有害的呢?

新加坡南洋理工大学、新加坡国立大学和信息通信研究所的研究人员直面这一挑战，提出了一种名为TOXCL的新框架。与以往将检测和解释合并为一个文本生成任务的系统不同，TOXCL采用了多模块方法，将问题分解为不同步骤。

首先是目标群体生成器——一个文本生成模型，用于识别在给定帖子中可能被针对的少数群体。接下来是编码器-解码器模型，首先使用其编码器将帖子分类为有毒或无毒。如果标记为有毒，解码器将在目标群体信息的帮助下生成为何这种言论有害的解释。

但这里的聪明之处在于，为了增强编码器的检测技能，研究人员还加入了一个强大的教师分类器。利用知识蒸馏技术，这个教师模型在训练过程中将其专业知识传递给编码器，提高其分类能力。

研究人员还添加了条件解码约束——一种巧妙的技巧，确保解码器只为被分类为有毒的帖子生成解释，消除了矛盾的输出。

那么，TOXCL的表现如何呢?在两个主要的隐含毒性基准测试中，TOXCL的表现超过了最先进的基准线，甚至超过了专注于检测或解释的模型。与其他领先系统相比，人类评估员评价其输出在正确性、流畅性和减少有害性方面更高。

当然，仍然有改进的空间。该模型有时可能会因为编码的符号或需要外部知识的缩写而出现问题。而隐含毒性的主观性意味着“正确”的解释往往是多方面的。但总体而言，TOXCL标志着朝着能够识别隐含仇恨并阐明其有害影响的人工智能系统迈出了令人印象深刻的一步。随着这项技术的进一步发展，我们还必须应对潜在的风险，比如强化偏见或产生有毒语言。但通过谨慎使用，它为赋予边缘化声音权力和遏制网络上的压制性言论提供了一条道路。

论文地址:https://arxiv.org/abs/2403.16685v1

项目:https://github.com/nhathoang2002/toxcl

（举报）

相关推荐

关键词：

荐AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯开源智能体框架Youtu-agent

本期AI日报聚焦多项技术突破：字节跳动发布OmniHuman-1.5实现图像音频秒变超真视频；爱诗科技PixVerse V5全球上线支持多场景创作；腾讯开源Youtu-agent框架提升AI开发效率；百度智能云发布百舸AI计算平台5.0；OpenAI将推出家长监控功能应对安全风险。同时涵盖硬件创新、市场预测及中国团队在全球AI应用领域的突出表现，展现人工智能领域快速发展的技术迭代与生态建设。

AI视频生成 OmniHuman-1.5 字节跳动
AI与数字化变革费率3年连降，海尔智家H1再优化0.1pct

海尔智家2025上半年业绩逆势增长，营收1564.94亿元，同比增长10.2%；净利润120.33亿元，增长15.6%。核心驱动因素为数字化转型与AI技术应用，通过全流程降本增效，销售管理费用率连续三年下降。国内聚焦明星爆品与多品牌协同，海外坚持本土化运营，实现各区域加速增长。AI驱动的产品创新打造多个行业爆款，带动高端品牌卡萨帝增长超20%。未来将持续深化数字化变革，开拓新发展空间。

家电企业海尔智家海外市场
哪里找最新AI工具官网？如何快速对比ChatGPT替代品？AI工具导航指南 - AIbase

文章探讨了在AI工具爆炸式增长的时代，用户面临的信息过载和筛选困难问题。主要内容包括：1）AI领域迭代速度远超传统软件，个人追踪信息效率低下且容易错过关键更新；2）AIbase.cn平台致力于解决这一问题，通过聚合主流AI工具、严格审核信息来源、持续更新行业动态；3）平台提供多维对比功能，结构化呈现工具参数，帮助用户快速定位适合需求的解决方案；4）建议用户定期浏览平台资讯栏目，善用搜索筛选功能，通过对比视图做出明智选择。核心价值在于降低信息筛选成本，让用户更高效地获取有价值的AI工具和前沿资讯。

AI工具导航信息筛选参数对比
再次定义行业创新范式跃然创新推出全球首款端到端 AI 玩具 CocoMate

8月26日，跃然创新推出全球首款搭载端到端语音模型的AI玩具CocoMate系列。该产品采用可拆卸设计，配备3000mAh电池，支持4G和WiFi网络。依托端到端技术，具备丰富交互表现和拟人化情感能力，支持多重唤醒、主题游戏及聊天室等功能。新品将于8月27日开售，首发包含奥特曼及原创IP“泡泡”等角色，后续还将上线财神爷、塔罗猫等系列，目标人群从儿童延伸至成年人。

文章搜索核心标签内容检索
DTCC2025丨达梦以智算多模与AI创新引领行业变革

近日，IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第十六届中国数据库技术大会（DTCC2025）在京隆重召开。大会以“智能创新数赢未来”为主题，汇聚超百位行业专家及上千名嘉宾，聚焦数据库领域前沿技术。达梦数据作为领军企业受邀参会，重点展示了其在多模数据处理与AI+数据库融合方面的突破，推出“智算多模”引擎，实现统一存储与智能查询，为行业智能化发展注入新动能。

数据库技术大会达梦数据多模数据处理
荐B站要变成AI站

互联网平台都在跟AI结合，B站没有成为例外。从新一季度财报来看，B站的AI味儿也越来越浓了。 8月21日，B站公布第二季度业绩，总营收达73.4亿元人民币，同比增长20%。其中，游戏业务收入为16.1亿元，同比增长60%，广告业务收入为24.5亿元，同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%，调整后净利润达到5.6亿元，创下历史最好成绩。从整体来看，B站生态集聚

B站财报 AI结合二次元经济
AI最新资讯在哪里看？AIbase：高效获取国内外AI新闻头条与行业动态

文章探讨了AI时代信息过载的困境：有价值的前沿动态、重磅模型发布和行业解读分散各处，筛选成本高、效率低下。AIbase资讯导航站应运而生，通过四大核心功能解决痛点：1)聚合主流信源，过滤低质噪音；2)结构化分类呈现大模型动态、行业应用等六大板块；3)提炼核心要点，拒绝标题党；4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达"，帮助用户节省70%信息搜集时间，将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

人工智能 AI资讯科技媒体
卖家精灵将亮相9月深圳CCBEC&武汉电博会，以AI+大数据赋能跨境卖家高效突围！

9月跨境卖家盛会双城联动：17-19日深圳CCBEC展会聚焦全产业链生态，汇聚1500+供应商；19-21日武汉电博会以“链接全球·数创未来”为主题，探讨数字贸易创新。两大展会呈现最新行业成果，举办20+高端论坛，提供选品策略、流量运营等一站式出海解决方案。卖家精灵作为官方合作伙伴，将展示AI选品工具与运营指南，助力卖家赢得全球市场竞争优势。
荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

AI日报栏目每日提供人工智能领域热点内容，聚焦开发者，帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括：MiniMax海螺AI首尾帧功能上线；元石科技发布问小白5挑战GPT-5；OpenAI推出语音模型GPT-Realtime；谷歌Gemini AI优化表格处理；腾讯黑科技实现AI配音；百度计划培养千万AI人才；MathGPT.ai反作弊功能推广；苹果Xcode集成Claude Sonnet4；微软发布自研AI模型MAI系列；xAI推出高效编码模型Grok Code Fast1；SuperCLUE多模态评测Gemini-2.5-Pro居首；9月1日起AI内容标识新规实施，违规将承担法律风险。

AI 人工智能技术趋势
荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

本期AI日报聚焦多项AI领域创新：1）阿里开源Qwen-Image-Edit图像编辑模型，支持中文渲染与精准文本编辑；2）淘宝测试"AI万能搜"功能，重构电商搜索体验；3）小红书发布DynamicFace人脸生成技术，实现高质量图像视频换脸；4）Gemini API新增URL Context功能，简化网页内容获取流程；5）Nvidia推出小型开放模型Nemotron-Nano-9B-v2，支持智能推理开关；6）马斯克发布Grok Imagine 0.1测试版，进军AI图像生成领域；7）Vercel推出iOS版AI开发工具v0；8）理想汽车发布MindGPT 3.1模型，处理速度提升5倍；9）ToonComposer工具简化动画制作流程；10）ElevenLabs推出视频到音乐生成流程。

AI 开源图像编辑

今日大家都在搜的词：

热文

3 天
7天

TOXCL：用于检测和解释隐性有毒言论的统一AI框架

荐AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯开源智能体框架Youtu-agent

AI与数字化变革费率3年连降，海尔智家H1再优化0.1pct

哪里找最新AI工具官网？如何快速对比ChatGPT替代品？AI工具导航指南 - AIbase

再次定义行业创新范式跃然创新推出全球首款端到端 AI 玩具 CocoMate

DTCC2025丨达梦以智算多模与AI创新引领行业变革

荐B站要变成AI站

AI最新资讯在哪里看？AIbase：高效获取国内外AI新闻头条与行业动态

卖家精灵将亮相9月深圳CCBEC&武汉电博会，以AI+大数据赋能跨境卖家高效突围！

荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

今日大家都在搜的词：

热文

华为MatePad Mini官宣9月4日发布

今日七夕节微信 520 元大额红包限时上线

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为上半年营收4270亿元同比增长3.95%：净利润371.95亿元

小米回应升级Beta后手机很烫：系统编译致短期功耗增加

迷你LABUBU开售后卖爆多平台已售罄：电商平台销量破百万

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

站长商机