首页 > 业界 > 关键词  > 100PoisonMpts最新资讯  > 正文

阿里天猫精灵推出AI治理开源数据集 预计在6月份开放批问答数据

2023-06-03 10:33 · 稿源:站长之家

站长之家(ChinaZ.com) 6月3日 消息:日前,阿里巴巴旗下的天猫精灵与通义大模型团队联合多位领域学者和组织,推出了一个名为100PoisonMpts大语言模型治理开源中文数据集,宣布十余位知名专家学者成为首批“给AI投100瓶毒药”的标注工程师。标注人各提出100个含有偏见和歧视回答的棘手问题,并标注出大型模型的回答,完成由AI "投毒"和"解毒"的攻防。

天猫精灵

据阿里联合团队负责人介绍,与国外公司的治理方法相比,100PoisonMpts数据集在技术方法上将具备更完整的标注流程、更隐性的问题领域、更全面的效益。标注数据对模型继续训练、微调、强化学习、线上服务等多个环节都有益处。

目前,首批领域数据涉及到反对歧视、同理心、商榷式表达等目标,该数据囊括了法律、心理学、儿童教育、无障碍、冷知识、亲密关系、环境公正等多个维度。100PoisonMpts数据集预计在6月份开放第一批问答数据,目前正在魔搭等技术社区征集更多垂直领域专家。

举报

  • 相关推荐
  • 天猫精灵新增公司品牌“未来精灵XGENIE”

    凤凰网科技讯9月19日阿里旗下人工智能公司发布公司新品牌“未来精灵”,AliGenie6.0系统由大模型全面驱动,从过去的一个天猫精灵,将变成对每个用户有差异化记忆,与众不同的精灵。未来精灵总裁彭超在发布中介绍,以“世界在对话之间”的理念,让每个人创建全天候、个性化的智能助手。旗下多款全新AIGC终端正在发布:首款接入精灵大模型AR眼镜,使用MicroLED衍射光波导显示方案,具有随身助手能力;30小时超长续航随声筒,一台终端与不同个性化助手对话;AITutor类智能平板产品预告将于10月份发布。

  • 天猫精灵发布“未来精灵XGENIE”新品牌

    阿里旗下的人工智能公司发布新品牌“未来精灵”,并宣布AliGenie6.0系统将由大模型全面驱动。新的品牌主唤醒词是“小灵,小灵”。这个系统将从一个天猫精灵变成一个具有差异化记忆和独特性的精灵,为每个用户提供个性化的智能助手。

  • 智源开源中英文语义向量模型训练数据集MTP

    智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。作为中国大模型开源生态圈的代表机构,智源持续进行包括数据在内的大模型全栈技术开源,推动人工智能协同创新。

  • Google AI推出SANPO:多属性视频数据集助力高级视觉场景理解

    GoogleAI最近推出了名为SANPO的数据集,旨在帮助AI模型更好地理解户外人类主观场景。这一数据集的重要性在于,它不仅包括真实世界的数据包括合成数据,以及丰富的注释和多属性特征。研究人员的隐私承诺使这一数据集能够支持其他研究人员开发面向视障人士的视觉导航系统,并推动先进的视觉场景理解领域的发展。

  • 国家网信办发布第一批26家应用程序分发平台备案编号

    国家互联网信息办公室发布了第一批应用程序分发平台备案编号。网信办表示,2022年8月1日《移动互联网应用程序信息服务管理规定》正式实施以来,国家互联网信息办公室依法依规组织开展应用程序分发平台备案管理工作。根据《移动互联网应用程序信息服务管理规定》有关要求,备案仅是对应用程序分发平台提供分发服务行为的确认,不代表对该平台服务能力和其在架应�

  • 「字少信息量大」,Salesforce、MIT 研究者手把手教 GPT-4「改稿」,数据集开源

    自动摘要技术取得了长足的进步,这主要归功于范式的转变——从在标注数据集上进行有监督微调转变为使用大语言模型进行零样本prompt,例如GPT-4。不需要额外的训练,细致的prompt就能实现对摘要长度、主题、风格等方面特征的精细控制。更多论文细节,可参考原论文。

  • 开源数据库生态发展研究报告》发布 GreatSQL为MySQL5.7最佳替代方案!

    随着数字化转型深入推进和数据量的爆炸式增长,行业应用对数据库的需求变化推动数据库技术加速创新。数据库作为数字经济基础底座,连接上层应用和底层基础资源,在数字经济时代展现出巨大的价值和潜能。四、国内开源数据库产业展望最后,针对我国MySQL技术路线开源数据库产业发展,报告进行以下展望:1、开源数据库发展应符合开源生态建设及产业引领要求,积极参与完善开源产业治理;2、加强相关方对开源协议认知,合法合规利用开源协议;3、利用国内MySQL现有技术生态,结合产业需求,加强独立演进开源分支的能力;4、大力推进开源数据库技术规范化、智能化发展。

  • 近视手术慎重做:有人近视300度术后变远视200度 第一批做的人后悔不已

    对于很多近视眼的朋友来说,总希望通过飞秒来治愈这个问题,不过还是要慎重。近日,广东一男子手术前近视300度,手术后却成为远视200度的事情引发人们的广泛关注。在手术之后,李先生的近视问题,确实得到了解决,手术效果肉眼可见,但眼睛却迎来了新的问题,那就是眼睛会时常出现疲劳的情况。上述情况持续半年后,李先生再次进行了检测,发现视力情况变得更加�

  • 中国研究团队发布多视角数据集“FreeMan” 解决3D人体姿势估计局限性

    从真实场景中估计人体的三维结构是一项具有挑战性的任务,对于人工智能、图形学和人机交互等领域具有重要意义。现有的3D人体姿态估计数据集通常在受控条件下收集,具有静态背景,无法代表真实世界场景的多样性,从限制了用于真实应用的准确模型的开发。FreeMan的可用性预计将推动人体建模、计算机视觉和人机交互领域的进步,弥合了受控实验室条件与真实场景之间的差距。

  • 机器人研究迎来ImageNet时刻:一个数据集,让DeepMind具身智能大模型突飞猛进

    在大模型不断取得突破的2023,把大模型当做大脑来辅助运行的具身智能机器人研究也在被迅速推进。2个多月前,谷歌DeepMind推出了第一个控制机器人的视觉-语言-动作模型——RT-2。未来的另一个方向是进一步探索不同数据集的混合会如何影响跨具身智能体泛化,以及这种泛化是如何是实现的。