首页 > 业界 > 关键词  > 生成式AIBard最新资讯  > 正文

微软研究员质疑Bard数据集包括Gmail邮件:谷歌迅速澄清

2023-03-22 10:15 · 稿源: 快科技

谷歌宣布生成式AI Bard开启公测后,微软研究院首席研究员Kate Crawford在社交媒体发布文章,质疑Bard的训练数据集调用了Gmail的数据。

换言之,Crawford质疑谷歌为了训练AI,侵犯了所有使用Gmail用户的隐私。

面对这一相当严重的质疑,谷歌官方迅速做出回应,并澄清了问题。

Google Workspace在回复中表示,Bard目前还在早期测试阶段,会存在错误,但该模型绝对没有使用从Gmail收集的信息进行训练。

微软研究员质疑Bard数据集包括Gmail邮件:谷歌迅速澄清

据悉,Gmail是谷歌推出的电子邮箱服务,同时也是目前全球范围内最大的免费电子邮箱之一,包含了全球各个语言区的大量交流数据,甚至有部分企业在商业交流上也会采用Gmail。

这意味着,如果谷歌在Bard的训练集中加入了Gmail的数据,将对大量用户的个人隐私数据,甚至是企业的商业数据,造成泄露。

举报

  • 相关推荐
  • 引入Bard后,谷歌Gmail工具生成了一些虚构的电子邮件

    谷歌最近将其大型语言模型驱动的聊天机器人Bard引入了一系列产品,包括Gmail、GoogleDrive、GoogleDocs、GoogleMaps以及谷歌旗下的YouTube等。尽管谷歌试图将其新一代生成式AI与已有的产品线相结合,但似乎行动有些仓促。谷歌发布如此混乱的产品,这也让人更为担忧AI在个人电子邮件中爬行可能带来的重大数据隐私问题。

  • 谷歌AI聊天机器人 Bard 新增Gmail谷歌应用插件

    谷歌的AI聊天机器人Bard最近获得了更新,增加了对Gmail、Docs和Drive等谷歌应用的插件支持。更新后的谷歌Bard支持的应用插件可以实时获取来自谷歌地图、YouTube、酒店和航班等应用的信息,并允许用户随时关闭。除了插件支持外,谷歌Bard还增加了一项公共链接分享功能,使用户能够将与Bard的对话分享给其他人,他们可以在自己的设备上继续与Bard对话。

  • 中国研究团队发布多视角数据集“FreeMan” 解决3D人体姿势估计局限性

    从真实场景中估计人体的三维结构是一项具有挑战性的任务,对于人工智能、图形学和人机交互等领域具有重要意义。现有的3D人体姿态估计数据集通常在受控条件下收集,具有静态背景,无法代表真实世界场景的多样性,从限制了用于真实应用的准确模型的开发。FreeMan的可用性预计将推动人体建模、计算机视觉和人机交互领域的进步,弥合了受控实验室条件与真实场景之间的差距。

  • 谷歌AI助手Bard“生造”用户邮件 隐私安全遭诟病

    近日,谷歌推出集成了大型语言模型的AI助手“巴德”,并将其应用于包括Gmail、Google地图在内的多款产品,希望能给用户提供更人性化的服务。但有报道指出,巴德在测试中频频出现乌龙。有分析认为,在争夺AI主导地位的过程中,谷歌可能会过于匆忙推出未成熟的产品,从带来隐患。

  • 谷歌内部员工质疑AI聊天机器人Bard的有效性和价值

    近几个月来,谷歌母公司Alphabet一直在对其AI聊天机器人Bard进行内部讨论,特别邀请重度使用者参与。内部员工开始质疑Bard的有效性和功能,引发了有关投入海量资源是否值得的疑虑。谷歌内部员工对Bard的有效性和价值提出了质疑,这对谷歌来说是一项严峻的挑战,尤其是在竞争日益激烈的AI领域。

  • 微软研究人员用儿童故事进行训练:微型语言模型进入成熟期

    学习英语并不容易,许多学生都深有体会。但当学生是一台计算机时,有一种方法表现出奇地出色:只需将大量来自互联网的文本输入到一个名为神经网络的巨大数学模型中。他们的研究结果暗示了可能有助于训练更大型模型并理解其行为的新研究方向。

  • 「字少信息量大」,Salesforce、MIT 研究者手把手教 GPT-4「改稿」,数据集已开源

    自动摘要技术取得了长足的进步,这主要归功于范式的转变——从在标注数据集上进行有监督微调转变为使用大语言模型进行零样本prompt,例如GPT-4。不需要额外的训练,细致的prompt就能实现对摘要长度、主题、风格等方面特征的精细控制。更多论文细节,可参考原论文。

  • 机器人研究迎来ImageNet时刻:一个数据集,让DeepMind具身智能大模型突飞猛进

    在大模型不断取得突破的2023,把大模型当做大脑来辅助运行的具身智能机器人研究也在被迅速推进。2个多月前,谷歌DeepMind推出了第一个控制机器人的视觉-语言-动作模型——RT-2。未来的另一个方向是进一步探索不同数据集的混合会如何影响跨具身智能体泛化,以及这种泛化是如何是实现的。

  • OpenAI、Google和Meta 的当红华人研究员们在想些什么|对话实录

    甚至你会以为这是一场明星见面会。当我从博士毕业时候,我的导师给了一个建议——AI研究者要拉长到未来很多年的时间维度来思考研究,也就是不只是考虑对现在的一些东西的改进是未来可能带来彻底改变的技术理念。

  • 智源开源中英文语义向量模型训练数据集MTP

    智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。作为中国大模型开源生态圈的代表机构,智源持续进行包括数据在内的大模型全栈技术开源,推动人工智能协同创新。