首页 > 业界 > 关键词  > 大语言模型最新资讯  > 正文

微软紧急撤回进的AI大模型:居然忘了测试了

2024-04-22 07:14 · 稿源: 快科技

快科技4月21日消息,Meta发布超级彪悍的大语言模型Llama 3之后,微软也很快推出了自己的新一代WizardLM2 8x22B,号称迄今最强大,完全超越Claude 3 OpusSonnet、GPT-4等竞品,而且开源,但是马上又把它撤回去了。

没有任何征兆,微软就删除了WizardLM2大模型的相关文件、代码,而且一直没有任何公开解释。

微软的一位工程师单独给出了原因,令人啼笑皆非。

原来,微软已经几个月没有发布新的大模型,对上新流程有些陌生,居然忘了必需的幻觉测试(toxicity test),目前正在抓紧补测,很快就会重新上线。

大语言模型的幻觉”分为两种,一是事实性幻觉,指模型生成的内容与可验证的现实世界事实不一致,二是忠实性幻觉,指模型生成的内容与用户的指令或上下文不一致。

大模型幻觉产生的原因有很多,训练数据、预训练和对齐阶段、推理阶段都会出现缺陷。

这么重要的测试都能忘掉,微软真是

微软紧急撤回最先进的AI大模型:居然忘了测试了

微软紧急撤回最先进的AI大模型:居然忘了测试了

微软紧急撤回最先进的AI大模型:居然忘了测试了

举报

  • 相关推荐
  • 大家在看
  • 阿里刚开源32B大模型,我们立马测试了“弱智吧”

    阿里的通义千问,终于拼齐了1.5系列的最后一块拼图——正式开源Qwen1.5-32B。直接来看“成绩单”。GQA的引入就降低了注意力计算的数量,从加速了推理时间。

  • AI大模型搜索之战开启,胜出黑马竟是ta?

    【新智元导读】距离AI「杀死」搜索引擎,到底还差几步?几天前,ChatGPT突然官宣免注册,让网友直呼AI取代搜索引擎的宏伟蓝图已经拉开帷幕。就像搜索引擎在2000年后逐渐成为了全世界互联网的大门一样,如今LLM的迅猛发展似乎也标志着互联网即将进入GenAI时代。我们搜索时会出现的,不仅仅再是简单的链接罗列是一个开门见山的准确答案。

  • 商汤港股涨超34% 昨日推出AI大模型“日日新5.0”

    商汤港股今日表现强势,涨幅显著扩大至34%,股价报0.820港元,总市值跃升至274.45亿港元。这一涨幅不仅彰显了市场对商汤科技的强烈信心,也反映出其业务的持续发展和强大潜力。这一功能在智能客服、智能写作、智能设计等领域具有广阔的应用前景,为商汤科技未来的发展奠定了坚实的基础。

  • 李未可科技正式推出WAKE-AI多模态AI大模型

    4月18日,2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕GPS轨迹视觉语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加持,能实现所见即所问、所问即所得的精准服务。李未可科技合伙人&AI负责人古鉴表示WAKE-AI将逐步开放平台能力,便于更多企业及开发者调用WAKE-AI能力,共建AI硬件生态。

  • 2024年8个AI商业趋势 最先进AI模型变得越来越昂贵

    斯坦福大学人类中心人工智能研究所发布的2024年人工智能指数,报告揭示了人工智能在商业领域的八大趋势,涵盖了人类优势、成本、监管、投资增长、工作效率提升等方面的关键问题,为企业和决策者提供了重要的参考和启示。1.人类在许多任务上仍然优于人工智能研究表明,在高级数学问题解决、视觉常识推理和规划等复杂任务上,人工智能仍然不如人类。”美国在人工智能模型的开发方面正在超越中国和其他国家。

  • 巨人网络申请“GIANTGPT”商标 为旗下游戏AI大模型

    巨人投资有限公司申请注册多枚“GIANTGPT”商标,国际分类为教育娱乐、科学仪器、网站服务等,当前状态均为等待实质审查。巨人投资有限公司由史玉柱任法定代表人、执行董事并持股约97.86%。今年2月,巨人网络宣布正式完成了游戏AI大模型GiantGPT的备案。

  • 久其女娲平台2.0全新升级!AI大模型加速,赋能政企数治未来

    4月25日,久其女娲平台2.0发布会在线成功举办。活动以 “数治未来 大模型加速” 为主题,通过专题报告、功能路演等环节,集中介绍了久其女娲平台作为久其新一代政企赋能底座,在以新质生产力为引领、AI大模型加速的新趋势下的全新定位与功能创新。高度聚焦政策导向,以创新引领服务升级,女娲平台2.0的发布彰显了久其软件作为卓越的政企产品与服务提供商的重要价值

  • 中兴通讯赋能AI大模型,重磅发布高端多控磁阵KF8810

    随着AI大模型及其相关产业深入发展,对于海量数据的高速存储需求与日俱增。在此背景下,中兴通讯于2024年中兴通讯云网生态峰会当中,重磅发布中兴通讯高端多控磁阵产品KF8810,其采用自研高性能处理器,自研存储操作系统,单系统最大支持32控,性能领先。基于该产品,中兴通讯能够有效满足低时延、大带宽的存储业务需求,为数字经济赋能,也为新质生产力的发展做出突出贡献。

  • 聚焦AI大模型 激发城市新活力 城市云数字领军人才研修班·东莞站成功举办

    新一代人工智能发展如火如荼,大模型如何落地推动数字转型赋能城市发展?4月25日,以“AI大模型打造城市新质生产力”为主题的城市云数字领军人才研修班在东莞举办。国家信息中心信息化和产业发展部主任单志广、东莞市发展与改革局副局长魏亚东、中国信息通信研究院云计算与大数据研究所政企数字化转型部主任徐恩庆、广东工业大学机电工程学院院长刘强、华为云中国区副总裁刘少华,全国20多个省市城市数字化建设相关负责人等政府、高校、研究院以及企业的专家、学者参加了此次活动。“城市云数字领军人才研修班”将针对不同层级、领域、区域的数字化建设者,建立差别化的课程体系,紧扣智慧城市、数字政府、数字化转型实际需要,增强学员的数字思维和专业素质,为全面增强数字城市建设效能提供重要人才保障。

  • 腾讯云推出AIGC云存储解决方案 专为AI大模型存储需求设计

    腾讯云推出了全新的AIGC云存储解决方案,这一方案专为AI大模型在数据采集清洗、训练、推理以及数据治理等全过程中的存储需求设计,为AI领域的各类应用提供了坚实可靠的存储保障。AIGC,作为利用人工智能技术生成内容的工具,其应用范围已经拓展到文本、音频、图像、视频等多个领域,甚至实现了跨模态生成,展现出强大的内容创造力。值得一提的是,这一解决方案还充分借鉴并复用了腾讯企业网盘的一些卓越功能,如精细的权限划分、实时的在线编辑以及高效的协同办公等,使AI生成的内容能够得到更为便捷和高效的管理,从进一步提升工作效率。

今日大家都在搜的词: