11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
快科技3月4日消息,随着AI的快速发展,日本政府也投入了约10亿日元(约合4879万人民币)的研发经费,试图开发一款用于判断儿童是否遭受虐待的AI工具。然而这一项目在测试阶段表现不佳,误判率高达60%,这一AI工具也被暂时搁置。该AI工具由日本儿童家庭厅开发,旨在帮助各地儿童咨询所”的工作人员判断是否需要临时保护疑似遭受虐待的儿童。按照设计,工作人员需输入9
最近一项发表在《JAMAPediatrics》的研究表明,大型语言模型ChatGPT的最新版本ChatGPT-4在诊断儿科病例时的表现令人失望。研究由纽约科恩儿童医学中心的研究人员完成。但研究人员还是对AI机器人未来在辅助医疗决策中发挥重要作用持乐观态度。
研究人员从斯坦福大学和UNCChapelHill共同努力解决了大语言模型产生的事实性错误的问题,这些错误被称为“幻觉”。在没有人工标记的情况下,研究人员通过微调LLMs,采用新颖的方法,以在开放式生成环境中提高事实准确性。对提取原子事实的简化方法进行调查,并将事实性调谐方法扩展到更大的模型,如GPT-4,提出了进一步探讨的建议。
美国最大的健康保险公司UnitedHealthcare被指控使用一个存在90%错误率的AI算法,绕过医生的判断,错误地拒绝向年长患者提供关键的医疗保障。根据一项本周在明尼苏达地区法院提起的诉讼,该公司的做法导致患者被迫提前退出康复计划和护理设施,迫使他们不得不耗尽生活积蓄以获取本应在政府资助的MedicareAdvantagePlan下获得的医疗服务。自从UnitedHealth在2020年收购NaviHealth以来,前员工表示,公司的重心从患者倡导转向了绩效指标和尽量将康复期保持短暂精简。
马里兰大学发布了一项重要研究,针对GPT-4V视觉模型进行了首个专为其设计的基准测试,名为HallusionBench。这项研究揭示了令人震惊的发现,即GPT-4V的错误率高达90%。这项研究对于深化我们对大型语言模型的认识,以及推动其在现实世界中的应用具有重要意义。
【新智元导读】只需几张图像,用文本即可生成任意年龄图像,用户反馈准确率达80%!当下的「人脸识别系统」抗衰老能力非常弱,人物面部老化会显著降低识别性能,隔一段时间就需要更换人脸数据。提升人脸识别系统的鲁棒性需要收集个体老化的高质量数据,不过近几年发布的数据集规模通常较小,年限也不够长,或是在姿态、照明、背景等方面有较大变化,没有专注于人�
自从ChatGPT等生成式人工智能诞生,就有不少开发者尝试将其作为编程中的辅助工具。美国普渡大学的一项研究指出,ChatGPT在回答编程问题时的错误率,出乎预料的高。需要注意的是,OpenAI很早之前就在官网告知用户,AI的回答可能会产生关于人、地点或事实的不准确信息。
GPT-4变笨,实锤了???来自斯坦福大学和UC伯克利大学的一篇最新论文显示:6月的GPT-4在一些任务上的表现客观上就是比3月的更差。比如他们用同样500道「判断给定整数是否为质数」的问题来测这两个版本,发现3月份的GPT-4答对了488个6月只对了12个……成功率直接从97.6%下降到2.4%!当研究员通过经典的「Let’sthinkstepbystep」办法来引导后者往正确答案上靠时,居然不好使了——6月的GP
人工智能研究机构OpenAI表示,已针对生成式AI技术ChatGPT的错误率上升进行了修复。OpenAI在网站上表示,已针对ChatGPT和GPT-4错误率上升进行了修复。OpenAI正在安全地启用GPT-4和GPT-3.5Turbo的精细调整功能,并预计该功能将在今年晚些时候可用。
在近日发表的一篇学术论文中,研究人员对 GitHub Copilot 人工智能编程辅助工具展开了深入调查。结果发现,仍处于测试预览阶段的 Copilot 具有高达 40% 的错误代码率,意味着开发者必须在使用时对其保持清醒的认知。此外在多场景测试项目中,约 40% 都被发现包含了安全漏洞。(图自:GitHub)据悉,GitHub 为这款 AI 编程辅助工具采用了来自 OpenAI 的 Codex 高级 AI 系统。特点是经过了 GPT-3 机器语言模型的生成式预训练,能够借