11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
Anthropic的研究者发现:一旦我们教会LLM学会骗人,就很难纠正它了。它会在训练过程中表现得「人畜无害」,随后神不知鬼不觉地输出恶意代码!如果想要纠正它,它的欺骗行为只会更变本加厉。AI注入的漏洞会非常多,这是每个人都应该警惕的一件事。
【新智元导读】前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。还未上线一天,模型权重和公告全被删除了,原因竟是......上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。开发者们还需要耐心等待,微软团队承诺,会在测试完成后重新上线。
Meta发布超级彪悍的大语言模型Llama3之后,微软也很快推出了自己的新一代WizardLM28x22B,号称迄今最强大,完全超越Claude3OpusSonnet、GPT-4等竞品开源,但是马上又把它撤回去了。没有任何征兆,微软就删除了WizardLM2大模型的相关文件、代码一直没有任何公开解释。大模型幻觉产生的原因有很多,训练数据、预训练和对齐阶段、推理阶段都会出现缺陷。
阿里的通义千问,终于拼齐了1.5系列的最后一块拼图——正式开源Qwen1.5-32B。直接来看“成绩单”。GQA的引入就降低了注意力计算的数量,从加速了推理时间。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用1、百度推出视频生成模型UniVG可处理各种文本和图像的组合输入【AiBase提要:】⭐UniVG是一种“统一模态视频生成系统”。🔸研究强调了预训练数据筛选过程中的复杂
【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生,通过了图灵测试,再次引领医疗AI的革命。我们需要研发对人类有益AGI的原因之一:OpenAI联创GregBrockman的一番话点明,当前先进AI系统还需不断演进,有望破解人类医学难题。AI医学,未来可期。
12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布,360集团与百度、腾讯、阿里四家率先通过评测。该测试由中国电子技术标准化研究院发起,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。今年7月,360被工信部电子标准院授予“国家人工智能标准化总体组大模型专题组”组长单位,
12月22日,国内首 个官方“大模型标准符合性评测”结果公布,首批仅360集团(601360.SH,下称“360”)、百度、腾讯、阿里通过。该测试由工信部中国电子技术标准化研究院(简称“工信部电子标准院”)发起,评测围绕多领域多维度模型评测框架与指标体系,从大模型的通用性、智能性、安全性等维度开展,涵盖语言、语音、视觉等多模态领域,旨在建立大模型标准符合性名
在12月22日的全国信息技术标准化技术委员会人工智能分委会全体会议上,腾讯混元大模型率先通过国家大模型标准符合性测试。本次评测由中国电子技术标准化研究院发起,基于32个细分维度,对国内主要的大模型进行测试。腾讯云还以提案牵头方身份启动《人工智能模型即服务功能要求》的讨论与编制,推动MaaS领域标准化。
BlueLM蓝心大模型是vivoAI全球研究院自主研发的大规模预训练语言模型,具有70亿模型参数量,能处理32K上下文长度。它基于260TB的多语言训练语料,提供了强大的语言理解能力,并可广泛应用于内容创作、知识问答、逻辑推理、代码生成等场景,持续为用户提供安全可靠的人机交互体验。以上就是BlueLM蓝心大模型的全部介绍了,感兴趣的小伙伴可以点击上方链接前往体验。
快科技12月8日消息,据国内媒体报道,日前,阿里智能信息事业群自研的夸克大模型已通过备案,将陆续在通识、健康、创作等领域升级内容产品与智能工具,落地一系列 AIGC 应用。夸克相关负责人表示,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型。在搜索应用中,将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景,提升用户体�
微软宣布在AzureAI云开发平台中新增40个大模型,包括WhisperV3、StableDiffusion、Phi、Falcon、SAM、CLIP、CodeLlama等,支持文本生成、图像处理、代码编写、语音识别等多种功能。三星确认GalaxyS24是AI手机三星确认其即将推出的GalaxyS24系列将聚焦于人工智能,申请了与AI相关的商标,预计在1月17日发布,并计划推出多项AI功能。论文地址:https://arxiv.org/abs/2311.13110芝加哥大学研究人员推出3D�
AutoGPT的得分也凉凉。GPT-4自诞生以来一直是位「优等生」,在各种考试中都能得高分。该基准尽最大努力涵盖各种主题领域和文化,尽管数据集的语言仅限于英语。
一项重大漏洞使得ChatGPT3.5用户能够免费升级至GPT-4Plus,作者通过链接测试并确认漏洞实锤。不过目前该漏洞似乎已经被补上。项目地址:https://github.com/abi/screenshot-to-code多模态语言模型新基准AMBER评估和降低模型中的幻觉问题AMBER项目是为多模态语言模型设计的新基准,致力于评估和减少模型在生成文本、图像或音频等多模态数据时可能产生的幻觉问题,并提供开源库支持。
最新研究警告,大型模型在基准评估中可能面临潜在危害,原因是测试集中的数据可能意外进入预训练过程。这项研究由中国人民大学信息学院、高瓴人工智能学院和伊利诺伊大学厄巴纳-香槟分校的学者联合进行。对于未来的研究,需要进一步探讨不同程度的数据泄露对模型性能的影响,并在预训练中引入数据泄露进行更深入的模拟测试。
在2023年百度世界大会上,百度发布了文心大模型4.0,提升了理解、生成、逻辑、记忆等四个方面,现在开发者可以申请使用ERNIEBotSDK开发与接入该模型的应用。申请地址:https://aistudio.baidu.com/community/channel/105腾讯混元大模型开放文生图功能腾讯混元宣布开放文生图功能,利用强大的中文理解能力,根据关键词生成具有真实感和
在今日的2023科大讯飞全球1024开发者节上,科大讯飞宣布,讯飞星火认知大模型V3.0正式发布,目前星火大模型已整体超越ChatGPT。🤖📱💼AI应用B站测试推出“AI视频总结”功能近日B站开始测试推出“AI视频总结”功能。它能够生成注释和文档,提高代码的可读性和开发效率。
近日B站开始测试推出“AI视频总结”功能。获得测试资格的用户将在视频播放页面的右下角显示“AI视频总结”测试版按钮,点击即可生成视频总结,用户可以通过总结点击跳转到视频的相关定位。体验该功能需要将哗哩哗哩app升级至7.36.0版本及以上。
DeepEval是一个用于对语言模型应用进行评估和单元测试的框架。它提供了各种指标,可以测试语言模型应用生成的回复在相关性、一致性、无偏见性和无毒性等方面的表现。如果你在开发聊天机器人、语言模型应用,DeepEval绝对是一个提高工程效率的好帮手。
蚂蚁集团宣布联合信通院发布金融大模型行业标准。蚂蚁集团表示,8月底,蚂蚁金融大模型已通过证券从业资格、保险从业资格、执业医师资格、执业药师资格等专业试题测试。蚂蚁集团与金融机构合作的所有数字金融业务将全线接入这一大模型,助力合作机构数字化升级、智能化转型。
蚂蚁集团在外滩大会上发布了自主研发的金融大模型,该模型在语言理解、生成、专业知识等多个维度取得显著进步,已经在蚂蚁旗下的财富、保险等平台内测,同时发布了基于该模型的智能金融助理“支小宝2.0”和业务助手“支小助”两款产品。
在昨日晚间的年度发布会上,小米宣布小爱同学已实现全新升级,正式接入大模型。升级后的小爱同学拥有一个更加强大的大脑,可以答疑解惑、激发灵感、创造艺术能扮演角色进行自然对话。如果小爱同学大模型手机内测报名已通过审核,音箱内测也会自动通过,在升级音箱APP与音箱固件后,即可开启大模型在小爱音箱的体验。
在小米今天的2023雷军年度演讲上,雷军正式宣布,小爱同学将升级生成式大模型。小米官方放出演示视频,展示了大模型加持下,小爱同学的功能性。设备符合要求的用户,可以在小米社区App中进行测试申请,或是对小爱说体验大模型”直达报名页。
MLPerf基准测试是评估系统在一系列人工智能工作负载下的性能表现的重要指标。人工智能正在快速发展,生成式人工智能工作负载日益突出MLPerf也在与行业一起不断进化。英伟达不再只是我们成长过程中的游戏图形公司是迅速成为我们集体未来的关键推动者。
【新智元导读】研究人员设计了一系列的测试,目的是防止大模型伪装成为人类。一个「终极丐版」的「图灵测试」,让所有大语言模型都难住了。看来研究者对于测试设计确实是非常用心了。
阿里巴巴天猫精灵的一款智能眼镜正在测试升级大模型交互系统。该音频眼镜能够实现随时智能语音交互,为用户提供即时的运动指导和饮食建议,在游戏过程中亦可陪聊角色攻略,如同一名AIGC助手。该智能眼镜还支持ENC通话降噪技术、蓝牙5.2旗舰版连接、磁吸式闪充以及IPX5级抗汗防雨等功能。
天翼云科技有限公司在2023云生态大会上表示,天翼云正在自主研发预训练大模型,目前已经进入内部测试阶段,将在近期适当的时候发布。天翼云科技有限公司,是中国电信子公司。天翼云是中国电信旗下云计算品牌,2016年,天翼云发布天翼云3.0。
脉脉创始人兼CEO林凡在“猎头推动人才、人才推动世界”猎头行业峰会上,发表主题为“AIGC浪潮下中高端人才发展趋势”的演讲。职场人将与AIGC建立伙伴式工作关系,中高端人才成为开启新纪元的关键。脉脉高聘将上线全链路猎头服务平台,该平台将成为猎头界的“大众点评”或者“贝壳”。
4+月+10+日,昆仑万维宣布,其和奇点智源合作自研、中国第+一个真正实现智能涌现的国产大语言模型——「天工」3.+5+发布在即,并将于+4+月+17+日启动邀请测试。「天工」大模型已经非常接近OpenAI+ChatGPT的智能水平。在+2022+年+12+月的行业评测中仍处于领先水平未来,「天工」+4+和「天工」+5+也将继续以行业领先的速度诞生,昆仑万维将继续坚定地在AGI的道路上走下去,走到全球前列。
阿里云今日宣布,大模型通义千问已开启企业邀测。阿里云方面认为,大模型是“大算力+强算法”相结合的产物,是人工智能的发展趋势和未来。根据“通义千问”页面介绍,这一个专门响应人类指令的大模型,是效率助手,也是点子生成机。