11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
微软研究人员挑战了语言模型预训练的传统方法,该方法在训练语料库中的所有token上均匀应用下一个token预测损失。他们提出了一种新的语言模型称为RHO-1,该模型利用选择性语言建模。SLM可以扩展到监督微调,以解决数据集中的噪声和分布不匹配,并通过训练一个强调帮助性、真实性和无害性的参考模型来获得在预训练期间获得本地对齐的基本模型。
在文档处理中,特别是在视觉丰富的文档中,高效信息提取的需求变得越来越关键。VRDs,如发票、水电费单和保险报价,在业务工作流中随处可见,通常以不同的布局和格式呈现类似信息。他们的研究为使普通用户能够访问先进的文档处理功能铺平了道路,标志着该领域迈出了重要的一步。
加利福尼亚大学圣地亚哥分校和南加利福尼亚大学的研究人员最近推出了一种名为CyberDemo的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务,特别是对于需要高度灵巧的任务来说。虽然为每个任务设计模拟环境需要额外的工作,但减少了数据收集的人为干预,并避免了复杂的奖励设计�
一组来自康奈尔科技大学、Intuit和以色列理工学院的研究人员创建了一种名为"MorrisII"的新型计算机蠕虫,能够利用和操纵生成式人工智能系统执行恶意任务。MorrisII是一种精心设计的输入,在被AI模型处理时会自我复制并进行如发送垃圾邮件、窃取敏感数据等违规行为。研究人员警告,随着AI系统在智能手机和汽车等领域的集成,此类攻击的潜在影响将更加严重。
旧金山初创公司Anthropic,由前OpenAI工程师创立并由一对兄妹领导,于今日宣布推出迄今为止最强大的面向消费者的大型语言模型系列之一,名为Claude3。亚马逊迅速将其中一款模型,Claude3Sonnet——在智能和成本方面属于中档的模型,添加到其AmazonBedrock托管服务中,用于在AWS云中开发AI服务和应用。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识并进行交易的数字城市广场。
宾夕法尼亚大学、多伦多大学和Vector研究所的研究人员推出了一款名为DataDreamer的新工具。DataDreamer是一款综合解决方案,旨在简化和管理各种任务中的大语言模型的集成和利用。有了DataDreamer,研究人员有了一个强大的盟友,可以解决大语言模型的复杂性,开启新的可能性。
在人工智能领域,多模式大语言模型在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。这种脆弱性引发了对MLLM在需要准确解释文本和视觉数据的应用中可靠性的担忧。作为一个不断发展的领域,解决这些挑战对于在现实应用中部署MLLMs至关重要。
研究人员在美国马里兰大学成功开发了一种高效的方法,可以在一分钟内诱导大型语言模型产生有害反应,他们将这一技术命名为BEAST。BEAST技术利用NvidiaRTXA6000GPU、48GB内存和即将发布的开源代码,仅需一分钟的GPU处理时间,就能让LLM飞越其防护栏。”此研究强调了确保未来更强大AI模型的安全部署需要制定可证明的安全保证。
斯坦福大学的研究人员最近发布了一种名为C3PO的新方法,旨在解决语言模型定制化面临的挑战。在人工智能领域不断发展的今天,语言模型的定制化对于确保用户满意度至关重要。这项研究的意义超出了技术成就的范畴,预示着人工智能可以无缝适应个人偏好、增强其实用性和可访问性的未来。
苹果的研究人员最近推出了一款名为Keyframer的动画原型工具,该工具采用了大型语言模型的动力,旨在从静态图像生成引人注目的动画。这标志着LLMs在创意领域的又一次创新应用。该研究为未来的动画设计工具提供了可能的方向,将生成能力与动态编辑器相结合,以实现更强大的创意控制和迭代。
在东京总部的人工智能初创公司SakanaAI宣布成功筹集3000万美元的种子轮融资。该公司由前谷歌研究人员DavidHa和LlionJones于去年共同创立,致力于开发新的人工智能模型。这反映了对当前大型系统训练需求的一种创新性回应。
微软公司的研究团队最近提出了一种独特且简单的方法,用于生成高质量的文本嵌入。这种新方法仅使用合成数据和极少的训练步骤,就取得了令人瞩目的成果。该研究的训练过程极大地减少了对中间预训练的需求,相较于当前的多阶段系统,更加简洁高效。
近期的研究表明,通过在高质量指令数据集上进行微调,生成的模型可以在广泛的任务上展现出色的能力。现有的指令数据生成方法通常会产生重复数据,并且在数据质量上不够可控。未来的工作可能会探索不同任务和更大数据集之间的相互作用,以进一步增强单任务性能和泛化能力。
加利福尼亚大学洛杉矶分校健康琼斯顿综合癌症中心的研究人员获得了一项为期五年的500万美元资助,以开展侵袭性前列腺癌的人工智能检测研究。这项由美国国家癌症研究所提供的资金旨在识别新的癌症生物标志物,并发展AI技术,用于检测和预测侵袭性前列腺癌,以帮助避免不必要的治疗及其负面副作用。该项目的成功将为前列腺癌的精准诊断和治疗提供新的突破,为患者提供更好的医疗选择。
丹麦研究人员成功研发了一款名为“life2vec”的机器学习模型,被戏称为“死亡计算器”,能够准确预测数百万人的死亡情况。该模型通过综合考虑个体的年龄、健康状况、教育、职业、收入等多个方面的数据,成功预测了截至2020年的死亡情况,其准确率达到了78%。”他认为,虽然这种技术在防止死亡方面具有潜力,但也存在将生活中的未知因素剥夺的风险,这并不一定是一�
随着细菌不断进化以抵抗抗生素的影响,细菌感染的治疗变得更加具有挑战性。过度和滥用抗生素使“抗生素耐药”问题变得更加严重。根据MIT研究的主要合著者之一FelixWong的说法,该研究将帮助“打开黑匣子”,帮助其他研究人员了解深度学习模型的工作原理。
在过去的12个月里,矢量数据库的兴起使得解决语言模型长期记忆不足的问题成为热门话题。研究人员提出了对这些矢量数据库常见方法的反思,并主张构建搜索引擎非矢量数据库。作者建议构建评估和监控基础设施,以便迭代搜索流水线并知道所做的更改是否是改进。
在近期的一项研究中,来自卡内基梅隆大学和BerriAI的研究团队对GoogleGeminiPro进行了深入的评估,并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。这一发现无疑是对Google在生成式人工智能领域与OpenAI竞争的雄心的一次沉重打击。随着GeminiUltra的推出,Google可能会迎头赶上,但目前GPT-4仍然是首选,至少直到GeminiUltra在新的一年发布。
新加坡南洋理工大学的研究人员成功发布了一项名为"Upscale-A-Video"的视频超分辨率技术,通过开创性的文本引导潜在扩散方法,旨在提升低质量视频的视觉质量。视频超分辨率领域面临着在真实场景中常见的多样且复杂的降质问题,包括但不限于降采样、噪音、模糊、闪烁和视频压缩等因素。NTU的研究不仅在技术上取得了显著进展,更为实现视频超分辨率的真实性和高质量提供了新的可能性。
亚马逊的研究人员在一篇论文中介绍了一种创新方法,旨在增强神经网络处理复杂表格数据时的性能。表格数据通常由行和列组成,看似简单,但当这些列在性质和统计特征上差异巨大时,就会变得复杂起来。这项研究为神经网络在处理复杂表格数据时的改进提供了新的思路和方法,有望在实际应用中取得更好的效果。
瑞士洛桑联邦理工学院与苹果联手推出了一项名为"MassivelyMultimodalMaskedModeling"的人工智能框架,旨在解决训练跨多模态视觉基础模型的挑战。尽管在自然语言处理领域,训练大型语言模型已经取得了显著成功,但在视觉领域,仍需要构建能够灵活处理多种输入模态和输出任务的模型。通过对4M性能影响的深入消融分析,结合该方法的简便性和通用性,研究人员认为4M在许多视觉任务和未来发展中具有巨大的潜力。
OpenAI,一个承诺为全人类利益构建人工智能的公司,自去年推出ChatGPT以来,其商业雄心在最近的治理危机中变得更加显著。该公司宣布,一个专注于管理未来超级智能AI的新研究小组开始取得成果。Sutskever在深度神经网络先驱GeoffreyHinton的指导下攻读了博士学位,后者今年5月离开谷歌,目的是警告AI现在似乎正在某些任务中迅速接近人类水平。
人工智能显然是目前最热门的行业。在OpenAI或DeepMind等世界顶级人工智能公司工作是很多人梦寐以求的事情。尽管研究人员的工资并不低,但HuggingFace以其开源方式向研究人员支付23.8万美元的年薪,以及27%的协商增量和18.5万美元的初始报酬。
印第安纳州普渡大学的研究人员设计了一种新的方法,成功地诱导大型语言模型生成有害内容,揭示了隐藏在合规回答中的潜在危害。在与聊天机器人进行对话时,研究人员发现通过利用模型制作者公开的概率数据和软标签,可以迫使模型生成有害内容,成功率高达98%。这项研究的结果提醒我们,保障人工智能技术的安全性和可信度仍然是一个重要的挑战。
视频生成领域取得了显著进展,但对于视频中的摄像机和物体运动的准确控制仍然是一个挑战。传统方法往往集中在其中一种运动类型,或者在两者之间没有明确的区分,从限制了运动控制的多样性。实验结果表明,MotionCtrl相对于现有方法在运动控制方面表现出色,具有更高的生成视频质量和更灵活的运动控制能力。
人工智能和机器学习的能力使它们成功地渗透到几乎每个可能的行业。随着大语言模型和问答系统的引入,尤其是近年来,AI社区取得了巨大的进展。对培训策略和答案相关性等重要元素的强调有助于更全面地了解这一领域。
近期研究发现,对大语言模型进行微调对性能有关键影响,但一项新研究表明,免微调的对齐方法也能有效提升LLM性能。针对大语言模型微调的传统方法,研究者发现对齐调优主要学习语言风格基础LLM已经具备回答用户查询所需的知识。这一研究为工程师提供了新的思路,可能减少对LLM进行微调的需求,为构建更高效的AI助手打开了新的可能性。
纽约大学和Meta的研究团队最近推出了一款名为Dobb-E的开源机器人学习框架,旨在解决家庭环境中机器人操作学习的挑战。这一高度适应性的系统通过从用户演示中学习和适应,取得了显著的成功,其在陌生家庭环境中的成功率达到了81%。实验还为照明条件和阴影影响任务执行的挑战提供了见解。
GoogleDeepMind的研究团队通过人工智能工具GNoME发现了220万种理论上稳定但实验上未实现的晶体结构,这一成果在《自然》杂志上发表。这一发现的晶体结构数量是科学史上发现的数量的45倍以上,为可再生能源和先进计算等领域的发展提供了潜在的进步。「这个庞大的无机晶体数据库应该充满待发现的『宝石』,以推进清洁能源和环境挑战的解决方案,」在麻省理工学院材料科学与工程以及核科学与工程系工作的Yildiz说。
韩国首尔国立大学的研究人员致力于训练能够自主创作真正拼贴艺术品的AI代理人。目前市面上的AI工具可以生成类似拼贴的图像,但缺乏真正的创作过程的真实性。通过用户研究和客观评估的验证,这一突破为AI在艺术创作中开辟了新的道路,为机器在视觉艺术领域有意义地贡献创造了前景。