11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
近日,百度团队在arXiv上发表论文,介绍了一种名为COBRA的新算法框架,被应用于提升生成式模型在广告推荐系统中的使用效果。根据论文介绍,工程师将COBRA框架应用于真实环境中的A/B测试,结果显示转化率提升了3.6%,平均每用户收入增加了4.15%。实测效果表明,COBRA框架在利用公开数据集和工业数据集进行离线和在线评估后,均优于目前业内最先进的方法。
苹果的研究人员推出了一种创新模型ReALM,可将参考解析问题转化为语言建模问题,能极大提升AI助手处理很多描述复杂或模糊不清的内容。我们网购时选好了橘子、鸭梨、苹果、橘子汽水、洗发水、短袖、拖鞋等物品,然后告诉AI助手只结算水果。该模块还能通过用户的反馈机制,帮助模型进行自我学习改进其解析能力。
悉尼科技大学的科研人员,通过大语言模型、EEG、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。DeWave的使用方法非常简单,用户只需要戴上EEG,然后开启你的思维活动,DeWave就能将你的想法直接翻译成文本,就像现实版的《读心人》非常“恐怖”。MEG主要应用:定位脑功能、研究大脑通信、诊断和治疗规划、研究神经发育和疾病等。
在这项最新的研究中,来自南洋理工大学的研究团队介绍了一项名为InsActor的创新性生成框架。该框架旨在通过使用先进的扩散式人体运动模型,以指令驱动的方式生成基于物理的角色动画。文章表示InsActor的能力使其成为未来指令驱动的基于物理的动画发展的重要基准。
GoogleDeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。在今年一月份,他们推出了MusicLM,该模型可以根据文本提示生成五分钟的音频片段。
Adobe研究人员与澳大利亚国立大学的团队合作,成功开发了一种突破性的人工智能模型,能够在短短5秒内将单一2D图像转化为高质量的3D模型。这一突破性技术在他们的研究论文《LRM:单一图像到3D的大型重建模型》中有详细介绍,有望彻底改变游戏、动画、工业设计、增强现实和虚拟现实等领域。但他们表示,这项工作展示了基于大规模数据集训练的大型变压器模型具有学习通用的3D重建能力的潜力。
FraunhoferHeinrichHertz研究团队取得重大突破,他们引入了一项全新技术,使用神经辐射场将标准RGB视频转化为可控制的3D人体模型。这一创新代表了计算机图形领域中的一项重要进展,解决了从视频片段中创建逼真、可控制的3D模型一直以来的难题。这项工作将数字人物的创建变得更加可行,为个人创作者和小型制作团队带来更多应用可能性。
卡内基梅隆大学、Google研究以及乔治亚理工学院联合推出了一项名为MAGVIT-v2的视频标记工具,它成功地将图像和视频输入转化为大型语言模型可识别的标记。项目地址:https://magvit.cs.cmu.edu/MAGVIT-v2的独特算法让开发者可以实现令人惊叹的应用。MAGVIT-v2的发布,预示着视觉生成领域的一次重大突破。
OpenPipe是一个创新的AI工具,旨在将昂贵的语言模型的强大能力与更便宜的模型相结合,以满足用户的精确需求。它的核心思想是利用强大但昂贵的大型语言模型进行微调,生成适合特定需求的廉价模型。多种训练数据导出格式:支持导出多种训练数据格式,包括Alpaca和ChatGPT,同时具备去重功能,使数据准备更加高效。
SQLCoder是由Defog.ai开发的一款先进模型,用于将自然语言问题转化为数据库查询。它在通用SQL架构中表现出色,并且在针对特定数据库架构进行优化时,性能超过了gpt-4。4.可根据程序需求进行定制化修改。