11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
多图像场景也能用DPO方法来对齐了!由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。MIA-DPO的成功证明了通过偏好优化对齐模型与人类反馈,在提升模型多图像感知与推理能力的同时,也可以保持原有的单图任务性能,为未来的研究奠定了坚实基础。
腾讯AI实验室开发的"TRANSAGENTS"是一个创新的多智能体框架,专门设计用于处理超长文学内容的翻译工作。这个系统通过创建一个虚拟的翻译出版公司来模拟真实的翻译流程,其中包含多个具有不同职责和专业技能的虚拟角色。这种新型的多智能体翻译系统有望在未来的文学翻译和跨文化交流中发挥重要作用。
极空间AI实验室 是北京天顶星智能信息技术有限公司推出的家庭私有云产品中的新功能。它包括自然语言搜索、相似图片搜索和图片文字识别等功能,旨在帮助用户更快捷地管理和使用存储在极空间中的图片。点击前往极空间AI实验室体验入口需求人群:适用于需要管理和快速检索大量图片的用户,如家庭用户、摄影师、设计师等。使用场景示例:使用自然语言搜索功能快速找
英伟达最新宣布成立通用具身智能体研究小组,专注于发展具备理解、推理和与物理世界互动能力的智能系统。该研究小组由英伟达高级科学家JimFan和其队友YukeZhu共同领导,他们认为未来的移动机器人将成为自主体,如同iPhone般无处不在。他们之前在具身智能领域的研究成果已经引起广泛关注,未来的发展也备受期待。
最新科学大模型浦科化学,发布即开源!这是上海AI实验室最新开源成果,它基于书生·浦语2.0强大的基座模型能力,通过注入海量化学专业数据,使大模型获得理解和处理化学相关专业任务的知识与能力。值得一提的是,在获得化学能力同时,大模型的数理学科及推理能力还得到增强。基于浦科化学模型,人工智能可为化学研究提供智能化辅助,如化学合成路径规划、化学反应条件优化、实验结果自动化分析等,从提升化学研究的效率和质量。
上海AI实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为Amphion的音频、音乐和语音生成工具包。Amphion可帮助开发人员研究文本生成音频、音乐等与音频相关的领域,可以在一个框架内完成,以解决生成模型黑箱、代码库分散、缺少评估指标等难题。开发团队表示,未来,会持续更新这个工具包,加入更多与语音相关的模型,打造成最好用的开源语音工具包之一。
上海AI实验室升级发布“浦医2.0”上海人工智能实验室与上海交通大学医学院附属瑞金医院等在“2023健康中国思南峰会”上发布了医疗多模态基础模型群“浦医2.0”,为跨领域、跨疾病、跨模态的AI医疗应用提供全面支持。用户可定制图�
上海人工智能实验室与上海交通大学医学院附属瑞金医院等合作伙伴在“2023健康中国思南峰会”上发布了医疗多模态基础模型群“浦医2.0”,旨在为跨领域、跨疾病、跨模态的AI医疗应用提供能力支持。浦医2.0新增了多领域模型,语言参数增量,涵盖医学图像、医学文本、生物信息、蛋白质工程等多个数据模态。整个浦医2.0实现了医疗大模型群的一站式开源,为实现人工智能�
最近在多模态大型语言模型领域取得了显著进展,但在多模态内容生成方面仍存在明显的空白。为了填补这一空白,腾讯AI实验室和悉尼大学的合作引入了GPT4Video,这是一个统一的多模型框架,使得大型语言模型具备了视频理解和生成的独特能力。该研究还提出了一种简单有效的微调方法,并发布了数据集,为未来的多模态LLMs研究提供了便利。
为庆祝Meta基础人工智能研究团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。Ego-Exo4D:官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/该项目以数据集及基准测试的形式呈现,旨在支持视频学习和多模态感知的人工智能研究。这三个项目的推出标志着MetaFAIR团队十年来在人工智能领域取得的巨大成就,并为未来的技术发展和创�