11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
据报道,百度计划在今年下半年发布下一代人工智能模型Ernie5.0,将大幅增强多模态能力。多模态人工智能能够处理和融合文本、视频、图像和音频等多种信息形式,并实现跨模态转换,例如将文本转换为视频,或将音频转换为图像。Ernie模型的当前版本为第四代,于2023年10月发布,其升级版涡轮版Ernie4.0于2024年8月发布。
OpenAI联合创始人兼首席执行官SamAltman出席了日本东京大学活动,介绍了OpenAI的技术研发、产品规划以及GPT模型未来发展等重要信息。在问答环节,有学生提到了大家比较关心的GPT-5问题,Altman表示,GPT-5将是一个超级混合模型,计划会把GPT和o系列模型整合在一起,并且支持视频、音频、图像的多模态交互。Altman表示,OpenAI积极倡导与全球各界共同探讨伦理问题,希望通过广泛的交流和合作,形成一套科学合理、切实可行的伦理规范。
在2024世界人工智能大会上,上海岩芯数智携Yan1.2多模态大模型亮相,不仅可以让大模型在手机、电脑、甚至树莓派端无损运行可以让机器人准确理解用户的模糊指令和意图。研发团队展示了一款部署Yan1.2多模态大模型的智能机器人“小智”,它能够基于Yan1.2的语音和视觉处理能力,实时识别环境、准确理解用户的模糊指令和意图,并据此控制其机械躯体高效完成各类复杂任务。当有人问“小智,你现在看到了什么”或手捧书籍邀请“小智”一同看书时,它能够基于多模态能力进行学习和创作,精确描述环境和人物特征、学习书籍信息。
2024年1月18日凌晨,三星在举办了GalaxyAI全球新品发布会,宣告GalaxyS24系列的登场,应用了谷歌Gemininano大模型共同迎接“GalaxyAI时代”的到来。除了这个模型,GalaxyS24的一些功能还受益于谷歌Imagen2模型,将文本到图像的能力植入手机。S24、S24的起售价为115.5万韩元、135.3万韩元Ultra版则以169.84万韩元起售。
在清华大学举行的演讲中,360集团创始人周鸿祎对2024年大模型的发展趋势进行了深刻的预测,引发了业界的广泛关注。周鸿祎首先指出,与操作系统不同,大模型将呈现无处不在的趋势,更类似于电脑的普及。大模型在中国的发展方向是产业化和垂直化,预计明年将涌现出许多真正解决实际问题的垂直大模型。
近期的Gemini-Pro评测报告显示其在多模态领域取得了显著的进展,与GPT-4V不相上下,甚至在某些方面表现更为出色。在多模态专有基准MME上的综合表现中,Gemini-Pro以1933.4的高分超越了GPT-4V,展现出在感知和认知方面的全面优势。Gemini-Pro的表现表明了多模态技术的潜在威力,为未来的研究和应用提供了有益的启示。
近日有网友看到一个“企鹅在沙漠洗澡”的视频,并将该视频分享到家庭群,引来其家人对环保的感慨当父母知道视频是人工智能生成时,将该网友踢出了家庭群。网友将这个经历分享到社交平台,“企鹅在沙漠洗澡”引来大量网友围观。发布会现场周鸿祎预告,下一步360计划发布插件平台,将进一步推动大模型产业生态发展。