11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、昆仑万维开源SkyworkR1V视觉思维链推理模型昆仑万维推出全球首个开源多模态推理模型SkyworkR1V,具有38亿参数,性能接近知名闭源模型DeepSeek-R1。该功能能够快速分析过去48小时内的热点话题,用户反馈积极,显示出Grok在信息处理方面的强大实力。
据报道,月之暗面公司正式宣布推出其全新的SOTA模型k1.5多模态思考模型,在多模态推理和通用推理能力上都实现了突破。k1.5多模态思考模型具备多模态推理能力,能够同时处理和分析来自不同模态的信息,如文本、图像、声音等,从提供更全面、更准确的理解和知识。用户在使用过程中如果发现模型切换按钮,即可体验这一全新升级的模型。
VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能能通过选择最佳候选图像来实际改善生成的图像。他的研究成果对视觉识别、自动驾驶、和人机交互等应用产生了深远影响,是该领域极具影响力的科学家之一。
多模态大模型初创企业“智子引擎”宣布完成千万元天使轮融资,旗下拥有参数规模约150亿的大模型“元乘象+ChatImg”,关注微信公众号“元乘象”即可体验。该模型的训练集主要包括图文对数据和视觉问答数据,已经在图文匹配、图文检索、图像描述生成和文本描述生成等多个任务上进行了训练,表现出了出色的多模态处理能力。文本描述生成能力使得该模型能够基于输入的