11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】由UCLA等机构共同组建的研究团队,全球首次在20亿参数非SFT模型上,成功实现了多模态推理的DeepSeek-R1「啊哈时刻」!就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」!这一成就,再次让AI社区轰动。博客地址:https://turningpointai.notion.site/the-multimodal-aha-moment-on-2b-model开源项目:https://github.com/turningpoint-ai/VisualThinker-R1-ZeroDeepSeek-R1的独特推理能力,能成功扩展到多模态推理领域吗?UCLA等机构的研究者发现,虽然目前已经涌现出许多试图复现DeepSeek-R1的研究,然这些研究大多遭遇了这个难点:很难复现出R1所表现出的回答长度增加和思考模式。在台湾大学获得硕士学位,导师是Chih-JenLin教授。
【新智元导读】Mini-Monkey是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略和尺度压缩机制,有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态理解和文档智能领域的潜力。作者也验证了多尺度自适应切分策略在别的架构的多模态大模型上的有效性,为缓解由切分增大分辨率导致的「后遗症」提供了一种简单有效的解决方案。
提升多模态大模型处理高分辨率图像的能力越来越引起这个领域的关注。绝大多数方法致力于通过对图像进行切分再融合的策略,来提升多模态大模型对图像细节的理解能力。作者也验证了多尺度自适应切分策略在别的架构的多模态大模型上的有效性,为缓解由切分增大分辨率导致的「后遗症」提供了一种简单有效的解决方案。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌发布全新Gemma22B模型,性能超越GPT-3.5-Turbo与Mixtral-8x7B谷歌推出了性能卓越的Gemma22B模型,拥有20亿参数,在多种硬件环境下表现优异。报告提出多项建议,包括责任从分发未�
重磅消息!StableDiffusion3,大概率会在明天开源。距离2月SD3的横空出世,已经过去了4个月。SD3开源倒计时开启,接下来坐等上手了。
识读距今2300多年战国时期的上古竹简,AI正在立功。且在这背后的“大功臣”,竟是只有2B大小的多模态大模型!这批上古竹简,由清华大学于2008年7月收藏,因此也被称为清华简。李大海在公开信中也透露了资金的用处,依旧将是技术和人才:有技术,有人才,有市场,面壁智能是值得继续关注一波的大模型实力派选手了。
一个体量仅为2B的大模型,能有什么用?答案可能超出你的想象。因为若是用四个字来概括,那就是“多、快、好、省”:多:它是业界第一个在端侧部署多模态的大模型。用李大海的话来说:嗯,五道口,不愧是“宇宙中心”。
【新智元导读】2B性能小钢炮来了!刚刚,面壁智能重磅开源了旗舰级端侧多模态模型MiniCPM,2B就能赶超Mistral-7B能越级比肩Llama2-13B。成本更是低到炸裂,170万tokens成本仅为1元!最强旗舰端侧模型,重磅诞生!就在刚刚,坐落在「宇宙中心」的面壁智能,重磅发布2B旗舰端侧大模型MiniCPM,并全面开源。在这个App上,不光有李白杜甫、清华北大的CP,或许,你还可以找到平行宇宙的ta。
2023年是生成式AI发力的元年,那么AIAgent,则一定是这股热潮中留存下来的明珠之一。在初期不过多地被资本干涉与左右,才更有可能做出亮眼的成果。在用户基数、市场份额均不占优的情况下,一个成功的生态,就成为了让用户保持粘性的关键。
对于京东也在布局AIGC,将出手打造“京东版”ChatGPT产品的说法,京东集团副总裁、IEEE Fellow何晓冬表示,京东一直在ChatAI 和AIGC赛道上推进,但更聚焦2B行业,近期将有进一步突破,包括在这一赛道上推出下一代产品。何晓冬表示,如果把ChatGPT看成是一个技术的话,京东一直在做相关研发;如果将其看成是一个产品的话,京东也已经有类似的Chat AI和AIGC的产品,但更加聚焦京东所在的行业。字节AI Lab成立于2016年,研究领域主要涉及自然语言处理、数据挖掘、机器学习、语音与音频等。