11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。团队宣布LLaVA-o1的代码、预训练权重、数据集等即将全部开源。
根据SuperCLUE发布的中文大模型基准测评最新报告,阿里通义千问开源模型Qwen2-72B-Instruct以卓越的表现位居国内通用能力第一,更在全球范围内成为最强开源模型。SuperCLUE报告详细披露了对国内外33个大模型的综合测评结果,Qwen2-72B在一级总分上以77分的高分与Claude-3.5-Sonnet并列第二,仅次于OpenAI的GPT-4o。截至目前Qwen系列模型的下载量已突破2000万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。
在2024年世界人工智能大会期间,李彦宏在一场圆桌访谈中对开源与闭源模型进行了讨论,并直言不讳地称开源其实是一种智商税。面对开源闭源的问题,李彦宏坚持认为闭源模型会持续领先,他解释说,闭源模型可以根据用户需求提供多种变体,以平衡效果、推理速度和成本。大模型的加持能让各行各业的公司受益,这种影响力对整个社会和人类来说更为重要。
发布仅2天,CodeLlama再次引爆AI编码的变革。还记得Meta在CodeLlama论文中出现的能够全面持平GPT-4的神秘版本UnnaturalCodeLlama吗?大佬Sebastian在自己博客里做出解释:是使用了1万5千条非自然语言指令对CodeLlama-Python34B进行微调之后的版本。如果要让70B的模型支持100ktoken的输入长度,可能会使得模型对于计算量的要求变得过于夸张了。