11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
在最近关于「ScalingLaw是否撞墙」的讨论中,后训练被寄予厚望。近期发布的OpenAIo1在数学、代码、长程规划等问题上取得了显著提升背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。最后必须说明,长达73页的Tülu3技术报告中还包含大量本文并未提及的细节,感兴趣的读者千万不要错过。
【新智元导读】Mistral7B诞生一周年之际,法国AI初创公司Mistral再次连发两个轻量级模型Ministral3B和Ministral8B,性能赶超Llama38B。Mistral7B仅仅发布一周年,法国AI初创小模型「lesMinistraux」就打败它了。对于Mistral也是如此,若要持续打造优秀的模型,只有这一种选择。
全球AI领导者英伟达开源了超强大模型——Llama-3.1-Nemotron-70B-Instruct。根据测试数据显示,这个模型已经击败GPT-4o、GPT-4turbo、Gemma-2、Gemini-1.5、Claude-3.5sonnet等140多个开闭源模型,仅次于OpenAI发布的最新模型o1。根据测试数据显示,使用HELPSTEER2-PREFERENCE数据集训练的模型性能非常强,在RewardBench评测中达到了94.1的高分,超过了同期几乎所有其他模型的表现。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、猛了!Meta震撼发布Llama3.2视觉方面吊打所有闭源模型?Meta在其年度MetaConnect2024大会上发布了Llama3.2,旨在提升边缘AI和视觉任务的能力。Molmo的成功归功于高质量训练数据和多样性,展现出色的多模态交互能力。
继分不清9.11和9.9哪个大以后,大模型又“集体失智”了!数不对单词“Strawberry”中有几个“r”,再次引起一片讨论。GPT-4o不仅错了还很自信。最后正如网友所说,希望OpenAI等大模型公司,都能在下个版本中解决这个问题。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、最强开源模型来了!Llama3.1以405B参数领先GPT-4o在人工智能的世界里,开源与闭源的较量从未停歇。整体业务增长势头良好,展望未来发展潜力巨大。
导读:时隔4个月上新的Gemma2模型在LMSYSChatbotArena的排行上,以27B的参数击败了许多更大规模的模型,甚至超过了70B的Llama-3-Instruct,成为开源模型的性能第一!谷歌出手,果然非同凡响。Gemma2上周刚刚发布,就在LMSYS竞技场上取得了亮眼的成绩。」看来在基准测试领域,重复的历史总在不断上演那个金句也总是适用——「当一个衡量标准成为目标时,它就不再是一个好的衡量标准了
【新智元导读】24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法,用思维模板大幅增强了推理性能。Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!大语言模型不擅长推理怎么办?用思维缓冲区来解决!最近,北大、UC伯克利、斯坦福的研究人员提出了一种元缓冲区。他担任/曾担任中�
LLama3-V模型正式发布,这是一种全新的SOTA开源VLM模型。LLama3-V不仅优于LLaVA在与GPT4-V、GeminiUltra、ClaudeOpus相比的性能表现上也不逊色,同时模型体积只有它们的1/100。这一消息让人兴奋不已,相信随着LLama3-V的问世,将会给人工智能领域带来全新的发展和突破。
【新智元导读】最大开源模型,再次刷爆纪录!Snowflake的Arctic,以128位专家和4800亿参数,成为迄今最大的开源模型。是又大又稀疏,因此计算资源只用了不到Llama38B的一半,就达到了相同的性能指标。他本人的研究兴趣是机器学习与系统的交叉领域。