11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。
AI不过周末,硅谷也是如此。Llama家族上新,一群LIama4就这么突然发布了。太平洋这头,已经开始落地应用和智能体了。
DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAIo1的中档推理设置相当。这样实时更新、确保公平性和可靠性的测试方法,获得了开发者社区的认可。
【新智元导读】小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4所花成本还不到三分之一。甚至还可以通过不冗长的输出,来进一步节省成本。
一款号称代码能力超越GPT-4的模型,引发了不少网友的关注。准确率比GPT-4高出超过10%,速度却接近GPT-3.5窗口长度也更长。一路测试下来,很难判断它们孰优孰劣,但考虑到搜索能力,以及免费免登录的特性,Phind还是可圈可点的。
昨天的我:在代码生成方面开源LLM将在几个月内击败GPT-4。现在的我:实际上是今天。大家可以下载模型后自行体验。
8月15日,讯飞星火认知大模型V2.0升级发布会如约至,科大讯飞董事长刘庆峰、研究院院长刘聪重磅发布代码能力和多模态能力升级,同时发布并升级搭载讯飞星火认知大模型V2.0能力的多项应用和产品。刘庆峰表示,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路也是科大讯飞既定的人工智能技术长期战略,大模型赋能个体和行业的大未来正在到来。”刘庆峰说,要全力以赴、不遗余力、充满激情、充满斗志的去争取,“有‘最终一定行’的精神指引,借助这一波通用人工智能的机会,我们打造每个人的AI助手、释放每个人无限可能的梦想,就一定能够成为现实。
科大讯飞发布了星火认知大模型V2.0,重磅推出代码能力、多模态能力。从测试集上的效果对比来看,星火V2.0的Python和C语言代码编写能力已经高度逼近ChatGPT,差距仅为1%和2%。讯飞星火认知大模型V2.0还能生成带有虚拟人的视频。
GPT-4再度进化!加上一个简单方法,就能让GPT-4这类大语言模型学会自我反思,性能直接提升30%。大语言模型回答出错,经常是二话不说,直接先道歉,然后emmmmmm,继续乱猜。结果也显易见,用了Reflexion,GPT-4的编程能力直接提升了21%。