11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。 该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平,以仅72B的参数量,超越了刚发布不就、参数量达671B的新版DeepSeek-R1。
日前,DeepSeek R1模型迎来重磅升级,正式发布DeepSeek-R1-0528全新版本。 从模型开源到上线仅用不到1天时间,腾讯即宣布腾讯元宝、ima、搜狗输入法、QQ浏览器等多款产品再次迎来升级,率先接入DeepSeek R1-0528,多项能力全面提升。 腾讯表示,用户打开元宝(电脑版、网页版可抢先体验)、ima(任意版本)、搜狗输入法(Windows版侧边栏)、QQ浏览器(任意版本),选择DeepSeek模型R
更新后的 R1 拥有 6850 亿个参数,体量庞大。由于模型规模极大,普通消费者级别的硬件很可能无法直接运行。
快科技4月15日消息,今日,电影《流浪地球 3》官宣开机,导演郭帆,吴京、沈腾等主演参加开机仪式。在开机仪式上,吴京表示,希望自己在戏里能多演喜剧,沈腾多演动作戏。据新浪电影官微,《流浪地球3》开机现场还介绍了一位新同事”自主研发的专属AI问答应用WEi。WEi基于国产大模型DeepSeek R1开发,通过整合多元化知识库资源,包括在线信息源的专业资料、图像和影视�
今日,科大讯飞高级副总裁于继栋在上海AI无界智营全球”2025科大讯飞全球智能营销产品发布会上透露,讯飞星火X1将于近期再次升级。升级后的讯飞星火X1在保持原有数学任务国内领先优势的基础上,推理能力、文本生成和语言理解等通用任务方面的效果将对标业界领先的OpenAIo1和DeepSeekR1模型。科大讯飞曾宣称:这一新版本的发布,预期就可以实现数学答题和过程思维链能力全面对标甚至超过OpenAIo1。
在R2和V4到来之前,DeepSeek先让我们看到了“V3Plus”。3月24日,DeepSeek一声不响的在Huggingface上发布了V3的“小版本”迭代“DeepSeek-V3-0324”。DeepSeek这开源的仗还会继续打下去,好戏还在后面。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升OpenAI近期推出了三款新语音模型,分别为:gpt-4o-transcribe,gpt-4o-mini-transcribeandgpt-4o-mini-tts,其中gpt-4o-transcribe备受关�
【新智元导读】HuggingFace的OpenR1重磅升级,7B击败Claude3.7Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。结合来自数学和代码等多领域的奖励信号,并引入奖励模型来评分非推理数据。
日前美团技术团队宣布对DeepSeekR1进行了INT8精度量化,让DeepSeekR1可以在如A100等老型号GPU上进行部署。DeepSeekR1发布以后不少企业和个人都在尝试部署满血版本,但原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持,其他型号GPU无法直接部署。目前量化代码已经发布在了开源LLM推理框架SGLang上,量化模型已经发布到了HuggingFace社区:https://huggingface.co/meituan/DeepSeek-R1-Block-INT8https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8对具体过程感兴趣的,可以查看官方技术报告。
阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数的DeepSeek-R1媲美。QwQ-32B已在HuggingFace和ModelScope开源,大家也可通过QwenChat直接进行体验!