11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
带着最强AI芯片GB300闪亮登场“AI超级碗”GTC,燃爆全场!性能方面,和去年发布的GB200相比,推理性能是其1.5倍。目前Nano和Super模型可在NIM微服务中获取,Ultra模型即将推出。所以大家这次都在观望,老黄是否又会“语出惊人”,相关探讨是否会对量子计算产业产生更大影响。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、昆仑万维开源SkyworkR1V视觉思维链推理模型昆仑万维推出全球首个开源多模态推理模型SkyworkR1V,具有38亿参数,性能接近知名闭源模型DeepSeek-R1。该功能能够快速分析过去48小时内的热点话题,用户反馈积极,显示出Grok在信息处理方面的强大实力。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、快手可灵AI全面接入DeepSeek-R1,DeepSeek灵感版已上线快手旗下的可灵AI近期全面接入DeepSeek-R1,为用户在视频和图片生成方面带来了显著便利。随着推理能力的提升,AI在编程领域的表现也在不断改善,未来几乎所有代码可能由AI生成。
日前,百度地图宣布,鸿蒙版百度地图新升级,融合DeepSeek-R1满血版。华为原生鸿蒙手机用户可将鸿蒙版百度地图升级至1.4.5版,检索即可体验,比如问问DeepSeek小众景区玩法、游玩推荐,帮你设置个性化定制路线等。2025年鸿蒙生态要压强投入,10万个应用是生态成熟标志,这是未来半年到一年时间的关键目标。
【新智元导读】HuggingFace的OpenR1重磅升级,7B击败Claude3.7Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。结合来自数学和代码等多领域的奖励信号,并引入奖励模型来评分非推理数据。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义开源R1-Omni模型可提升多模态情感识别能力通义实验室团队于3月11日开源了R1-Omni模型,标志着全模态模型的发展取得了重要进展。新模型可更准确地将静态图像转化为流畅动画,并支持多种风格转换,极大提高了内容创作者的创作效率和灵活性。
国产大模型DeepSeek-R1爆火后,许多第三方平台陆续接入了该模型,比如腾讯、阶跃星辰、蚂蚁集团、百度、字节跳动等等。中文大模型测评基准SuperCLUE发布DeepSeek-R1联网搜索能力首测,公布了10家第三方平台测评结果。所有平台在分析推理能力上平均耗时都明显高于基础检索能力。
日前美团技术团队宣布对DeepSeekR1进行了INT8精度量化,让DeepSeekR1可以在如A100等老型号GPU上进行部署。DeepSeekR1发布以后不少企业和个人都在尝试部署满血版本,但原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持,其他型号GPU无法直接部署。目前量化代码已经发布在了开源LLM推理框架SGLang上,量化模型已经发布到了HuggingFace社区:https://huggingface.co/meituan/DeepSeek-R1-Block-INT8https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8对具体过程感兴趣的,可以查看官方技术报告。
苹果深夜放大招!昨晚,苹果重磅发布新款MacStudio,配备了地表最强的全新M3Ultra和M4Max芯片。M3Ultra集成了1840亿个晶体管,性能是M1Ultra的2.5倍。新款MacBookAir起售价7999元,凭借其高性价比,仍然是最畅销的笔记本电脑之一。
阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数的DeepSeek-R1媲美。QwQ-32B已在HuggingFace和ModelScope开源,大家也可通过QwenChat直接进行体验!