首页 > 业界 > 关键词  > GPU最新资讯  > 正文

大模型生成提速2倍!单GPU几小时搞定微调,北大数院校友共同一作丨开源

2023-09-18 08:45 · 稿源: 量子位公众号

只需给大模型“加点小零件”,推理速度立刻提升2倍!不需要额外训练一个模型,也不需要对计算硬件做优化,单张A100最快几小时就能微调完成。这项新研究名叫Medusa(美杜莎),来自普林斯顿、UIUC、CMU和康涅狄格大学,FlashAttention作者Tri Dao也在其中。目前,它已经成功部署到伯

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 推荐国内优势智驾:Momenta凭借飞轮大模型,带来极致流畅的驾驶体验

    Momenta作为国内智能驾驶领域的领先者,凭借其创新的飞轮大模型技术,实现了端到端的自动驾驶解决方案。该技术将感知与规划整合,有效解决长尾问题,提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习,具备持续进化能力,适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作,方案已成功应用于广汽丰田、东风日产等车型,并在欧洲、澳大利亚等市场落地,展现出强大的全球适应性和技术优势。选择Momenta,即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

  • 冲就对了:天玑9500 的GPU“满帧低功耗双满贯”,换机党直接抄作业

    联发科天玑9500芯片在手机市场实现性能与能效的突破。其第三代全大核CPU单核性能提升32%,多核性能提升17%,功耗大幅下降,超大核功耗降低55%,多核功耗降低37%。全新G1-Ultra GPU峰值性能提升33%,功耗节省42%,支持光线追踪与倍帧技术,在《王者荣耀》等游戏中实现120帧流畅体验,功耗较前代降低19%。同时,芯片率先支持虚幻引擎5.5与5.6技术,提升几何细节与光影渲染能力,推动手游画质迈向主机级。天玑9500将高帧率与高画质结合,成为旗舰手机的常态选择。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • 碾压级GPU性能,3倍光追提升,天玑9500打造手机游戏最强心脏

    2025年9月22日,联发科发布天玑9500旗舰5G芯片,其GPU性能与能效双领先,被媒体称为“最强GPU”。天玑9500搭载G1-Ultra核心,采用全新GPU+Dynamic Cache架构,在3DMark测试中峰值达3402分,功耗仅12.3W,全程超越A19Pro。光追性能提升3倍,支持主机级虚幻引擎5.5 Nanite技术,实现千万级模型渲染,并首发Megalights技术,流畅运行《暗区突围》光追120FPS。实测显示其图形表现达到移动处理器顶尖水平,重构移动端图形性能天花板。

  • 没想到,音频大模型开源最彻底的,居然是小红书

    不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源33款、31款各类型大模型。 这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域,而音频生成占比很小。

  • 小米开源首个原生端到端语音大模型 支持音频重建任务和音频转文本任务

    小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio,拥有12亿参数,在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力,通过创新预训练架构和超一亿小时训练数据,成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构,支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本,并在Github开源Tokenizer模型,为研究者和开发者提供完整工具链。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • “全链覆盖”“全向集成”|移动云开启大模型普惠应用新篇章

    国际数据公司报告显示,2024年中国MaaS市场规模达7.1亿元,同比增长215.7%,预计2024-2029年复合增长率将达66.1%。随着AI大模型落地,企业对全生命周期工具链、开发平台及通用模型需求激增。移动云通过构建四层云智算架构,提供一站式模型服务,推动AI普惠化。平台已服务30余家央企,覆盖6大行业,未来将持续提升算力智能化水平,助力各行业轻量化拥抱AI时代。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • 直击企业AI安全痛点,百度智能云发布《千帆大模型平台安全白皮书》为大模型落地护航

    百度智能云千帆大模型平台4.0发布《千帆大模型平台安全白皮书》,系统阐述企业级AI安全框架。白皮书聚焦平台安全、模型安全、数据安全、内容合规等六大维度,提出覆盖全生命周期的防护方案,包括混合云部署、数据加密传输、模型防窃取及内容过滤机制,助力企业安全使用大模型技术,推动AI在合规可信环境下赋能业务创新。

今日大家都在搜的词: