首页 > AI头条  > 正文

华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream 7B,打破文本生成格局

2025-04-11 10:07 · 来源: AIbase基地

人工智能领域再添一颗耀眼新星!近日,华为诺亚方舟实验室与香港大学自然语言处理组(HKU NLP Group) 联合发布了名为 Dream7B 的全新语言模型。这款模型被誉为“迄今为止最强大的开源扩散大型语言模型”。

Dream7B 的问世,不仅在性能上超越了现有的扩散语言模型,更在通用能力、数学、代码以及规划能力上,比肩甚至超越了同等规模的顶尖自回归(AR)语言模型。这一突破性的进展,预示着文本生成领域或将迎来新的技术范式。

QQ_1744337169007.png

颠覆传统:扩散模型赋能更强语言理解与生成

长期以来,以 GPT-4、DeepSeek、Claude 为代表的主流大型语言模型都依赖于自回归(AR)架构,即按照从左到右的顺序逐个生成文本。尽管这类模型取得了巨大成功,但在复杂推理、长期规划以及维持长文本连贯性方面仍面临挑战。

QQ_1744337189799.png

Dream7B 的核心在于采用了离散扩散模型(Discrete Diffusion Models, DMs) 的创新架构。与 AR 模型不同,扩散模型从完全噪声的状态出发,通过逐步精炼的方式并行生成完整的文本序列。这种根本性的架构差异带来了诸多显著优势:

  • 双向语境建模,实现更强的全局一致性:扩散模型能够同时考虑文本序列中双向的信息,从而更全面地理解语境,生成连贯性更强的文本。
  • 灵活可控的生成能力:通过迭代式的优化过程,Dream7B 能够实现更灵活、更可控的文本生成。
  • 潜在的采样加速能力:新的架构和训练目标有望实现从噪声到数据的更高效直接映射,从而加速模型推理过程。

近年来,扩散模型在语言任务中的潜力日益凸显,例如 DiffuLLaMA 和 LLaDA 等模型已经将扩散语言模型扩展到70亿参数。此次发布的 Dream7B 正是在这一趋势下的又一里程碑式成果。

性能卓越:多项任务比肩顶尖自回归模型

Dream7B 在多个关键能力上展现出惊人的实力:

  • 大幅超越现有扩散语言模型
  • 在通用、数学和代码能力上,与同等规模的顶级自回归模型不相上下,甚至有所超越
  • 规划能力方面表现突出,通过在 Countdown 和 Sudoku 等任务上的评估,Dream7B 显著优于同等规模的其他模型,有时甚至能匹敌参数量远超自身的最新 DeepSeek V3。这表明扩散模型在解决需要多重约束或达成特定目标的问题时更具优势。

独具匠心:创新技术提升模型效能

Dream7B 的成功并非偶然,其背后蕴含着研发团队的诸多创新:

  • 借鉴自回归模型进行权重初始化:研究团队发现,利用现有的自回归模型(如 Qwen2.57B 和 LLaMA3)的权重作为扩散模型的初始参数,能够显著提升训练效率,尤其是在训练初期。
  • 上下文自适应的 Token 级噪声重调度机制:Dream7B 能够根据每个 Token 的上下文信息量动态调整其噪声水平,从而实现更精细化的学习。

灵活推理:打破生成顺序限制

与自回归模型固定的从左到右生成方式不同,Dream7B 的扩散模型架构赋予了其更灵活的推理能力:

  • 任意顺序生成:Dream7B 不受生成顺序的限制,可以按照任意顺序合成输出,从而更好地适应不同的用户查询。例如,它可以灵活地进行文本补全和中间内容填充。
  • 质量-速度可调:通过调整扩散步骤的数量,用户可以在生成速度和质量之间进行灵活的权衡。较少的步骤可以实现更快的生成,但质量稍低;而更多的步骤则能 menghasilkan 更高质量的输出,但计算成本更高。

目前,Dream7B 已经开源了其基础模型和指令微调模型的权重,代码也已在 GitHub 上公开。这无疑将极大地促进扩散模型在自然语言处理领域的进一步研究和应用。华为诺亚方舟实验室和香港大学自然语言处理组也表示,未来将继续探索扩散语言模型更先进的后训练方法。

产品入口:https://top.aibase.com/tool/dream-7b

  • 相关推荐
  • 携手湖南省质检院共建婴幼儿辅食创新实验室 赋能行业品质未来

    5月23日,英氏控股集团与湖南省质检院联合筹建的"国家农副产品质量检验检测中心(湖南)婴幼儿辅食联合研发实验室"在英氏婴童营养与健康科学产业基地揭牌成立。该实验室将聚焦婴幼儿辅食领域,围绕检验检测、标准制定、科研开发等方向开展合作,建立覆盖原料筛选、生产工艺优化、成品质量管控的全链条研发检测体系。双方表示,此次合作将推动行业从"制造"向"智造"升级,为婴幼儿提供更安全、营养的辅食产品。英氏集团强调将始终把科研创新与品质安全视为生命线,此次合作是产学研深度融合的典范。

  • 高校科研实验室集体“退烧”?亿万克液冷攻克散热难题

    随着高校科研对高性能计算(HPC)、人工智能(AI)和大数据分析需求的激增,传统风冷散热面临四大挑战:1)散热效率接近物理极限;2)空间利用率低;3)噪音污染严重;4)温控精度不足。液冷技术尤其是冷板式液冷方案凭借高效、节能、静音等优势成为新选择。某公司推出的冷板式液冷解决方案包含冷块模组、循环系统等核心组件,支持从单台设备到整个机房的灵活配置。该方案可提升计算性能8-15%,机架功率密度达30kW以上,PUE降至1.2以下,年省电费数十万元,噪音从70dB降至45dB以下,并释放25%以上机架空间。该技术不仅解决当前散热难题,更为未来设备升级预留空间。

  • 火山引擎推出豆包·语音播客模型:文本秒变双人对话播客,5 秒生成热点音频!

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 海尔希望小学首届科技节暨首个科技实验室落成 开启教育公益新生态

    5月29日,海尔在陕西延安洛川县菩提镇中心小学举办首届科技节暨全国首个"海尔小科学家"科技实验室落成仪式。该实验室作为"海尔小科学家计划"重要组成部分,标志着海尔公益实践从硬件援建向科技赋能的跨越升级。活动现场展示了学生们的科技创意作品,包括净水装置、太阳能小车等。实验室配备智能教学设备,融合编程、音乐等多学科资源,通过虚拟研学等创新模式培养青少年科学思维。海尔集团表示将持续深化教育公益实践,2024年计划在全国建设10个科技实验室,打造"沉浸式学习+实践展示"的创新培育体系,激发青少年科技潜能。

  • 从实验室严测到家庭信赖:友望(UWANT)洗地机以技术透明赢得用户深度信任

    友望携手知乎实验室推出云鲸2.0洗地机测评视频,通过五大极限场景测试验证产品性能:除臭测试中分层除味棒实现99.9%杀菌率;IPX6级防水设计解决机身清洁难题;低矮空间测试展现灵活清洁能力;双排悬浮恒压鲨鱼齿配合23000Pa吸力轻松解决毛发缠绕;AI基站实现自动清洁闭环。该测评创新采用用户全程监督的公开测试模式,以可视化数据验证产品实力,突破行业参数内卷困局。友望通过可浸泡式主机、推入式基站等创新设计重新定义洗地机标准,展现技术领导力。这场硬核测评不仅体现产品解决用户痛点的能力,更以"共情共创"理念建立用户信任,视频发布即获上万播放量,印证了科技产品用用户语言讲故事的沟通有效性。

  • 广电视听人工智能联合共建实验室成立,共筑智慧媒体发展新引擎

    5月22日,国家广播电视总局广播电视规划院、贵州多彩新媒体股份有限公司与腾讯云等联合成立"广电视听人工智能联合共建实验室",旨在推动AI技术与广电视听产业深度融合。实验室汇聚全国十余家省级广电新媒体单位及头部科技企业,聚焦机器学习、自然语言处理、计算机视觉等前沿技术领域,致力于技术突破、人才培养和产业升级。该实验室将作为"智慧广电"建设的重要创新平台,通过跨领域资源整合,构建开放创新生态,推动从内容生产到终端服务的全链条智能化升级,助力广电行业构建更高效、更智能的传播生态。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

    今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)。 龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

今日大家都在搜的词: