Meta 推出创新模型 AU-Nets，革新文本处理方式

2025-07-23 11:06 · 来源： AIbase基地

在大语言模型（LLM）领域，文本数据的分解一直是关键的研究方向。传统的分词技术，如字节对编码(Byte Pair Encoding)，通常在文本处理前将其切割为固定的单元，并基于此构建一个静态的词汇表。这种方法虽然广泛使用，但也存在局限性。一旦分词完成，模型的处理方式就无法灵活调整，且在面对低资源语言或特殊字符结构的文本时，效果更是不尽如人意。

为了解决这些问题，Meta 的研究团队推出了一种名为 AU-Net 的创新架构。AU-Net 通过自回归的 U-Net 结构，改变了传统的文本处理模式，能够直接从原始字节开始学习，灵活地将字节组合成单词和词组，甚至形成多达四个单词的组合，形成多层次的序列表示。

AU-Net 的设计灵感来源于医学图像分割领域的 U-Net 架构，具备独特的收缩路径和扩张路径。收缩路径负责压缩输入的字节序列，将其合并为更高层次的语义单元，以提取文本的宏观语义。而扩张路径则负责将这些高层次信息逐步还原，恢复到原始序列长度，同时融合局部细节，使得模型能够在不同层次上捕捉文本的关键特征。

AU-Net 的收缩路径分为多个阶段。在第一个阶段，模型直接处理原始字节，使用限制注意力机制的方式以保证计算的可行性。接着在第二阶段，模型在单词边界处进行池化，将字节信息抽象为单词级的语义信息。而在第三阶段，池化操作在每两个单词之间进行，捕捉更大范围的语义信息，增强模型对文本含义的理解。

扩张路径则负责将压缩后的信息逐步还原，采用多线性上采样的策略，使得每个位置的向量能够根据序列中的相对位置进行调整，优化高层次信息和局部细节的融合。此外，跳跃连接的设计保证了在还原过程中不丢失重要的局部细节信息，从而提升模型的生成能力和预测准确性。

在推理阶段，AU-Net 采取自回归的生成机制，确保生成的文本既连贯又准确，同时提高了推理效率。这种创新架构为大语言模型的发展提供了新的思路，展现了更强的灵活性和适用性。

开源地址:https://github.com/facebookresearch/lingua/tree/main/apps/aunet

划重点:
- 🚀 AU-Net 架构通过自回归方式，动态组合字节形成多层次的序列表示。
- 📊 采用收缩和扩张路径，确保宏观语义信息和局部细节的有效融合。
- ⏩ 自回归生成机制提高推理效率，确保文本生成的连贯性与准确性。

相关推荐

谷歌24亿收购Windsurf击败OpenAI，Meta/微美全息竞相扩充AI战略布局

谷歌以24亿美元收购AI编程初创公司Windsurf，原计划由OpenAI斥资30亿美元收购的交易突然取消。Windsurf年收入已达1亿美元，其核心团队将加入谷歌DeepMind。同时，Meta收购AI语音公司PlayAI，加强自然语音生成能力。微美全息等企业也在积极布局"AI+"赛道，推动多场景应用。全球科技巨头正通过收购和人才争夺加速AI领域布局，AI技术已成为推动行业变革的核心引擎，未来竞争将围绕技术创新和商业化应用展开。
马斯克xAI推出Grok - 4 大模型将至，Meta/微美全息深耕开源AI融合加速

埃隆·马斯克旗下xAI即将发布Grok-4大模型，该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs，加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施，扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型，推动AI产业升级。当前AI赛道竞争激烈，大模型正向通用多模态演进，商业化落地成为关键。
微软以Maia 280开启新局对垒英伟达，Meta/微美全息开源联动引领AI创新

微软自研AI芯片Braga因设计问题延期至2026年，将推出过渡产品Maia280，性能或提升30%。微软原计划2025年量产Braga芯片以减少对英伟达的依赖，但延期导致后续产品线同步推迟。面对英伟达在AI芯片领域的主导地位（市占率超80%，年销售额增长10倍），微软正调整战略转向更务实的迭代路线。与此同时，Meta成立"超级智能团队"加速AI研发，微美全息押注量子计算等前沿技术。行业分析师认为，由于英伟达技术迭代速度极快（年增长32%），多数企业自研芯片计划可能最终难以抗衡其市场领导地位。

微软AI芯片 Braga芯片延期 Maia280产品
荐A日报：Trae 2.0 正式升级 SOLO 模式；通义发布Qwen3新模型；智谱AI重磅推出Zread

本期AI日报聚焦多项AI领域突破：1)Trae 2.0推出SOLO模式，实现AI全流程自主开发；2)阿里通义发布Qwen3-235B大模型，支持256K文本处理；3)智谱AI推出Zread工具，一键转换GitHub项目为使用手册；4)零一万物发布万智企业大模型平台2.0及定制Agent方案；5)字节跳动推出通用机器人模型GR-3，具备高精度操作能力；6)Pika推出AI视频特效APP，降低创作门槛；7)Dia浏览器将上线AI驱动的"分身鼠标&

人工智能 AI产品开发者
荐AI日报：智谱AI重磅发布GLM-4.5；阿里开源Wan2.2；阶跃星辰推全新模型Step3

【AI日报】本期重点内容：1.智谱AI发布开源大模型GLM-4.5，在推理、编码和智能体能力方面达到SOTA水平；2.阿里开源视频生成模型Wan2.2，采用MoE架构提升计算效率；3.阶跃星辰推出AI研究助手"阶跃深研"，支持金融医疗等专业领域研究；4.微软Edge浏览器新增Copilot模式，提供智能搜索体验；5.Anthropic对Claude用户实施使用限制引发争议；6.阶跃星辰发布321B参数大模型Step3；7.蚂�

人工智能开源模型技术趋势
猿辅导AI大模型：技术深融与场景革新，重构学习体验

2025年教育科技领域迎来智能化新浪潮。猿辅导集团通过自主研发的"猿力大模型"与开源推理大模型DeepSeek深度融合，构建覆盖"数据-场景-交互"全链路的AI教育生态。其技术方案已获信通院"模型开发5级"认证，成为教育行业首个获此最高评级的大模型。硬件方面推出"小猿学练机"和"小猿AI学习机"，实现学习平板与智能基座结合，支持打印、情感交互等功能。校园端覆盖25省市超1000所学校，通过"AI安全驾驶模拟"等项目培养学生计算思维。编程教育领域推出支持代码实时监测的AI-Agent工具。凭借300亿条学情数据和15亿题库构建的高质量素材库，显著降低"幻觉"风险68%。目前旗下出海产品已服务100多个国家，推动中国教育科技走向国际。

教育科技智能化跃迁大模型应用
苹果智能眼镜布局全面加速，Meta/微美全息产业生态协同撬动万亿市场

苹果计划2025年推出搭载M5处理器的Vision Pro智能眼镜，2027年将发布主打拍摄和AI功能的Vision Air，以及更轻便的头显设备。彭博社透露苹果还在探索有线版Vision Pro。Meta与Ray-Ban合作的智能眼镜取得市场成功，即将推出高端版Hypernova眼镜，配备神经腕带控制器。微美全息积极布局智能眼镜领域，通过技术创新推动AR眼镜发展。随着AI技术进步，智能眼镜市场迎来爆发式增长，互联网巨头、硬件厂商纷纷入局，推动办公、影视、游戏等场景应用升级。
微云全息（MLGO）推出基于LSTM和门控循环单元的比特币区块链货币价格预测模型

微云全息（NASDAQ: HOLO）开发了基于LSTM和GRU的区块链货币价格预测模型，通过捕捉市场长期依赖关系，显著提升了比特币、以太坊和瑞波币等主要加密货币的价格预测准确度。该模型采用多层神经网络架构，整合历史价格、交易量及技术指标等多维数据，在测试集上RMSE指标优于传统时间序列模型。未来将继续优化模型性能，融合多模态数据，为用户在波动剧烈的加密市场提供更精准的决策支持。

去中心化加密货币比特币以太坊
央广网等百余家媒体报道，Lamett乐迈石晶建博会首秀掀起“石晶全屋整装”热潮

在第27届中国建博会上，Lamett乐迈石晶凭借"石晶全屋整装解决方案"和"7天无理由退货"服务政策成为全场焦点。该品牌推出的石晶材料具备八大核心性能，完美解决传统建材在环保、功能和安装上的痛点，实现健康与美学的平衡。展会期间，其产品覆盖地面、墙面、柜体等多场景应用，引发行业高度关注。权威专家指出，Lamett石晶符合国家"好房子"政策方向，有望推动家居建材行业升级。凭借创新技术和完善服务体系，该品牌正引领行业迈入以石晶为核心的新时代。
荐抖音低价加码酒旅，OTA群战升级

继外卖补贴热战之后，酒旅也暗潮涌动。最新消息是，抖音本地生活在暑期将投入亿元级对酒旅做补贴，联合华住、凯悦等酒店集团推出6 折订房优惠，新客专享价等。抵达用户的通道，除品牌酒店集团矩阵号、职人号直播间，还有抖音日历房。针对酒旅行业的进击行动，抖音是今年的第三个玩家。在此之前，京东于618 当天打出「三年0佣金」政策吸引酒店入驻，立志重构O

抖音本地生活酒旅行业酒店补贴

今日大家都在搜的词：

热文

3 天
7天

Meta 推出创新模型 AU-Nets，革新文本处理方式

谷歌24亿收购Windsurf击败OpenAI，Meta/微美全息竞相扩充AI战略布局

马斯克xAI推出Grok - 4 大模型将至，Meta/微美全息深耕开源AI融合加速

微软以Maia 280开启新局对垒英伟达，Meta/微美全息开源联动引领AI创新

荐A日报：Trae 2.0 正式升级 SOLO 模式；通义发布Qwen3新模型；智谱AI重磅推出Zread

荐AI日报：智谱AI重磅发布GLM-4.5；阿里开源Wan2.2；阶跃星辰推全新模型Step3

猿辅导AI大模型：技术深融与场景革新，重构学习体验

苹果智能眼镜布局全面加速，Meta/微美全息产业生态协同撬动万亿市场

微云全息（MLGO）推出基于LSTM和门控循环单元的比特币区块链货币价格预测模型

央广网等百余家媒体报道，Lamett乐迈石晶建博会首秀掀起“石晶全屋整装”热潮

荐抖音低价加码酒旅，OTA群战升级

今日大家都在搜的词：

热文

BOSS直聘通报“王某香”涉黄简历：男子恶意编造已被刑拘

iQOO Z10 Turbo+开启预约：预计8月发布搭载8000mAh电池

AI日报：可灵发布灵动画布创意工作台；Coze Studio和Loop正式开

iPhone17 Pro支持8倍光学变焦或迎相机重大升级

淘宝闪购：连续两个周末日订单超9000万

雷军雨天健身房打卡上热搜已完成2025年第73次

旺仔小乔被禁言：蒙面演唱会引争议多平台账号被禁止关注

荣耀平板GT2 Pro开售：国补2124.15元起配备3K电竞屏

微信安全团队：将治理违规直播外部链接

小米SU7系列正式推送1000万Clips版本端到端辅助驾驶

苹果发布首个iOS 26公测版液态玻璃设计引发热议

BOSS直聘通报“王某香”涉黄简历：男子恶意编造已被刑拘

AI日报：字节发布同声传译模型Seed LiveInterpret 2.0；秘塔搜

AI日报：扣子空间网页设计功能上线；阿里Wan 2.2即将上线；O

iQOO Z10 Turbo+开启预约：预计8月发布搭载8000mAh电池

AI日报：可灵发布灵动画布创意工作台；Coze Studio和Loop正式开

REDMI Pad 2将于8月1日开售：2.5K屏+9000mAh电池

iPhone17 Pro支持8倍光学变焦或迎相机重大升级

华为Pura 80数字版维修备件价格出炉：换屏849元

陶琳称特斯拉不关注排名：回应懂车帝辅助驾驶测试第一

站长商机