首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:豆包输入法正式上线;混元开源HunyuanOCR模型;Claude Opus4.5发布

2025-11-25 15:55 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA,多场景赋能 OCR 应用

腾讯混元正式开源全新 OCR 模型 HunyuanOCR,该模型参数仅10亿,依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中取得 SOTA 成绩。其采用全端到端范式设计,具备高效便捷、性能优异等优势,并在多语种文档解析、票据字段提取和视频字幕抽取等方面有广泛应用。

image.png

【AiBase提要:】

🔥 HunyuanOCR 是一款轻量级 OCR 模型,参数仅为 10 亿,便于部署和使用。

📊 在 OmniDocBench 测评中,HunyuanOCR 以 94.1 分超越谷歌 Gemini3-Pro 等领先模型。

🌍 支持 14 种高频小语种与中/英文互译,并在 ICDAR2025 端到端文档翻译比赛中获得小模型赛道冠军。

详情链接:https://hunyuan.tencent.com/vision/zh?tabIndex=0 https://github.com/Tencent-Hunyuan/HunyuanOCR

2、豆包输入法正式上线 深度整合AI,支持复杂语境智能预测与离线使用

豆包输入法正式上线,深度整合AI技术,支持复杂语境智能预测与离线使用,为用户提供更高效、便捷的输入体验。

image.png

【AiBase提要:】

🗣️ 支持多种方言、英语及中英混合输入,适应嘈杂环境。

⌨️ 利用AI技术提升长句输入准确率,结合语境自动纠错。

🌐 界面整洁无广告,支持离线使用语音输入。

3、Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型

Anthropic 发布了其最新旗舰模型 Claude Opus4.5,该模型在编码、推理和长期任务管理方面表现出色,显著提升了软件工程、多智能体协作以及办公自动化等场景的生产力。同时,Opus4.5在安全性、效率和资源使用灵活性上也有了重大改进。

【AiBase提要:】

🧠 核心能力涵盖编码、推理与长期任务管理,性能达到世界领先水平。

🚀 支持较长上下文窗口,并引入 'effort 参数' 提升计算强度与输出质量。

🔒 安全性增强,对齐性和鲁棒性优于此前版本,更难被误导。

4、ChatGPT“购物研究”上线:利用用户“记忆”深度推荐 准确率高达64%

OpenAI推出了名为‘购物研究’的新功能,使ChatGPT能够根据用户的对话历史进行个性化产品搜索和推荐。该功能在假日购物季期间基本不受限制,并依托于一个专用模型运行,准确率达到64%。

image.png

【AiBase提要:】

🛒 购物研究功能通过分析用户的历史对话提供个性化推荐

🔍 该工具能主动提出问题并生成可视化的购物指南

📊 专用模型的准确率高达64%,远超标准模型

5、全球首个“纯AMD”训练MoE大模型ZAYA1 发布:14T tokens+CCA注意力,性能对标Qwen3

文章介绍了AMD与IBM及AI初创公司Zyphra合作推出的全球首个全程基于AMD硬件训练的MoE基础模型ZAYA1。该模型在预训练数据量、性能表现以及架构创新方面均展现出强大的实力,尤其在数学和STEM推理领域表现出色。

【AiBase提要:】

🔥 ZAYA1是全球首个全程基于AMD硬件训练的MoE基础模型,展现了AMD在大规模模型训练中的潜力。

💡 CCA注意力机制显著降低了显存占用并提升了长上下文吞吐能力,体现了架构上的创新。

📈 ZAYA1在多个基准测试中与Qwen3系列表现相当,且在部分任务中超越了Qwen3专业版,显示出其强大的性能。

6、微软推出 Fara-7B:本地运行的计算机智能助手

微软推出的 Fara-7B 是一款拥有70亿参数的本地运行计算机智能助手,专注于数据安全和隐私保护。它通过视觉方式处理网页,与用户交互更加直观,并在任务执行效率上超越了其他大型模型。

image.png

【AiBase提要:】

🌟 Fara-7B 是一款本地运行的计算机智能助手,专注于数据安全和隐私保护。

⚙️ 该模型通过视觉方式处理网页,与用户的交互更为直观,效率远超其他大型模型。

🛡️ Fara-7B 具备 “关键点” 识别功能,确保用户在关键操作前能进行确认,提升安全性。

7、谷歌Nano Bana Pro模型首秀:NotebookLM新增幻灯片和信息图功能

谷歌在其AI笔记工具NotebookLM中新增了幻灯片生成器功能,使用户能够快速将笔记或资料转换为简洁的演示幻灯片。这一新工具基于谷歌的Nano Bana Pro模型(即Gemini3Pro图像生成),旨在提升用户的整理效率和视觉效果。

【AiBase提要:】

✨ 新增幻灯片生成器功能,帮助用户高效整理笔记并生成演示草稿。

🖼️ 基于Nano Bana Pro模型,支持将详细提示转化为精确且包含大量文字的图像。

📄 目前可导出为PDF格式,未来计划支持Google Slides和PowerPoint格式。

8、Amazon Leo正式开放企业测试:1Gbps卫星直连AWS, 2025 年底启动、 2026 年全面商用

Amazon Leo的推出标志着亚马逊在低轨卫星网络领域的重大进展。其提供三种终端设备,支持高速数据传输,并通过AWS骨干网实现安全连接,强调‘卫星+云+AI’一体化模式,旨在满足工业级和偏远地区的通信需求。

【AiBase提要:】

🛰️ Amazon Leo提供三种终端设备,分别适用于工业级场景、偏远办公及轻量级应用。

🔒 终端具备军规级设计与AES-256加密,确保在极端环境下稳定运行并保障数据安全。

🌐 每颗卫星作为AWS边缘节点,客户可直接调用云服务,形成差异化竞争力。

举报

  • 相关推荐
  • 腾讯混元开源翻译模型1.5:1GB内存就能流畅运行

    腾讯混元宣布开源其翻译模型1.5版本,包含1.8B和7B两个模型。该版本支持33种语言互译,涵盖5种方言,包括多种小语种,应用范围广泛。1.8B模型针对移动设备优化,仅需1GB内存即可流畅运行,端侧部署实现离线实时翻译,性能超越多数商用API。7B模型为WMT25比赛冠军模型的升级版,翻译准确率显著提升,实用性增强。两模型可协同部署,提升效果一致性与稳定性。目前模型已在官网及GitHub、Huggingface等平台上线,为开发者提供便利。

  • AI日报:Meta宣布收购Manus;腾讯混元发布1.5版开源翻译模型;OpenAI更新手机版ChatGPT

    本期AI日报聚焦行业动态与产品更新。Meta以数十亿美元收购AI初创公司Manus,强化通用AI代理技术。腾讯混元发布1.5版开源翻译模型,端侧部署性能提升。上海16部门联合发文推动“AI+消费”,将发放算力券、模型券等支持工具。微软Copilot全线升级GPT-5.2,免费开启“专家级”工作流。Zara利用AI技术数字化编辑模特照片以削减成本,引发行业讨论。Plaud Note Pro AI录音笔凭借超薄离线和隐私保护设计,成为专业用户首选。OpenAI更新手机版ChatGPT,用户可调节AI思考深度。Claude Code可视化工作流编辑器发布,通过拖拽节点即可构建AI自动化流程。

  • AI日报:千问Qwen3-VL双子星开源;腾讯内测“上头蛙”AI互动故事小程序;小鹏祭出“物理世界大模型”

    本期AI日报聚焦多领域进展:阿里开源Qwen3-VL多模态检索模型,腾讯推出AI互动故事小程序“上头蛙”,小鹏发布第二代VLA模型剑指L4智驾。MiniMax港股上市首日暴涨42%,高德世界模型登顶国际榜单。阿里千问下载量突破7亿,单月击败Meta、OpenAI总和。谷歌Gmail引入AI专属收件箱与自然语言搜索,马斯克xAI进军“氛围编程”推Grok Build。

  • AI智能体时代,企业还需要SCRM吗?

    2025年,AI正重塑各行业业务模式,企业纷纷引入AI以提升效率。面对多样化的AI工具,SCRM(社交客户关系管理)对高客单价企业依然必要。其核心价值在于:一、系统梳理业务流程,统一管理获客、转化、成交、服务等环节,帮助企业识别并优化关键节点;二、借助AI助手等工具,自动、精准地收集并统一业务数据,为管理者提供实时业务洞察,辅助科学决策;三、通过AI能力赋能一线员工,自动完成客户资料维护、跟进记录生成等工作,减轻负担,复制最佳实践,提升团队整体效率与转化率。在AI时代,真实、完整的业务数据是AI应用的基础,SCRM正是企业数字化转型的“基建工程”,能帮助企业沉淀高质量数据资产,更好地借助AI优化业务,构建竞争优势。

  • AI日报:腾讯开源3D动作神器混元Motion1.0;罗永浩发布AI讲书App“且听”;夸克AI眼镜首次OTA

    本期AI日报聚焦多领域动态:腾讯开源10亿参数文生3D动作模型,赋能游戏影视;罗永浩发布AI讲书App“且听”,年费不足40元;京东上线自营租赁业务,推动机器人技术普及;夸克AI眼镜首次OTA升级,新增图文备忘等功能;MiniMax启动港股IPO,拟募资约41.9亿港元;阿里通义实验室推出多模态智能代理MAI-UI,性能超越同行;百度文心AI发布年度提示词“工作”,反映社会关注;2026年“两新”政策新增智能眼镜等产品补贴,加速AI终端落地。

  • 腾讯回应用户被元宝AI辱骂:小概率模型异常输出

    近日,有用户反映在使用腾讯元宝AI修改代码时,遭遇AI多次辱骂。此事迅速引发网络关注。腾讯元宝官方紧急回应称,经核查日志,该情况与用户操作无关,不存在人工干预回复,纯属小概率模型异常输出。腾讯方面坦言,AI模型在内容生成过程中,偶尔可能出现不符合预期的失误,这正是技术团队持续优化改进的重点方向。目前,腾讯已启动内部排查机制,将通过技术升级尽量避免类似情况再次发生,同时对用户反馈表示感谢。随着AI技术加速渗透日常生活,用户对智能工具的稳定性要求日益提高。此次事件为整个行业敲响了警钟——在追求技术创新的同时,如何建立更完善的质量监控体系,确保AI服务始终在可控范围内运行,将成为技术厂商必须面对的核心课题。

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • 三星推出全球首款130英寸Micro RGB,搭载新一代显示技术和前卫设计

    三星在CES 2026上推出全球首款130英寸Micro RGB电视R95H,凭借卓越画质为超高端显示领域树立新标杆。新品采用前沿Micro RGB显示技术,结合AI芯片引擎Pro与HDR Pro技术,实现精准色彩控制与100% BT.2020色域覆盖,并获VDE色彩认证。其设计灵感源自建筑窗框,通过极窄边框与集成声学系统,打造沉浸式视觉空间。产品还支持HDR10+ ADVANCED与升级版AI助手,提供智能交互体验。

  • 全面开源 小米宣布自研大模型MiMo公测限免延长20天

    12月中旬,小米正式发布并开源自研大模型MiMo-V2-Flash。 今日,MiMo小米大模型Core团队宣布,原定于2025年12月底结束的免费试用期,将延后至2026年1月20日14:00。 在此期间,用户可继续免费使用MiMo-V2-Flash模型API,使用其核心功能,包括高效文本生成、代码处理等。 官方表示,MiMo API开放平台的支付能力系统将于公测结束前启用,并进行为期一周左右的试运行。 试用期间用户可�

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

今日大家都在搜的词: