首页 > 业界 > 关键词  > AI最新资讯  > 正文

AI日报:腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新;阿里夸克AI眼镜开启预售

2025-10-24 15:38 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://app.aibase.com/zh

1、Kimi k2性能被赞超越 GPT-5,月之暗面再获数亿美元重磅融资

国内大模型明星创业公司月之暗面(Moonshot AI)即将完成新一轮数亿美元的融资。此次融资距离月之暗面公开披露的上一轮约3亿美元融资仅过去不久(上一次公开信息为2024年8月),显示出资本市场对该公司的信心再次高涨。

【AiBase提要:】

🚀 Kimi k2模型性能超越GPT-5和Claude4.5,引发全球关注。

💰 月之暗面完成数亿美元融资,资本市场对其信心高涨。

🌐 Kimi k2的发布使月之暗面重新成为全球AI舞台的焦点。

2、Anthropic 为 Claude Pro/Max 用户推出“记忆”功能,实现个性化与安全升级

Anthropic 为其旗舰 AI 模型 Claude 的 Pro 和 Max 版本推出了全新的‘记忆’功能,旨在提升对话的一致性和个性化体验。该功能注重隐私和隔离性,允许用户控制记忆内容,并提供‘隐身聊天’模式以确保数据不被保存。【AiBase提要:】

🧠 记忆功能可记住项目内容、用户偏好和工作流程,提升对话连贯性。

🔒 项目独立记忆和用户控制权设计,保障隐私和数据隔离。

🕵️‍♂️ 新增‘隐身聊天’模式,确保对话数据不被保存或显示在记录中。

3、中国科大与字节发布 MoGA 长视频生成模型:分钟级多镜头短片一键生成

中国科学技术大学与字节跳动联合发布端到端长视频生成模型,采用MoGA算法实现分钟级高质量视频生成,标志着国产技术在全球AI竞赛中取得关键突破。

【AiBase提要:】

🎥 生成分钟级多镜头视频,突破传统短时限制

🧠 引入MoGA算法,优化上下文处理与算力开销

🚀 支持影视、广告等多领域应用,具备产业落地潜力

详情链接:https://jiawn-creator.github.io/mixture-of-groups-attention/

4、腾讯发布全新ima2.0:任务模式上线 新增「AI要点」等功能

腾讯在ima Open Day活动上正式发布了全新升级的ima2.0版本,引入了‘任务模式’,使知识库从简单的搜索问答工具升级为能够理解复杂任务、自主拆解步骤、调用工具并完成整套流程的智能伙伴。此外,新增了‘AI要点’功能,支持多任务并行和协作共享,提升了知识管理的效率。

image.png

【AiBase提要:】

🔥 ima2.0引入‘任务模式’,实现复杂任务的自动拆解与执行。

💡 新增‘AI要点’功能,自动生成结构化摘要,快速抓住重点。

🤝 支持多任务并行与协作共享,提升知识库的使用效率。

5、阿里夸克AI眼镜开启预售:支持支付宝“看一看”支付

阿里夸克AI眼镜推出,支持支付宝支付,具备出色的外观设计和强大的拍摄功能,满足用户多样化需求。

image.png

【AiBase提要:】

📱 支持支付宝“看一看”支付,成为国内首款集成生物识别支付的智能眼镜。

👓 采用7.5mm超细镜腿与超薄镜框设计,整体重量仅42克,佩戴舒适。

📸 搭载SuperRaw超级夜景模式和双重防抖系统,提升拍摄能力。

6、微软 Copilot 新增群聊、记忆与 Edge AI 模式:最多可让32人实时协作

微软对 Copilot 进行了秋季重大更新,新增了群聊功能、长期记忆以及 Edge AI 模式,提升了协作性、个性化和跨服务整合能力。

【AiBase提要:】

🌟 引入“群组”群聊功能,支持32人实时协作与任务分配。

🧠 增加“长期记忆”功能,保存用户关键信息并在后续对话中自动调用。

🌐 Edge 浏览器推出 Copilot 模式,提供内容分析与智能建议。

7、Opera Neon 浏览器推出深度研究 Agent“ODRA”

Opera Neon浏览器推出了全新的AI功能——Opera Deep Research Agent(ODRA),标志着Opera在浏览器AI生态建设上的重要进展。ODRA通过并行化处理方式,提升了复杂问题查询的效率和准确性,展现了与行业巨头竞争的实力。

image.png

【AiBase提要:】

🌍 ODRA是Opera自研AI引擎的核心部分,经过两年多的研发和优化,性能显著提升。

⚙️ ODRA采用并行化操作,将复杂任务拆分为多个子问题,提高研究效率。

🔍 ODRA作为第四个Agent加入Opera Neon,用户可通过全能搜索框启动研究功能。

8、百度 PaddleOCR-VL 模型登顶全球 OCR 榜,连续五日领跑 Huggingface 趋势榜

百度飞桨团队发布的 PaddleOCR-VL 模型在 OCR 领域引发轰动,凭借强大的性能和多语言支持,成为当前最受关注的开源 OCR 模型。

QQ20251024-135355.png

【AiBase提要:】

✅ PaddleOCR-VL 在 OmniDocBench V1.5评测中取得92.56分,超越主流模型登顶全球 OCR 榜单。

🌐 支持109种语言识别,可解析文本、表格、公式与图表,并具备文档语义结构重建能力。

🔍 百度、DeepSeek 与上海 AI Lab 等机构开源 OCR 模型,核心目标是为大模型训练提供数据基础。

举报

  • 相关推荐
  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 拒绝做“套金属壳”的伪AI:看“大模型国家队”如何啃下硬骨头

    人工智能成为资本市场热点,随之而来的是鱼龙混杂的乱象。简单包装、打着AI旗号卖高价的“套壳”现象层出不穷。科大讯飞董事长刘庆峰强调,发展人工智能要有长期主义精神,告别“虚火”,把根扎在国产算力的土壤里。下半场比拼的不再是概念堆砌,而是全栈自主可控的硬实力与赋能千行百业的真本事。可靠与安全才是基石,算力是最大瓶颈。企业需构建安全底座并解决真实痛点,才能穿越周期。科大讯飞坚持“顶天立地”战略,既要在源头技术上领先,又要在产业应用上解决民生刚需,展示了AI技术“落地”的正确姿态。

  • AI不再健忘!红熊AI发布“记忆熊”,给大模型装上“海马体”

    当前大模型虽能力惊人,却普遍存在“记忆缺失”问题,制约了AI应用的深度与用户体验。红熊AI推出的开源记忆系统“记忆熊”,旨在突破这一瓶颈。它基于认知科学原理,构建了包含存储层、编排层和应用层的三层架构,模拟人类记忆的感知、提炼、关联与遗忘全周期,为智能体提供长期记忆框架。该系统不仅显著提升了任务性能与效率,降低了幻觉生成,更标志着AI设计从“即时响应”向“持续认知”的关键转变。记忆系统的完善,将驱动AI在医疗、教育、企业服务等领域实现更深度的智能化升级,开启人机协作的新时代。

  • 逗哥配音ai软件|创新升级:自研大模型引领声音创作新浪潮

    在短视频蓬勃发展的当下,AI配音软件“逗哥配音”凭借自主研发的大模型技术引发关注。该软件拥有近千种风格的发声人资源,覆盖多语言及方言,通过精准的节奏控制和情感表达优化,显著降低高质量音频制作门槛。其创新的声音克隆技术仅需少量数据即可生成高度相似的人工语音,结合人声分离、文案提取等实用工具,为创作者提供跨领域音频解决方案,推动数字内容生态向多元化、个性化发展。

  • AI日报:可灵AI全量上线O1视频大模型;千问APP接入万相Wan2.5

    本文汇总了AI领域的最新动态:可灵AI发布O1视频大模型,支持多模态输入一键生成视频;千问APP接入万相Wan2.5,提升视频创作能力;PixVerse V5.5实现音画同步,简化视频制作;深度求索推出DeepSeek-V3.2,引入稀疏注意力机制降低成本;Runway发布Gen-4.5模型,增强视觉质量;谷歌优化AI搜索体验,Gemini 3 Pro扩展国际市场;Lovart推出Touch Edit功能,实现零门槛图像编辑;蚂蚁数科Agentar入选中国智能体开发赛道第一梯队,展现技术实力。

  • AI日报:OpenAI将停止GPT-4o API访问;小米开源跨域具身大模型MiMo-Embodied;灵光上线6天突破200万下载

    OpenAI将停止GPT-4o模型API访问,开发者需尽快迁移至GPT-5.1系列。小米开源跨域具身大模型MiMo-Embodied,在29项基准测试中全面领先。清华提出“能力密度”评估体系,强调模型应注重高密度、轻规模。月之暗面即将融资40亿美元,计划明年启动IPO。灵光AI助手上线6天突破200万下载,展现强大市场潜力。谷歌在安卓版Chrome浏览器增加AI图像生成功能。Udio取消用户下载AI音乐作品权利,引发创作者不满。育碧推出首款可玩生成式AI项目“Teammates”,通过实时语音指令提升游戏体验。

  • 可灵AI O1正式上线:号称全球首个统一多模态视频大模型

    可灵AI正式发布全新O1视频大模型,被誉为全球首个统一多模态视频大模型。该模型基于创新的多模态视觉语言交互架构,用户可在单一输入框内无缝融合文字、图像、视频等多种指令,实现跨模态内容的高效创作。其技术突破解决了传统视频生成工具功能割裂、操作复杂的痛点,并攻克了视频中主体特征漂移的行业难题,支持长达310秒的自由生成时长。目前用户可通过可灵App及官网体验。

  • 易鑫开源汽车金融业首个Agentic大模型,加速AI生态共建

    易鑫集团(02858.HK)宣布开源其自主研发的Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于通义千问Qwen3-14B深度优化,具备卓越推理、复杂任务处理及多方协作的智能体能力,在多项性能测试中位列榜首,推理成本较行业平均水平降低三分之一。模型搭载金融领域专属知识体系与工具集,覆盖语音交互、车辆评估、风控、欺诈识别等功能,形成全链路智能支撑体系。易鑫提出“底座开放-社区共建-能力迭代-企业部署-生态繁荣”的开源共建模式,通过提供低代码私有化模板,帮助企业快速落地AI应用。此次开源与之前发布的行业首个开源推理大模型YiXin-Distill-Qwen-72B形成“垂直底座+Agentic大脑”双轮技术矩阵,填补了汽车金融领域专业开源AI工具链的空白。

  • 司马阅自研模型DocMind-V3.0进一步降低AI幻觉,加速重塑企业数据价值

    数字时代,企业80%以上数据隐藏于各类非结构化文档中,成为AI落地的“堵点”。大语言模型虽能处理此类数据,但常因输入数据质量低导致“幻觉”问题。司马阅DocMind-V3.0通过多模型协同的完整处理链路,将非结构化数据转化为可用于分析、AI应用的结构化数据,从根源降低AI幻觉,提升商业落地价值。

  • 行业首家!易鑫正式开源Agentic大模型,定义汽车金融AI新范式

    易鑫宣布开源自主Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于Qwen3-14B,参数规模140亿,通过多阶段训练体系深度优化,在智能体协作、函数调用、推理等能力上可比肩参数200B以上的商用大模型。多项专业评测显示,其在金融专业知识理解方面显著优于DeepSeek V3.1、Kimi-K2等主流模型,并在智能体工具使用任务中同样表现卓越,位居同尺寸模型性能测试首位。该模型既展现出强劲的专业理解力与协作推理能力,又兼具高实用性与经济效益,将为汽车金融及各类专业场景提供高效、可靠的智能引擎。易鑫以技术创新为核心驱动力,持续引领行业迈向智能化转型。

今日大家都在搜的词: