首页 > 原创 > 关键词  > DeepSeek最新资讯  > 正文

AI日报:DeepSeek识图模式灰测;小红书成立AI一级部门;阿里发布程序员“数字分身”QoderWake

2026-04-30 16:34 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、DeepSeek 开启识图模式灰度测试多模态视觉理解能力正式落地

DeepSeek 在发布 DeepSeek-V4 后迅速开启多模态识图功能的灰度测试,标志着其多模态能力进入实质性阶段。该功能在移动端与网页版新增了“识图模式”入口,并在基础视觉理解、画面描述及逻辑推理方面表现出色,但仍有优化空间。

QQ20260430-112943.jpg

【AiBase提要:】

✨ DeepSeek 开启多模态识图功能灰度测试,推动视觉交互发展。

🔍 模型在基础视觉理解与逻辑推理方面表现优异,具备较高还原度。

⚠️ 面对极端视觉挑战时识别率受限,需进一步优化提升准确率。

2、文心一言5.1预览版上线 LMSYS 竞技场,目前位列全球第13位

文心一言5.1预览版低调上线国际大模型盲测平台LMSYS Chatbot Arena,位列全球第13位。这标志着百度核心模型进入新一轮快速迭代周期,并开始接受全球用户的直接质量检验与基准对标。

【AiBase提要:】

🚀 文心一言5.1预览版低调上线国际大模型盲测平台LMSYS Chatbot Arena。

📊 该版本在总榜中位列第13位,展现强大的技术实力。

🌐 百度通过公开的国际主流评价体系验证其实战能力,加速全球化布局。

3、小红书成立 AI 一级部门 “Dots”

小红书宣布成立AI一级部门“Dots”和企业智能部,以增强对人工智能的技术投入,并设立海外部门“Rednote”和Lab 1327团队,推动国际化业务和新产品孵化。

【AiBase提要:】

✅ 设立AI一级部门“Dots”,涵盖AI模型研发、基础设施、工程落地和产品应用等多个环节。

✅ 企业智能部整合原有企业效率部和数据科学部,为AI时代发展提供组织架构和人才支撑。

✅ 成立海外部门“Rednote”和Lab 1327团队,推动国际化业务和新产品孵化。

4、Chrome 正式发布 Prompt API:浏览器原生 AI 时代来临,网页直接调用 Gemini Nano 本地模型

Chrome 推出 Prompt API,允许开发者通过 JavaScript 直接调用内置的 Gemini Nano 模型,实现本地 AI 能力。这一功能标志着浏览器 AI 能力的“民主化”,提升了隐私保护并降低了开发门槛。

image.png

【AiBase提要:】

🌍 Prompt API 是 Chrome 内置 AI 框架的一部分,允许网页应用调用 Gemini Nano 模型。

🔒 模型在本地运行,数据不上传云端,提升隐私保护。

🛠️ 开发者无需依赖外部 API,降低开发成本和复杂性。

详情链接:https://developer.chrome.com/docs/ai/prompt-api

5、程序员“数字分身”上岗:阿里发布 QoderWake,实现代码修复全流程无人值守

阿里巴巴发布QoderWake和Qoder移动端,标志着其AI智能体生态实现全场景覆盖,提升了研发运维自动化水平,并推动AI向原生操作系统级转型。

image.png

【AiBase提要:】

💻 QoderWake作为生产级数字员工,能够自主执行代码变更简报整理、错误诊断等任务并生成修复代码。

📱 Qoder移动端支持跨端协同与交互体验革新,用户可通过手机远程操控桌面端Agent执行复杂任务。

🔄 阿里通过Qoder产品布局,推动AI从辅助工具演变为具备独立任务处理能力的生产要素。

详情链接:https://qoder.com/qoderwake

6、蚂蚁集团正式开源万亿级大模型Ling-2.6-1T

蚂蚁集团正式开源万亿级大模型Ling-2.6-1T,该模型通过创新的混合架构优化了指令执行、工具适配及长上下文承接能力,提升了智效比。同时,它能够适配多工具、多约束的复杂业务场景,展现出强大的多步执行能力,在代码生成、缺陷修复以及噪声环境下的精准推理方面均达到了开源领域的顶尖水平。

image.png

【AiBase提要:】

🧠 Ling-2.6-1T采用混合架构,提升智效比

🛠️ 支持多工具、多约束的复杂业务场景

🚀 在代码生成和精准推理方面达到开源领域顶尖水平

详情链接:https://huggingface.co/inclusionAI/Ling-2.6-1T

7、巨日禄宣布与火山引擎达成深度合作 AI短剧进入“工业化”时代

杭州巨日禄科技有限公司与火山引擎达成深度合作,接入豆包视频生成模型Seedance 2.0,标志着AI剧制作进入工业化时代。通过整合火山引擎的算力与算法优势,巨日禄实现了制作效率和画面可用性的双重突破,并构建了全栈式技术架构,推动国内AI影视产业向更成熟的工业化阶段迈进。

【AiBase提要:】

🚀 效率与质量的双重飞跃:AI剧制作效率提升近10倍,生产周期从15-30天压缩至1-3天。

🖼️ 画面可用性显著提升:传统AI生成模式下画面合格率仅30%,新技术架构下已跃升至90%以上。

🛠️ 全栈式技术架构:双方合作构建覆盖前期创作到最终交付的技术体系,降低AI剧生产门槛并确保内容高品质。

8、彻底告别复制粘贴!Gemini 迎来史诗级更新,一键生成 Office 文档

Gemini通过新增直接生成和导出多种格式文件的功能,显著提升了其作为生产力工具的能力,同时增强了与办公软件的衔接性,为用户提供了更高效的办公体验。

【AiBase提要:】

✨Gemini新增直接生成并导出多种格式文件的功能,提升办公效率。

📊支持Google Docs、Word、Excel等主流文档格式,兼容性强。

🖼️引入图像识别功能,可将手写笔记转为排版规整的PDF文件。

举报

  • 相关推荐
  • DeepSeek回应聊天记录搜索:正在灰度测试 并非全量推送

    近日,不少网友在社交平台上发帖称,DeepSeek能查聊天记录了。 今日实测发现,DeepSeek网页版和APP页面均可通过关键词搜索,查询用户和DeepSeek之间的历史聊天内容。 将DeepSeek APP检查更新至2.1.0(213)版本后,其侧边栏顶部会新出现搜索聊天内容”搜索框。 框内输入关键词后页面会显示多条包含这个词的历史聊天记录,点击某条聊天记录即可定位至具体聊天位置。

  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 填补空白!DeepSeek灰度上线识图模式

    DeepSeek正灰度测试识图模式,用户可在网页端和App端上传图片进行内容理解、描述与分析,填补了多模态能力的空白。该模式与快速、专家模式并列,作为独立一级入口存在,表明视觉理解被定位为核心能力。部分用户已可使用,但另一些用户虽看到入口却收到暂不可用的提示。实测显示,当前开放的主要是图片理解能力,涵盖视觉问答、截图分析等场景,尚未支持图像生成、视频理解或跨模态生成,更接近视觉语言模型范畴。

  • 满血版DeepSeek V4要来了:补上缺失的多模态关键一环

    DeepSeek V4刚发布还不到5天,光是降价就来了三轮,然而他们的后续动作还很多,马上就要推出满血DeepSeek V4,补上多模态支持。 DeepSeek负责多模态开发的研究员陈小康(xiaokang_chen)今天下午在X上预告新版DeepSeek V4,不出意外就是多模态版的DeepSeek V4了。 此前发布的DeepSeek V4不论Flash还是Pro,都还是纯文本大模型,未免有些遗憾,不是说纯文本没有用,而是多模态支持能力是当�

  • DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

    DeepSeek做了件罕见的事情:在终于开始灰测多模态能力后,它放出了一篇解释背后技术的论文,但这篇论文却在发布没多久就又被悄悄撤掉。 4月29日,DeepSeek研究员陈小康在X发布一条推文——现在,我们可以看见你了。配图中,DeepSeek 标志性的鲸鱼 logo 摘下眼罩,露出了眼睛。 过去,DeepSeek 最被外界熟知的是它在文本、代码和推理任务上的能力。但真实世界里的问题,并不总�

  • 时隔一个月又崩了!DeepSeek网页及API服务出现异常 官方称正在修复

    今日,多名用户在社交平台反馈DeepSeek服务异常,平台对话页面提示服务器繁忙,请稍后重试”。官方服务状态网站显示DeepSeek网页及API服务不可用。今日下午,官方状态页面更新信息,确认问题已定位,正在实施修复。

  • 小艺Claw上线自进化能力越用越懂你,接入DeepSeek V4逻辑推理跃迁

    小艺Claw上线30天内完成10余次架构迭代与20余项核心能力交付,成为首个获国家级智库认证的终端厂商Claw类智能体。4月29日重磅更新引入自进化能力,可记忆用户偏好与技能,越用越懂你;同时接入DeepSeek+V4模型,实现百万级超长上下文处理与逻辑推理跃迁。此外,Skills市场不断丰富,涵盖金融、生活、开发等场景,并基于鸿蒙星盾架构确保数据安全。用户无需部署,在HarmonyOS 6及以上设备上打开小艺APP即可预约体验。

  • 华为小艺Claw重磅更新!正式接入DeepSeek V4、支持自进化

    华为宣布鸿蒙版龙虾小艺Claw重磅更新,新版本号为11.6.3.300。 此次升级最大亮点是上线自进化能力,小艺能够自主学习并记忆用户使用习惯、创作风格与日常指令偏好,无需反复重复同类要求,长期使用后适配度和响应精准度持续提升,形成专属化智能助手体验。

  • 微信状态能看访客了?回应来了:iOS端灰度测试

    今日,一则关于微信状态可查看访客记录的消息迅速登上热搜,引发大量网友关注和讨论。 根据已体验用户的反馈,在微信状态的有效期内,用户点击状态页面右下角即可看到该条状态的浏览人数。更值得注意的是,如果浏览者当前也开启了微信状态,那么还能直接看到对方的头像,轻点头像甚至可以跳转查看对方正在展示的状态内容,互动性明显增强。

  • 微信转账组合支付上热搜 客服回应:正灰度测试中

    微信近期在iOS及安卓双端迎来了一次重要的功能迭代,其中一项被用户誉为“史诗级更新”的新特性迅速引发了热议。 根据用户实际操作发现,这一功能并未直接展示在默认界面中,而是隐藏在转账流程的细节里。当用户在好友转账界面输

今日大家都在搜的词: