AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

2025-10-17 15:54 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、谷歌Gemini 3.0 Pro开始小范围推送：强化推理能力，正式发布或在本月底

谷歌DeepMind团队开始向部分用户推送Gemini 3.0 Pro模型，该模型在推理能力和多模态处理上有所提升，并计划在10月底正式发布。

【AiBase提要:】
🧠 Gemini 3.0 Pro引入Deep Think推理架构，提升多步骤复杂任务处理能力。
🌐 支持文本、图像、音频和视频等多种输入格式，可生成完整前端代码。
🚀 谷歌计划推出轻量级Flash变体版本，满足移动设备和边缘计算需求。

2、百度发布全球领先文档解析模型 PaddleOCR-VL，重塑OCR技术格局！

百度发布的PaddleOCR-VL模型在文档解析领域表现出色，凭借其轻量高效、多语言支持和高精度识别能力，成为OCR技术的新标杆。

【AiBase提要:】
🌍 支持109种语言，适用于多种文档处理任务。
⚙️ 核心参数仅为0.9B，实现高效计算与精准识别。
🚀 推理速度显著提升，较其他主流模型表现更优。

3、AI视频公司爱诗科技完成1亿元B+轮融资：ARR突破4000万美元，用户超1亿

爱诗科技在AI视频生成领域取得了显著进展，完成了1亿元人民币的B+轮融资，并实现了ARR突破4000万美元和注册用户超过1亿的里程碑。其产品策略和技术创新为市场提供了强大的竞争力。

【AiBase提要:】
🚀 爱诗科技完成1亿元B+轮融资，显示出资本市场的认可与支持。
📈 年度经常性收入(ARR)突破4000万美元，用户数量达到1亿以上。
💡 技术创新不断，PixVerse V5版本提升生成效率和视频质量，引入Agent创作助手功能。

4、Anthropic 推出 Claude “skills” 功能，提升 AI 工作效率

Anthropic 推出了 Claude AI 的新功能 'skills'，旨在增强 AI 在工作场景中的实用性。该功能通过文件夹形式提供指令、脚本和资源，使 Claude 能够更高效地处理特定任务，如 Excel 文档或品牌指南。用户还可以创建自定义技能，并在多个平台上使用。此功能与 OpenAI 的 AgentKit 相呼应，标志着 AI 行业向实用化迈进。

【AiBase提要:】
🌟 Anthropic 推出 Claude 'skills' 功能，提升 AI 在工作中的实用性。
🛠️ 用户可以创建自定义技能，以便 Claude 更好地适应特定工作场景。
🚀 此举与 OpenAI 发布的 AgentKit 等新功能同步，显示 AI 行业持续向实用化迈进。

5、Pinterest推出AI内容限制工具：用户可自定义减少生成式AI图像

Pinterest推出了新的内容控制工具，允许用户限制信息流中AI生成内容的比例，以回应用户的不满情绪。该平台通过引入AI修改标签和提供用户可选的设置，试图在AI创新与用户体验之间取得平衡。

【AiBase提要:】
🖼️ 用户可以自定义减少生成式AI图像的显示比例。
🤖 Pinterest引入AI修改标签，用于标识AI生成内容。
🌐 Pinterest在平衡AI技术与用户体验之间寻求折中方案。

6、全面开源的 LLaVA-OneVision-1.5，超越 Qwen2.5-VL 的多模态模型登场

LLaVA-OneVision-1.5 是一款开源多模态模型，具有处理图像和视频等多种输入的能力，并在多个基准测试中表现出色，超越了 Qwen2.5-VL 模型。

【AiBase提要:】
🧠 LLaVA-OneVision-1.5 是一个全新的多模态模型，能够处理图像和视频等多种输入形式。
📈 训练过程分为三个阶段，旨在高效提升模型的视觉与语言理解能力。
🏆 在基准测试中，LLaVA-OneVision-1.5 表现优异，超越了 Qwen2.5-VL 模型。
详情链接:https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5 https://huggingface.co/lmms-lab/LLaVA-OneVision-1.5-8B-Instruct

7、OpenAI视频生成模型Sora 2上线微软Azure平台：定价每秒0.1美元，进入公共预览阶段

微软宣布OpenAI的Sora2视频生成模型已在Azure AI Foundry国际版上线，进入公共预览阶段，标志着生成式AI视频工具开始商业化应用。

【AiBase提要:】
🎥 Sora2 是一款多模态视频生成模型，支持文本、图像和视频输入并生成新视频内容。
💰 定价为每秒0.1美元，采用按生成时长计费模式，适合企业用户批量使用。
🌐 Sora2 仅在Azure AI Foundry国际版上线，中国区用户暂时无法直接访问。

8、旅行搜索引擎Kayak推出 “AI 模式” 旅行规划与预订更便捷

Kayak推出了全新的 'AI 模式'，通过内置聊天机器人帮助用户研究、规划和预订旅行。该功能利用ChatGPT技术提供更具上下文的搜索结果，并支持开放性问题以获取旅行建议。

【AiBase提要:】
🌍 Kayak推出 'AI 模式'，让用户可以通过聊天机器人方便地规划和预订旅行。
🗣️ 该功能支持询问旅行建议和比较各种旅行服务，利用 ChatGPT 技术提供精准信息。
📅 'AI 模式' 初期仅支持英语，后续将扩展至更多语言及平台，并加入语音请求功能。

（举报）

相关推荐

关键词：

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

视觉中国与多家AI公司合作开发可商用视觉大模型，已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频，引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人，仅保留Meta AI。宇树科技推出仿人机器人Unitree H2，具备拟人化设计。谷歌为Gemini集成地图数据工具，可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器，但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能，可分析手机未分享照片。

AI 视觉大模型版权合规
荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

阿里巴巴发布紧凑型Qwen3-VL多模态模型，推动边缘设备AI应用；科大讯飞推出全球首款AI翻译耳机，支持60种语言实时翻译；谷歌NotebookLM集成图像生成功能，可将笔记转为动态视频；ChatGPT将于12月向成人开放限制内容并推出自定义交互功能；谷歌Gemini代码泄露Veo3.1视频模型升级迹象；马斯克宣布X平台将全面转向AI推荐系统；巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS；vivo公布X200系列影像升级计划；字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

AI技术多模态模型边缘计算
荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%，创国产AI编程里程碑；杭州云深处推出全球首款IP66防护全候作业机器人DR02；谷歌Chrome将集成Gemini引发隐私担忧；学者指控苹果使用盗版书籍训练AI，版权争议再起；Liquid AI发布高效稀疏激活模型LFM2-8B-A1B；苹果拟收购Prompt AI布局智能家居视觉技术；AI伴侣应用泄露4300万条用户隐私对话；西湖大学DeepScientist显著提升科研效率。

AI日报快手72B代码模型 KAT-Dev
华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

苹果iPad mini系列称霸了多年的小平板，这两年迎来了很多新玩家的挑战，前不久发布的华为MatePad mini就是最具竞争力的一款，凭借着超轻薄、SIM卡等配置收到很多用户青睐。现在苹果的新一代应战者iPad mini 8也要来了，新品将会在明年上半年发布，起售价维持在499美元。根据泄露的代码显示，iPad Mini 8（代号J510/J511）预计搭载A19 Pro芯片，大概率是与iPhone Air同款的阉割版

iPad mini 8
双11跨代机皇！海信电视E8S Pro RGB-Mini LED影游旗舰提前发布

海信发布2026款E8S Pro电视，定位"影游机皇"。新品采用RGB-Mini LED技术，拥有100% BT.2020色域、9360分区控光，搭载信芯AI画质芯片H7，支持4K 170Hz刷新率。配备4.2.2声道系统，提供12项专属影游功能，包括游戏妙控台和专属游戏模式。10月14日开启预约，首发价16599元起，前238名用户赠送游戏手柄等福利。该产品通过技术创新重塑高端影音体验，树立行业新标杆。

RGB-Mini LED 海信E8S
影像等升级无短板！黄韬：X300系列是vivo 30周年的诚意之作没mini版

下周一vivo就要发布X300系列，对于这款重磅旗舰，vivo产品副总裁黄韬也是刚刚给出了更多的信息。下周一要发布的vivo X300系列，是vivo 30周年的诚意之作。产品的爆料已经不少，但还有一个非常关键的点，本来没打算讲的，但这段时间，看到很多媒体和网友都在讨论，那今天就由我来给大家爆料一下。X300系列，没有X300！” 黄韬重申，X300在蓝厂内部的定位

vivo X300系列 vivo
2025 PMI项目管理大会|多个活动板块首发，早鸟报名通道开启

自2008年起，PMI项目管理大会汇聚数百位国内外顶尖企业代表、行业领袖与专家，分享洞见与实践，启发数十万参与者。当前，生成式AI、大数据等前沿科技正重塑商业生态与项目管理模式。2025年大会以“智驱万象，项启新篇”为主题，聚焦科技带来的颠覆性变革与机遇，通过行业趋势、跨界交流等多维度活动，打造最具影响力的共创平台，推动合作突破边界。报名已开启，微信搜索“2025PMI项目管理大会”即可参与。

项目管理前沿科技行业趋势
REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

Redmi K90 Pro+Max搭载6.9英寸超级像素屏幕，采用与小米17 Pro+Max同源的全RGB排列技术，通过子像素独立布局实现高像素密度与生产效率的双重突破。屏幕实际子像素达938万，显示效果媲美2K屏，功耗降低26%。影像系统配备“光影猎人950”传感器，具备13.5EV超高动态范围，支持潜望式长焦镜头，标志着Redmi影像能力正式跻身旗舰梯队。

REDMI K90Pro Max
荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
红米最强标准版！REDMI K90外观跟K90 Pro Max不一样

REDMI产品经理笋寸与米粉互动时表示，REDMI K90标准版的外观跟Pro Max版不一样，后面会单独预热。据悉，REDMI K90标准版搭载高通骁龙8至尊版处理器，这是REDMI史上最强标准版，该机同样配备2K直屏，屏幕、性能、续航都全面拉满。资料显示，高通骁龙8至尊版于

REDMI K90 高通骁龙8至尊版

今日大家都在搜的词：

热文

3 天
7天

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

双11跨代机皇！海信电视E8S Pro RGB-Mini LED影游旗舰提前发布

影像等升级无短板！黄韬：X300系列是vivo 30周年的诚意之作没mini版

2025 PMI项目管理大会|多个活动板块首发，早鸟报名通道开启

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

红米最强标准版！REDMI K90外观跟K90 Pro Max不一样

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

天猫双11今晚8点开卖品类券每人可领万元

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

火车免费坐？12306今起又上新功能：积分可兑换车票

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

真我GT8官宣搭载Pro同款理光GR影像系统

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

REDMI K90 Pro Max搭载第五代骁龙8至尊版+独显芯片D2

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

小米推出短剧App围观短剧：主打无广告免费看

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

站长商机