AI日报：重磅！阿里新夸克升级为“AI框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

2025-03-13 15:34 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。这款应用基于阿里通义的先进推理与多模态大模型，整合了多种AI功能，旨在为用户提供无缝的智能体验。新夸克不仅能够进行智能对话，还具备深度思考和执行能力，能够满足用户在多个场景下的需求。

【AiBase提要:】
🤖 新夸克整合了AI对话、深度思考、深度搜索等多种功能，提供一站式服务。
📊 通过智能中枢系统，新夸克能够自动识别用户指令并进行深度执行。
🌐 阿里巴巴计划将通义系列模型的最新成果快速接入新夸克，以增强其功能。

2、谷歌开源新一代多模态模型 Gemma-3:性能卓越、成本降低10倍

谷歌最新发布的多模态大模型Gemma-3以其低成本和高性能引起了广泛关注。该模型支持多种参数规模，最大可达270亿参数，且仅需一张H100显卡进行高效推理，算力需求显著降低。Gemma-3在对话模型评比中表现优异，支持长文本处理和多模态数据，展现出强大的语言处理能力和创新的架构设计，是当前算力要求最低的高性能模型之一。

【AiBase提要:】
🔍 Gemma-3是谷歌最新开源的多模态大模型，参数范围从10亿到270亿，且算力需求降低10倍。
💡 模型采用创新的架构设计，有效处理长上下文和多模态数据，支持文本与图像的同时处理。
🌐 Gemma-3支持140种语言的处理能力，经过训练优化后在多项任务中表现优异，展现了强大的综合能力。
详情链接:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

3、百度文心快码推出Comate Zulu版本并正式开放公测

百度旗下的文心快码推出了Comate Zulu版本，标志着在智能编程领域的一次重大突破。该版本通过结合文心大模型的强大能力和丰富的编程大数据，为开发者提供了更高效的编程体验。用户可以通过自然语言与系统进行交流，快速搭建项目和理解代码逻辑，大幅提升开发效率。公测活动将持续至3月28日，开发者可以在主流IDE中体验这一创新功能。

【AiBase提要:】
🛠️ 通过全自然语言实现需求，无需编写代码即可自动搭建项目，支持口语交流和图片展示。
📊 快速理解代码库的业务逻辑，提供架构图梳理和智能启发思路，帮助开发者迅速上手新项目。
⚙️ 自动搭建开发环境，支持依赖自动安装和服务自启动，实现从需求到代码的端到端生成。
详情链接:https://comate.baidu.com

4、字节Trae接入硅基流动SiliconCloud 支持DeepSeek多款模型API

硅基流动平台与字节跳动推出的AI IDE——Trae正式接入，提升了开发者的编程体验。用户可以通过简单的步骤接入多款编码模型，包括DeepSeek-R1、V3等，满足不同需求。平台还提供免费的API服务，助力开发者实现更高效的开发过程。未来，硅基流动将继续扩展模型种类和合作应用，致力于为开发者提供更稳定的服务。

【AiBase提要:】
🔧 Trae接入硅基流动，提供多种高效编码模型，提升编程体验。
🔑 用户可通过简单步骤添加模型，获取API密钥。
🚀 硅基流动致力于提供稳定的API服务，未来将扩展模型种类。

5、王炸更新!谷歌AI Studio再进化:YouTube视频秒懂，AI作画还能保持角色统一

谷歌AI Studio的最新升级引发了科技圈的轰动，用户现在可以直接通过YouTube链接理解视频内容，无需下载和上传。Gemini2.0Flash Experimental模型不仅在视频解析上表现出色，还在图像生成方面展现了惊人的一致性。

【AiBase提要:】
🎥 谷歌AI Studio现在支持直接解析YouTube视频链接，用户可快速理解视频内容。
🖼️ Gemini2.0Flash exp在图像生成方面表现卓越，角色在多张图片中保持一致性。
⚡ 更新标志着谷歌AI Studio从基础模型向应用级工具的转型，影响现有AI工具生态。
详情链接:https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube

6、叫板Sora?潞晨科技开源视频大模型Open-Sora2.0，降本提速

潞晨科技推出的Open-Sora2.0以其仅20万美元的训练成本和110亿参数的强大性能，成功挑战了OpenAI Sora等行业标杆。该模型在多个评测中表现优异，尤其在VBench中与OpenAI Sora的性能差距缩小至0.69%。

【AiBase提要:】
💰 成本低:Open-Sora2.0仅需20万美元训练成本，显著低于行业标准。
📈 性能强:拥有110亿参数，性能接近OpenAI Sora，VBench评测中表现优异。
🌐 开源共享:全流程训练代码开源，推动视频生成技术的共同发展。
详情链接:https://github.com/hpcaitech/Open-Sora

7、阿里通义新视频生成和编辑模型VACE 可控制运动轨迹、替换主体等

阿里通义Wan团队推出了全新的VACE模型，旨在降低视频制作的门槛并提升创作效率。VACE的按条件生成视频功能让用户可以通过文字描述快速实现创意，仿佛拥有了一支梦幻摄制组。此外，VACE还具备多种强大的编辑功能，如物体运动轨迹控制、视频主体替换、风格迁移和视频画面智能扩展等。

【AiBase提要:】
🎬 VACE模型通过文字描述快速生成视频，提升创作效率。
🔄 支持物体运动轨迹控制和视频主体替换，灵活多变。
🖼️ 具备视频画面智能扩展和风格迁移功能，丰富创作表现。
详情链接:https://arxiv.org/pdf/2503.07598

8、理想汽车AI助手理想同学网页版上线:接入DeepSeek R1满血版

理想汽车正式推出其人工智能助手理想同学网页版，标志着其在智能服务领域的进一步扩展。该助手接入了DeepSeek R1V3671B满血版，提供强大的问答能力和跨场景服务协同。用户可以在不同模型之间切换，支持长文本输入及图像问答功能，提升了交互体验。

【AiBase提要:】
💻 理想同学网页版现已上线，用户可在电脑端使用，拓展智能服务生态。
🔍 接入DeepSeek R1V3671B满血版，支持模型切换和深度思考功能，提升问答能力。
🖼️ 支持千字长文本输入和图像问答，提供更强的用户交互体验。

9、谷歌Gemini2.0Flash放出原生多模态图像生成功能:支持多轮对话式实时编辑

谷歌最新推出的Gemini2.0Flash在AI图像生成领域引入了原生图像生成技术，显著提升了生成效率和准确性。与以往依赖于大型语言模型的方式不同，Gemini2.0Flash实现了图像生成与文本理解的直接集成，使得创作过程更加流畅。

【AiBase提要:】
🎨 原生图像生成:Gemini2.0Flash将图像生成功能直接集成，避免了信息失真，提高了生成效率和准确性。
🖌️ 实时编辑:支持多轮对话式编辑，用户可以用自然语言提出修改意见，AI能够即时响应并调整图像。
📈 企业应用:为营销团队和开发者提供强大工具，快速生成内容，降低设计成本，提高工作效率。

10、Remade AI 开源8款 Wan2.1特效 LoRA，掀起 AI 视频创作新热潮

Remade AI 在 Hugging Face 平台推出了8款基于 Wan2.1模型的开源特效 LoRA，吸引了科技界的广泛关注。这些特效模块不仅能够将静态图像转化为动态视频，还为 AI 视频生成带来了新的创意可能性。

【AiBase提要:】
🎨8款新特效 LoRA 包括挤压、蛋糕化、膨胀等，丰富了 AI 视频创作的可能性。
💻 Wan2.1模型以其高效性和多功能性，成为视频生成领域的顶尖选择。
🌍 Remade AI 邀请全球用户提出定制需求，承诺持续开源更多特效模块。

11、AI对口型革命性突破:Captions新模型Mirage打造超真实UGC视频

Captions公司推出的全新AI模型Mirage，标志着视频生成技术的重大突破。该模型能够实时生成UGC风格视频，面部表情与肢体语言的真实度超越以往技术，简化了视频制作流程，尤其对广告和内容创作者而言，将成本和时间大幅缩减。

【AiBase提要:】
🚀 Mirage模型能够实时生成UGC视频，无需依赖预录素材或传统工具。
🎭 生成的角色面部表情与肢体语言真实度极高，难以分辨真假。
🌍 支持29种语言生成视频，极大简化视频制作流程，降低成本与时间。
详情链接:https://www.captions.ai/mirage

12、谷歌推机器人控制模型Gemini Robotics，让机器人像人类一样思考行动

谷歌的Gemini Robotics是一个革命性的机器人控制模型，旨在将人工智能的智慧注入机器人，使其在物理世界中更智能地行动。基于Gemini2.0模型，Gemini Robotics具备强大的多模态理解能力，能够理解文本、图像、音频和视频，并具备出色的泛化能力，能快速适应新环境和指令。

【AiBase提要:】
🚀 Gemini Robotics基于Gemini2.0模型，具备强大的多模态理解能力，能够处理文本、图像、音频和视频。
🧠 该模型展现出卓越的泛化能力，能够迅速适应新物体和环境，解决各种实际问题。
🔒 谷歌在安全性方面采取了全面措施，确保机器人在执行任务时的安全性和可靠性。
详情链接:https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/

13、智谱AI宣布再获珠海5亿元融资

珠海华发集团近期宣布向智谱公司投资5亿元人民币，旨在推动其GLM大模型的技术创新与生态发展。这一举措标志着珠海国资正式加入智谱的投资阵容。智谱在融资方面表现优异，去年成功完成多轮融资，总额超过40亿元，吸引了多家知名投资机构。

【AiBase提要:】
💡 珠海华发集团向智谱进行5亿元战略投资，支持其技术创新与生态发展。
🚀 智谱在融资方面表现强劲，去年完成超过40亿元的多轮融资，投资者涵盖多个城市的国资力量。
🌐 预计到2025年，智谱将推出全新开源大模型，推动AI行业的繁荣与发展。

（举报）

相关推荐

关键词：

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

AI时代重塑陪伴形式，联想“想帮帮AI服务智能体”以公益之心推出，通过五大功能（智玩、智验、智检、智修、智换）构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统，一键解决电脑卡顿等问题，让用户省时省心。该服务强调责任与长期守护，结合北京领养日公益理念，传递科技向善、服务有爱的智能温度，重新定义AI陪伴的全部意义。

AI陪伴领养代替购买智能服务
荐双11“换芯” 阿里妈妈AI按下加速键

今年双11的不同，在平台对外披露的商家案例中得以一窥究竟。 AI智能选品、AI智能出价、AI智能调控投放节奏..... 这些营销策略的表述来自音箱品牌Marshall，双11第一波段10天活动期内，Marshall在影音电器行业品牌和店铺排名均位居第一;成交转化率提升67%，爆款成交同比增长30%。这波爆发式增长的背后，反复被CUE到的AI可以说是深藏功与名。绝非只是平台意志的表达，

AI智能选品 AI智能出价 AI智能调控
法大夫AI法律智能体首次亮相法博会引关注！“法小助”斩获卓越技术奖！

2025年10月25-26日，深圳法律服务博览会（法博会）在福田会展中心举办。本届展会聚焦“法律服务创新保障科技与产业创新”，汇聚众多法律科技企业。法大夫推出的AI法律智能体矩阵备受关注，其与广东宝城律师事务所联合研发的“法小助”AI律师智能体成为亮点，荣获法博会法律科技产品大赛“卓越技术奖”。该智能体集成九大核心功能，覆盖法律咨询、合同审查、文书生成等场景，提供24小时不间断服务，通过“Web端+小程序+智能终端”实现多端覆盖，已落地多地法院及企业园区，有效提升法律服务效率与普惠性。

法律服务创新 AI法律智能体法律科技
智能座舱的“理想”样本背后，为什么需要一朵AI云?

文章探讨了智能座舱体验作为汽车差异化竞争的核心，指出在AI时代汽车正从“出行工具”转变为“移动空间”。理想汽车与阿里云的合作展示了如何通过端云协同架构实现“速度”与“深度”的结合：端侧确保交互响应速度（如通义Qwen模型延迟仅211ms），云侧承担深度推理和长期记忆（基于Tair、Lindorm等数据库实现99.5%召回率）。这种协作既定义了“家”般的座舱温度感，也揭示了车厂与云厂商的高效合作模式，推动移动智能体持续进化。

座舱体验汽车文化工业革命

今日大家都在搜的词：

热文

3 天
7天

AI日报：重磅！阿里新夸克升级为“AI框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

人工智能巨头OpenAI拟上市估值或高达1万亿美元

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

荐双11“换芯” 阿里妈妈AI按下加速键

法大夫AI法律智能体首次亮相法博会引关注！“法小助”斩获卓越技术奖！

智能座舱的“理想”样本背后，为什么需要一朵AI云?

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机