首页 > 原创 > 关键词  > AI技术最新资讯  > 正文

AI日报:重磅!阿里新夸克升级为“AI框”;谷歌开源多模态模型Gemma-3;潞晨科技开源视频大模型Open-Sora 2.0

2025-03-13 15:34 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。这款应用基于阿里通义的先进推理与多模态大模型,整合了多种AI功能,旨在为用户提供无缝的智能体验。新夸克不仅能够进行智能对话,还具备深度思考和执行能力,能够满足用户在多个场景下的需求。

【AiBase提要:】

🤖 新夸克整合了AI对话、深度思考、深度搜索等多种功能,提供一站式服务。

📊 通过智能中枢系统,新夸克能够自动识别用户指令并进行深度执行。

🌐 阿里巴巴计划将通义系列模型的最新成果快速接入新夸克,以增强其功能。

2、谷歌开源新一代多模态模型 Gemma-3:性能卓越、成本降低10倍

谷歌最新发布的多模态大模型Gemma-3以其低成本和高性能引起了广泛关注。该模型支持多种参数规模,最大可达270亿参数,且仅需一张H100显卡进行高效推理,算力需求显著降低。Gemma-3在对话模型评比中表现优异,支持长文本处理和多模态数据,展现出强大的语言处理能力和创新的架构设计,是当前算力要求最低的高性能模型之一。

image.png

【AiBase提要:】

🔍 Gemma-3是谷歌最新开源的多模态大模型,参数范围从10亿到270亿,且算力需求降低10倍。

💡 模型采用创新的架构设计,有效处理长上下文和多模态数据,支持文本与图像的同时处理。

🌐 Gemma-3支持140种语言的处理能力,经过训练优化后在多项任务中表现优异,展现了强大的综合能力。

详情链接:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

3、百度文心快码推出Comate Zulu版本 并正式开放公测

百度旗下的文心快码推出了Comate Zulu版本,标志着在智能编程领域的一次重大突破。该版本通过结合文心大模型的强大能力和丰富的编程大数据,为开发者提供了更高效的编程体验。用户可以通过自然语言与系统进行交流,快速搭建项目和理解代码逻辑,大幅提升开发效率。公测活动将持续至3月28日,开发者可以在主流IDE中体验这一创新功能。

image.png

【AiBase提要:】

🛠️ 通过全自然语言实现需求,无需编写代码即可自动搭建项目,支持口语交流和图片展示。

📊 快速理解代码库的业务逻辑,提供架构图梳理和智能启发思路,帮助开发者迅速上手新项目。

⚙️ 自动搭建开发环境,支持依赖自动安装和服务自启动,实现从需求到代码的端到端生成。

详情链接:https://comate.baidu.com

4、字节Trae接入硅基流动SiliconCloud 支持DeepSeek多款模型API

硅基流动平台与字节跳动推出的AI IDE——Trae正式接入,提升了开发者的编程体验。用户可以通过简单的步骤接入多款编码模型,包括DeepSeek-R1、V3等,满足不同需求。平台还提供免费的API服务,助力开发者实现更高效的开发过程。未来,硅基流动将继续扩展模型种类和合作应用,致力于为开发者提供更稳定的服务。

image.png

【AiBase提要:】

🔧 Trae接入硅基流动,提供多种高效编码模型,提升编程体验。

🔑 用户可通过简单步骤添加模型,获取API密钥。

🚀 硅基流动致力于提供稳定的API服务,未来将扩展模型种类。

5、王炸更新!谷歌AI Studio再进化:YouTube视频秒懂,AI作画还能保持角色统一

谷歌AI Studio的最新升级引发了科技圈的轰动,用户现在可以直接通过YouTube链接理解视频内容,无需下载和上传。Gemini2.0Flash Experimental模型不仅在视频解析上表现出色,还在图像生成方面展现了惊人的一致性。

image.png

【AiBase提要:】

🎥 谷歌AI Studio现在支持直接解析YouTube视频链接,用户可快速理解视频内容。

🖼️ Gemini2.0Flash exp在图像生成方面表现卓越,角色在多张图片中保持一致性。

⚡ 更新标志着谷歌AI Studio从基础模型向应用级工具的转型,影响现有AI工具生态。

详情链接:https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube

6、叫板Sora?潞晨科技开源视频大模型Open-Sora2.0,降本提速

潞晨科技推出的Open-Sora2.0以其仅20万美元的训练成本和110亿参数的强大性能,成功挑战了OpenAI Sora等行业标杆。该模型在多个评测中表现优异,尤其在VBench中与OpenAI Sora的性能差距缩小至0.69%。

image.png

【AiBase提要:】

💰 成本低:Open-Sora2.0仅需20万美元训练成本,显著低于行业标准。

📈 性能强:拥有110亿参数,性能接近OpenAI Sora,VBench评测中表现优异。

🌐 开源共享:全流程训练代码开源,推动视频生成技术的共同发展。

详情链接:https://github.com/hpcaitech/Open-Sora

7、阿里通义新视频生成和编辑模型VACE 可控制运动轨迹、替换主体等

阿里通义Wan团队推出了全新的VACE模型,旨在降低视频制作的门槛并提升创作效率。VACE的按条件生成视频功能让用户可以通过文字描述快速实现创意,仿佛拥有了一支梦幻摄制组。此外,VACE还具备多种强大的编辑功能,如物体运动轨迹控制、视频主体替换、风格迁移和视频画面智能扩展等。

【AiBase提要:】

🎬 VACE模型通过文字描述快速生成视频,提升创作效率。

🔄 支持物体运动轨迹控制和视频主体替换,灵活多变。

🖼️ 具备视频画面智能扩展和风格迁移功能,丰富创作表现。

详情链接:https://arxiv.org/pdf/2503.07598

8、理想汽车AI助手理想同学网页版上线:接入DeepSeek R1满血版

理想汽车正式推出其人工智能助手理想同学网页版,标志着其在智能服务领域的进一步扩展。该助手接入了DeepSeek R1V3671B满血版,提供强大的问答能力和跨场景服务协同。用户可以在不同模型之间切换,支持长文本输入及图像问答功能,提升了交互体验。

image.png

【AiBase提要:】

💻 理想同学网页版现已上线,用户可在电脑端使用,拓展智能服务生态。

🔍 接入DeepSeek R1V3671B满血版,支持模型切换和深度思考功能,提升问答能力。

🖼️ 支持千字长文本输入和图像问答,提供更强的用户交互体验。

9、谷歌Gemini2.0Flash放出原生多模态图像生成功能:支持多轮对话式实时编辑

谷歌最新推出的Gemini2.0Flash在AI图像生成领域引入了原生图像生成技术,显著提升了生成效率和准确性。与以往依赖于大型语言模型的方式不同,Gemini2.0Flash实现了图像生成与文本理解的直接集成,使得创作过程更加流畅。

image.png

【AiBase提要:】

🎨 原生图像生成:Gemini2.0Flash将图像生成功能直接集成,避免了信息失真,提高了生成效率和准确性。

🖌️ 实时编辑:支持多轮对话式编辑,用户可以用自然语言提出修改意见,AI能够即时响应并调整图像。

📈 企业应用:为营销团队和开发者提供强大工具,快速生成内容,降低设计成本,提高工作效率。

10、Remade AI 开源8款 Wan2.1特效 LoRA,掀起 AI 视频创作新热潮

Remade AI 在 Hugging Face 平台推出了8款基于 Wan2.1模型的开源特效 LoRA,吸引了科技界的广泛关注。这些特效模块不仅能够将静态图像转化为动态视频,还为 AI 视频生成带来了新的创意可能性。

image.png

【AiBase提要:】

🎨8款新特效 LoRA 包括挤压、蛋糕化、膨胀等,丰富了 AI 视频创作的可能性。

💻 Wan2.1模型以其高效性和多功能性,成为视频生成领域的顶尖选择。

🌍 Remade AI 邀请全球用户提出定制需求,承诺持续开源更多特效模块。

11、AI对口型革命性突破:Captions新模型Mirage打造超真实UGC视频

Captions公司推出的全新AI模型Mirage,标志着视频生成技术的重大突破。该模型能够实时生成UGC风格视频,面部表情与肢体语言的真实度超越以往技术,简化了视频制作流程,尤其对广告和内容创作者而言,将成本和时间大幅缩减。

image.png

【AiBase提要:】

🚀 Mirage模型能够实时生成UGC视频,无需依赖预录素材或传统工具。

🎭 生成的角色面部表情与肢体语言真实度极高,难以分辨真假。

🌍 支持29种语言生成视频,极大简化视频制作流程,降低成本与时间。

详情链接:https://www.captions.ai/mirage

12、谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动

谷歌的Gemini Robotics是一个革命性的机器人控制模型,旨在将人工智能的智慧注入机器人,使其在物理世界中更智能地行动。基于Gemini2.0模型,Gemini Robotics具备强大的多模态理解能力,能够理解文本、图像、音频和视频,并具备出色的泛化能力,能快速适应新环境和指令。

【AiBase提要:】

🚀 Gemini Robotics基于Gemini2.0模型,具备强大的多模态理解能力,能够处理文本、图像、音频和视频。

🧠 该模型展现出卓越的泛化能力,能够迅速适应新物体和环境,解决各种实际问题。

🔒 谷歌在安全性方面采取了全面措施,确保机器人在执行任务时的安全性和可靠性。

详情链接:https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/

13、智谱AI宣布再获珠海5亿元融资

珠海华发集团近期宣布向智谱公司投资5亿元人民币,旨在推动其GLM大模型的技术创新与生态发展。这一举措标志着珠海国资正式加入智谱的投资阵容。智谱在融资方面表现优异,去年成功完成多轮融资,总额超过40亿元,吸引了多家知名投资机构。

【AiBase提要:】

💡 珠海华发集团向智谱进行5亿元战略投资,支持其技术创新与生态发展。

🚀 智谱在融资方面表现强劲,去年完成超过40亿元的多轮融资,投资者涵盖多个城市的国资力量。

🌐 预计到2025年,智谱将推出全新开源大模型,推动AI行业的繁荣与发展。

举报

  • 相关推荐
  • 每日互动CTO叶新江出席2026长三角人工智能大会,探讨大模型与具身智能发展路径

    3月11日,2026长三角人工智能大会在杭州举行。每日互动CTO叶新江受邀出席,与多家企业代表探讨AI赋能产业的新路径。他分享了公司“让数好用,把数用好”的理念,构建了从数据治理到场景应用的全链路体系。在具身智能方面,每日互动已利用四足机器人进行巡检,并探索“半人马”形态机器人。叶新江强调,数据治理与要素市场化是AI发展的核心瓶颈,行业需要更多愿意投入成本、参与共创的伙伴。他认为AI的价值在于帮助人类回归人性,未来人机协同将提升人类的共情与创造能力。公司推出的“个知·智能工作站”已广泛应用于政务、医疗等行业,未来将继续携手伙伴,打造开放共赢的AI生态。

  • 中国人工智能开源生态崛起:从两会部署到企业实践的“智变”之路

    2026年政府工作报告将支持人工智能开源社区建设列为重点任务,旨在深化“人工智能+”行动,推动技术规模化应用。当前中国AI产业规模突破1.2万亿元,开源模型下载量居全球首位。政策引导下,开源生态从行业自发行为升级为国家战略,通过构建“技术-算力-数据”保障体系,降低开发门槛,加速AI从实验室成果转化为社会生产力。企业实践如“小智AI”通过开源模式构建覆盖软硬件的开放生态,助力中小企业转型,推动技术下沉与场景深耕。开源正成为技术创新的孵化器、产业协同的连接器与社会普惠的加速器。

  • 对话硅谷投资人张璐:从 AI 军备竞赛到全产业部署,硅谷正在“超级加速”

    生成式AI问世三年来,正加速推动世界变革。资本层面,科技巨头持续加码,大模型融资纪录不断刷新,竞争态势升温。AI正从科技公司迅速扩展至医疗、金融、物流等传统行业,重塑商业运行方式。硅谷知名投资人张璐指出,AI已进入大规模产业部署阶段,问题从“要不要用AI”转变为“如何规模化部署AI”。她认为,未来一年AI发展的重点方向包括:AI基础设施(从模型竞争走向成本与效率竞争)、AI医疗(从工具应用走向垂直系统)、Physical AI与SpaceTech(AI走向真实物理世界)、金融与保险(最快实现规模化落地的行业)。尽管面临估值泡沫、能源约束与全球不确定性等挑战,但AI带来的增长空间依然巨大。

  • 小熊电器与百度智能云达成战略合作,AI驱动小家电智能升级

    3月12日,小熊电器与百度智能云在AWE2026上签署战略合作协议,双方将围绕“AI+家电+智能生活”展开长期合作,共同推动AI技术与小家电智能化升级。合作旨在将AI大模型能力融入产品与用户体验,探索AI家电的创新可能。现场展示了双方合作的AI智享系列产品,如搭载AI语音交互功能的空气炸锅,能根据用户需求提供个性化服务。未来,双方将持续推出更多AI产品,覆盖更多生活场景,并拓展企业数智化建设等合作维度,共同开拓市场增长机遇。

  • 海尔发布SeekerV80D,行业首个L4级AI智能体电视

    海尔在AWE 2024上推出行业首款L4级AI智能体电视Seeker V80D,标志着智慧家庭中心已实现。该产品具备主动感知、自然交互与自主决策能力,能通过方言免切换、多意图理解实现“一句话场景”交互,并作为全屋智能控制中枢,联动家电、管理健康数据,提供管家式服务。其L4级智慧感知系统可主动营造舒适观影环境,代表电视从显示设备向“家庭智慧中樞”进化。

  • AWE看点:海尔洗衣机将开启“AI洗护智能体时代”

    洗衣机硬件虽不断进化,但用户洗衣仍需费心费力。海尔将在AWE2026上推出“Seeker洗护家”和“云溪5.0”等新品,终结“人围着机器转”的状态。前者搭载“AI之眼”,能识别深浅串色、衣物夹门等细节;后者通过AI直驱科技2.0,解决大件洗不动、甩干不稳等难题。这些创新让洗衣机从“盲洗”变为会思考的“家庭洗护管家”,开启行业“AI洗护智能体时代”。

  • 雅迪的智能技术,不是突然开窍,而是藏得够深!白鲨Ⅱ终于摊牌了

    2026年两轮电动车市场将迎来结构性变化,电摩市场崛起、新国标落地及细分场景需求升级。智能化成为行业焦点,从“是否智能”转向“如何实现有价值的智能”。雅迪冠能白鲨Ⅱ凭借高度智能化表现打破市场认知,成为行业标杆。文章指出,智能化的本质是“用户价值”而非营销标签,应聚焦实用性与情绪价值。雅迪等传统巨头在智能化领域的布局被低估,其全面性反而让单点创新不够突出。随着全民AI时代到来,行业需回归以用户为中心,实现真正意义上的智能普惠。

  • 出行新物种降临AWE:首驱科技“具身化”智能产品,如何用全维技术重塑骑行?

    2026年中国家电及消费电子博览会(AWE)上,首驱科技携六大系列12款核心产品亮相,聚焦AI智能出行。概念车T5NOVA01搭载全球首创随速变形风翼系统、360°超级雷达等多项行业首创技术,重新定义两轮出行的科技边界与品质高度。高性能电摩、新国标电自等产品矩阵,覆盖不同用户群体需求,展现品牌深厚研发实力。首驱科技以汽车级研发标准打造产品,致力于引领两轮出行行业迈向AI智能出行新时代。

  • 揭秘戴在眼前的“AI助理” AWE 2026同款爆火“智能眼镜”新品京东上线

    在AWE2026京东展区,智能眼镜体验区人气火爆。京东携手英特尔、联想等数十家科技巨头,带来50余款AI新品。智能眼镜区生动展现了“AI从概念走向生活”的主题,汇聚了Rokid、INMO、小米、玄景M6Air、千问G1等多款产品,分别针对导航、翻译、拍摄等场景痛点提供创新方案。现场观众通过亲身体验,直观感受了信息获取、实时翻译到第一视角记录的革命性变化,体验到“所见即所得”的交互魅力。京东持续推动以智能眼镜为代表的穿戴式AI技术走向日常,邀请消费者亲临现场,开启“第一视角”智能新纪元。

  • 首驱AI智能电动车全矩阵登陆AWE2026,全球首款“具身化智能电摩”首秀在即

    2026年中国家电及消费电子博览会(AWE2026)将于3月12日至15日在上海新国际博览中心举行。首驱科技将携多款新品亮相,并首次发布全球首款“具身智能电摩”T5NOVA01。该产品搭载多项行业首创技术,如全球首创的随速变形风翼系统、智能可调座舱、汽车级矩阵激光大灯、360°超级雷达护卫系统及自修复轮胎等,旨在通过AI技术重新定义智能骑行体验,实现个性化交互与全场景智能互联。同时,首驱还将展示包括K95C+MAX、Y395C+NEW等在内的全系产品矩阵,展现其在性能、空间、续航及智能化维度的系统布局。

今日大家都在搜的词: