首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:DeepSeek开源大模型加速器FlashMLA;海螺AI推I2V-01-Director模型;Pixverse V4.0支持同步音效与转绘功能

2025-02-24 15:28 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek在开源周首日推出了FlashMLA,这是一款针对英伟达Hopper架构GPU的高效多层注意力解码内核,旨在优化变长序列场景下的大模型推理性能。该技术通过全面支持BF16精度和创新的页式键值缓存系统,显著提升了内存管理的精确性。FlashMLA在性能测试中表现出色,达到了3000GB/s的处理速度和580TFLOPS的算力。

QQ20250224-101526.png

【AiBase提要:】

⚙️ FlashMLA专为英伟达Hopper架构GPU设计,优化变长序列场景,提升推理性能。

💾 采用BF16精度和块大小为64的页式键值缓存系统,实现精确内存管理。

📈 在H800SXM5GPU上,FlashMLA在内存受限场景下达到3000GB/s的处理速度。

详情链接:https://github.com/deepseek-ai/FlashMLA

2、海螺AI解锁全新“导演”模式:I2V-01-Director模型向所有人开放

海螺AI最新推出的I2V-01-Director模型为全球用户提供了一个突破性的AI视频生成工具,标志着AI在影视创作领域的又一重要进展。该工具允许用户通过自然语言指令控制镜头运动,轻松将创意转化为电影般的作品。

【AiBase提要:】

📽️ I2V-01-Director模型支持自然语言指令,用户可通过简单描述控制镜头运动。

🎨 该工具降低了专业视频制作的门槛,提升了创意工作者的创作自由度。

🌐 海螺AI已将该模型整合至视频创作平台,用户可立即体验。

详情链接:https://hailuoai.video/create

3、谷歌AI视频生成模型Veo2使用成本曝光:一分钟视频要30美元

谷歌最近公布了其视频生成AI模型Veo2的定价信息,引起了广泛关注。Veo2的使用费用为每秒50美分,换算下来一分钟的视频成本为30美元,每小时则高达1800美元。与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo2的定价显得相对划算。

image.png

【AiBase提要:】

💰 Veo2的视频生成费用为每秒50美分,每小时成本高达1800美元。

🎬 与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo2的定价显得非常划算。

💡 OpenAI 的 Sora 模型订阅费为每月200美元,Veo2在市场上具有竞争优势。

4、Grok3上线实时语音功能,一共支持10种模式

Grok APP最近推出了实时语音模式,支持多达10种交互模式,提升了用户体验。新增的Unhinged和Sexy模式引起了广泛关注,前者以挑衅式争论为特点,后者则充满浪漫暗示。这一更新不仅丰富了对话方式,也引发了对内容审核和未成年用户影响的讨论。

image.png

【AiBase提要:】

🎙️ Grok APP推出实时语音模式,支持10种交互方式,提升用户体验。

🔥 新增Unhinged和Sexy模式,前者擅长挑衅争论,后者则充满调情意味。

🔍 此次更新引发对内容审核及未成年用户影响的讨论,xAI需平衡创新与安全。

5、百度APP全面焕新:上线AI入口 DeepseekR1深度搜索不卡顿

百度App今日宣布全量上线全新的AI入口,深度整合文心大模型与DeepSeek模型,为用户提供全面升级的使用体验。新功能包括AI搜索、全网信息提炼、AI总结和数字人智能体,能够精准理解用户需求,实现个性化搜索结果。借助海量用户数据和大模型推理能力,百度App为用户呈现多模态内容推荐,提升信息获取效率。

微信截图_20250224143656.png

【AiBase提要:】

🔍 新增AI搜索、全网信息提炼等多项智能功能,提升用户体验。

👤 通过用户画像与行为数据分析,提供个性化的搜索结果,真正实现千人千面。

📈 升级首日使用量突破千万次,显示出用户对新功能的高度认可。

6、腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望

腾讯混元视频模型(Hunyuan Video)近期在X平台上公开招募测试伙伴,标志着其AI视频生成技术进入关键测试阶段。该模型以超过13B参数量成为开源视频生成模型中的佼佼者,展现出卓越的性能,特别是在视频流畅性和多对象生成方面。

【AiBase提要:】

🎯 混元视频模型是腾讯在AI视频生成领域的重要创新,参数量超过13B,具备强大的生成能力。

🛠️ 该模型在测试阶段表现出色,尤其在视频流畅性、细节还原和多对象生成方面超越现有模型。

🤝 招募测试伙伴旨在通过合作提升模型性能,参与者将为模型开源前的稳定性和实用性提供反馈。

详情链接:https://docs.google.com/forms/d/e/1FAIpQLScZe9DflcpKf_JfcgGnAiXfyhEZAt2uP4mE0Rhs5l9R2m49oA/viewform

7、月之暗面联手UCLA推新模型Mixture-of-Expert,提升语言模型训练效率

在人工智能领域,Moonshot AI与UCLA联合开发的Moonlight模型,采用Muon优化器,显著提升了大型语言模型的训练效率和稳定性。通过创新的牛顿-舒尔茨迭代法和权重衰减技术,Moonlight在多个任务上超越了传统的AdamW优化器,尤其在语言理解和代码生成方面表现优异。

【AiBase提要:】

🌟 Moonlight模型是由Moonshot AI与UCLA联合开发的Mixture-of-Expert模型,提供30亿和160亿参数配置,训练使用了5.7万亿个标记。

⚙️ Muon优化器通过牛顿-舒尔茨迭代法和权重衰减技术,显著提高了大型模型训练的效率和稳定性。

📈 实证结果显示,Moonlight在多个任务上优于传统的AdamW训练模型,表现出更好的语言理解和代码生成能力。

详情链接:https://github.com/MoonshotAI/Moonlight?tab=readme-ov-file

8、1x发布家庭机器人NEO Gamma:能冲咖啡、洗衣和吸尘等

1X 公司最新推出的家居机器人 Neo Gamma 具备多项家务功能,如冲咖啡、洗衣和吸尘,同时也能为用户提供陪伴。与传统家用机器人不同,Neo Gamma 的设计更为温和亲切,易于引发情感依赖。其先进的运动控制系统和语言交互功能,使其能够自然地融入家庭生活,成为人们生活中的得力助手。

【AiBase提要:】

🌟 Neo Gamma 是一款新型家居机器人,能够完成家务并为用户提供陪伴。

🤖 其设计更为亲切温和,与传统家用机器人截然不同,易于让人产生情感依赖。

🛠️ Neo Gamma 具备自然运动能力和语言交互功能,未来将与家庭生活紧密结合。

详情链接:https://www.1x.tech/neo

9、小米将推出首款AI PC产品

小米集团合伙人兼总裁卢伟冰在最近的直播中宣布,小米即将推出其首款AI PC产品,引起了科技界的广泛关注。这款新产品的最大亮点是其搭载的99Wh超大电池,不仅符合民航运输的安全标准,还能显著提升用户在移动办公时的续航能力。随着移动办公的普及,用户对电池续航的需求日益增加,而小米的这一设计正好解决了这一问题。

【AiBase提要:】

🔋 新款AI PC搭载99Wh超大电池,满足民航运输安全标准,成为可登机产品。

💼 该产品旨在提升用户在移动办公时的续航能力,解决续航焦虑。

🤖 深度整合AI技术,提供更智能的操作体验,提升工作和学习的便利性。

10、阿里巴巴宣布创纪录投资:未来三年3800亿加码云与AI硬件建设

阿里巴巴集团CEO吴泳铭宣布未来三年将投入超过3800亿元人民币用于云和AI硬件基础设施建设。这一创纪录的投资不仅是中国民营企业在该领域的最大手笔,也展示了阿里在AI时代的技术野心与战略布局。

【AiBase提要:】

🚀 阿里巴巴未来三年将投入3800亿元人民币用于云和AI硬件基础设施建设。

📈 国内AI产业正迎来爆发式增长,阿里巴巴的投资将加速行业智能化转型。

🌍 此次投资将提升中国在全球AI竞赛中的竞争力,助力企业在国际舞台上占据重要位置。

11、Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破

Meta AI团队最新推出的V-JEPA模型在无监督视频学习领域取得了重大突破。该模型通过特征预测原则,利用视频数据直接进行学习,避免了传统方法对预训练编码器和文本监督的依赖。V-JEPA在运动理解和视频任务上表现优越,展示了其高效的训练能力和强大的表示能力,尤其在低样本设置下仍能保持准确性。

image.png

【AiBase提要:】

🔍 V-JEPA模型专注于无监督特征预测,直接从视频数据中学习,避免传统方法的限制。

⚡ 该模型在视频任务和低样本学习中表现出色,展现了高效的训练能力和强大的表示能力。

📈 V-JEPA在捕捉细微运动细节方面具有优势,证明了其在视频理解中的潜力。

详情链接:https://ai.meta.com/research/publications/revisiting-feature-prediction-for-learning-visual-representations-from-video/

12、LiblibAI哩布哩布AI宣布再获数亿元融资 一年内连续完成四轮融资

LiblibAI在短短一年内成功完成四轮融资,创下国内AI应用赛道融资速度的新纪录。此次融资再获数亿元资金,进一步巩固了其在行业内的领先地位。公司致力于通过AI技术改变创作者的创作方式,建立了完整的创作生态链,并在用户增长和技术研发上持续发力。

image.png

【AiBase提要:】

💰 LiblibAI在一年内完成四轮融资,创下国内AI应用赛道融资速度新纪录。

🖼️ 公司的AI模型/图像创作者已突破两千万,日均创作交互数百万级。

🌐 本轮融资将重点投入创作者生态建设和技术研发,提升平台技术实力和用户体验。

13.Pixverse V4.0更新:音效与转绘功能震撼登场

Pixverse 发布了 V4.0版本,增强了底层模型,新增同步生成音效和转绘功能。用户可以通过 “Restyle” 功能将视频风格转换,且生成速度和真实感显著提升。这次更新为内容创作者提供了更丰富的创作体验,并被广泛好评。

【AiBase 提要:】

🎨 V4.0引入转绘功能,支持多种风格转换,提升创作自由度。

⚡ 视频生成速度提升至10秒,真实感和提示词遵循度显著提高。

🎶 新增同步音效功能,丰富视频内容体验,增强视听效果。

举报

  • 相关推荐
  • 卓世科技亮相 2026海南(三亚)人工智能科技大会,具身智能通用大脑赋能自贸港产业升级

    5月19日-25日,2026海南(三亚)人工智能科技大会以“睿见未来”为主题举办。卓世科技作为国家级专精特新“小巨人”企业受邀参展,创始人李伟伟发表主题演讲,展示自研“璇玑玉衡”大模型与具身智能通用大脑技术体系,深度对接海南自贸港AI产业生态。大会聚焦物理AI、智能制造、医疗康养等前沿赛道,搭建政产学研资用一体化平台。卓世科技针对行业痛点,提出分层赋能、即插即用的通用大脑解决方案,涵盖AI数字员工、陪伴交互大脑、非人形协同大脑及人形自主作业大脑等,并公布“数据资产、模型能力、场景方案、适配服务、验证认证”五大货架体系,助力海南打造全球人工智能“自贸高地”。

  • 京东云率先上线MiniMax M3:显著提升模型推理吞吐

    MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。 依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。 MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�

  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • 卓世科技荣膺「2026 福布斯中国人工智能科技企业 TOP50」

    近日,《福布斯》发布“2026福布斯中国人工智能科技企业TOP50”榜单,卓世科技凭借其行业大模型创新、自主可控的“璀璨玉衡”大模型体系、Tri-Core三核协同具身智能通用大脑,以及在工业制造、企业服务、健康养老、教育等多领域的深度商业化落地能力成功入选。同时,其创始人屠静女士也入选“人工智能影响力人物”。这标志着卓世科技已跻身中国人工智能产业核心阵营,其技术实力与产业价值获得高度认可。

  • 小米超高端手机下半年发布:玄戒芯片+OS+AI大模型大会师!全自研

    小米将于下半年发布一款超高端新品,属于MIX系列,可能命名为MIX Fold 5,搭载自研玄戒O3旗舰SoC(3nm制程、超大核4.05Ghz等)、澎湃OS 4系统(底层重构提升流畅度)和自研MiMo大模型(MiMo-V2.5系列全球领先)。该产品并非小米17S Pro,而是新一代大折叠屏手机,此外MIX系列还规划了一款直板机,带模块化磁吸镜头量产方案,两款机型预计Q3发布,最快7月亮相。

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • 每日互动打造AI PC个知·智能工作站 内置300亿参数小模型平衡安全与成本

    2026年台北GTC大会上,黄仁勋指出PC使用方式将因RTX Spark超级芯片和Windows改变,用户只需提问即可完成工作,“AI PC”成为必然趋势。文章强调消费级与企业级AI PC的区别,后者需解决数据主权、私有化部署和成本可控问题。每日互动推出的“个知·智能工作站”采用“云边端库”架构,通过端侧模型与云侧大模型协同,实现本地数据安全处理。该工作站内置300亿参数大语言模型�

  • AI日报:Claude Opus 4.8上线;小红书PC端上线AI搜索助手点点;阶跃星辰开源Step 3.7 Flash 大模型

    今日AI领域亮点:Anthropic发布Claude Opus 4.8,性能提升且价格大降;小红书PC端上线AI搜索助手“点点”,基于真实笔记提供对话式交互;阶跃星辰开源Step 3.7 Flash模型,专注智能体生产化;拼多多加强AI治理,打击涉考作弊工具;Grok Build 0.2.7更新,新增多代理共享终端;小米宣布MiMo旧版模型2026年6月下线;阿里云百炼全面CLI化并开源;腾讯混元推出Hy-Memory智能记忆插件,提升记忆密度与效率。

  • Check Point发布智能体暴露验证功能,主动应对AI模型自主漏洞利用威胁

    Check Point发布全新AI智能体“暴露验证(AEV)”,以攻击者视角推理验证真实可利用漏洞,帮助安全团队在攻击前采取行动。该功能利用前沿AI模型自主发现和利用漏洞,结合威胁情报上下文,从外部审视企业数字暴露面,摒弃静态严重性评分,通过安全验证闭环分析资产、CVE漏洞及现有控制措施,生成针对性验证路径。AEV是持续威胁暴露管理(CTEM)体系的关键验证能力,已为数十个漏洞生成新利用路径,现已正式上线。

今日大家都在搜的词: