首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:DeepSeek开源大模型加速器FlashMLA;海螺AI推I2V-01-Director模型;Pixverse V4.0支持同步音效与转绘功能

2025-02-24 15:28 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek在开源周首日推出了FlashMLA,这是一款针对英伟达Hopper架构GPU的高效多层注意力解码内核,旨在优化变长序列场景下的大模型推理性能。该技术通过全面支持BF16精度和创新的页式键值缓存系统,显著提升了内存管理的精确性。FlashMLA在性能测试中表现出色,达到了3000GB/s的处理速度和580TFLOPS的算力。

QQ20250224-101526.png

【AiBase提要:】

⚙️ FlashMLA专为英伟达Hopper架构GPU设计,优化变长序列场景,提升推理性能。

💾 采用BF16精度和块大小为64的页式键值缓存系统,实现精确内存管理。

📈 在H800SXM5GPU上,FlashMLA在内存受限场景下达到3000GB/s的处理速度。

详情链接:https://github.com/deepseek-ai/FlashMLA

2、海螺AI解锁全新“导演”模式:I2V-01-Director模型向所有人开放

海螺AI最新推出的I2V-01-Director模型为全球用户提供了一个突破性的AI视频生成工具,标志着AI在影视创作领域的又一重要进展。该工具允许用户通过自然语言指令控制镜头运动,轻松将创意转化为电影般的作品。

【AiBase提要:】

📽️ I2V-01-Director模型支持自然语言指令,用户可通过简单描述控制镜头运动。

🎨 该工具降低了专业视频制作的门槛,提升了创意工作者的创作自由度。

🌐 海螺AI已将该模型整合至视频创作平台,用户可立即体验。

详情链接:https://hailuoai.video/create

3、谷歌AI视频生成模型Veo2使用成本曝光:一分钟视频要30美元

谷歌最近公布了其视频生成AI模型Veo2的定价信息,引起了广泛关注。Veo2的使用费用为每秒50美分,换算下来一分钟的视频成本为30美元,每小时则高达1800美元。与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo2的定价显得相对划算。

image.png

【AiBase提要:】

💰 Veo2的视频生成费用为每秒50美分,每小时成本高达1800美元。

🎬 与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo2的定价显得非常划算。

💡 OpenAI 的 Sora 模型订阅费为每月200美元,Veo2在市场上具有竞争优势。

4、Grok3上线实时语音功能,一共支持10种模式

Grok APP最近推出了实时语音模式,支持多达10种交互模式,提升了用户体验。新增的Unhinged和Sexy模式引起了广泛关注,前者以挑衅式争论为特点,后者则充满浪漫暗示。这一更新不仅丰富了对话方式,也引发了对内容审核和未成年用户影响的讨论。

image.png

【AiBase提要:】

🎙️ Grok APP推出实时语音模式,支持10种交互方式,提升用户体验。

🔥 新增Unhinged和Sexy模式,前者擅长挑衅争论,后者则充满调情意味。

🔍 此次更新引发对内容审核及未成年用户影响的讨论,xAI需平衡创新与安全。

5、百度APP全面焕新:上线AI入口 DeepseekR1深度搜索不卡顿

百度App今日宣布全量上线全新的AI入口,深度整合文心大模型与DeepSeek模型,为用户提供全面升级的使用体验。新功能包括AI搜索、全网信息提炼、AI总结和数字人智能体,能够精准理解用户需求,实现个性化搜索结果。借助海量用户数据和大模型推理能力,百度App为用户呈现多模态内容推荐,提升信息获取效率。

微信截图_20250224143656.png

【AiBase提要:】

🔍 新增AI搜索、全网信息提炼等多项智能功能,提升用户体验。

👤 通过用户画像与行为数据分析,提供个性化的搜索结果,真正实现千人千面。

📈 升级首日使用量突破千万次,显示出用户对新功能的高度认可。

6、腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望

腾讯混元视频模型(Hunyuan Video)近期在X平台上公开招募测试伙伴,标志着其AI视频生成技术进入关键测试阶段。该模型以超过13B参数量成为开源视频生成模型中的佼佼者,展现出卓越的性能,特别是在视频流畅性和多对象生成方面。

【AiBase提要:】

🎯 混元视频模型是腾讯在AI视频生成领域的重要创新,参数量超过13B,具备强大的生成能力。

🛠️ 该模型在测试阶段表现出色,尤其在视频流畅性、细节还原和多对象生成方面超越现有模型。

🤝 招募测试伙伴旨在通过合作提升模型性能,参与者将为模型开源前的稳定性和实用性提供反馈。

详情链接:https://docs.google.com/forms/d/e/1FAIpQLScZe9DflcpKf_JfcgGnAiXfyhEZAt2uP4mE0Rhs5l9R2m49oA/viewform

7、月之暗面联手UCLA推新模型Mixture-of-Expert,提升语言模型训练效率

在人工智能领域,Moonshot AI与UCLA联合开发的Moonlight模型,采用Muon优化器,显著提升了大型语言模型的训练效率和稳定性。通过创新的牛顿-舒尔茨迭代法和权重衰减技术,Moonlight在多个任务上超越了传统的AdamW优化器,尤其在语言理解和代码生成方面表现优异。

【AiBase提要:】

🌟 Moonlight模型是由Moonshot AI与UCLA联合开发的Mixture-of-Expert模型,提供30亿和160亿参数配置,训练使用了5.7万亿个标记。

⚙️ Muon优化器通过牛顿-舒尔茨迭代法和权重衰减技术,显著提高了大型模型训练的效率和稳定性。

📈 实证结果显示,Moonlight在多个任务上优于传统的AdamW训练模型,表现出更好的语言理解和代码生成能力。

详情链接:https://github.com/MoonshotAI/Moonlight?tab=readme-ov-file

8、1x发布家庭机器人NEO Gamma:能冲咖啡、洗衣和吸尘等

1X 公司最新推出的家居机器人 Neo Gamma 具备多项家务功能,如冲咖啡、洗衣和吸尘,同时也能为用户提供陪伴。与传统家用机器人不同,Neo Gamma 的设计更为温和亲切,易于引发情感依赖。其先进的运动控制系统和语言交互功能,使其能够自然地融入家庭生活,成为人们生活中的得力助手。

【AiBase提要:】

🌟 Neo Gamma 是一款新型家居机器人,能够完成家务并为用户提供陪伴。

🤖 其设计更为亲切温和,与传统家用机器人截然不同,易于让人产生情感依赖。

🛠️ Neo Gamma 具备自然运动能力和语言交互功能,未来将与家庭生活紧密结合。

详情链接:https://www.1x.tech/neo

9、小米将推出首款AI PC产品

小米集团合伙人兼总裁卢伟冰在最近的直播中宣布,小米即将推出其首款AI PC产品,引起了科技界的广泛关注。这款新产品的最大亮点是其搭载的99Wh超大电池,不仅符合民航运输的安全标准,还能显著提升用户在移动办公时的续航能力。随着移动办公的普及,用户对电池续航的需求日益增加,而小米的这一设计正好解决了这一问题。

【AiBase提要:】

🔋 新款AI PC搭载99Wh超大电池,满足民航运输安全标准,成为可登机产品。

💼 该产品旨在提升用户在移动办公时的续航能力,解决续航焦虑。

🤖 深度整合AI技术,提供更智能的操作体验,提升工作和学习的便利性。

10、阿里巴巴宣布创纪录投资:未来三年3800亿加码云与AI硬件建设

阿里巴巴集团CEO吴泳铭宣布未来三年将投入超过3800亿元人民币用于云和AI硬件基础设施建设。这一创纪录的投资不仅是中国民营企业在该领域的最大手笔,也展示了阿里在AI时代的技术野心与战略布局。

【AiBase提要:】

🚀 阿里巴巴未来三年将投入3800亿元人民币用于云和AI硬件基础设施建设。

📈 国内AI产业正迎来爆发式增长,阿里巴巴的投资将加速行业智能化转型。

🌍 此次投资将提升中国在全球AI竞赛中的竞争力,助力企业在国际舞台上占据重要位置。

11、Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破

Meta AI团队最新推出的V-JEPA模型在无监督视频学习领域取得了重大突破。该模型通过特征预测原则,利用视频数据直接进行学习,避免了传统方法对预训练编码器和文本监督的依赖。V-JEPA在运动理解和视频任务上表现优越,展示了其高效的训练能力和强大的表示能力,尤其在低样本设置下仍能保持准确性。

image.png

【AiBase提要:】

🔍 V-JEPA模型专注于无监督特征预测,直接从视频数据中学习,避免传统方法的限制。

⚡ 该模型在视频任务和低样本学习中表现出色,展现了高效的训练能力和强大的表示能力。

📈 V-JEPA在捕捉细微运动细节方面具有优势,证明了其在视频理解中的潜力。

详情链接:https://ai.meta.com/research/publications/revisiting-feature-prediction-for-learning-visual-representations-from-video/

12、LiblibAI哩布哩布AI宣布再获数亿元融资 一年内连续完成四轮融资

LiblibAI在短短一年内成功完成四轮融资,创下国内AI应用赛道融资速度的新纪录。此次融资再获数亿元资金,进一步巩固了其在行业内的领先地位。公司致力于通过AI技术改变创作者的创作方式,建立了完整的创作生态链,并在用户增长和技术研发上持续发力。

image.png

【AiBase提要:】

💰 LiblibAI在一年内完成四轮融资,创下国内AI应用赛道融资速度新纪录。

🖼️ 公司的AI模型/图像创作者已突破两千万,日均创作交互数百万级。

🌐 本轮融资将重点投入创作者生态建设和技术研发,提升平台技术实力和用户体验。

13.Pixverse V4.0更新:音效与转绘功能震撼登场

Pixverse 发布了 V4.0版本,增强了底层模型,新增同步生成音效和转绘功能。用户可以通过 “Restyle” 功能将视频风格转换,且生成速度和真实感显著提升。这次更新为内容创作者提供了更丰富的创作体验,并被广泛好评。

【AiBase 提要:】

🎨 V4.0引入转绘功能,支持多种风格转换,提升创作自由度。

⚡ 视频生成速度提升至10秒,真实感和提示词遵循度显著提高。

🎶 新增同步音效功能,丰富视频内容体验,增强视听效果。

举报

  • 相关推荐
  • 超过ChatGPTDeepseek?谷歌发布 Gemini 2.5 Flash AI 模型

    新版AI模型缩短了响应时间,节约了运算成本;还推出了新的AI芯片“Ironwood”。谷歌发布了新的AI模型“Gemini2.5Flash”,据称,这款AI模型的性能比OpenAI和DeepSeek的AI产品“更高效”。谷歌计划在三星今年上半年推出的AI伴侣机器人Ballie上搭载生成式AI模型。

  • DeepSeek领航大模型普惠化浪潮,xAI/微美全息加速开源AI布局打造新格局

    DeepSeek 作为当前最受关注的大模型之一,凭借其技术创新正在加速 AI 普惠化进程。根据机构新报告显示,DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已经超过OpenAI的ChatGPT。DeepSeek市场份额全球第三目前,DeepSeek市场份额6.58%,仅次于ChatGPT和Canva。DeepSeek是继ChatGPT之后的又一现象级AI产品,它的市场份额从2.34%快速增长至6.58%,展现出强劲的增长态势。全球著名�

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • 奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

    【新智元导读】代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用量4倍。奥特曼在TED放话:将推超强开源模型,直面DeepSeek挑战。持续的创新、丰富的资源和智能AI将会无缝融入日常生活,未来一代人将会觉得当前人们又辛苦又落后。

  • 刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

    Llama4重磅发布了!Meta官宣开源首个原生多模态Llama4,首次采用的MoE架构,支持12种语言,首批发布一共两款:Llama4Scout:共有1090亿参数,17B活跃参数,16个专家,1000万上下Llama4Maverick:共有4000亿参数,17B活跃参数,128个专家,100万上下文另外,2万亿参数Llama4Behemoth将在未来几个月面世,288B活跃参数,16个专家。Llama4的横空出世,成为迄今为止开源最强,多模态能力最好的模型之一。L

  • AI进化论——音乐、绘画和舞蹈的DeepSeek时刻

    “昔者仓颉作书天雨粟,鬼夜哭”——人类掌握文字后,天地为之动容,因为属于人类的文明诞生了。“仓颉作书”出自西汉《淮南子》,距离人类掌握文字已经过去了千年。AI进化的答案,或许早就镌刻在人类文明的起点里。

  • 艾力斯特iRest云系统接入Deepseek赋能AI健康管理新时代

    随着人工智能技术的快速发展,健康管理领域也掀起了AI智能化转型的新浪潮。iRest艾力斯特作为中国按摩器具行业领先品牌,为满足用户日益增长的个性化健康管理需求,旗下独家研发的iRest云系统——按摩椅智能控制系统和健康管理平台,于今年3月份完成三项重大功能升级:接入DeepseekAI智能健康管家、联动华为运动健康以及推出按摩周月年报功能。艾力斯特将继续深耕健康科技领域,以用户需求为导向,通过健康生态链智能技术建立起iRest产品生态链,不断推出创新产品与服务,为用户创造更健康、更便捷的生活方式。

  • 深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek、修复超百项问题

    快科技4月16日消息,今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等,具体重点改进如下:硬件兼容性与内核优化:集成6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;?

  • 开发效率提升100倍!腾讯云AI代码助手正式搭载DeepSeek-V3-0324顶级模型

    腾讯云AI代码助手最新宣布,正式搭载DeepSeek-V3-0324顶级模型。下载/更新AI代码助手插件即可用,官方号称开发效率能直接提升100倍。腾讯总结了DeepSeek-V3-0324的五大强项:创新的训练策略-采用无辅助损失的负载均衡,避免传统方法的性能损失-多token预测训练提升推理速度,FP8混合精度训练显著降低计算成本-在超大规模模型上验证FP8训练的有效性,提高训练效率优化的MoE架构-动态调整偏差项,防止路由崩溃,性能提升15%以上-节点受限路由机制减少跨节点通信流量至1/3,结合FP8调度与RDMA优化,训练效率提升40%-支持128K超长上下文,可处理50页PDF或完整代码库,多轮对话记忆更强综合能力大幅提升-关键指标突破性进步,在各项权威基准测试中相较于初代V3,在关键指标上展现了突破性进步。

  • 合合信息发布“大模型加速器 2.0”,助力大模型跨越“幻觉”障碍

    近日,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器 2.0”版本正式上线,凭借其多维度升级,为降低大模型“幻觉”风险、推动大模型精准应用提供了强大助力。训练数据是影响大模型“认知能力”的关键,合合信息“大模型加速器 2.0”基于领先的智能文档处理技术,从数据源头入手,对复杂文档的版式、布局和元素进行精准解析及结构化处理,