对标Sora？国产公司推文生视频工具Etna 能生成15秒4K视频

2024-03-14 09:07 · 稿源：站长之家

要点:
国产公司推出的AI视频技术实现了15秒4K60帧超逼真效果，与小米、快手合作瞄准500亿美元的短剧出海市场。
Etna模型作为成功复现Sora技术的重要成果之一，采用Diffusion Transformer处理不同维度数据，实现了时长、清晰度、细节丰富度和语义理解的优势。
七火山公司布局全产业链，通过AI多模态产品如Etna、Lava、miniTV和Bromo，改造短视频全产业链，受到资本市场的关注和青睐。

站长之家（ChinaZ.com）3月14日消息:随着国产公司推出的AI视频技术的崛起，短剧市场迎来了新的变革。七火山公司在国内率先复现了Sora的成果，并通过Etna模型等创新技术取得了重大突破。

Etna模型采用了Diffusion Transformer处理视频数据，实现了15秒4K60帧的超高清晰度，同时具备了时空理解能力和深度语义理解能力。

官网地址：https://top.aibase.com/tool/etna

论文地址：https://arxiv.org/pdf/2212.09748.pdf

从上图可以看出，相较于市场上的现有模型，Etna在时长、高清晰度、丰富生动细节和强语义理解上，都保持着较大优势。

为什么七火山能成为国内率先复现出Sora的公司?Sora的关键创新，是一个可以灵活地处理不同维度数据的Diffusion Transformer。时空压缩器会把原始视频转映射到潜空间中，视觉Transformer（ViT）模型会对已经被分词的潜表征进行处理，并输出去除噪声后的潜表征。

一个与CLIP模型类似的系统根据用户的指令（已经通过大语言模型进行了增强）和潜视觉提示，引导扩散模型生成具有特定风格或主题的视频。经过多次去噪处理之后，会得到生成视频的潜表征，然后通过相应的解码器映射回像素空间。

在相关领域技术积累的基础上，Etna模型迅速抓住了Sora的精髓，另外还引入了几项创新。技术架构创新主要是针对视频的时空特性提出的挑战，如何从空间和时间上将视频压缩到潜空间，以实现高效去噪，如何将压缩潜空间转换为patches，并将其输入到Transformer中，以及如何处理长距离的时空依赖性，并确保内容的一致性。

为此，Etna模型在主干网络上采用了Diffusion架构，同时在一个更大的数据集上实验和适配与Sora相似的Diffusion+Transform架构。融合了Diffusion模型和Transformer模型的优势，Etna形成了一种高效且先进的新型模型架构，提升了模型的生成效率，保证了生成内容的高质量和高一致性。

七火山公司不仅布局了AI多模态产品，还与小米、快手等合作伙伴展开战略合作，共同探索短剧出海市场。

资本市场对七火山公司的发展充满了期待，认为其具备了潜在的成长空间和投资价值。AI视频技术的兴起将颠覆整个短视频产业链，为用户带来全新的观影体验，也为产业链上下游企业带来了更多的商机和发展空间。

（举报）

相关推荐

关键词：

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
从“实现需求”到“共创价值”：AI Native时代需要什么样的工程师团队？

在1024程序员节，小红书技术副总裁风笛出席CCF工程师文化日五周年庆典，分享AI时代技术团队转型方向。他指出传统开发模式下工程师仅1/3时间编码，其余被会议沟通挤占，导致技术成长受阻、创新力下降。提出AI Native时代需重构协作模式：通过任务导向的扁平化组织，让工程师从需求执行者转变为价值创造者。以48小时上线翻译功能为例，展示新型协作效能。强调AI不会取代工程师，而是将其角色提升至系统定义和复杂性管理的新高度。

1024程序员节工程师文化 AI
AI全面落地双11，淘宝走出一条和OpenAI不同的路

今年的双11已经进入最后阶段，消费者和商家都有一个明显的感受是，AI的浓度真的很高，并且AI的全面落地应用，真的在改变传统用户购物、商家经营的链路。消费者能感受到两个比较明显的变化:一个是AI导购开始走进真实的购物场景。淘宝为双11投入了六款AI导购类产品，其公布的数据显示，AI万能搜已经帮助消费者解决了5000万个消费需求。另一个则是平台推荐的商品越

AI导购双11购物淘宝AI
OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

本期AI日报聚焦多领域突破：OpenAI视频应用Sora登陆安卓平台并引入付费角色功能；网易云音乐推出AI调音大师实现智能音效适配；字节跳动高薪布局人形机器人赛道；谷歌Gemini平台将升级图像生成技术；llama.cpp实现多模态革命；特斯拉秘密实验室通过行为数据训练机器人；上海首例AI著作权案宣判保护原创；微软推出自研图像生成器MAI-Image-1，在创意效率与质量间取得平衡。

OpenAI Sora Android
荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。
软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

在“软件定义汽车”浪潮下，智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而，传统软件测试模式成本高、耗时长，难以覆盖复杂场景，易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破：需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式，测试工程师角色转向质量策略师。到2027年，超80%企业将集成AI测试工具，汽车行业2025年成为转型关键节点。

软件定义汽车智能汽车座舱体验
50人团队、1亿美元ARR，AI PPT还在续写“神话”？

AI 生成 PPT 可以说是去年的热门赛道，尤记得关于这类产品是否具有真正竞争力的热烈讨论，而2025年9月份的数据显示，赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且，今天官宣了由 a16z 领投的6800万美元 B 轮融资，融资后估值达到21亿美元。而不仅 Gamma，根据 AI 产品榜数据，9月份，AIPPT 赛道的 Top3产品流量平均涨幅30%+，更有一款

AI生成PPT Gamma融资 AIPPT赛道

今日大家都在搜的词：

热文

3 天
7天

对标Sora？国产公司推文生视频工具Etna 能生成15秒4K视频

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

从“实现需求”到“共创价值”：AI Native时代需要什么样的工程师团队？

AI全面落地双11，淘宝走出一条和OpenAI不同的路

OpenAI发布GPT-5.1：情商大涨本周开始推送

荐OpenAI也来了，巨头为何决战AI浏览器？

荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

50人团队、1亿美元ARR，AI PPT还在续写“神话”？

今日大家都在搜的词：

热文

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

荣耀500系列开启预约：Pro版外观首次亮相

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

苹果回应输入法宁死不屈：具备记忆功能与学习机制

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

站长商机