AI日报：阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字；腾讯发布混元视频生成大模型

2024-12-03 15:28 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阶跃星辰视频生成大模型Step-Video开启内测可在跃问视频申请

阶跃星辰的Step-Video模型正式开启内测，用户可以通过跃问视频官网申请资格。该模型支持从文本生成高达1080P分辨率、最长10秒的视频，展现出在自动优化提示词、美学风格和运动控制方面的显著优势。

【AiBase提要:】
🎬 Step-Video模型支持从文本生成高清视频，分辨率高达1080P，最长可达10秒。
🌟 在美学风格上，Step-Video对中国风题材的理解和生成尤为精准，符合古诗意境。
⚙️ 该模型在运动控制方面表现优异，能够生成符合物理规律的视频，处理复杂的空间关系。
详情链接:https://top.aibase.com/tool/yuewenshipin

2、Luma发布全新图像生成模型Luma Photon，速度更快，成本更低!

Luma Labs推出的Luma Photon和Photon Flash是两款革命性的图像生成模型，具有超高的生成速度和低成本优势。Luma Photon在多项测试中表现出色，能够生成高质量的图像，适用于广告、影视、艺术等多个领域。

【AiBase提要:】
🚀 Luma Photon生成图像速度是市场上其他模型的10倍，成本低至0.2美分每张1080p图片。
🎨 支持多轮自然语言指令，用户可逐步优化生成内容，适合复杂创意任务。
📈 在质量、创造力和理解力方面，Luma Photon在双盲评估中超越市场上所有模型。
详情链接:https://lumalabs.ai/photon

3、可灵AI导演共创计划作品12月6日上线将发布9部电影级AI视频

快手科技宣布将于12月6日正式上线中国首个AIGC导演共创计划——“可灵AI导演共创计划”。此计划由快手自研的视频生成大模型“可灵AI”联合多位知名导演共同发起，旨在通过AI技术拓宽影视创作的边界。

【AiBase提要:】
🎥 计划由快手科技与9位知名导演共同发起，涵盖多元题材。
🤖 所有短片将使用可灵AI进行视频生成，推动AI技术在影视创作中的应用。
📈 可灵AI自发布以来已服务超500万用户，生成5100万个视频和1.5亿张图片。

4、字节旗下即梦AI灰测图片2.1模型 AI生图终于可以出中文字体了!

字节跳动旗下的即梦AI最近推出了图片2.1模型，解决了AI图像生成中文字体的问题。用户只需简单输入文字描述，便可快速生成个性化海报，极大提高了设计师的工作效率。新模型的应用场景广泛，包括海报制作、书籍封面设计和社交媒体配图。

【AiBase提要:】
🎨 新模型支持中文字体生成，提升海报设计效率。
📚 用户可通过文字描述创建个性化海报和封面。
🌌 模型应用场景广泛，适用于社交媒体、故事创作等。
详情链接:https://top.aibase.com/tool/jimeng

5、秘塔AI搜索:「学术搜索」数据增加7倍新增”解释“功能

上海秘塔网络科技有限公司最近对其AI秘塔学术搜索功能进行了重大升级，数据量增加了7倍，用户现在可以更全面地检索到数千万篇Open Access论文，包括40%的SCI论文及顶级期刊如《Nature》和《Science》。此次更新还新增了“解释”功能，帮助用户理解复杂的文献内容。

微信截图_20241203091022.png

【AiBase提要:】
📈 数据量增加7倍，覆盖数千万篇Open Access论文，提升检索能力。
📝 新增“解释”功能，帮助用户理解文献中复杂的句子。
🌍 支持44种语言的翻译模型，消除小语种论文的阅读障碍。

6、李飞飞创业首秀:一张图生成交互式3D 世界，AIGC 进入全新时代!

李飞飞的最新创业项目World Labs，带来了颠覆性的3D生成技术。用户只需提供一张图片或一句话，就能创造出互动的3D场景，标志着AIGC进入全新的沉浸式时代。这项技术不仅能精准还原细节，还能模拟各种相机效果，赋予用户导演般的控制感。

【AiBase提要:】
🖼️ 只需一张图片或一句话，即可生成栩栩如生的3D场景，开启全新交互体验。
🎥 该技术支持模拟多种相机效果，让用户在3D世界中自由掌控镜头。
🚀 World Labs计划持续提升3D世界的规模和精度，探索更多用户互动方式。
详情链接:https://www.worldlabs.ai/blog

7、告别语音克隆侵权!Hume AI推出语音控制功能，可创建个性化AI语音

Hume AI最近推出了一项名为“语音控制”的实验性功能，使用户能够轻松创建个性化的AI声音，无需任何编码技能。该功能允许用户通过滑块调整声音特征，提供多种维度的定制选项，旨在满足多样化的应用需求。

【AiBase提要:】
🔊 Hume AI推出“语音控制”功能，用户可轻松创建个性化AI声音。
🛠️ 该功能无须编码技能，用户可以通过滑块调整声音特征。
🌐 Hume旨在通过个性化和情感智能的语音AI来满足多样化的应用需求。
详情链接:https://www.hume.ai/blog/introducing-voice-control

8、Cohere推新的搜索模型 Rerank3.5:可处理100多种语言精准查询

Cohere最近推出的Rerank3.5搜索模型，标志着企业数据检索的重大进步。该模型支持超过100种语言的查询，尤其在阿拉伯语、日语和韩语等主要商业语言中表现出色，帮助跨国公司打破语言障碍。内部测试显示，Rerank3.5在金融服务领域的表现显著提升，能够节省成本并降低风险。

【AiBase提要:】
📊 Rerank3.5能够处理100多种语言的查询，帮助全球企业打破语言障碍。
💡 内部测试显示，该模型在金融服务领域的搜索表现大幅提升，能节省成本和降低风险。
🚀 Cohere 通过主流云平台的部署，力求成为企业搜索的行业标准，同时企业需随时适应快速变化的 AI 环境。
详情链接:https://cohere.com/blog/rerank-3pt5

9、OpenAI CFO 回应广告传闻:当前不考虑引入广告模式

OpenAI的首席财务官Sarah Friar在接受采访时表示，当前公司并无计划引入广告，尽管广告收入对盈利公司来说是一个诱人的选择。Friar提到，OpenAI正在快速增长，并在现有商业模式中发现了机会，未来可能会探索其他收入来源。

【AiBase提要:】
🌟 OpenAI CFO Sarah Friar 表示当前无意引入广告，未来有可能探索其他收入来源。
💼 OpenAI 招聘了多位广告和市场营销领域的专家，表明未来或将考虑广告模式。
🚪 公司高管频繁变动，创始人 Sam Altman 依然在努力推动公司愿景。

10、提到 “David Mayer”一词ChatGPT就崩溃，这是什么神秘力量?

最近，社交媒体上出现了一个让人困惑的现象:OpenAI的聊天机器人ChatGPT在提到“David Mayer”时无法正常回应，并强制结束对话。这一现象引发了网友们的广泛讨论与猜测，许多人尝试询问ChatGPT有关“David Mayer”的信息，却都遭遇了同样的结局。

【AiBase提要:】
🌐 ChatGPT在提到“David Mayer”时无法回应，并强制结束对话。
🔍 “David Mayer”可能与法律问题有关，涉及GDPR被遗忘权。
🤔 其他姓名同样会导致ChatGPT出现故障，凸显AI模型的复杂性。

11.WPS Office 推出 AI 语音速记功能

WPS Office 近期发布了 AI 语音速记功能，增强了语音转文字的体验，支持实时录音和多语言互译。该功能通过声纹识别和 AI 自动总结提升准确性，并与 WPS 云文档深度整合，确保用户在录音过程中能顺利继续录音。用户可在最新版本的 WPS Office 中轻松找到并使用此功能。

微信截图_20241203150637.png

【AiBase 提要:】
🗣️ 语音速记功能实现实时录音与音频转文字。
🌐 支持中英等多种语言的互译功能。
🔒 提供安全的文档协作体验，提升用户便利性。

12.腾讯发布混元视频生成大模型： 130 亿参数全面开源

腾讯推出了混元视频生成模型，拥有 130 亿参数，是当前最大开源视频生成模型。该模型支持高清、真实感视频生成，适用于广告和创意视频等商业应用。用户可通过腾讯元宝 APP 和腾讯云接口进行试用或对接，降低了视频生成的技术门槛，促进了 AI 技术的普及。

【AiBase 提要：】
🎥 混元视频生成模型具备超写实质感，适合多种商业场景使用。
🔧 模型允许用户细致刻画生成内容，提供高度语义遵循。
🌐 开源模式推动了 AI 视频生成技术的民主化，鼓励创意与开发者创新。
官网：https://aivideo.hunyuan.tencent.com
模型：https://huggingface.co/tencent/HunyuanVideo

（举报）

相关推荐

关键词：

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
爱诗科技下注的AI视频，正在比它预期的更「快」落地

「我们决定全力投入视频生成领域，因为我们坚信视频生成一旦能够落地，其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中，这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。短短两年后，视频大模型的产品化和商业化潜力已经如王长虎判断的那样，在快速落地，形成自己的创作生�

AI视频生成视频大模型产品化
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
荐长视频，要MCN化？

过去十多年，长视频平台习惯用头部综艺与大剧撬动增长:内容够强，自然破圈，声量带动会员与广告。这套“内容中心逻辑”曾行之有效。但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事，三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩，哪怕是重金制作，也可能上线当周见顶、难以延展。在这种环境下，平台不得不寻找新的增长方式。�

文章搜索核心标签长视频平台
豆包-应用生成·「一点都不技术」创作挑战赛开赛！

英特尔联合豆包-应用生成发起“一点都不技术”创作挑战赛，旨在通过零代码AI工具降低创意门槛。用户只需输入一句话或一张图，即可在5分钟内生成网页、工具或小游戏等多样化作品。赛事设置总价值20万元奖励，包含现金及火箭发射观礼等特色福利，并构建“创作-交流-成长”的完整生态，推动AI技术普惠。活动将持续至2025年12月8日，让每个平凡创意都有机会落地生花。

AI技术创意革命零代码

今日大家都在搜的词：

热文

3 天
7天

AI日报：阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字；腾讯发布混元视频生成大模型

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

跨境支付的未来：人工智能、嵌入式金融和即时结算

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

人工智能巨头OpenAI拟上市估值或高达1万亿美元

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

爱诗科技下注的AI视频，正在比它预期的更「快」落地

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

荐长视频，要MCN化？

豆包-应用生成·「一点都不技术」创作挑战赛开赛！

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

快手发布2025年第三季度财报：可灵AI营业收入超3亿元

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机