首页 > 原创 > 关键词  > AI短剧生成最新资讯  > 正文

AI日报:首个AI短剧视频生成模型SkyReels-V1开源;马斯克发布王炸大模型Grok 3;AI才女罗福莉已到新岗位上班

2025-02-18 15:23 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、昆仑万维开源首个面向AI短剧创作的视频生成模型SkyReels-V1

昆仑万维宣布开源AI短剧创作的首个视频生成模型SkyReels-V1及其表情动作可控算法SkyReels-A1,旨在解决现有模型的高成本和使用难度问题。这一创新将推动AI短剧行业的发展,提供更高质量的影视内容生成能力。SkyReels-V1通过高质量数据训练,实现了对人物表演的细致控制,支持多种表情和动作组合,提升了视频的真实感和表现力。

【AiBase提要:】

🎥 SkyReels-V1是中国首个开源AI短剧视频生成模型,支持33种表情和400多种动作组合。

🤖 SkyReels-A1是首个SOTA级别的表情动作可控算法,能够实现高保真的微表情还原。

🌐 昆仑万维致力于开源技术,推动AI短剧行业的创新与发展,降低制作成本。

详情链接:https://github.com/SkyworkAI/SkyReels-V1

2、xAI王炸模型 Grok3发布: 超越GPT-4o,计算能力提升10倍

xAI于周一发布了其最新旗舰AI模型Grok3,标志着该公司在人工智能领域的重要进展。Grok3的计算能力比前一版本Grok2提升了10倍,能够分析图像并回答问题,且在多项基准测试中超越了OpenAI的GPT-4o。新功能DeepSearch使用户能够快速获取深度信息分析,进一步提升了Grok应用的实用性。未来还将推出语音模式,预计将为用户带来更丰富的体验。

image.png

【AiBase提要:】

🧠 Grok3是xAI最新推出的AI模型,计算能力比前一版本提高了10倍。

📈 Grok3能够分析图像并回答问题,且在多项基准测试中超越了GPT-4o。

🔍 新推出的DeepSearch功能可以提供深度信息分析,支持用户快速获取信息。

3、阶跃开源130B 统治级语音模型,实时对话+情感克隆,炸裂来袭

阶跃(Step Audio)最近开源了一款1300亿参数的语音模型,标志着语音交互领域的重大突破。这款模型结合了语音理解与生成控制的能力,展现出强大的多语言支持和方言识别,能够实现个性化的语音交互体验。此外,其情感控制和语音克隆功能为用户提供了更为丰富的互动可能性,预示着未来语音AI将更加智能和自然。

【AiBase提要:】

🚀 这款模型是业界首个集语音理解与生成控制于一体的实时语音对话系统,具备强大的控制能力。

🌍 支持多种语言和方言,包括中文、英文、日语及粤语、四川话,为跨语言交流提供了便利。

🎶 具备语音克隆和情感控制功能,用户可以自由设定语音的情感基调,创造个性化的语音助手。

详情链接:https://github.com/stepfun-ai/Step-Audio/tree/main

4、效果最佳!阶跃星辰开源Step-Video-T2V 视频生成模型

今日,阶跃星辰与吉利汽车集团联合推出了两款开源的多模态大模型,特别是Step-Video-T2V视频生成模型,凭借300亿参数量在视频生成领域展现出卓越的能力。该模型不仅在生成高质量视频方面表现出色,还能精准理解指令,支持多种镜头运动,生成的画面真实且符合物理规律。开发者们可以在跃问App中体验这款模型,并为其提供反馈,推动技术进步。

image.png

【AiBase提要:】

🌟 Step-Video-T2V模型拥有300亿参数,生成204帧540P分辨率的视频,性能全球领先。

🎨 模型在运动平滑性和美感度等方面表现优异,超越现有开源视频模型。

📱 两款模型已上线跃问App,开发者可体验并提供建议,推动技术发展。

详情链接:https://github.com/stepfun-ai/Step-Audio

5、AI才女罗福莉已到新岗位上班

罗福莉,这位95后的AI天才少女,最近开始了新的职业旅程,尽管具体的公司信息尚未透露。她曾因小米创始人雷军的千万年薪邀请而引发广泛关注。罗福莉在北京大学获得计算语言学硕士学位,随后在阿里巴巴达摩院和DeepSeek等公司积累了丰富的研究经验。

【AiBase提要:】

✨ 罗福莉已开始新工作,具体公司尚未公布。

💰 雷军以千万年薪邀请罗福莉加入小米团队。

📈 DeepSeek-V2模型的性价比被罗福莉称为“性价比之王”。

6、小模型+大模型协同!秘塔AI搜索推出浅度研究「Shallow Research」功能

秘塔网络科技有限公司于2025年2月18日推出了其新功能——“浅度研究”,旨在利用AI技术快速收集和分析信息,以提高研究效率。该功能采用了小模型与大模型的协同架构,能够在短时间内完成数百个网页的搜索与分析,极大地缩短了研究时间。虽然目前仍处于浅度研究阶段,但已能为用户提供初步分析结果,展现了AI在信息处理方面的巨大潜力。

image.png

【AiBase提要:】

🧠 采用小模型与大模型的协同架构,提升研究效率。

⏱️ 能在2到3分钟内完成数百个网页的搜索与分析。

📈 未来计划加入代码执行和数值分析等能力,深化研究。

7、HYBE旗下AI 声音工具Supertone Play上线:10秒搞定声音克隆

HYBE旗下的Supertone推出了名为“Supertone Play”的文本转语音工具,旨在为创作者提供高质量、富有表现力的音频内容。该工具支持英语、韩语和日语,并将在未来扩展至西班牙语和中文。Supertone Play拥有150种声音角色,适用于多种创作需求,并具备语音克隆功能,用户可以根据自己的声音创建个性化角色,调整情感语调。

image.png

【AiBase提要:】

🎙️ Supertone Play支持多种语言,提供150种声音角色供创作者使用。

🔒 该工具具备声音验证码和不可听水印等安全措施,以防止技术被滥用。

🌍 在测试阶段,该工具已在80多个国家被广泛使用,用户积极下载生成的内容。

详情链接:https://play.supertone.ai/

8、腾讯电子签将上线AI起草合同功能

腾讯电子签公众号近期宣布即将推出AI起草合同功能,利用混元和DeepSeek大模型技术,旨在为用户提供便捷的合同生成和管理服务。通过AI,小王可以轻松生成合租合同并添加必要条款,而小李则能快速审查供应商合同的潜在风险。法务人员老张也能高效管理合同,避免信息丢失。此功能将极大提升合同处理的效率和准确性。

image.png

【AiBase提要:】

🤖 AI可一键生成合同,简化起草流程,降低用户操作难度。

🔍 AI作为风险扫描助手,能快速识别合同中的潜在不利条款。

📂 AI实现智能化合同管理,帮助用户快速找到关键信息,避免合同“失踪”。

9、深圳福田、广州上线“AI公务员” :部署 DeepSeek 大模型

深圳市福田区和广州市相继上线基于DeepSeek大模型的“AI公务员”,标志着智慧政务建设的重要进展。福田区推出的AI数智员工已覆盖240个业务场景,显著提升政务服务效率,个性化定制生成时间大幅缩短,审核时间减少90%。广州市也在推进基于DeepSeek的智慧政务体系建设,展现了AI技术在优化政务服务中的潜力。

【AiBase提要:】

🚀 福田区推出AI数智员工,覆盖240个业务场景,提升政务服务效率。

⏱️ 个性化定制生成时间从5天缩短至分钟,审核时间减少90%。

🌐 广州市构建基于DeepSeek的智慧政务体系,推动数字化新引擎建设。

10、网易有道推出国内首款AI原生学习硬件SpaceOne集成DeepSeek-R1

网易有道于2月18日推出了革命性的学习硬件——全面屏答疑词典笔SpaceOne,成为国内首款深度融合大模型能力的AI原生教育硬件。该产品以“草稿纸式推演”为核心,突破传统解题工具的局限,提供全题型深度讲解,覆盖数学、物理、化学等多个学科,极大提升学习效率。

image.png

【AiBase提要:】

🖊️ SpaceOne集成DeepSeek-R1推理模型,通过可视化分步拆解难题,模拟教师思维过程,覆盖10大学科。

📱 采用滑动机身与4.4英寸护眼全面屏,竖屏显示效率提升350%,优化学习交互体验。

🌐 内置7800万词库及移动4G模块,支持百种语言互译,突破地域性教育资源限制。

11、OpenAI 联合创始人初创公司SSI融资超10亿美元,估值超300亿美元

OpenAI联合创始人伊利亚·苏茨克夫为其新创公司“安全超智能”(SSI)筹集超过10亿美元资金,估值已超300亿美元,使其成为全球最有价值的私人科技公司之一。SSI专注于开发安全的AI系统,尚未产生收入,首个产品将是安全超智能。苏茨克夫强调公司将完全隔绝外部压力,避免参与复杂产品竞争。

【AiBase提要:】

🌟 SSI正在筹集超过10亿美元的资金,估值超过300亿美元。

🚀 该公司专注于开发安全AI系统,目前尚未产生收入。

🤖 Sutskever表示,公司的首个产品将是安全超智能,其他业务将暂时搁置。

12、OpenAI 考虑特别投票权以抵御马斯克等敌意收购

OpenAI 正在探索通过赋予其非营利董事会特殊投票权的方式来保护公司控制权,以应对潜在的敌意收购,特别是来自亿万富翁马斯克的威胁。这一策略旨在确保在转型为营利性企业后,OpenAI 仍能保持其核心使命的独立性。

【AiBase提要:】

🌐 OpenAI 考虑通过特殊投票权来保护其董事会的控制权,以抵御潜在的敌意收购。

🤖 此举主要是为了确保在转型为营利性企业后,仍能保持公司核心使命的独立性。

💡 这一策略可能会对整个科技行业产生影响,促使更多公司思考如何保护自身的控制权。

13.月之暗面科技推出 Kimi-latest 模型:可第一时间体验kimi最新模型

北京月之暗面科技有限公司发布了新模型 kimi-latest,旨在为开发者和企业用户提供更强大、更稳定的 AI 生成能力。该模型具有 128k 的上下文长度,支持图片理解及自动上下文缓存,适用于多种应用场景。通过不断更新,确保用户能体验到最新的 AI 技术。

微信截图_20250218150913.png

【AiBase 提要:】

🌟 kimi-latest 模型对标 Kimi 智能助手,确保用户体验最新技术。

📈 支持 128k 上下文长度,自动选择计费标准,提高使用灵活性。

🔧 模型适用于聊天应用和意图识别,满足不同用户需求。

举报

  • 相关推荐
  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型

    据媒体报道,马斯克旗下人工智能公司xAI正式推出新一代旗舰模型Grok 4,并宣称其为世界上最强大的AI模型”。 该模型基于xAI的Colossus超级计算机训练,核心优势在于其深度推理能力,承诺带来显著增强的逻辑推理和文本生成水平。 此外,Grok 4还具备自然的人类对话风格、实时网络访问能力,以及对互联网文化(包括梗、俚语和幽默)的高精度理解。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署