魔搭社区开源Data-Juicer 、 lite-Sora 类 Sora 模型

2024-03-25 08:45 · 稿源：站长之家

站长之家(ChinaZ.com) 3月25日消息:在2024全球开发者先锋大会上，魔搭社区推出了 “ModelScope-Sora 开源计划”，旨在通过开源力量促进中国类 Sora 模型的探索与创新。

该计划提供一站式工具链，包括数据处理工具、多模态数据集、类 Sora 基础模型、训练推理工具等。

微信截图_20240325084641.png

魔搭发布了多模态数据处理系统 Data-Juicer，内含100多种高效算子，可大幅提升视频数据处理效率和质量。Data-Juicer 支持文本、图片、音频、视频处理，开发者可自由组合算子，如剪辑视频、增强分辨率等。

此外，魔搭还推出基础类 Sora 模型 lite-Sora，并将举办 “ModelScope-Sora 挑战赛” 鼓励开发者参与类 Sora 模型开发。

未来，魔搭计划构建开放的中文高质量多模态数据集，助力中国多模态大模型的发展。

Data-Juicer页面:https://github.com/modelscope/data-juicer
lite-Sora页面:https://github.com/modelscope/lite-sora

（举报）

相关推荐

关键词：

豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品：1）Seedance 1.0 lite视频生成模型，支持5-10秒480P/720P视频生成，具备影视级画质和生成速度优势，适用于电商广告、影视创作等场景；2）豆包1.5视觉深度思考模型，仅20B参数但具备多模态理解能力，在60项基准测试中38项达SOTA水平；3）升级版豆包音乐模型，新增英文歌曲创作功能，并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

AI模型升级视频生成技术火山引擎发布
Aloudata Agent公测开启：NoETL+大模型=好数据驱动真智能，让“万数皆可问”

4月22日，Aloudata大应科技推出自研的Aloudata Agent，这是一款基于NoETL明细语义层的分析决策智能体，旨在通过自然语言实现数据查询、归因诊断、报告生成等功能。该产品解决了企业数据分析面临的五大挑战：语义鸿沟、口径一致性、场景覆盖度、性能优化和数据权限管控。Aloudata Agent采用NL2MQL2SQL技术路径，通过指标语义层实现业务语言与数据语言的精准对齐，显著提升查询准�

Aloudata 大应科技智能BI
贝昂空气循环扇·SF3Lite清凉上市

贝昂科技推出新款智能空气循环扇云宝SF3 Lite，搭载AI智能调速技术，能自动调节风速，配备智能声控功能，支持语音指令操作。采用三档高度可调设计（49/75/101cm），满足多场景使用需求。产品兼具负离子净化功能，可释放负离子净化空气。运行噪音低至30分贝，一夏仅耗1度电，兼具环保节能特性。简约时尚外观设计，能完美融入各种家居环境。该产品以创新技术和卓越性能，为消费者带来全新清凉体验。

智能空气循环扇贝昂科技 AI智能调档
李想AI Talk第二季来了：理想VLA司机大模型是从动物到人类的进化

在这期间，李想分享了他对人工智能的最新思考，以及包含智能驾驶和理想同学在内的人工智能技术的最新进展，并宣布基于自研基座大模型Mind GPT的理想同学从车机进入手机，App已于12月27日全量上线。
Anthropic首席执行官：AI 模型的“幻觉”比人类少！

Anthropic 首席执行官达里奥·阿莫代伊（Dario Amodei）表示，他认为当前的 AI 模型出现“幻觉”（即编造虚假事实并将其当作真实信息呈现）的频率，比人类还要低……

AI幻觉 Anthropic开发者大会 Anthropic
Kalodata-Bo助力中国品牌踏上史诗征程

美国对中国商品加征关税导致部分外贸企业客户流失30%，部分美国客户为避税将订单转向越南、印尼等地。中国与东盟贸易额连续5年互为最大贸易伙伴，2024年贸易额达6.99万亿元，占中国外贸总值15.9%。东南亚成为中国应对外部压力的关键，越南电子组装70%零部件需从中国进口。RCEP生效后区域内90%货物贸易实现零关税，帮助中国企业分散供应链至东南亚再出口全球。Kalodata-BO平台数据显示，东南亚6.5亿人口中年轻消费群体庞大，2024年越南榴莲对华出口激增48.6%。该平台通过连接10万+品牌与2万+创作者，助力企业开拓东南亚市场。

利润表客户关系经营模式
荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

本文介绍了AI领域多项最新进展：1)B站团队推出开源动漫视频生成模型AniSora，支持多种风格创作；2)OpenAI发布编程智能体Codex，提升开发效率；3)Google测试AI问答功能AI Mode；4)ChatGPT将整合MCP协议，支持第三方AI服务对接；5)阿里推出ZeroSearch框架，减少对搜索引擎的依赖；6)Stability AI与Arm合作推出手机端音频生成AI；7)Qwen发布WorldPM系列大模型；8)GPT-5将整合多款产品功能；9)ListenHub上线AI播客生成工具；10)QQ浏览器升级为AI浏览器；11)数学建模AI助手MathModelAgent面世；12)GenSpark推出全球首个智能下载代理；13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

AI日报动漫视频生成 AniSora
GhibliTattoo发布！AI纹身生成，吉卜力风格专属定制！

这款工具专为吉卜力粉丝、纹身爱好者与创意设计师打造。通过文本提示或图片上传，即可生成高分辨率、透明背景的吉卜力风格纹身设计……

GhibliTattoo 吉卜力风格 AI纹身
对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3，对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频，还能为人物对话、鸟鸣等场景自动匹配音效，实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户，月费249.99美元，并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是，谷歌在AI图像生成领域并非一帆风顺，此前Imagen 3曾因生成含历史错误的图像引发争议。

谷歌视频生成模型 Veo
荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

本文汇总了近期AI领域多项重要进展：1)扣子空间开放测试，无需邀请码即可体验AI协作平台；2)腾讯推出HunyuanCustom视频生成工具，实现音视频同步编辑；3)阿里巴巴ZeroSearch技术降低AI训练成本88%；4)OpenAI新增GitHub连接器，强化代码分析功能；5)联想发布天禧个人超级智能体，具备感知交互能力；6)OpenAI在亚洲推出数据驻留计划；7)Multiverse发布全球首款AI生成多人游戏；8)秘塔AI上线"讲题"功能辅助家长辅导；9)Genspark推出智能电子表格工具AI Sheets；10)Google Gemini API新增缓存功能可节省75%成本；11)PixVerse v4视频生成速度质量双提升；12)快手推出内容净化器KuaiMod；13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度，展现了AI技术的快速发展和广泛应用。

AI产品人工智能技术趋势

热文

3 天
7天

魔搭社区开源Data-Juicer 、 lite-Sora 类 Sora 模型

豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

Aloudata Agent公测开启：NoETL+大模型=好数据驱动真智能，让“万数皆可问”

贝昂空气循环扇·SF3Lite清凉上市

李想AI Talk第二季来了：理想VLA司机大模型是从动物到人类的进化

Anthropic首席执行官：AI 模型的“幻觉”比人类少！

Kalodata-Bo助力中国品牌踏上史诗征程

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

GhibliTattoo发布！AI纹身生成，吉卜力风格专属定制！

对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

热文

超越OpenAI？Claude4大模型能连续工作7小时，创SWE-Bench得分纪

“统治色情世界”的 OnlyFans 正在出售中，估值 80 亿美元

不久后，苹果可能会同意你放弃Siri，改用更智能的 AI 助手

Meta AI负责人：无关爱国，是“自卑情结” 阻碍了欧洲科技发展

特朗普签署法案，将“报复性色情”和“露骨AI深度伪造”定为犯

苹果与Epic诉讼战升级，法官施压：要么批准《堡垒之夜》上架，

黄仁勋：AI十年变革拉开序幕，“这个赛道没有第二名”

谷歌推出 Beam AI：将普通视频通话，转为逼真的 3D 沉浸式体验

苹果WWDC2025定档6月9日-13日，iOS大改版、没有AI…

高通确认9月底发布骁龙8 Elite 2，将与天玑9500正面交锋

超越OpenAI？Claude4大模型能连续工作7小时，创SWE-Bench得分纪

AI 驱动高效转型，Klarna 人均收入飙升至近 100 万美元

彭博社：比起ChatGPT，苹果siri前负责人更青睐谷歌gemini

调查发现：近 50% 年轻人宁愿活在“没有互联网”的世界！

站长商机