首页 > 业界 > 关键词  > 开源计划最新资讯  > 正文

魔搭社区开源Data-Juicer 、 lite-Sora 类 Sora 模型

2024-03-25 08:45 · 稿源:站长之家

站长之家(ChinaZ.com) 3月25日 消息:在2024全球开发者先锋大会上,魔搭社区推出了 “ModelScope-Sora 开源计划”,旨在通过开源力量促进中国类 Sora 模型的探索与创新。

该计划提供一站式工具链,包括数据处理工具、多模态数据集、类 Sora 基础模型、训练推理工具等。

微信截图_20240325084641.png

魔搭发布了多模态数据处理系统 Data-Juicer,内含100多种高效算子,可大幅提升视频数据处理效率和质量。Data-Juicer 支持文本、图片、音频、视频处理,开发者可自由组合算子,如剪辑视频、增强分辨率等。

此外,魔搭还推出基础类 Sora 模型 lite-Sora,并将举办 “ModelScope-Sora 挑战赛” 鼓励开发者参与类 Sora 模型开发。

未来,魔搭计划构建开放的中文高质量多模态数据集,助力中国多模态大模型的发展。

  • Data-Juicer页面:https://github.com/modelscope/data-juicer

  • lite-Sora页面:https://github.com/modelscope/lite-sora

举报

  • 相关推荐
  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频”

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • Aloudata Agent公测开启:NoETL+大模型=好数据驱动真智能,让“万数皆可问”

    4月22日,Aloudata大应科技推出自研的Aloudata Agent,这是一款基于NoETL明细语义层的分析决策智能体,旨在通过自然语言实现数据查询、归因诊断、报告生成等功能。该产品解决了企业数据分析面临的五大挑战:语义鸿沟、口径一致性、场景覆盖度、性能优化和数据权限管控。Aloudata Agent采用NL2MQL2SQL技术路径,通过指标语义层实现业务语言与数据语言的精准对齐,显著提升查询准�

  • 贝昂空气循环扇·SF3Lite清凉上市

    贝昂科技推出新款智能空气循环扇云宝SF3 Lite,搭载AI智能调速技术,能自动调节风速,配备智能声控功能,支持语音指令操作。采用三档高度可调设计(49/75/101cm),满足多场景使用需求。产品兼具负离子净化功能,可释放负离子净化空气。运行噪音低至30分贝,一夏仅耗1度电,兼具环保节能特性。简约时尚外观设计,能完美融入各种家居环境。该产品以创新技术和卓越性能,为消费者带来全新清凉体验。

  • 李想AI Talk第二季来了:理想VLA司机大模型是从动物到人的进化

    在这期间,李想分享了他对人工智能的最新思考,以及包含智能驾驶和理想同学在内的人工智能技术的最新进展,并宣布基于自研基座大模型Mind GPT的理想同学从车机进入手机,App已于12月27日全量上线。

  • Anthropic首席执行官:AI 模型的“幻觉”比人少!

    Anthropic 首席执行官达里奥·阿莫代伊(Dario Amodei)表示,他认为当前的 AI 模型出现“幻觉”(即编造虚假事实并将其当作真实信息呈现)的频率,比人类还要低……

  • Kalodata-Bo助力中国品牌踏上史诗征程

    美国对中国商品加征关税导致部分外贸企业客户流失30%,部分美国客户为避税将订单转向越南、印尼等地。中国与东盟贸易额连续5年互为最大贸易伙伴,2024年贸易额达6.99万亿元,占中国外贸总值15.9%。东南亚成为中国应对外部压力的关键,越南电子组装70%零部件需从中国进口。RCEP生效后区域内90%货物贸易实现零关税,帮助中国企业分散供应链至东南亚再出口全球。Kalodata-BO平台数据显示,东南亚6.5亿人口中年轻消费群体庞大,2024年越南榴莲对华出口激增48.6%。该平台通过连接10万+品牌与2万+创作者,助力企业开拓东南亚市场。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • GhibliTattoo发布!AI纹身生成,吉卜力风格专属定制!

    这款工具专为吉卜力粉丝、纹身爱好者与创意设计师打造。通过文本提示或图片上传,即可生成高分辨率、透明背景的吉卜力风格纹身设计……

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

    本文汇总了近期AI领域多项重要进展:1)扣子空间开放测试,无需邀请码即可体验AI协作平台;2)腾讯推出HunyuanCustom视频生成工具,实现音视频同步编辑;3)阿里巴巴ZeroSearch技术降低AI训练成本88%;4)OpenAI新增GitHub连接器,强化代码分析功能;5)联想发布天禧个人超级智能体,具备感知交互能力;6)OpenAI在亚洲推出数据驻留计划;7)Multiverse发布全球首款AI生成多人游戏;8)秘塔AI上线"讲题"功能辅助家长辅导;9)Genspark推出智能电子表格工具AI Sheets;10)Google Gemini API新增缓存功能可节省75%成本;11)PixVerse v4视频生成速度质量双提升;12)快手推出内容净化器KuaiMod;13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度,展现了AI技术的快速发展和广泛应用。