首页 > 传媒 > 关键词  > 正文

MindSpore嘉年华再启,静待多模态勇士问鼎华为Mate60大奖

2023-12-20 13:47 · 稿源: 站长之家用户

01

MindCon 极客周

MindCon 极客周是昇思 MindSpore 开源社区每半年举办一次的开发者狂欢盛会,旨在引领兴趣者们走入 AI 探索的世界。自 2020 年 12 月首届举办至今,每年都会与昇思 MindSpore 开源社区的开发者相聚,如今正式迎来第五届,回首第 一届 MindCon 极客周时,昇思 MindSpore AI 框架刚刚开源半年,凭借热爱我们带领社区开发者从 0 到 1 参与开源贡献,也正式开启了众多热爱开源开发者的封神之路!

随后三届赛事中,我们又收获了更多开源爱好者一起修复社区 Bugfix,贡献开源社区,分享 AI 前沿技术,三年半间,昇思 MindSpore 在众多志同道合的开发者支持下迅速成长,目前已凝聚 650 万开发者,2.4 万 + 开发者在社区作出卓越贡献,同时我们也在不断创新,将 MindCon 极客周的任务、场景、形式都更丰富起来,希望吸引更多开源爱好者共同探索共同探索人工智能的无穷可能。

02

昇思 MindSpore2023 新突破

作为国内领先的开源深度学习框架,2023 年昇思 MindSpore 持续创新,“秦岭・翱翔”、“空天・灵眸 时空预测”、“鹏城・脑海” 等多个业界知名大模型等正式发布,助力中国人工智能产业快速发展;基于昇思 MindSpore 的昆仑万维 Skywork-13B 正式开源,降低大模型商业门槛,推动人工智能技术落地千行百业;MindSpore2.0 版本全新升级,在编程范式方面全面支持函数式 + 面向对象融合编程,新编程范式提供了更自由的低阶接口,在使代码更加简洁易懂的同时,提高了易用性,降低了上手难度;同时,昇思 MindSpore 联合中科大、西交、西电等高校打造了 CV、NLP、Audio、OCR、YOLO 等领域的 AI 套件 ,集成了大量主流和前沿的算法模型,是加速 AI 开发和研究的利器。在统一接口模块、降低学习开发成本的同时,用户可以更快地开发和应用不同的深度学习模型以解决不同领域的实际问题。

03

第五届 MindCon 极客周强势回归

为了让更多开发者体验昇思 MindSpore AI 开源框架的易用性和创新,第五届 MindCon 极客周年末强势回归,以昇思 “显眼孢” 争夺赛为主题,共有 5 个任务组成,您可以申请个人出战或者组队开黑,完成相应任务即可积累相应分数,积分最 高者胜,可赢大奖华为 Mate60!

任务一:“孢” 显热爱

MindCV、MindNLP 等系列套件入门到精通,速通热门大模型。

任务二:“孢” 显创新

将给定的应用案例从 MindSpore1.7 升级到 MindSpore2.0, 使用函数式 + 面向对象融合编程写法,并尽可能的使用套件

任务三:“孢” 显智慧

认领 SIG 任务,体验 MindQuantum、MindFlow 等 AI4Sci 前沿

任务四:“孢” 显能力

体验昇思大模型平台,完成多领域应用场景挑战,基于 MindSpore 的 GPT、LlaMA、ChatGLM 等模型微调

任务五:“孢” 显探索

打造自己的昇思 AIGC 精调模型,掌握轻松识别 “照骗” 的人生攻略

04

欢迎加入昇思MindSpore开源社区

2020 年 3 月 28 日,昇思 MindSpore AI 框架正式开源,作为一种全新的深度学习框架,旨在实现易开发、有效执行、全场景覆盖三大目标。截至 2023 年 12 月,昇思 MindSpore 已凝聚 650 万开发者,2.4 万 + 开发者在社区作出卓越贡献,基于昇思产业落地的大模型占国内整体应用大模型 40%+,服务超过 5500 + 企业,帮助客户构建应用方案,加速 AI 场景化应用。

作为国内领先的开源深度学习框架,昇思 MindSpore 着重提升框架易用性并降低 AI 开发者的开发门槛,使开发态变得更加友好,显著减少模型开发时间,降低模型开发门槛。在昇思框架建设中,除了来自昇思的工程师外,还汇聚了一批热爱昇思、热爱开源的开发者,他们正在用自己的方式参与昇思框架建设,与昇思共同成长。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Tykr:股票筛选和教育平台一体化,助您自信管理投资。

    Tykr是一个结合了股票筛选器和教育平台的应用程序,旨在帮助用户自信地管理自己的投资。自2020年以来,Tykr通过其产品、服务和教育帮助成千上万的投资者做出更好的投资决策。

  • SDXL Flash:高效能的文本到图像生成模型

    SDXL Flash是由SD社区与Project Fluently合作推出的文本到图像生成模型。它在保持生成图像质量的同时,提供了比LCM、Turbo、Lightning和Hyper更快的处理速度。该模型基于Stable Diffusion XL技术,通过优化步骤和CFG(Guidance)参数,实现了图像生成的高效率和高质量。

  • Jector:AI 创建工具,打造令人惊叹的产品照片。

    Jector是一个AI创作工具,专注于为产品摄影提供高质量的背景生成服务。它通过简化AI设置,提供独立的生成环境插槽,以及基于节点的图像生成历史记录,使得用户能够轻松创建和合成产品图像。Jector的主要优点包括无需复杂设置即可开始使用,提供简单但高度灵活的生成选项,自动产品合成,以及额外的清除和放大功能。此外,它还提供无限保存和下载功能,让用户可以轻松地为产品生成自己的心情历史。

  • Spon:一站式社区构建平台,管理活动、社区和成员。

    Spon是一个专为线下社区构建者设计的全功能平台,由人工智能提供支持。它允许用户从单一界面管理活动、社区和成员。它提供了多种工具来促进社区成员之间的互动,如即兴活动、有意义的讨论和专门的聊天。Spon还提供了社区发现、兴趣匹配和基于位置的搜索功能,帮助用户扩大社区影响力。此外,Spon还提供了一个内置钱包和真实奖励系统,鼓励社区领导者通过他们的努力获得认可和奖励。Spon的愿景是超越事件本身,强调社区的支持、友谊、勇气、好奇心、联系和爱。

  • ChatTTS:一个用于文本到语音转换的开源项目。

    ChatTTS是一个开源的文本到语音转换(TTS)模型,它允许用户将文本转换为语音。该模型主要面向学术研究和教育目的,不适用于商业或法律用途。它使用深度学习技术,能够生成自然流畅的语音输出,适合研究和开发语音合成技术的人员使用。

  • Doly for iPhone:快速轻松生成出色的3D产品视频。

    Doly是一款为iPhone 11及以上版本设计的应用程序,它允许用户通过简单的操作生成高质量的3D产品视频。这款应用通过提供一系列3D模板,使得用户能够快速创建出吸引人的产品展示视频,从而提升产品在社交媒体、广告或产品页面上的呈现效果。Doly的主要优点包括易用性、成本效益和高效的视频生成速度。

  • Streaks 66:66天习惯养成助手,AI智能指导。

    Streaks 66是一款习惯追踪应用程序,旨在帮助用户通过66天的挑战来建立持久的日常习惯。它提供了不同难度模式以适应不同用户的需求,并通过集成的AI习惯教练为用户提供个性化建议、激励和关于习惯和目标的洞察。此外,该应用程序还支持设置提醒、与朋友和家人分享习惯进展以及跨设备同步数据。

  • ChatGPT Notepad:在线文本编辑器,提供文本编辑、保存、复制、剪切等功能。

    ChatGPT Notepad是一款在线文本编辑器,旨在帮助用户高效地编辑和处理文本内容。它支持基本的文本编辑功能,如保存、复制、剪切等,同时提供全屏模式和大小写转换等高级功能。该产品重视用户隐私保护,不使用第三方跟踪工具,确保用户数据安全。

  • InternLM-Math-Plus:双语开源数学推理大型语言模型。

    InternLM-Math-Plus 是一个最新的双语(英文和中文)开源大型语言模型(LLM),专注于数学推理,具有解决、证明、验证和增强数学问题的能力。它在非正式数学推理(如思维链和代码解释)和正式数学推理(如LEAN 4翻译和证明)方面都有显著的性能提升。

  • Selfarama:用AI将孩子的肖像与画家相结合 生成书籍

    Selfarama 是一款教育图书产品,通过将孩子与历史上最伟大的画家联系起来,帮助他们学习艺术史知识。产品包含定制的孩子肖像画和通俗易懂的教育文本。

  • Open-Sora-Plan-v1.1.0:文本到视频生成的开源模型,性能卓越。

    Open-Sora-Plan是一个由北京大学元组团队开发的文本到视频生成模型。它在2024年4月首次推出v1.0.0版本,以其简单高效的设计和显著的性能在文本到视频生成领域获得了广泛认可。v1.1.0版本在视频生成质量和持续时间上进行了显著改进,包括更优的压缩视觉表示、更高的生成质量和更长的视频生成能力。该模型采用了优化的CausalVideoVAE架构,具有更强的性能和更高的推理效率。此外,它还保持了v1.0.0版本的极简设计和数据效率,并且与Sora基础模型的性能相似,表明其版本演进与Sora展示的扩展法则一致。

  • &udm=14:无AI干扰的谷歌搜索页面

    &udm=14的AI-Free Search是一个提供无AI干扰的谷歌搜索服务的网站,允许用户在没有人工智能干预的情况下进行搜索。它使用'udm=14'参数来实现这一点,旨在保护用户的隐私,同时提供快速、准确的搜索结果。该网站由Tedium团队构建,支持开源代码,用户可以通过Glitch或Github获取。

  • LookOnceToHear:实时语音提取智能耳机交互系统

    LookOnceToHear 是一种创新的智能耳机交互系统,允许用户通过简单的视觉识别来选择想要听到的目标说话者。这项技术在 CHI 2024 上获得了最佳论文荣誉提名。它通过合成音频混合、头相关传输函数(HRTFs)和双耳房间脉冲响应(BRIRs)来实现实时语音提取,为用户提供了一种新颖的交互方式。

  • Models Table:大型语言模型的详细列表和信息

    Models Table 提供了一个包含300多个大型语言模型的列表,这些模型被所有主要的AI实验室使用,包括Amazon Olympus, OpenAI GPT-5, OpenAI GPT-6等。该列表展示了大型语言模型的发展趋势和多样性,对于AI研究者和开发者来说是一个宝贵的资源。

  • ReVideo.pro:一键式AI视频制作工具,适用于社交媒体和商业广告。

    ReVideo是一款功能强大的在线视频制作工具,它集成了100多个高级模板、AI背景移除工具、无版权音乐和图片库等。用户可以通过ReVideo轻松创建适用于Facebook、Instagram、YouTube、TikTok、Snapchat、播客等多种平台的视频内容。ReVideo的主要优点包括:无需录制视频或面对镜头、AI自动转录音频为字幕、自动生成音频波形、一键式品牌资产个性化、媒体库集成、超过300万的库存照片和视频资源可供搜索等。此外,ReVideo还提供了商业许可,允许用户为其客户创建视频并保留100%的利润。

  • SignLLM:首个多语种手语生成模型,优化手语翻译与教学。

    SignLLM是首个多语种手语生成模型,它基于公共手语数据构建,包括美国手语(ASL)和其他七种手语。该模型能够从文本或提示生成手语手势,并通过强化学习加速训练过程,提高数据采样质量。SignLLM在八种手语的生产任务上都达到了最先进的性能。

  • InstructAvatar:文本引导的情感和动作控制,生成生动的2D头像

    InstructAvatar是一个创新的文本引导方法,用于生成具有丰富情感表达的2D头像。该模型通过自然语言接口控制头像的情感和面部动作,提供了细粒度控制、改进的交互性和对生成视频的泛化能力。它设计了一个自动化注释流程来构建指令-视频配对的训练数据集,并配备了一个新颖的双分支扩散基础生成器,可以同时根据音频和文本指令预测头像。实验结果表明,InstructAvatar在细粒度情感控制、唇同步质量和自然度方面均优于现有方法。

  • AnyNode:ComfyUI的节点,能够根据用户指令生成任何类型的输出。

    AnyNode是一个为ComfyUI设计的插件,它利用LLMs(大型语言模型)的能力,根据用户的输入生成所需的输出。它支持使用OpenAI API或本地LLMs API,允许用户通过简单的配置和指令,实现复杂的编程任务,无需编写代码。该插件的主要优点包括易用性、灵活性和强大的功能,能够显著提高开发效率,尤其适合需要快速原型开发和自动化任务的开发者。

  • FlashRAG:高效的检索增强生成研究工具包

    FlashRAG是一个Python工具包,用于检索增强生成(RAG)研究的复现和开发。它包括32个预处理的基准RAG数据集和12种最先进的RAG算法。FlashRAG提供了一个广泛且可定制的框架,包括检索器、重排器、生成器和压缩器等RAG场景所需的基本组件,允许灵活组装复杂流程。此外,FlashRAG还提供了高效的预处理阶段和优化的执行,支持vLLM、FastChat等工具加速LLM推理和向量索引管理。

  • MusicGPT:在本地使用 LLMs 根据自然语言提示生成音乐。

    MusicGPT 是一款允许在任何平台上以高性能方式在本地运行最新音乐生成 AI 模型的应用程序。它支持文本条件音乐生成、旋律条件音乐生成以及不确定长度 / 无限音乐流。产品优势在于无需安装重型依赖如 Python 或机器学习框架,能够本地运行 AI 模型,提供自然语言提示生成音乐的功能。

今日大家都在搜的词: