首页 > 传媒 > 关键词  > 正文

围绕算力+数据,矩阵起源建设开源 AI 原生软件平台

2024-05-21 18:11 · 稿源: 站长之家用户

一年多前,ChatGPT初露头角,其突破性的自然语言交互能力撼动了整个世界。之后十几个月,Transformer 架构和大语言模型 LLM 成为划时代的技术,激发了整个 AGI 领域的创业和创新。OpenAI 和 Google 相继推出了 GPT-4o、Project Astra 等「AI 全家桶」、字节跳动发布「豆包」大模型家族、腾讯发布混元大模型,AI 应用领域也百花齐放,进入了新的大发展阶段。此外,数字人、数字孪生、生命科学、具身智能、元宇宙等技术也正逐渐进入人们视野AI-Native 的时代正在向我们召唤,对于企业而言,研究和应用 AI 技术已然成为数字化乃至智能化转型的“必选题”。

而在繁荣的另一面,我们也清楚地看到 Transformer 架构高度依赖于“scaling law”,除了传统深度学习依赖的的算力、数据、算法要素,电力也加入进来,成为企业、数据科学家和应用开发者新的瓶颈。高电力消耗、高能源成本向云计算时代构建的基础设施发起了挑战;昂贵的算力成本和笨拙的海量数据处理放慢了应用创新的脚步;AI应用在场景发掘、开发、部署和运维方面的的理想实践,依然还在摸索中。

MatrixOS正式发布

为应对 AI 大模型时代的挑战,矩阵起源发布 MatrixOS 产品。MatrixOS 是一个开源开放的 AI-Native 操作系统,链接算力、数据、知识、模型与企业应用,提供一整套端到端的 AI Stack 服务框架。

MatrixOS 秉承开放理念,拥抱开源技术,整体以可快速插拔和扩展的容器化架构为基础,内置强大的异构数据存储及加工平台,同时涵盖各类开源大模型及精调、编排应用框架。MatrixOS 由三个核心子产品构成,既可以一站式组合服务,也可以由每个子产品独立提供服务。

MatrixDC:算力服务平台

MatrixDC 是一款异构算力管理及调度的软件产品,作为 MatrixOS 的算力底座,具备模块化、可扩展、高性能的云原生服务能力,为企业提供异构算力池化调度、超大规模算力集群、智能运维服务质量保障等一系列平台能力;通过灵活的计费模式,更高的性价比,满足客户多样化的需求场景;提供开箱即用的分布式算力池,为数据处理、训练、微调、推理提供快捷、稳定、有效、弹性的分布式支撑环境;面向开发者,提供完备的开发 API/SDK,助力企业快速接入 MatrixDC 平台,实现预期的业务目标。同时,MatrixDC 支持与 NVIDIA AI Enterprise 和 OminiVerse 软件平台的深度集成,配合全面的专家技术支持,为客户提供 AI 应用开发、模型训练、推理等全生命周期管理服务,助力企业实现 AI 赋能。同时 MatrixDC 也将逐步支持国产 GPU 芯片的集成,组网及算力服务。

MatrixDC:算力服务平台

MatrixOne:超融合数据管理平台

MatrixOne 是一款超融合数据管理平台。作为 MatrixOS 的数据处理层,它面向云原生和容器化设计,整体采用存算分离的架构,支持针对 OLTP,OLAP,时序,流计算,机器学习等多种异构负载,以及多种数据类型的处理。基于共享对象存储的存储层使得它得以极低的成本进行海量数据存储及分享协作,基于无状态容器化的计算层可以使得它快速弹性扩缩容以应对各类负载的波动。开发者可以基于 MatrixOne 快速的一站式的打造业务系统和数据分析应用,针对LLM大模型场景也可以基于其向量能力快速构建基于场景数据理解的知识库。MatrixOne 也是一个完全开源的项目,我们也非常欢迎社区开发者的加入和贡献。

MatrixOne:超融合数据管理平台

MatrixGenesis:AI 智能体开发平台

MatrixGenesis,作为 MatrixOS 的核心应用开发层,引领企业级 AI 应用进入一个全新的时代。这一创新平台不仅全链路覆盖了大模型的开发环节,还提供了从模型选择、部署、推理服务、精调,到与结构化系统数据实时打通的全生命周期开发支持。MatrixGenesis 致力于为企业提供端到端的开发流程体验,确保每一个环节都能无缝对接,从而加速 AI 应用的开发与部署。

MatrixGenesis 开发平台是专为 AI 开发者设计的,旨在提供一个有效、灵活的工具链和平台,支持从零到一的快速迭代大模型应用。无论是基于现有的基础模型还是自选模型,用户都能开发出符合自身应用场景的智能应用。MatrixGenesis 涵盖了从 Model Finetune(DPO,PPO)、Model Alignment 和 Model Evaluation,到知识库、知识图谱的建立,以及低代码构建 Multi-Agent Workflow 的全链路开发需求。此外,我们还提供针对特定场景的 RAG/Prompt 调优和评测,帮助开发者快速迭代,不断提升应用的实际AI能力。

同时 MatrixGenesis 也将联合合作伙伴打造开放式的模型,应用商店和智能体分享订阅能力,使得更多的开发者可以参与到智能应用的生态建设中,迅速为自己的智能体应用聚集用户,更好的服务所面对的用户。

MatrixGenesis:AI 智能体开发平台

展望未来:开放、合作、创新

基于 MatrixOS 和世纪互联 AIDC 万卡集群能力的 AI 原生云平台 neolink.AI 也即将发布,这是 MatrixOS 在行业内的初次大规模落地。

MatrixOS的发布,不仅是矩阵起源对AI未来的一次大胆预测和积极布局,更是对整个技术社区的一次诚挚邀请。欢迎更多的AIDC供应商,大模型厂商和数据智能应用厂商加入到这个开源开放的生态体系中来。我们坚信,通过开放合作、共享创新,我们可以共同推动AI技术的进步,为企业和社会创造更大的价值。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Eloquence:无需编码,基于数据做出决策。

    Eloquence是一个使决策基于数据的商业智能工具。它允许用户无需编码即可通过结构化的自然语言提出问题,快速连接数据库,过滤所需数据,并立即获得结果。Eloquence注重安全性,采用行业标准的加密技术保护数据,支持在线使用或部署在公司防火墙内,并且承诺不保存任何数据。

  • Vagabond:轻松规划,沉浸式旅行体验

    Vagabond是一个致力于提供个性化旅行规划服务的网站。它通过精心设计,为用户打造一个难忘的行程,满足用户的个性化旅行需求。

  • 橙篇AI:智能写作助手,一键生成内容,提升写作效率。

    橙篇AI是一款针对写作领域的智能工具,旨在通过AI技术提升用户的写作效率和质量。它拥有一键生成长文、资料搜索、文档总结、全文校正等功能,帮助用户快速整理思路、搜集资料和校对文本。橙篇AI的背景是随着AI技术的发展,越来越多的行业开始利用AI来提高工作效率,尤其是在内容创作领域。产品定位于辅助用户进行高效写作,无论是学术论文、商业报告还是日常笔记,都能通过橙篇AI得到快速生成和优化。目前产品提供免费试用,具体价格未在页面上明确标注。

  • LearnerOn:AI驱动的智能学习平台

    LearnerOn是一个面向企业,特别是人才领导者的先进学习体验平台(Learning eXperience Platform),提供高度个性化的学习和发展体验,技能和知识进度跟踪,以及支持公司成功转型为学习型组织。它通过集成学习资源目录、技能和职业,以及学习管理,简化了学习与发展(L&D)流程。LearnerOn利用AI技术提供个性化和吸引人的学习体验,并通过用户自助服务、同行学习和自上而下的模式,轻松跟踪学习进度。

  • Park Here:通过拍照停车标志,快速找到合适的停车位。

    Park Here 是一款旨在简化停车过程的移动应用程序。它通过让用户拍照停车标志,利用图像识别技术来提供用户当前位置的停车选项。该应用程序的背景是解决城市停车难题,帮助用户节省寻找停车位的时间,提高停车效率。

  • Supermaven:好用的GitHub Copilot 的平替

    Supermaven 是一个 AI 代码补全工具,利用 300,000 标记的上下文窗口,为开发者提供高质量的代码自动补全。它的主要优点在于速度快、准确度高、上下文理解能力强。Supermaven 的背景信息是基于深度学习模型,旨在提高编程效率。

  • ElevenLabs Text to Sound Effects:AI生成音效,从文本描述到声音效果的创新工具。

    Text to Sound Effects是ElevenLabs开发的最新AI音频模型,能够根据文本提示生成各种音效、短音乐曲目、音景和角色声音。它代表了音频制作领域的重大创新,为电影电视工作室、视频游戏开发者和社交媒体内容创作者提供了快速、经济、大规模生成丰富沉浸式音景的工具。该产品通过与Shutterstock的合作,利用其丰富的音频库中的授权曲目,经过精细调整,为现代创作者创造了一个多功能的新工具。

  • Video-MME:首个全面评估多模态大型语言模型在视频分析中的性能基准。

    Video-MME是一个专注于多模态大型语言模型(MLLMs)在视频分析领域性能评估的基准测试。它填补了现有评估方法中对MLLMs处理连续视觉数据能力的空白,为研究者提供了一个高质量和全面的评估平台。该基准测试覆盖了不同长度的视频,并针对MLLMs的核心能力进行了评估。

  • Fixie.ai:构建自然人类交流的实时人工智能

    Fixie.ai致力于开发能够像人类一样自然交流的人工智能模型。我们认为,有用的、高效的、易获取的通用人工智能(AGI)将需要能够在快节奏、模糊不清的自然人类交流世界中运作的模型。我们正在解决的问题是构建Ultravox,一个开源的、最先进的语音到语音模型;构建处理WebRTC上LLMs实时通信的最佳堆栈;在Town上构建新体验;在TheFastest.ai上跟踪模型和提供商的延迟;以及在AI领域探索可能性的边界。

  • ComfyUI Animated Optical Illusions:将炫酷的视错觉动画引入ComfyUI

    ComfyUI Animated Optical Illusions 是一款为ComfyUI用户界面设计的视觉插件,它通过动画视错觉效果,增强了用户的视觉体验,为界面设计带来了创新和趣味性。该插件采用Python语言开发,具有高度的可定制性和互动性,适合那些寻求在界面设计中添加新颖元素的开发者和设计师。

  • Outlines:强大的结构化文本生成工具

    Outlines是一个用于生成结构化文本的开源库,它支持多种模型集成,如OpenAI、transformers等,并提供了基于Jinja模板引擎的简单而强大的提示原语。它通过多种方式控制语言模型的生成,使输出更加可预测,从而提高模型效率并减少所需的示例数量。Outlines是提高包含大型语言模型的系统可靠性的第一步,通过确保模型输出与用户定义的代码之间有明确定义的接口。

  • Riffo:AI助手,简化文件重命名和组织流程

    Riffo是一款旨在帮助用户简化文件重命名和组织流程的AI助手。它通过智能技术,减少了文件管理中的猜测工作,使得文件组织变得简单快捷。Riffo支持多种文件格式,包括图片、Word文档、PDF等,并通过并行处理技术,能够快速完成大量文件的批量重命名。

  • RB-Modulation:无需训练的扩散模型个性化定制

    RB-Modulation是谷歌发布的一种基于随机最优控制的新型训练免费个性化扩散模型解决方案。它通过终端成本编码所需属性,实现风格和内容的精确提取与控制,无需额外训练,即可生成与参考图像风格一致且遵循给定文本提示的图像。该技术在无需训练的情况下,通过新颖的注意力特征聚合(AFA)模块,保持对参考图像的高保真度,并遵循给定的提示,具有重要的研究和应用价值。

  • Consistent character:创建不同姿势的给定角色图像

    cog-consistent-character 是一个基于 AI 的图像生成模型,允许用户创建给定角色在不同姿势下的图像。它利用了 Stable Diffusion 技术,通过 ComfyUI 提供了一个用户友好的界面,使得即使是没有编程背景的用户也能轻松生成高质量的图像。

  • Omost:将大型语言模型的编码能力转换为图像生成能力。

    Omost是一个旨在将大型语言模型(LLM)的编码能力转化为图像生成(更准确地说是图像组合)能力的项目。它提供了基于Llama3和Phi3变体的预训练LLM模型,这些模型能够编写代码以使用Omost的虚拟Canvas代理来组合图像视觉内容。Canvas可以由特定的图像生成器实现来实际生成图像。Omost项目背后的技术包括Direct Preference Optimization (DPO)和OpenAI GPT4o的多模态能力。

  • FastGPT:基于LLM大模型的开源AI知识库构建平台

    FastGPT是一个开源的AI知识库构建平台,提供数据处理、模型调用、RAG检索、可视化AI工作流编排等能力,帮助用户轻松构建复杂的AI应用。它支持特定领域AI客服的构建,自动化数据预处理,工作流编排,以及强大的API集成。FastGPT的优势在于其开源性、独特的QA结构、可视化工作流、无限扩展性、便于调试,并支持多种模型。

  • EasyAnimate:生成高分辨率和长视频的端到端解决方案

    EasyAnimate 是一个基于 transformer 架构的流水线,可以用于生成 AI 照片和视频,训练基线模型和 Lora 模型以用于 Diffusion Transformer。支持直接从预训练的 EasyAnimate 模型进行预测,生成不同分辨率、约 6 秒(24fps)的视频。用户还可以训练自己的基线模型和 Lora 模型以执行特定风格转换。

  • NVIDIA ACE:是一套用于创建数字人类、AI非玩家角色和交互式头像的生成式AI技术套件。

    NVIDIA ACE提供了一套先进的生成式AI模型和微服务,易于部署且性能优越。这些AI模型基于商业安全、负责任许可的数据进行训练,并通过微调和防护措施确保无论用户输入如何,都能提供准确、恰当、切题的结果。ACE支持灵活的部署选项,可以在云端或NVIDIA RTX AI PC上部署和运行。此外,ACE还提供了数字人类工作流程,允许开发者将ACE NIMs集成到他们的产品、工具、服务或游戏中,用于特定领域的AI工作流程,如NPC和客户服务助手。NVIDIA还与Inworld AI合作,展示了将NVIDIA ACE集成到一个端到端NPC平台中的示例,该平台在Unreal Engine 5中提供了尖端的视觉效果。

  • Illuminate:将学术论文转化为AI生成的音频讨论。

    Illuminate是谷歌推出的一个创新的教育工具,它利用人工智能技术将复杂的学术论文转化为易于理解的音频讨论,帮助用户以更直观、互动的方式学习和理解学术内容。该产品通过简化学习过程,提高了学习效率,尤其适合快节奏和多样化的学习需求。

  • JobCopilot:自动化求职助手,提升面试机会

    JobCopilot是一款在线求职自动化工具,旨在帮助求职者通过自动化技术提高求职效率,节省时间,增加面试机会。它通过人工智能技术,帮助用户自动搜索和申请工作,跟踪申请进度,并提供AI简历和求职信的构建服务。JobCopilot的背景是现代求职者需要面对大量的职位申请,手动填写申请表既耗时又重复,而JobCopilot通过自动化服务,简化了这一过程,帮助用户专注于更重要的事情,如面试准备和职业发展。

今日大家都在搜的词: