首页 > 传媒 > 关键词  > 正文

爱芯元智获评人工智能大会“最具创新价值产品奖”并正式发布爱芯派Pro

2023-08-25 14:10 · 稿源: 站长之家用户

2023 年 8 月 23 日,由电子发烧友网和elexcon深圳国际电子展联合主办的 2023 第七届人工智能大会在深圳召开。以“智向远大,能者千面”为主题,本届大会汇聚行业的专家、学者、企业代表,共同寻找人工智能产业发展新机遇。

爱芯元智AI推理引擎总监唐琦受邀出席大会,发表《Transformer视觉大模型在边缘侧的部署》主题演讲,分享基于爱芯通元混合精度NPU部署Transformer视觉模型的落地实践,并正式发布开发者套件——爱芯派Pro。第四届人工智能卓越创新奖同期颁发,凭借在边缘AI赛道的强大自研实力和突出落地成果,爱芯元智AX650N获评“最 具创新价值产品奖”。

端侧智能快速普及 Transformer视觉模型应用走向新高度

自 2015 年,AI模型的物体识别准确率在ImageNet的图像分类比赛中首 次超过人类以来,人工智能行业便正式进入到新航海时代。而近年来,伴随着芯片行业制程的进步以及AI模型小型化、轻量化的趋势,AI模型在扫地机器人、家用摄像头、智能音箱等产品的本地化部署成为现实,端侧智能得到普及。

“到现在为止,基于传统CNN模型的云、边、端三角互补的算力主线已经完成”,唐琦在演讲中表示。而在AI模型从云端往端侧迁移的过程中,Transformer网络结构也在不断进步,并随着ChatGPT的火爆备受关注。回顾Transformer视觉模型的发展历史,从基于Transformer网络结构的语义分割模型应用于自动驾驶场景,到分割万物的SAM和基座视觉大模型DINOv2,Transformer视觉模型的应用正走向新的高度。

致力于打造领先的人工智能视觉芯片,爱芯元智专注于高性能、低功耗的边缘侧、端侧人工智能处理器芯片开发,布局智慧城市、智能驾驶和AIoT三大业务市场。基于智慧城市的升级改造,L2/L2+智能驾驶的应用大规模落地,以及终端设备智能化需求的扩大,爱芯元智将在边缘感知智能芯片上持续投入,持续打造感知和计算基础能力。

加快AI开发落地效率 用视觉连接数字世界和物理世界

从智慧城市到智能驾驶再到AIoT,爱芯元智之所以能做到三大应用场景全覆盖,依托于公司自研的爱芯智眸AI-ISP和爱芯通元混合精度NPU两大核心技术。

爱芯智眸AI-ISP是将深度学习算法与传统的ISP处理单元相结合,作为万物智能的“眼睛”感知更多信息,特别是暗光全彩的刚需。其拥有六大技术亮点:AI星光全彩、AI HDR成像、AI多光谱融合、AI防抖、AI场景增强、AI多传感器融合,在暗黑道路、隧道出口、颠簸路段等多个行车场景下可全面提高画质,实现更优质的视觉效果。

爱芯通元混合精度NPU作为爱芯元智另一大核心自研技术,支持INT4/INT8/INT16 三种计算精度,具有高性能、低成本、易使用的突出优势。值得一提的是,在汲取前两代产品的市场反馈并结合行业前沿技术的发展趋势之下,第三代爱芯通元混合精度NPU进一步增强了算子支持种类和不同精度的混合计算,优化了内部内存调度机制,同时可有效率支持CNN网络和Transformer网络模型。而针对爱芯通元3.0 NPU研发的工具链——Pulsar2 则进一步完善了工具链的功能和易用性,支持主流深度学习训练框架的模型部署,支持PTQ、QAT两种不同的量化操作,满足各种场景的量化调优功能。

Transformer模型在爱芯元智NPU上部署非常简单有效,以SwinT模型为例:从PyTorch的官方ModelZoo上直接下载SwinT的ONNX模型,不需要做任何模型或算子修改,就可以实现SwinT的量化压缩和编译,达到199 FPS/W的高能效比。而会上获评“最 具创新价值产品奖”的AX650N作为爱芯元智在今年推出的高性能芯片产品,基于第三代NPU,在边缘侧、端侧部署Transformer具有高性能、高精度、易部署、低功耗等特性,是业内排名靠前的Transformer落地平台。

打造芯片开发者生态 爱芯派Pro助力视觉大模型落地

大会上,爱芯元智正式推出开发者套件——“爱芯派Pro”,这款联合硬件生态伙伴共同打造的开发者套件,意在为社区开发者低成本地体验视觉大模型在边缘侧、端侧的便捷部署。爱芯派Pro搭载AX650N,拥有高算力和超强编解码能力,可满足行业对高性能边缘智能计算的需求,实现视频结构化、行为分析、状态检测等应用,有效率支持CNN模型和Transformer视觉大模型。

在爱芯派Pro发售的同时,爱芯元智还将释放集成模型量化、模型编译、模型部署三合一功能的新一代AI工具链Pulsar2 的社区版本以及丰富的开发文档,方便用户快速进行产品原型验证和二次开发,帮助用户在智慧城市、智慧交通、智慧教育、智能制造等领域发挥更大的价值。

目前,爱芯元智已经量产了四代多颗应用于不同行业领域的视觉感知芯片,并坚持基于算法、芯片、产品的垂直整合,为合作伙伴提供全栈式解决方案,帮助客户实现最 新技术的快速落地。面向人工智能产业的高速发展,爱芯元智也将通过持续的技术创新,提高芯片性能、降低成本,让边端智能更加普惠,最终实现“普惠AI 造就美好生活”的使命。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Partnerplace:合作伙伴管理工具,提升合作效率。

    Partnerplace是一款专为合作伙伴关系管理设计的在线工具,它通过自动化繁琐的任务,如佣金处理,帮助企业高效管理和发展合作伙伴网络。该工具支持定制化合作伙伴计划,实现品牌专业体验,并通过集中化平台提高工作效率。Partnerplace的价值观包括弹性、参与度和连接性,旨在为用户提供一个完全定制化的、参与性强的、连接销售团队和CRM系统的合作伙伴管理系统。

  • Depth Anything V2:先进的单目深度估计模型

    Depth Anything V2 是一个经过改进的单目深度估计模型,它通过使用合成图像和大量未标记的真实图像进行训练,提供了比前一版本更精细、更鲁棒的深度预测。该模型在效率和准确性方面都有显著提升,速度比基于Stable Diffusion的最新模型快10倍以上。

  • OTTO SEO by Search Atlas:革命性的AI SEO工具,简化SEO工作流程。

    OTTO SEO是Search Atlas推出的一款AI驱动的SEO工具,旨在通过自动化技术优化网站,提高SEO效率。它通过添加OTTO像素到网站,能够自动执行网页优化,包括技术修复、内容优化、反向链接建设和内容创作。OTTO SEO的主要优点在于节省时间、提高效率,并帮助营销团队或代理公司实现SEO策略的自动化和优化。

  • AI drafts by Help Scout:提升客服团队效率,实现个性化客户服务。

    Help Scout提供的AI客服平台,通过人工智能技术,帮助客服团队提升工作效率,减少重复性工作,让团队成员能够专注于更复杂和个性化的客户对话。平台特点包括无需编程即可使用、快速回复、提升客户满意度,以及通过AI生成回复草稿等。

  • OpenVLA:开源视觉-语言-动作模型,推动机器人操作技术发展。

    OpenVLA是一个具有7亿参数的开源视觉-语言-动作(VLA)模型,通过在Open X-Embodiment数据集上的970k机器人剧集进行预训练。该模型在通用机器人操作策略上设定了新的行业标准,支持开箱即用控制多个机器人,并且可以通过参数高效的微调快速适应新的机器人设置。OpenVLA的检查点和PyTorch训练流程完全开源,模型可以从HuggingFace下载并进行微调。

  • VideoLLaMA 2:视频理解领域的先进空间-时间建模与音频理解模型。

    VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。该模型在多选视频问答和视频字幕生成等任务上展现了卓越的性能。

  • HumanPlus:人类动作模仿与自主技能学习系统

    HumanPlus是一个研究项目,旨在通过模仿人类动作来训练人形机器人,从而实现自主技能学习。该项目通过模拟强化学习训练低级策略,并将这些策略应用到真实世界中,实现实时跟踪人类身体和手部动作。通过影子模仿技术,操作员可以远程操作机器人收集全身数据,用于学习不同任务。此外,通过行为克隆技术,机器人能够模仿人类技能,完成各种任务。

  • Jace:AI助手,助力高效营销与管理。

    Jace是一款商业领域的AI助手,专注于提升营销效率,无需专业技能即可轻松启动和管理营销活动。其主要优点包括创建针对性的营销活动、实时监控性能和随时优化。

  • ARC-AGI:人工智能通用推理测试集

    ARC-AGI是一个旨在测试人工智能系统是否具备类似人类一般流体智力的抽象和推理能力的数据集。它由400个训练任务和400个评估任务组成,每个任务都以JSON格式存储,包括输入输出对。该数据集可以作为人工智能基准测试、程序合成基准测试或心理测量智力测试。

  • PROTEUS:实时表情生成人类模型

    PROTEUS是Apparate Labs推出的一款下一代基础模型,用于实时表情生成人类。它采用先进的transformer架构的潜在扩散模型,创新的潜在空间设计实现了实时效率,并能通过进一步的架构和算法改进,达到每秒100帧以上视频流。PROTEUS旨在提供一种通过语音控制的视觉体现,为人工对话实体提供直观的接口,并且与多种大型语言模型兼容,可定制用于多种不同应用。

  • Warp:AI和协作工具重新定义的终端

    Warp是一款使用Rust语言编写的终端应用程序,它通过集成AI和协作工具,提供了现代化的编辑、命令生成、可复用工作流和知识共享等功能,旨在提升开发者的生产力。Warp的AI功能可以建议正确的命令或解答编程问题,同时保持请求的私密性和安全性。Warp Drive允许用户组织难以记忆的命令,提高个人和团队的效率。此外,Warp还提供了自定义主题和以隐私为设计原则的安全性。

  • TalkWithGemini:一键部署您的私人Gemini应用

    TalkWithGemini 是一款支持一键免费部署的跨平台应用,用户可以通过这个应用与 Gemini 模型进行交互,支持图片识别、语音对话等多模态交互方式,提高工作效率。

  • PowerInfer-2:专为智能手机设计的高效大型语言模型推理框架

    PowerInfer-2是一个为智能手机特别优化的推理框架,支持高达47B参数的MoE模型,实现了每秒11.68个token的推理速度,比其他框架快22倍。它通过异构计算和I/O-Compute流水线技术,显著减少了内存使用,并提高了推理速度。该框架适用于需要在移动设备上部署大型模型的场景,以增强数据隐私和性能。

  • emo-visual-data:表情包视觉标注数据集

    emo-visual-data 是一个公开的表情包视觉标注数据集,它通过使用 glm-4v 和 step-free-api 项目完成的视觉标注,收集了5329个表情包。这个数据集可以用于训练和测试多模态大模型,对于理解图像内容和文本描述之间的关系具有重要意义。

  • E3Gen:高效、表现力强、可编辑的数字头像生成

    E3Gen是一种新型的数字头像生成方法,能够实时生成高保真度的头像,具有详细的衣物褶皱,并支持多种视角和全身姿势的全面控制,以及属性转移和局部编辑。它通过将3D高斯编码到结构化的2D UV空间中,解决了3D高斯与当前生成流程不兼容的问题,并探索了在涉及多个主体的训练中3D高斯的表现力动画。

  • Surface:使用AI提升表单转化率

    Surface是一个基于AI技术的在线表单构建工具,专为营销和需求生成团队、CRO专家以及领英生成团队设计。它提供了一个无代码表单构建器,能够创建与品牌匹配的多步表单,提升转化率并收集部分响应数据。通过AI技术,Surface可以提高潜在客户的筛选过程,确保用户专注于最有希望的潜在客户。此外,它还提供了强大的入站工作流程自动化,以及2000多个集成选项,帮助用户有效地捕获、培养和转化潜在客户。

  • MotionClone:训练无关的运动克隆,实现可控视频生成

    MotionClone是一个训练无关的框架,允许从参考视频进行运动克隆,以控制文本到视频的生成。它利用时间注意力机制在视频反转中表示参考视频中的运动,并引入了主时间注意力引导来减轻注意力权重中噪声或非常微妙运动的影响。此外,为了协助生成模型合成合理的空间关系并增强其提示跟随能力,提出了一种利用参考视频中的前景粗略位置和原始分类器自由引导特征的位置感知语义引导机制。

  • Leonardo Phoenix:创新的AI基础模型,提供卓越的提示遵循能力。

    Leonardo Phoenix是Leonardo AI平台推出的一款基础模型,它在提示遵循、图像生成清晰度和AI研究方面取得了突破性进展。该模型通过架构创新,提供了更高质量的图像生成,特别是在人像、横幅、海报和标志的文本生成方面表现出色。此外,它还增强了创造性控制,允许用户通过提示增强和AI提示编辑来轻松获取和快速修改生成内容。尽管目前一些功能如图像引导、元素和照片写实尚未集成,但预计将在不久的将来加入。

  • Uizard Autodesigner 2.0:AI驱动的UI设计生成器,快速实现设计和原型制作。

    Autodesigner 2.0是Uizard公司推出的最新版AI UI设计生成器,它结合了ChatGPT的对话流和Uizard的生成设计能力以及拖放编辑器,使用户能够仅通过文本提示实时设计和迭代。该产品通过AI技术简化了UI设计流程,提高了设计效率,尤其适合产品经理、设计师、市场营销人员、初创公司创始人和开发者等不同背景的用户。

  • KREA AI Enhancer:视频和图像增强工具,提升画质清晰度。

    KREA AI - Enhancer 是一款在线视频和图像增强工具,利用AI技术提升视频和图像的清晰度和质量。它通过实时处理,帮助用户改善视觉内容,适用于需要高质量视觉素材的专业人士和爱好者。产品背景信息显示,KREA AI - Enhancer 通过AI算法优化,能够在短时间内提供高质量的输出,是内容创作者和编辑者的理想选择。

今日大家都在搜的词:

热文

  • 3 天
  • 7天