首页 > 传媒 > 关键词  > 视频直播最新资讯  > 正文

面向多样化智能应用场景,安谋科技发布“玲珑”DPU和新一代VPU

2024-09-20 10:20 · 稿源: 站长之家用户

当前,受视频直播、AR/VR、智驾智舱等新兴应用场景和使用人群的飞速增长,视频编解码及显示处理领域呈现出旺盛需求,进而带动了下游设备数量不断攀升。以智能汽车为例,根据盖世汽车研究院的产业报告显示,预计 2025 年国内车载摄像头搭载量将超 1 亿颗,车载显示市场规模也将达到1208. 3 亿元。

同时,视频、图像等数字多媒体数据流所涵盖的应用场景日趋碎片化,多媒体信息处理任务也变得愈发繁多且复杂,对云、边、端等设备的图像显示处理和视频编解码能力均提出了更高要求。

对此,安谋科技(中国)有限公司(以下简称“安谋科技”)于 9 月 19 日正式推出本土自研的首 款“玲珑”D8/D6/D2 显示处理器,以及新一代的“玲珑”V510/V710 视频处理器。聚焦国内前沿技术趋势,安谋科技全新亮相的处理器新品能够满足多样化智能应用场景的性能功耗配置需求,助力国产芯片厂商在多媒体技术领域实现创新跃进。

扎根场景,紧扣需求,安谋科技既要做好学徒,又要当好标兵

结合行业特点来看,数字多媒体是一个典型的高度碎片化市场,不同细分场景对视频图像显示和超高清编解码的需求差异很大。对于安谋科技来说,如何平衡好产品标准化和适用性,并兼顾好不同客户和垂直行业的差异化需求,是本土产品研发中需要重点考量的地方。

作为一家诞生于本土、根植于本土、服务于本土的芯片IP企业,安谋科技在“玲珑”多媒体新品的研发中始终聚焦于国内行业伙伴的实际创新需求,与客户保持密切沟通,通过客户做“师傅”、研发做“学徒”的方式,把客户的行业实践积累和安谋科技的专业IP技术进行叠加,实现优势互补。

另一方面,安谋科技充分发挥全球领先的Arm技术生态优势,并从IP上游视角进行系统性考量,综合平衡性能、功耗、成本、面积等关键要素,为本土客户提供多元化且符合本土产业需求的产品和解决方案,当好“标兵”,助力国产芯片厂商在产品快速研发和上市的同时,亦能保持足够的差异化竞争优势。

对此,安谋科技产品研发副总裁刘浩表示:“当前,基于视频图像的数字多媒体技术与各领域的融合正不断提速,由此催生了许多智能化程度更高、人机交互更流畅的新业态和新应用。在‘玲珑’D8/D6/D2 DPU与‘玲珑’V510/V710 VPU的加持下,安谋科技将针对主流市场不断迭代的高画质显示和高清视频编解码需求,提供更优质、丰富的多媒体解决方案,并协同自研NPU、CPU及SPU等计算单元,为国内半导体厂商夯实核心技术底座。凭借产品多样性和可扩展性,以及团队扎根本土市场的紧密性,安谋科技自研业务目前已成功授权超过 220 家本土厂商,相关芯片累计出货量突破 5 亿颗,深度赋能国内半导体产业提质升级。”

玲珑”D8/D6/D2 DPU:超高画质图像显示“芯”引擎

作为安谋科技本土自研的首 款显示处理器,“玲珑”D8/D6/D2 DPU凭借其灵活扩展、有效低延时、低系统宽带及高数据安全等优势,能够为汽车座舱、手机、PC、平板电脑、电视、可穿戴设备等智能终端提供超高画质显示体验。

“玲珑”D8/D6/D2 DPU基于多核架构设计,支持按需灵活编程与配置,单核性能可高达每秒8K60 帧,或能同时处理 4 路每秒4K60 帧的实时显示输出,最多可支持 16 层的内容输入,有效促进系统资源的利用和管理。得益于与Arm®架构的深度协同,“玲珑”D8/D6/D2 DPU集成了Arm帧缓冲压缩(AFBC)技术,在确保整体系统方案的高性能和高画质的前提下,最 大限度地节省带宽及功耗。其内置的Arm系统存储管理单元MMU-600/ 700 中的转换缓冲单元(TBU)模块,可针对不同显示场景进行专门优化,以进一步降低系统访问延时。此外,“玲珑”D8/D6/D2 DPU还支持Arm TrustZone®媒体保护(TZMP)架构,实现了软硬一体化设计,能够为显示数据的安全性提供大力保障。

图:“玲珑”D8/D6/D2 DPU概览

对比前代产品Arm Mali™-D71/D51/D37 DPU,全新“玲珑”D8/D6/D2 DPU实现了核心性能的两倍提升。具体而言,其单核性能从原先最 高支持的每秒4K120 帧提高至每秒8K60 帧,而且同时支持的实时显示输出从 2 路扩展至 4 路,充分满足了智能应用场景的多元化显示需求。

“玲珑”V510/V710 VPU:新一代超高清视频处理核芯

为了应对高清视频技术普及所带来的海量信息传输和存储挑战,业内最 新的国际视频编码标准H. 266 能够提高4K和8K超高清视频的压缩效率。在同等画质下,H. 266 能够比上一代标准节省约50%的流量,高清视频的传输和存储成本得以显著降低。

作为国内首批同时支持H. 266 标准的编码及解码视频处理器,“玲珑”V510/V710 VPU采用了多核多格式编解码融合的可编程处理架构,单核的编码或解码性能可达到每秒4K60 帧,根据端、边、云等不同场景需求,分别提供1- 4 核、4- 8 核等多种配置。在大幅节省存储空间及带宽成本的同时,“玲珑”V510/V710 VPU还能轻松按需配置,确保系统性能、功耗和面积的最 佳平衡。

图:“玲珑”V510/V710 VPU概览

相较于前代“玲珑”V6/V8 VPU,新一代“玲珑”V510/V710 VPU的编解码性能均实现了翻倍提升,并且在4K/8K应用场景中的编码质量可提高25%以上,特别新增了屏幕显示菜单OSD前处理功能,更好地兼顾主流市场和新兴应用的实时编解码需求。除此之外,为帮助开发者基于各种视频编解码标准进行快速部署,“玲珑”V510/V710 VPU还提供了一整套完备的固件工具及软件支持,凭借软硬件交互的架构设计,开发者后续还可通过软件升级对既有硬件进行灵活扩展和优化。

历经三年的迭代与优化,“玲珑”VPU已授权超过 30 家国内合作伙伴,并广泛应用于手机终端、PC、智能汽车、智能安防等众多视频应用场景。未来,安谋科技“玲珑”产品线将继续强化其多媒体技术栈,同时整合先进的AI处理单元,力求在AI手机、AI PC、智能汽车、数据中心等领域,发挥更高阶的智能影像“芯”作用。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 51chat:全能AI助手,提供对话、搜索、写作等功能

    51chat是一个全能AI助手网站,提供对话、搜索、写作等功能。它通过大模型生成内容,帮助用户一键总结网页链接概要、生成小红书爆款内容、进行多语言翻译等。产品背景信息显示,51chat致力于提供高效、准确的AI服务,以满足用户的多样化需求。目前产品提供免费试用,具体价格和定位需进一步了解。

  • VideoMaker:免费在线工具,将文本和图片转换为视频

    VideoMaker Luma AI视频生成器是一个利用AI技术快速轻松创建高质量视频的平台,提供文本转视频和图片转视频功能,让用户能够将文本和图片转化为引人入胜的视频。该平台通过免费的AI视频制作工具和在线视频制作工具,提供了一种专业且用户友好的体验,无需任何编辑技能。Luma AI以其在AI技术领域的创新而闻名,特别是在3D建模方面。其最新的创新产品Dream Machine模型是一款AI视频生成器,可以通过文本和图片输入生成高质量、逼真的视频,具备流畅的动作和一致的背景,相较于以前的AI视频生成器是一个显著的改进。

  • Electronic-Component-Sorter:AI驱动的电子元件分类器,智能组件管理的终极解决方案。

    Vanguard-s/Electronic-Component-Sorter是一个利用机器学习和人工智能自动化识别和分类电子元件的项目。该项目通过深度学习模型,能够将电子元件分为电阻、电容、LED、晶体管等七大类,并通过OCR技术进一步获取元件的详细信息。它的重要性在于减少人工分类错误,提高效率,确保安全性,并帮助视觉障碍人士更便捷地识别电子元件。

  • URL Parser Online:在线URL解析器,将URL转换为适合大型语言模型的输入格式。

    URL Parser Online是一个在线工具,它能够将复杂的URL转换为适合大型语言模型(LLMs)使用的输入格式。这项技术的重要性在于它能够帮助开发者和研究人员更有效地处理和解析URL数据,尤其是在进行网页内容分析和数据抽取时。产品背景信息显示,随着互联网数据量的爆炸式增长,对URL的解析和处理需求日益增加。URL Parser Online以其简洁的用户界面和高效的解析能力,为用户提供了一个便捷的解决方案。该产品目前提供免费服务,定位于开发者和数据分析师。

  • AI Summarizer:全能AI摘要生成器,快速生成文本、PDF、视频摘要。

    AI Summarizer是一个强大的AI摘要生成器,支持文本、PDF、视频等多种格式的摘要生成。它通过先进的算法提取关键信息,帮助用户快速理解内容要点,提升工作和学习效率。产品支持超过50种语言,保障用户隐私,不存储任何上传文件,并提供免费的Chrome扩展插件,方便用户随时随地使用。

  • Transcribro:Android平台上的私有、设备端语音识别键盘和文字服务

    Transcribro是一款运行在Android平台上的私有、设备端语音识别键盘和文字服务应用,它使用whisper.cpp来运行OpenAI Whisper系列模型,并结合Silero VAD进行语音活动检测。该应用提供了语音输入键盘,允许用户通过语音进行文字输入,并且可以被其他应用显式使用,或者设置为用户选择的语音转文字应用,部分应用可能会使用它来进行语音转文字。Transcribro的背景是为用户提供一种更安全、更私密的语音转文字解决方案,避免了云端处理可能带来的隐私泄露问题。该应用是开源的,用户可以自由地查看、修改和分发代码。

  • Oasis:基于Transformer的实时开放世界AI模型

    Oasis是由Decart AI开发的首个可玩、实时、开放世界的AI模型,它是一个互动视频游戏,由Transformer端到端生成,基于逐帧生成。Oasis能够接收用户键盘和鼠标输入,实时生成游戏玩法,内部模拟物理、游戏规则和图形。该模型通过直接观察游戏玩法学习,允许用户移动、跳跃、拾取物品、破坏方块等。Oasis被视为研究更复杂交互世界的基础模型的第一步,未来可能取代传统的游戏引擎。Oasis的实现需要模型架构的改进和模型推理技术的突破,以实现用户与模型的实时交互。Decart AI采用了最新的扩散训练和Transformer模型方法,并结合了大型语言模型(LLMs)来训练一个自回归模型,该模型可以根据用户即时动作生成视频。此外,Decart AI还开发了专有的推理框架,以提供NVIDIA H100 Tensor Core GPU的峰值利用率,并支持Etched即将推出的Sohu芯片。

  • 三顿智能助手:多功能AI助手,提供问答、写作、绘图等智能服务。

    三顿智能助手是一个集成了多种AI功能的在线平台,它通过提供问答、写作、绘图等多种服务,帮助用户提高工作效率和创造力。该产品以其强大的AI技术背景和用户友好的界面,为用户提供了一个便捷的智能服务入口。价格方面,三顿智能助手提供免费试用,同时也提供付费服务以解锁更多功能。

  • Light Novels:AI驱动的轻小说阅读平台,提供个性化推荐和翻译

    Explore Light Novels是一个AI驱动的轻小说阅读平台,旨在通过人工智能技术打破语言障碍,为全球读者提供沉浸式的轻小说阅读体验。平台拥有数千部流行轻小说,并提供AI驱动的个性化推荐,每日更新新章节和根据读者偏好定制的新鲜内容。此外,平台还提供AI生成的文化背景注释,帮助读者深入了解故事背景,并通过AI推荐系统学习用户的轻小说偏好,推荐新作者和故事。平台还设有AI主持的全球社区讨论,以及AI生成的每日内容,确保读者总有新鲜内容可读。

  • SDXL_EcomID_ComfyUI:ComfyUI的EcomID原生支持插件

    SDXL_EcomID_ComfyUI是一个为ComfyUI提供原生SDXL-EcomID支持的插件。它通过增强肖像表示,提供更真实、审美上更令人愉悦的外观,同时确保语义一致性和更大的内部ID相似性。这个插件完全集成于ComfyUI,并且不使用diffusers,而是本地实现EcomID。它的重要性在于能够提升图像生成的质量和一致性,特别是在处理人物肖像时,能够保持不同年龄、发型、眼镜等物理变化下的内部特征一致性。

  • Promega:通过ChatGPT加速制造、销售和市场营销。

    Promega是一家在生命科学领域领先的公司,提供用于研究和应用技术的开创性生物试剂和集成系统。Promega通过自上而下地采用ChatGPT,帮助员工更高效地管理数千种产品和超过60,000个账户,从而加速产品交付到生物技术生态系统。ChatGPT的使用不仅提高了工作效率,还增强了客户关系,并在制造、销售和市场营销等多个领域发挥了重要作用。

  • Excerptor:从实体书籍中提取划线或手写标记的文本

    Excerptor是一个专门设计来从实体书籍中提取划线或手写标记文本的工具。它通过图像处理和光学字符识别技术,将书籍中的标记文本转换为数字格式,方便用户编辑和保存。这项技术的重要性在于它能够帮助用户快速从大量书籍中提取关键信息,提高研究和学习的效率。Excerptor以其高效、准确的文本识别能力和用户友好的操作界面,满足了学术研究、教育和个人学习等不同领域的需求。目前,Excerptor是免费提供给用户的,它的开发和维护由开源社区负责。

  • Spafe Code:AI代码翻译器

    Spafe Code是一个利用人工智能技术实现代码翻译的平台,它能够将代码从一种编程语言翻译成另一种编程语言。这项技术的重要性在于它能够帮助开发者跨越语言障碍,提高代码的可读性和可维护性,促进全球开发者之间的协作。Spafe Code以其高效的翻译能力、易用性和对多种编程语言的支持而受到开发者的欢迎。目前,Spafe Code提供免费试用,具体价格和定位信息需要进一步查询。

  • Browser AI Kit:在浏览器中直接运行的AI工具箱

    Browser AI Kit是一个集成了多种AI工具的平台,用户可以在浏览器中直接使用这些工具,无需安装或设置。它提供了音频转文本、去除背景、文本转语音等多种功能,并且完全免费。这个工具箱基于Transformers.js开发,强调数据安全和隐私保护,所有数据处理都在本地进行,不上传任何服务器。它的目标是为用户提供一个便捷、安全、多功能的AI工具平台。

  • Emotive AI Actors by CreatorKit:视频广告中的情感AI演员

    Emotive AI Actors by CreatorKit是一个利用人工智能技术创建用户生成内容(UGC)视频和广告的平台。它通过与真实UGC演员和内容策略师合作训练AI,使得用户能够快速创建出具有真实情感反应的视频广告。这个产品的重要性在于它能够以更低的成本、更快的速度和更好的性能来替代传统的视频制作方式,同时提供可扩展的解决方案,允许用户在几分钟内创建出100个视频广告。AI Actors的主要优点包括成本效益、快速制作、性能优越和易于扩展。

  • SELA:通过结合蒙特卡洛树搜索和基于LLM的代理来增强自动化机器学习。

    SELA是一个创新系统,它通过将蒙特卡洛树搜索(MCTS)与基于大型语言模型(LLM)的代理结合起来,增强了自动化机器学习(AutoML)。传统的AutoML方法经常产生低多样性和次优的代码,限制了它们在模型选择和集成方面的有效性。SELA通过将管道配置表示为树,使代理能够智能地探索解决方案空间,并根据实验反馈迭代改进其策略。

  • Universal-2:下一代语音AI,提供卓越的音频数据处理能力。

    Universal-2是AssemblyAI推出的最新语音识别模型,它在准确度和精确度上超越了前一代Universal-1,能够更好地捕捉人类语言的复杂性,为用户提供无需二次检查的音频数据。这一技术的重要性在于它能够为产品体验提供更敏锐的洞察力、更快的工作流程和一流的产品体验。Universal-2在专有名词识别、文本格式化和字母数字识别方面都有显著提升,减少了实际应用中的词错误率。

  • Laminar.ai:开源全栈平台,为打造顶级LLM产品提供支持

    Laminar是一个开源的全栈平台,专注于从第一性原理出发进行AI工程。它帮助用户收集、理解和使用数据,以提高大型语言模型(LLM)应用的质量。Laminar支持对文本和图像模型的追踪,并且即将支持音频模型。产品的主要优点包括零开销的可观测性、在线评估、数据集构建和LLM链管理。Laminar完全开源,易于自托管,适合需要构建和管理LLM产品的开发者和团队。

  • HOVER:人形机器人多功能神经全身控制器

    HOVER是一个针对人形机器人的多功能神经全身控制器,它通过模仿全身运动来提供通用的运动技能,学习多种全身控制模式。HOVER通过多模式策略蒸馏框架将不同的控制模式整合到一个统一的策略中,实现了在不同控制模式之间的无缝切换,同时保留了每种模式的独特优势。这种控制器提高了人形机器人在多种模式下的控制效率和灵活性,为未来的机器人应用提供了一个健壮且可扩展的解决方案。

  • LinkedIn Hiring Assistant:LinkedIn招聘助手,助力招聘流程自动化。

    Hiring Assistant for Recruiter & Jobs是LinkedIn推出的一款AI助手,旨在帮助招聘人员自动化执行耗时的任务,从而让他们专注于更有影响力的、以人为中心的工作部分。这款产品代表了LinkedIn在利用人工智能技术优化招聘流程方面迈出的重要一步,它通过自动构建候选人管道、筛选顶级申请者、起草外展邮件甚至回答有关角色的基本问题来减轻招聘人员的工作负担。产品背景信息显示,LinkedIn一直致力于通过AI技术提升用户体验,而Hiring Assistant的推出进一步强化了这一点。产品定位于帮助招聘人员提高效率,同时保持对招聘过程的完全控制。

今日大家都在搜的词:

热文

  • 3 天
  • 7天