首页 > 传媒 > 关键词  > 智能终端最新资讯  > 正文

生成式AI时代下,这颗骁龙新生代旗舰芯片,有了新的任务

2024-03-21 10:31 · 稿源: 站长之家用户

想象一下,当一台手机不再只是通话和上网的工具,而是成为化身为 AI 时代多功能的智能终端:它可以是你的私人智能助理,也可以是影像工作站、AI 绘画板、同传翻译官。听起来理想很美,但这个未来其实并不遥远。一览今年众多新登场的旗舰手机时,会发现 AI 功能早已融入其中,化身为一个个标配的小功能。2023 年开始,各大手机厂商纷纷在 AI 领域发力,力图抢占「AI 终端」这一移动产品的未来制高点。然而,这场变革的源头,其实要从芯片厂商主导的底层创新说起。作为这一变革背后的推动者,高通早已开始布局从「手机芯片」走向「智能终端芯片」,并从底层架构设计入手,为旗舰手机提供强大的 AI 算力。 如今,骁龙8系已成功助力众多厂商在旗舰机上实现端侧大模型部署,让 AI 手机不再只是停留在概念阶段。而这次,他们打算更进一步。

骁龙8系的持续进化,让手机厂商们快速踏入 AI 时代

近半年的 Android 手机新机潮可以说是十分热闹了:各大品牌的旗舰款机型抢先发布,甚至在未发布手机前,AI 功能就已先行高调发布,大家纷纷高喊出 All in AI 的口号。 这股 AI 热潮的重要推手,正是骁龙8系新芯片的发布。作为专为移动设备上的生成式 AI 优化的芯片,骁龙8 系列通过软硬件层面的全方位创新,为手机厂商进军 AI 赛道提供了强劲助力。

骁龙在 AI 领域的进化,并非简单的算力提升,而是通过各个环节的底层技术革新来实现的:升级的 Hexagon 作为一块专用的 AI 神经网络处理器,在更低功耗的同时大大提升了 AI 运算性能。 骁龙8系列还在硬件层面引入了微切片推理(Micro Inferencing)等前沿 AI 技术,在时间轴上对神经网络的不同层次进行切分,让多个切片在同一时刻并行计算,从而确保芯片处理器始终保持有效的运转状态,极大地提高了 AI 推理效率。

2023年10月,高通发布了第三代骁龙8芯片,AI 性能相比上一代近乎翻了一倍,支持包括 Meta Llama2、ChatGPT 等通用大模型,推理速度高达每秒20个 token。而在第三代骁龙8推出后不到48小时,首发搭载的小米14系列就正式发布,同时宣布了自研的60 亿参数大模型已经成功跑通。升级后的小爱同学不仅能够准确理解用户的各种指令,还能完成撰写演讲稿、商品点评、拟写祝福信息等复杂任务。 骁龙8系列对 INT4 新特性的支持同样可以对 OPPO 的 AI 战略提供助力,OPPO 可以基于 INT4让原本28GB 内存的模型现在只需要不到4GB 就能跑通,大大提升了内存带宽效率,实现有效端侧部署。2024的开年旗舰 OPPO Find X7Ultra 成功在本地运行了70亿参数的满血版 AndesGPT 大模型,在大幅降低资源需求的同时,AI 模型的输出效果也几乎不受影响。

在第三代骁龙8芯片支持的新特性中,AI 照片扩展也是一大亮点,用户可以无需依赖网络和云计算,而是通过 AI 来理解图像中的细节和结构,实现智能创意的 AI 扩图。很快,这一功能也得到了普及,继小米14宣布支持 AI 扩图功能后,诸多厂商也纷纷跟进。

搭载第三代骁龙8的荣耀 Magic6Pro 则采用了自家的「魔法大模型」。 其中「智慧成片」的功能,让用户只需要讲出想要的画面,比如「帮我做一条这个月我家猫猫的可爱回忆短片」,AI 就能自动汇总手机中的素材,智能剪辑成短片,并配上最契合情绪的配乐和文字。「一拖日程」的功能则让用户只需将包含日程信息的文字一拖至屏幕边缘,系统就能在不到1 秒内识别用户意图并自动创建日程。

基本上,现在大家只要看到「骁龙8」的标签,基本已经和「旗舰、优质性能、AI 新特性」这些关键词深度绑定。 自骁龙8 系诞生开始,几乎每款新发布的旗舰手机,都不断增加着令人惊奇的 AI 新特性。在影像、游戏、无线连接、音频等用户感知最为直观的方面,也都携手实现了跨越式的升级。 新生代的第三代骁龙8s,有了新的任务 如果说第三代骁龙8的问世,是助力手机厂商一同完成了 AI 手机从无到有的突破。那新推出的第三代骁龙 8s,肩负着将生成式 AI 应用进一步带向大众的重任。第三代骁龙8s 继承了与第三代骁龙8旗舰平台相同的 CPU 架构,并同样搭载比较新的 Hexagon NPU 神经网络处理器,在 AI 的性能表现上同样保持了旗舰高水准。这意味着手机厂商可以为更多定位不同的机型,配备先进的生成式 AI 能力,真正实现生成式 AI 应用的进一步普及。

第三代骁龙8s 支持100亿级别的大语言模型。并且和其他厂商的单一 AI 模块不同,高通独特的异构计算特性,能让 CPU、GPU、ISP 等各个模块都具备 AI 能力,各自负责擅长的领域,相当于举整个平台之力,来完成理想性能的大模型 AI 计算。

目前,高通已经开始与多家中国头部手机厂商展开了深度合作,通过软硬件的联合优化,充分释放第三代骁龙8s 在 AI 领域的潜力。可以预见在2024 年发布的旗舰新机型中,满血版的本地大语言模型也能成为人人都能体验到的新标配,大大加速了 AI 在手机市场的渗透和落地。手机芯片发展至今,早已从一块单独的 「处理器」进化为「平台」。在第三代骁龙8s 这个新平台的加持下,手机的影像、游戏、智能助手、连接等各项功能都得到了全面的 AI 增强。 比如第三代骁龙8s 的感知能力,就让手机变得更加智能灵动了:不仅支持人脸解锁、扫码、移动支付等常用场景的快速响应,还能通过 AI 不断学习用户的使用习惯和偏好,让手机变得更像一个时刻陪伴并且学习的 AI 助理,真正做到「认识你也认识这个世界」了。

而在移动 AI 体验最为直观的影像、游戏等各个方面,第三代骁龙8都携手各大厂商实现了跨越式的升级。例如计算摄影上的 AI 分割、AI 降噪等黑科技,以及游戏领域的 AI 光追、AI 超分辨率等技术,都将移动影像和游戏的表现提升到了全新的水准。

以影像为例,第三代骁龙8s 集成了认知18-bit 三 ISP,可通过高达18bit 的数据采样让摄像头每秒处理数十亿像素。搭配第二代图像分割功能,支持照片和视频实时语义分割,带来比竞品近2.5倍的提升。当这一切与芯片强大的 AI 处理器结合,摄像头也真正开始「看见并理解世界」,无论是暗光拍摄的画质表现,还是 AI 识图、修图、扩图等功能,都将得到质的飞跃。 当然,之所以叫「认知」,是因为其在第二代骁龙8时便实现了通过 Hexagon 直连的方式,将 ISP 与 Hexagon NPU 直接连接,让 ISP 具备强大 AI 分析的能力,从而在拍摄过程中将 AI 优化提前,实现实时语义分割,让甚至于眼镜反光的每个拍摄细节都能得到更为精细的优化,而且是实时的反馈,从而大大提升手机成像质量和拍摄体验。这就是高通 AI 引擎和 ISP 联手的深藏功与名之处。

作为骁龙8系列中的新生代旗舰平台,第三代骁龙8s 不仅在 AI、影像、游戏、连接等多个领域提供了卓越的体验,同时它也是一款支持 Snapdragon Seamless 技术的先锋产品,加速助力各类型各品牌终端互联。 比如在影音娱乐方面,用户可以在手机上开始观看视频,Seamless 技术可以让手机与电视或平板等大屏设备无缝切换,在大屏上继续播放;在办公场景下,用户可以在手机上开始处理文档,Seamless 技术让工作状态可以无缝切换到笔记本等大屏设备继续编辑。全新优质移动平台第三代骁龙8、全新优质 PC 平台骁龙 X Elite 和高通的可穿戴平台与音频平台,都已支持 Snapdragon Seamless,未来还将扩展至 XR、汽车和物联网平台。

在定位上,第三代骁龙8s 对比第三代骁龙 8「优质旗舰创新标杆」的定位,选择了「新生代旗舰」这一角色。正值中国手机厂商变革与端侧大模型起步发展的关键时期,这块灵活灵动、同样全能的新生代旗舰芯片,正是「AI 普及」这个宏大愿景得以实现的关键一环,加速了 AI 在中国的普及,从少数走向更多数用户。 一个可能的未来——无所不在的 AI 2023 年,你突然发现你的手机助手更好用了。许多宝妈开始用手机智能剪视频,学生们也可以用 AI 画画创作,上班族们在开会时掏出手机录音,会议纪要和重点内容转眼就整理好了。但这还远远不够。 据麦肯锡的一份《生成式人工智能的经济潜力》报告,对于许多上班族而言,未来还将有60%-70% 的工作,都可以用 AI 替你自动完成。AI 将不再是某些特定领域或高端产品的特权,而是深度融入我们生活的方方面面。

现在,手机硬件已经进入了一个新的时代,迎来了瞬息爆发的 AI 生态,而 AI 体验的好坏也成为了厂商竞相角逐的新赛道。 在高通构想的未来图景中,大家手中的 AI 手机既可以是你的移动影像工作站,对照片视频进行智能编辑,也可以是一台 AI 绘画板,让你随手即可创作出艺术作品;同时它是一台游戏主机,带来实时光线追踪和环绕音效的沉浸体验;最后,它是一个全能的智能助手,和你一起观察学习这个世界,也时刻守护你的隐私与安全。

目前高通正在加速 AI 生态的爆发。而这个加速绝不只是在硬件层面:对于开发者而言,高通 AI Stack 和 AI Hub 的推出也极大地降低了 AI 开发的门槛。这两个功能强大的 AI 开放平台,不仅集成了自然语言处理、语音识别、计算机视觉等多个领域的 AI 能力,也包含了全面优化的生成式 AI 大语言模型库。 开发者不用再把精力消耗在各个设备平台的适配以及繁琐的 AI 性能调度上。开发者可以简单有效地在骁龙和高通平台上进行部署,借助高通 AI Hub 提供统一的开发框架和工具链,通过 NPU 等专用硬件和异构计算架构实现高性能、低功耗的 AI 计算。 简单来说,未来的软件开发者,只需要几行代码就可以玩转 AI 大模型,而不同设备的适配也简单省心,节省了大量时间和工作量,快速灵活地打造自己独特的产品。而手机厂商也能更专注于创造属于 AI 时代的全新的交互方式,同时不必受限于算力、功耗、各个传感器调度协作等问题。

在可以预见的未来,当你的车载助手也能帮你一键规划旅行安排,当你的手机就能做好公司要求的广告图,手机语音助手也开始变聪明变成百科全书,在未来你的眼镜会 24小时做你的贴身管家提醒你重要事项。在 AI 终端的领域,或许我们不会等到所谓的「iPhone 时刻」,因为 AI 早已开始渗透到我们生活的方方面面。

当我们不再天天谈及 AI 有多么神奇,而是自然而然地享受这一切时,AI 就是真正普及到了每个人生活中。 目前,仅在中国市场,骁龙的品牌认知度就达到了 85%。在几乎所有的价位段,消费者都认为骁龙是行业领先的处理器。而作为领先者的高通,也正在为骁龙8系列赋予新的角色定位——成为 AI 时代万物智能的引领者,引领 AI 终端走进我们的生活。

(本文内容转载自爱范儿)

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • All in AI:探索最佳的AI产品和工具

    All in AI是一个集合了多种AI产品和服务的平台,旨在帮助用户发现包括人工智能、大型模型学习、生成工具等在内的最佳AI产品和工具。平台提供了从图像生成、聊天机器人、文本写作到视频创作、代码辅助、设计辅助、教育学习、音乐生成等多种AI应用的导航和工具目录。

  • BestBlogs.dev:为开发者提供高质量编程、AI等领域阅读体验

    BestBlogs.dev 是一个专注于编程、人工智能、产品设计、商业科技及个人成长领域的阅读平台。它通过先进的语言模型,为开发者提供智能摘要、精准评分与多语言辅助,帮助用户高效过滤信息噪音,节约时间,实现技术与认知的双重飞跃。

  • Forloop:无需编码即可快速收集和自动化数据流程。

    Forloop是一个易于使用的AI工具,专为快速增长的数据团队设计,用于数据准备和管道管理。它支持从各种数据源创建管道,如数据仓库、存储和驱动器。无代码环境允许数据科学家独立于DevOps团队工作,主要针对AI初创公司和拥有机器学习产品的公司。

  • Make-An-Audio 2:基于扩散模型的文本到音频生成技术

    Make-An-Audio 2是一种基于扩散模型的文本到音频生成技术,由浙江大学、字节跳动和香港中文大学的研究人员共同开发。该技术通过使用预训练的大型语言模型(LLMs)解析文本,优化了语义对齐和时间一致性,提高了生成音频的质量。它还设计了基于前馈Transformer的扩散去噪器,以改善变长音频生成的性能,并增强时间信息的提取。此外,通过使用LLMs将大量音频标签数据转换为音频文本数据集,解决了时间数据稀缺的问题。

  • llama-fs:自组织文件系统,智能管理文件

    LlamaFS是一个自组织文件管理器,它基于文件内容和已知约定(例如时间)自动重命名和组织文件。支持多种文件类型,包括通过Moondream处理的图片和通过Whisper处理的音频文件。它有两种运行模式:批量处理(批处理模式)和交互式守护进程(监视模式)。在监视模式下,LlamaFS启动守护进程监视目录,拦截所有文件系统操作,使用最近的编辑上下文主动学习和预测您如何重命名文件。此外,它还具有“隐身模式”的切换功能,允许通过Ollama而不是Groq路由每个请求,以确保隐私。

  • AIKit:开源大型语言模型的托管、部署、构建和微调一站式解决方案。

    AIKit 是一个开源工具,旨在简化大型语言模型(LLMs)的托管、部署、构建和微调过程。它提供了与OpenAI API兼容的REST API,支持多种推理能力和格式,使用户可以使用任何兼容的客户端发送请求。此外,AIKit 还提供了一个可扩展的微调接口,支持Unsloth,为用户提供快速、内存高效且易于使用的微调体验。

  • 好说:二次元AI口语陪练,拒绝社恐,一起学口语。

    好说是一款二次元AI口语陪练应用,旨在帮助用户通过与AI角色的互动来提高口语能力,克服社交恐惧,增强语言学习的乐趣。

  • KnowEdit:知识编辑基准测试,用于评估大型语言模型的知识编辑方法。

    KnowEdit是一个专注于大型语言模型(LLMs)的知识编辑基准测试。它提供了一个综合的评估框架,用于测试和比较不同的知识编辑方法在修改特定领域内LLMs行为时的有效性,同时保持跨各种输入的整体性能。KnowEdit基准测试包括六个不同的数据集,涵盖了事实操作、情感修改和幻觉生成等多种编辑类型。该基准测试旨在帮助研究者和开发者更好地理解和改进知识编辑技术,推动LLMs的持续发展和应用。

  • 精灵AI:多功能智能助手,覆盖写作、咨询、编程等领域。

    精灵AI是一个集成了多种智能服务的网站,旨在通过人工智能技术帮助用户在写作、情感咨询、编程等领域提高效率和质量。它结合了自然语言处理和机器学习技术,为用户提供个性化的智能对话、写作辅助、情感咨询等服务。

  • Aya-23-8B:多语言指令微调的大型语言模型

    Aya-23-8B是由Cohere For AI开发的指令微调模型,具有23种语言的强大多语言能力,专注于将高性能预训练模型与Aya Collection结合,为研究人员提供高性能的多语言模型。

  • Stable Assistant:通过对话生成图像的友好聊天机器人

    Stable Assistant 是由 Stability AI 提供的聊天机器人,它利用最新的文本和图像生成技术,支持 Stable Diffusion 3 和 Stable LM 2 12B 模型。它擅长从对话提示中生成图像,提供知识性回应,帮助写作项目,并增强内容匹配的图像。Stable Assistant 能够生成各种风格的图像,特别是在某些特定用例中倾向于插画风格。

  • FinRobot:开源AI代理平台,专为金融应用设计。

    FinRobot是一个开源的AI代理平台,利用大型语言模型(LLMs)为金融应用提供全面的解决方案。它整合了多种AI技术,超越了单纯的语言模型,展现了平台的多功能性和适应性,满足金融行业的多样化需求。FinRobot的AI代理概念是指使用大型语言模型作为其大脑来感知环境、做出决策并执行动作的智能实体。与传统人工智能不同,AI代理具有独立思考和使用工具以逐步实现给定目标的能力。

  • YOLOv10::实时端到端目标检测模型

    YOLOv10是新一代的目标检测模型,它在保持实时性能的同时,实现了高精度的目标检测。该模型通过优化后处理和模型架构,减少了计算冗余,提高了效率和性能。YOLOv10在不同模型规模上都达到了最先进的性能和效率,例如,YOLOv10-S在相似的AP下比RT-DETR-R18快1.8倍,同时参数数量和FLOPs减少了2.8倍。

  • Alchemyze:智能分析投资平台,提供AI驱动的洞察和股票分析。

    Alchemyze是一个面向所有投资者提供高质量市场智能的平台。它利用精确数据和先进的机器学习算法,提供以往只有最富有的个体才能获得的洞察。其使命是民主化市场智能,使最佳洞察力对每个人都可用。平台通过将具有相似特征的股票分组,确保公平和相关的比较,并分析每组内每只股票超过500个技术和财务特征,精心评估它们的重要性。这导致特定特征的权重和量身定制的评分公式,为每个股票类别、部门和行业提供精确和可操作的洞察。

  • mistral-finetune:轻量级代码库,用于高效微调Mistral模型。

    mistral-finetune是一个轻量级的代码库,它基于LoRA训练范式,允许在冻结大部分权重的情况下,只训练1-2%的额外权重,以低秩矩阵微扰的形式进行微调。它被优化用于多GPU单节点训练设置,对于较小模型,例如7B模型,单个GPU就足够了。该代码库旨在提供简单、有指导意义的微调入口,特别是在数据格式化方面,并不旨在涵盖多种模型架构或硬件类型。

  • EasyEdit:易用的大规模语言模型知识编辑框架

    EasyEdit 是一个面向大型语言模型(LLMs)的易用知识编辑框架,旨在帮助用户高效、准确地调整预训练模型的特定行为。它提供了统一的编辑器、方法和评估框架,支持多种知识编辑技术,如ROME、MEND等,并提供了丰富的数据集和评估指标,以衡量编辑的可靠性、泛化性、局部性和可移植性。

  • Cohere Aya:多语言AI模型,支持101种语言。

    Aya是由Cohere For AI领导的全球性倡议,涉及119个国家的3000多名独立研究人员。Aya是一个尖端模型和数据集,通过开放科学推进101种语言的多语言AI。Aya模型能够理解并按照101种语言的指令执行任务,是迄今为止最大的开放科学机器学习项目之一,重新定义了研究领域,通过与全球独立研究人员合作,实现了完全开源的数据集和模型。

  • Focus Group Simulator:市场洞察力生成器,通过模拟焦点小组获取市场反馈

    Focus Group Simulator是一个市场洞察力生成器,结合了LLMs对目标群体的模拟和市场量化分析,采用最佳营销框架,比起简单地让GPT-34为我生成市场研究报告,提供更深入的见解。通过Focus Group Simulator,您可以准确了解您的潜在用户群体,并了解如何构建产品定价和推广策略,避免资源浪费,创造更多价值。

  • AI Clone Voice Free:免费的人声克隆工具 支持多种语言和口音。

    AI 克隆声音是一项利用机器学习技术生成与特定人声相似的语音的技术。无需特殊设备,可在浏览器中快速生成高质量的克隆声音。价格分为免费基础服务和付费高级服务,提供更多的声音定制选项。

  • Hacker Search:利用Hacker News历史数据回答关于任何话题的问题

    Hacker Search是一个基于Hacker News历史数据的问答工具,它特别适用于理解HN读者对某个话题的情感,或寻找HN读者感兴趣的话题的专家见解。

今日大家都在搜的词: