智能终端的发展历史上,芯片始终扮演着关键角色,芯片之所以成为推动智能终端发展的重要动力,得益于每次芯片性能升级能带来的生产效率提升。时间来到 2023 年,AI 大模型爆发出了超乎想象力的应用效果,产生了明显的智能涌现效应。以 AI 技术激发第四次工业革命,带来新的生产力大发展,成为全球关注的普遍议题。在这样的时代中,智能终端 AI 化的趋势看起来已经势不可挡。为了能够让智能终端的 AI 发展适配智能化生产力需求的崛起,我们迫切需要一颗更强大的 " 芯 "。
在这样的背景下,高通在今年的骁龙峰会上,发布了两款新品,第三代骁龙 8 和骁龙 X Elite ,分别在智能手机和 PC 代表的智能移动设备上, 实现了百亿参数大模型的本地运行,赋予了移动终端更智能的能力。
AI,移动芯片效率的倍增器
过去一段时间里,移动芯片的升级迭代思路非常清晰,在工艺制程上的稳步提升,让芯片在性能方面不断增长。所以,是先有芯片,继而才有了消费者用到新的电子产品,芯片是智能设备发展链条的起点,既能定义产品的性能,也能锚定行业发展的方向。
但随着万物互联、5G、人工智能等技术的快速发展,扩展了智能设备对于芯片的需求范围,比如人工智能提出了更多样化的芯片需求。支持人工智能的 GPU、NPU,更低功耗低成本通信芯片、功能芯片等,快速增长的多样化需求成为芯片产业发展链条的新起点,这也意味着移动芯片领域迎来了全新的发展阶段。
在这个全新阶段中,高通凭借极具前瞻性的战略目光,早早就将 AI 作为芯片发展的关键能力。早在 2015 年,高通公司已经在移动平台中发布了支持异构计算的高通 AI 引擎,能够调动整个芯片的能力,用 AI 来增强图像、音频和传感器的运算。此外,在 2016 年高通还发布了骁龙神经网络处理引擎工具包 ( SnapdragonNeuralProcessingEngineSDK ) ,这款 SDK 允许 OEM 厂商在智能手机、安全摄像头、汽车和无人机等骁龙 820 设备上运行自己的神经网络模型。至此,下游厂商可以基于骁龙芯片的 AI 能力定制化开发,比如用 AI 来增强图像、音频和传感器的运算等。
在经过了多年的技术积累,从第一代骁龙 8 开始,高通公司便愈发重视芯片的 AI 算力,率先支持了 INT8 精度整数计算,实现张量加速器计算性能翻倍;而在第二代骁龙 8 上,AI 性能再次整体提升了 4.35 倍。AI 能力的不断提升,帮助下游厂商的拓展了终端开发场景,还大幅提升了终端产品的运行速率,使得完成同样的操作,需要的反应和计算时间显著减少,这也使得 AI 成为了如今芯片最关键的基础能力。
骁龙打开移动芯片 AI 的新边界
对于高通来说,不断提升芯片性能不是创新的最终目的,以芯片为基础真正提升智能设备的生产效率,变革用户的设备使用方式和使用体验才是。因此在高通眼里,在这个全面提升移动终端体验的全新发展阶段,AI 的作用是无法替代的。在消费者眼里同样如此,过去芯片评测往往只突出性能,主频、跑分、帧率。而现在普通消费者对芯片 AI 的重视也在与日俱增,AI 能力正在成为消费者关注的重要内容。
因此,充分利用技术优势,在芯片方面实现 AI 能力的进化,不断推动 AI 技术在终端侧演进和扩展,成为了高通芯片升级的主要航向。今年年初,高通演示了它们强大的终端侧 AI 能力,在手机上运行超过 10 亿的 AI 模型 Stable Diffusion,并且生成图片速度能控制在 15 秒内。
时间来到 10 月份,搭载第三代骁龙 8 处理器的终端,不仅能在本地跑起百亿参数大模型,同时利用 Stable Diffusion 生成图片的速度仅仅需要 0.6 秒。如此巨大的提升,离不开高通 AI 引擎的核心,也就是升级了全新微架构的 HexagonNPU。它性能提升了 98%,能效提升了 40%。此外,HexagonNPU 还集成了硬件加速单元、微切片推理单元、性能加强的张量 / 标量 / 矢量加速器单元,同时所有单元共享 2 倍带宽的大容量共享内存。
这代表着,用户可以在搭载第三代骁龙 8 的终端上,利用 AI 能力自由实现生成图片、文本等内容的生成式 AI 体验,提升用户在终端设备上的创造性和生产力。对此,高通公司高级副总裁兼手机业务总经理 ChrisPatrick 表示:" 第三代骁龙 8 平台将开启生成式 AI 的新时代——赋能用户创作独特内容、帮助生产力提升,并实现其他突破性的用例。"
手机芯片战场之外,骁龙还对 PC 市场寄予厚望。此次骁龙峰会上,高通还发布了面向 PC 产品的骁龙 XElite,它同时也是高通将 AI 带到端侧的关键一步棋。
骁龙 X Elite 基于定制的 Oryon CPU 核心,相同功耗下 CPU 性能可达到 x86 处理器竞品的 2 倍;峰值多线程 CPU 性能比 Arm 架构处理器苹果 M2 芯片高出 50%。GPU 方面,与性能领先的 x86 集成 GPU 相比,骁龙 X Elite 的性能领先高达 80%。
而在最重要的整体高通 AI 引擎 AI 算力方面,则是达到了 75 TOPS,相较 2017 年性能提升了约 100 倍。不仅是算力升级,骁龙 XElite 还集成了高通传感器中枢,集成 MicroNPU 和始终感知的 ISP。值得一提的是,骁龙 XElite 也是首个集成始终感知 ISP 的 PC 处理器。
超强的算力,让之前只能在云端获得的生成式 AI 体验,可以成功在搭载了骁龙 X Elite 芯片的电脑本地环境中运行。据介绍,骁龙 X Elite 最高可以在 PC 端运行高达 130 亿参数的大语言模型,Token 生成速度达到每秒 30 个。此外,高通还表示,未来在 PC 端,端侧 AI 将直接从本地提升用户的具体使用体验,即便是没有网络连接,AI 也始终在用户身边。
一面扩大芯片 AI 能力的演进,一面将处理器的壁垒会打破使其走向更多智能终端,骁龙正在打开芯片创新的新边界。
高通加速驶向端侧 AI
不难发现,芯片行业已行至十字路口,拥有更强大的性能只是基本功,而拥有强悍的 AI 能力,才能承载起引领下一个时代的重任。而在高通眼里,端侧 AI 是未来发展的主要方向。
因为,相比依赖云端的传统 AI 服务,终端 AI 具有独立性高、响应速度快、安全可靠等明显优势。
首先,从响应速度来看,使用云端生成式 AI 的过程中,需要面对需求高峰期时的高时延,而端侧 AI 不会出现这样的问题,在搭载了最新骁龙芯片的终端上,Stable Diffusion 生成图片时间不足一秒。而在网络不良的情况下,本地设备的 AI 能力就成了用户的唯一选择,这便是端侧 AI 的首要优势。
其次,从安全角度看,终端 AI 数据都存储和处理在用户自己的设备中,避免信息外泄的风险。此外,凭借安全芯片和加密算法,能更有效保护用户隐私。这也是其优于云端服务的重要原因。
另一方面,AI 通过学习用户本地设备上长期累积的个人行为模式和偏好,能够深入了解用户需求,提供高度个性化的智能服务。它理解用户的语言习惯,上下文环境,为用户节省大量时间成本。这是实现真正 " 助手 " 本质的必然要求。
写在最后:对于未来,高通公司 CEO 安蒙表示:"AI 的预测能力,加上终端是专门为你打造的,这就让终端和操作系统,以及应用和云端变得智能。" 可以预见,随着骁龙在终端侧 AI 能力的演进,未来骁龙的 AI 能力,将很快从 PC 、手机转移到更多智能终端上,这意味着智能设备以 AI 为索的第四次工业革命的大幕正徐徐拉开,骁龙塑造的新时代,也在顺势到来。