网站首页 > 软文百科 > 将AI大模型引入终端,高通混合AI引领下一个时代

将AI大模型引入终端,高通混合AI引领下一个时代

2023-07-15 18:15 发布

随着下半年的到来,搭载下一代旗舰芯片的新机很快就要与消费者见面了。以往我们在畅想下一代智能手机之时,大家最感兴趣的还是性能、功耗、游戏、拍照等等,但今年有点不同寻常,当下正处于智能手机AI体验变革的前夜,或许下一刻,一台真正的“万能助手”就将来到我们身边。

不要认为笔者说得夸张,想一想ChatGPT是如何在短短两个月就实现月活用户突破一亿?再想一想互联网大厂齐聚生成式AI赛道,AIGC应用又是如何一夜之间成为行业“新风口”的?只能说技术发展的太快,改变往往只是一瞬间的事情。

当然,好的前景是一回事,能否实现快速落地就是另外一回事了,毕竟这需要厂商和开发者以及整个行业的共同努力才行。好消息是,在生成式AI探索最前沿,我们不仅看见了OpenAI、微软、谷歌、百度、阿里等国内外科技企业的身影,同样还有高通这样的全球知名芯片厂商,在为AI规模化发展添砖加瓦,种种表现似乎都在告诉我们一件事:这次是要玩真的了。

推动AI规模化发展,混合AI是趋势

一般来说,AI处理通常会部署在云端和终端侧,其中像ChatGPT这类大家熟悉的生成式AI应用,其背后需要动辄数十亿参数的各类大模型作为支撑,而AI大模型越复杂,越需要大量的计算资源和更长的训练时间,因此几乎都在云端部署运行。

但无论是在云端进行AI训练,还是执行大模型处理,都是一个不小的成本,特别它的推理成本是随着日活用户数量以及使用频率增加而增加的,很显然,这会是一个极高的成本,也并不利于AI规模化发展。

基于这样的现状,高通在不久前正式发布《混合AI是AI的未来》白皮书,自此,“混合AI”开始走向台前。

所谓混合AI,简单理解就是在云端和边缘终端(智能手机、PC、汽车以及其他终端设备)之间分配并协调AI工作负载,从而实现更强大、更高效且高度优化的AI。

在高通看来,混合AI在成本、能耗、性能、隐私、安全和个性化方面有着显著优势,并且几乎适用于所有生成式AI应用和终端领域。

仍旧以成本为例,生成式AI搜索可以提供出色的用户体验和搜索结果,但它的成本也是传统搜索方法的10倍,随着用户数量和查询次数的增多,企业运营成本将会是一个天文数字,而且这还不包括硬件、数据中心场地、能耗、运营、额外带宽和网络传输的成本,如果都算上,成本还会持续增加。

混合AI则不同,目前全世界有数十亿台已部署或者具备AI能力的终端设备,这些终端设备能够独立,或者与云端协同,主动承担起相当大一部分计算负载,如果是智能手机、PC等设备生成文本或者图片,成本将会非常低,甚至没有成本。从这一点就不难发现,相比单一的云端AI,混合AI策略确实更有利于推动AI规模化发展。

下沉终端,高算力平台是关键

当然,依靠混合AI策略实现AI规模化扩展,关键在于终端一侧。云端不受设备体积和功耗限制,因此可以提供足够算力。但终端设备却不在此列,试想,如果让手机跑大模型,发热和续航会是一个令人头疼的问题。

但这个问题并非无解,仅从手机行业来看,高通其实已经取得了一些突破。此前,高通AI Research利用高通AI软件栈执行全栈AI优化,这一全栈优化最终让Stable Diffusion能够在智能手机上高效运行,在15秒内执行20步推理,生成一张512x512像素的图像。

全球首个运行在Android手机上的Stable Diffusion终端侧演示

Stable Diffusion是一个基于输入的文本生成图片的AI模型,它的参数超过10亿,这样的参数规模过去只能在云端计算集群内运行,如今能够在手机终端运行,除了结合高通AI软件栈和AI Studio提供全栈AI能力和优化外,高通AI引擎强悍的AI性能同样不容忽视。

全球最快的手机上的ControlNet终端侧演示

值得一提的是,在刚刚结束的2023世界人工智能大会,高通首次展示了全球最快的手机端“ControlNet”用例演示,该模型有15亿参数,并可以完全在手机上运行,只需不到12秒就能生成一张AI图像。

其实高通并非AI领域的“新玩家”,早在2015年的骁龙820芯片上,就已经推出了高通第一代AI引擎,从此之后,AI就和智能手机紧紧绑定了在一起,从视频拍照到语音助手,从系统资源调度到温度控制,从信号增强到网络稳定,几乎都有AI的影子。

去年,高通正式发布了第二代骁龙8移动平台,它搭载最新的高通AI引擎,全新升级了Hexagon处理器,提升了分组卷积、激活函数加速和Hexagon张量加速器的性能,支持微切片推理和INT4硬件加速,从而可以快速高效地运行Transformer网络,以及前面提到的,行业内率先在终端侧支持Stable Diffusion、ControlNet等生成式AI用例。

目前,第二代骁龙8移动平台已经可以支持参数超过10亿的AI模型运行。未来几个月内,随着终端侧处理能力的持续提升,更将有望支持拥有100亿或更高参数的模型在终端侧运行,为智能手机搭载生成式AI应用铺平道路,进一步激发混合AI的潜力。

助力AI发展与应用,高通优势突出

和很多互联网科技企业不同,高通在AI领域具有自己独特的优势,作为业界领先的芯片厂商,高通业务遍布全球以及各个行业,采用高通解决方案的终端设备规模十分庞大,每年还有每年有数亿台的新终端还在进入市场,在众多设备中,除了智能手机外,更有汽车、XR头显与眼镜、PC以及其他物联网终端,完全满足终端侧AI大规模落地的需求。

此外高通还为此开发了高通AI软件栈(Qualcomm AI Stack),为OEM厂商和开发者提供一套完整的AI解决方案,它集成所有AI框架、开发者库、操作系统的整合平台,也同时具备了“一次开发,多终端使用”的特点,为AI由单一终端扩展到其他各种终端提供了便利。

与此同时,高通在无线领域堪称“难逢敌手”,高通最新的5G芯片骁龙X75,已经5G-Advanced扩展至手机、汽车、卫星通信、计算、工业物联网等全部关键垂直领域,而AI与5G的结合还将催生出更多新的应用场景,为传统行业带来新的发展机遇。

总的来说,“混合AI”是基于高通自身优势而来的一种策略,与生成式AI未来的发展路径高度吻合。相信随着AI大模型参数越来越小,以及终端AI能力的不断增强,混合AI架构将真正推动人工智能走进千家万户,惠及百业千行,真正创造一个触手可及的AI世界。

(8252340)

免责声明:

本文内容来自用户上传并发布或网络新闻客户端自媒体,本站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系删除。

推荐问答