如果你认为智能手机仅仅是可以装几个应用的移动电话,那你绝对算不上科技达人。在智能手机时代,当我们拿起手机行走时,手机中的三轴加速传感器便开始工作记录下行走的状态。当我们使用手机拍照时,开启摄像头取景后会判断当前的环境光线以匹配最合适的参数。再比如待机情况下的信息推送,手机的调试解调器或WI-FI模块控制数据流的通讯,交换数据后像微信之类的应用会提示信息。诸如此类应用场景的实现,需要手机的多个硬件之间协同工作后,最终将结果通过软件显示在手机上。
既然这些应用场景下需要开启手机上的多个硬件,那就意味着CPU处理器需要一直计算各硬件反馈的数据。而在计算的同时,如需确保手机整体的使用流畅,旗舰手机需要配备核数更多或是性能更强的处理器来胜任,这然显然不是下一代高性能、低功耗处理器的发展方向。
为解决这个难题,可以处理单项任务的DSP处理器诞生了。这就好像是PC计算机中独立的声卡、显卡、网卡一般,这些独立的硬件可以单独处理大量数据,处理结果可以直接被CPU调用,这大大降低了CPU的计算强度。
iPhone6的宣传页中对M8协处理器进行详细介绍
手机行业中苹果最先宣传iPhone5的处理器中有一个命名为M7的协处理器,它可以以极低的功耗完成三轴加速传感器的数据处理。实际上早在2008年高通骁龙S1处理器诞生之日起,其架构中就已经集成名为Hexagon的DSP。
在骁龙S1的年代,这颗DSP可以直接处理音频解码,当消费者通过手机播放MP3音乐的时候,DSP可以完成MP3文件的解码和播放,而无需通过CPU进行解码计算。因此这里我们可以模糊的将DSP看做是一个低功耗的CPU,它可以协同CPU、GPU、ISP等重要内核工作,以达到像苹果宣传的那样节省整机能耗。
高通在8月25日召开的媒体沟通会上,首次确认了骁龙820处理器将搭载全新架构的Hexagon 680 DSP,并详细介绍了如何实现移动SOC计算效率基础上实现用户体验创新。
三个DSP实现最高效率
骁龙820处理器实际上是一个SOC片上系统,它包含CPUGPUISPMODEMDSP等部分,高通骁龙820的SOC处理器中内建三个独立Hexagon 680 DSP,这三个DSP分别负责低功耗计算、影像音视频计算和低功率岛传感器计算。尤其需要强调的是,这三个DSP是可编程的,换句话说未来不论是方案厂商还是软件公司都可以重新定义这三个DSP的功能。
现在的多数手机存在性能过剩的问题,大量的软件并未对处理器进行多核心优化,而这也直接导致处理器陷入了不断增加核心数、提升主频的恶性循环。实际上大部分需要并行计算的应用,是可以依托DSP来完成的。 骁龙820上搭载的Hexagon 680 DSP虽是单核计算架构,但设计上可以同时运行多达4个线程,每一个线程都有支持的软件。那么通过Hexagon 680可以带给消费者和合作伙伴哪些过去没有的体验呢?
·继CPU和GPU之后的第三大计算硬件
Hexagon 680是一个四线程的可编程计算引擎,它的计算能力虽然没有骁龙820上的CPU和GPU强,但对于普通任务的并行执行是完全没有问题的。就好像前文笔者举的例子,当这个DSP被编程作为音频解码时,听音乐的时候就可以直接由DSP解码并输出,省去了CPU解码的过程,不仅降低了功耗而且还提升了CPU的计算效率。
音频解码只是应用案例之一,Hexagon 680相比过去架构进行了扩展,目前加入图像任务、摄影、计算机视觉、虚拟现实、机器学习等功能,目前有1000多个合作伙伴使用骁龙工具链在开发更多的应用。
·业内首款支持向量扩展(HVX)的计算DSP
骁龙820中集成的Hexagon是业内首个支持向量SIMD(单指令流多数据流)扩展的DSP,它虚拟现实、摄像头计算机视觉和视频领域开发新的用例,可以让DSP通过一个指令同时处理多个视频流。高通曾展示过基于此实现的摄像头识别场景的功能,当我们将照片放置与摄像头后时,系统软件可自动识别场景和物体。
通过DSP完成原本CPU需要重度计算的任务
实际上实现这个功能的感知计算是通过类比成千上万个已经归类的图片,从而找到最相似的进行匹配并形成独特的学习数据库。而在骁龙处理器平台上,该功能的实现无需借助CPU计算,仅使用DSP就够了。
这一技术需要经过三个过程:识别图像、判断图像、调整图像
与此同时,当Hexagon向量扩展(HVX)和Spectra ISP协同工作时,又可以颠覆传统CPU对图像的计算瓶颈,以获得更好的影像画面。当我们使用骁龙820平台进行拍照,在弱光、强光或暗光录制视频等应用场景中,DSP会察觉画面中较暗或过曝的部分并进行修正,从而达到弱光部分适度增强亮度,而整体的明亮程度并不发生变化。使用DSP实现这一功能,其处理速度相当于骁龙801的三倍,而能耗则减少10倍。
·低功率岛让感知应用随时待命
智能手机越来越智能,像计步、指纹解锁、语音唤醒、敲击亮屏等功能的实现,都离不开传感器的实时监控。骁龙820可利用Hexagon 680的低功率岛控制传感器的工作状态,在设计上支持所有的传感器并提供完整的传感器软件框架和算法。目前低功率岛已经完成包括对Android L的支持,相比骁龙808来看,在计步器、旋转向量(传感器辅助定位)应用上可以降低3倍和2倍的能耗。
总的来说,骁龙820中的DSP将充当一个小型CPU的角色,将并不需要复杂计算以及CPU计算起来功耗过大的工作,都交由DSP来完成。或许这与GPU异构计算很像,但还是有所不同的。首先如果计算中包括连续不断的数据流,GPU计算是非常好的选择,它的效率比CPU要高出不少。但如果数据流处理中,需要决策的话,那GPU的效率就非常低了。此时DSP将会更高效,很多新型算法可以定制在DSP中,继而完成虚拟现实、扩增实境等计算。
实际上通过DSP和GPU的异构计算,可以获得比CPUGPU异构更好的运算效能。比如DSP可以通过计算机视觉算法决定从一个图像中识别一个图形,然后GPU根据识别出来的数据将该图像显示出来,整个过程中无需CPU进行计算,从而达到功耗下降效能提升的目的。
所以简而言之,未来DSP将承担更多的计算任务,使用CPU计算所有数据的时代已经过去。在未来,手机处理器并不需要很多CPU核,取而代之的则是功能更多的DSP处理器。实际上在过去英伟达也曾推出过所谓4+1核的产品,这个1核就是一个低功耗的核心,但它仅可以执行像桌面刷新、低码率视频解码等功能,而联发科技也曾推出过十几个低功耗核心产品。
以上这些低功耗CPU相比可定制功能的Hexagon 680 DSP来看,显然Hexagon在效率和能耗上更有优势,因为CPU需要同时计算的数据太多,而定制后的DSP可以快速的完成定制内容。相信在未来可定制DSP将会是手机SOC的一个发展趋势,高通再一次的领先了整个行业。
网友评论