摄像机的核心组件是图像传感器和视频处理芯片,要实现良好的图像质量,除了前端镜头、传感器部分对光线的处理,影像处理部分也是摄像机中不可忽视的一环。而芯片作为核心处理器,对高清监控的效果更是起着举足轻重的作用。拥有专业AI芯的摄像机是实现前端智能化的前提。
01
芯片的分类
从应用目的区分,可以将芯片大致分为通用芯片和专用芯片两类。
通用芯片是为了解决一些通用的任务而设计的,主要为各种架构的CPU(中央处理器)芯片,例如x86、ARM、MIPS、PowerPC、RISC-V等等,这类芯片往往可以运行操作系统,并具备丰富的外设接口,以满足多种多样的应用需求。在市场竞争过程中,MIPS、PowerPC等芯片架构已不再辉煌,甚至逐渐退出了历史舞台。
专用芯片是为了解决某一类专门的应用而设计的,例如擅长处理图像任务的GPU,擅长数字信号处理的DSP,擅长AI加速的AI芯片,以及可针对特定应用场景进行硬件编程的FPGA。这一种类的芯片在处理特定应用时效率很高,但是不擅长处理通用类型业务。
实际上,随着芯片的演进,这两类芯片也在发生一些融合。例如通用芯片中集成GPU、DSP,甚至FPGA,从而提供针对特定应用的加速能力;而专用芯片中也往往会集成一些通用的CPU,从而提供一定的灵活性和独立部署能力。
02
芯片的历史
x86芯片
在很长一段时间内,CPU和Intel/x86是划上了等号的。CPU的历史可以追溯到1971年。在这一年,Intel公司研发出了世界上第一款微处理器4004。它是一款4位处理器,每秒只能计算6万次。这一划时代的产品,尽管性能非常孱弱,但是CPU这一影响深远的概念首次亮相了。随后几年,Intel迅速推出了4040、8008、8080等处理器。
1978年,Intel首次推出16位处理器i8086,它是x86架构的鼻祖,该处理器上使用的指令集,被称为x86指令集,并演进至今。
80年代,Intel相继推出了80286、80386、80486,晶体管数量突破100万个,CPU主频提高到50MHz。
2000年,Intel推出了奔腾4系列,开始引入64位架构,并支持虚拟化。
2010年,Intel从酷睿系列开始,通过Tick-Tock节奏,即一年更新微架构、一年升级制程的方式,不断向前演进。但是,随着工艺尺寸接近物理极限,Intel已经由Tick-Tock变化为PAO(制程Process->架构Architecture->优化Optimization )策略。
ARM芯片
ARM芯片的历史要追溯到1978在英国剑桥创办的CPU公司(Cambridge Processing Unit),1979年更名为Acorn公司,主要业务是提供电子设备。1985年,Acorn基于RISC架构,自行研发了第一代32位、6MHz的处理器,简称ARM(Acorn RISC Machine),ARM名字由此而来。
RISC 的全称是 “ 精简指令集计算机 ”(Reduced Instruction Set Computer),它支持的指令比较简单,所以功耗小、价格便宜,特别适合移动设备。早期使用 ARM 芯片的典型设备,就是苹果公司的牛顿 PDA。
1990年代,ARM的32位嵌入式RISC进入了低功耗、低成本和高性能的嵌入式应用。进入二十一世纪之后,随着手机的快速发展,ARM处理器占领了全球手机市场,一直延续至今。
AI芯片
当前对人工智能芯片的定义并没有一个公认的标准。比较通用的看法是面向AI应用的芯片都可以称为AI芯片,按设计思路主要分为三大类:专用于机器学习尤其是深度神经网络算法的训练和推理加速芯片;受生物脑启发设计的类脑仿生芯片;可高效计算各类人工智能算法的通用AI芯片。
AI芯片的历史是随着深度学习的兴起同步发展 起来的。深度学习对算力的需求十分巨大,传统的CPU无法满足,算法研究人员发现,GPU很适合用来处理深度学习的训练和推理计算任务。所以英伟达借AI浪潮再次崛起,后来也推出了专门用于深度学习任务的Tesla、Jetson等系 列AI芯片。
近五年时间内,随着深度学习的爆发式增长,涌现出大量的AI专用芯片和厂家。
03
芯片的产业链
芯片从设计到出厂,芯片产业链的分工主要包括六大部分。
04
芯片的发展趋势
AI芯片的发展趋势
现今的 AI芯片在某些具体任务上可以大幅超越人的能力,但究其通用性与适应性,与人类智能相比差距甚远,大多处于对特定算法的加速阶段,缺乏通用性。因此未来通用AI芯片应包含以下特征。
可编程性:适应算法的演进和应用的多样性。
架构的动态可变性:能适应不同的算法,实现高效计算。
高计算效率:算法对算力的需求是无止境的,现有的计算效率制约了很多算法的实际应用落地。
高能量效率:能耗比高,能够应用在端侧嵌入式设备中。
应用开发简便:提供完备的软件栈,降低AI开发的门槛。
通用芯片的发展趋势
微架构演进,IPC(Instruction Per Cycle)每代提升10%。IPC仍然是衡量通用芯片处理能力的一个重要指标,通过芯片内部集成更大的缓存、更多的执行单元、更精确的分支预测和任务调度机制,将IPC不断提升。
工艺演进:目前通用芯片工艺已经迈入7nm制程,后续5nm,甚至3nm的制程已经在研究当中,虽然由于已经逼近物理极限,但是工艺演进仍然是提升芯片性能的关键一环。
功耗控制:随着通用芯片核数越来越多,尺寸越来越大,功耗控制成为制约芯片实际商用的重要因素。需要更加精细和智能的功耗控制机制。
互连带宽:多芯片之间往往可以通过互连形成更强的单节点处理能力。
ARM芯片的优势战场在嵌入式领域,而x86的优势战场在桌面和数据中心。但是,双方的竞争从未停止。目前已经出现了一些服务器级别的ARM芯片,开始争夺数据中心市场。但是x86在数据中心的体量和地位目前仍然遥遥领先。
ARM架构处理器的单核性能往往较弱,所以单CPU核数较多;而x86的单核能力强,因此核数较少。两者的架构区别导致了其适用于不同的业务场景。
但是,随着制程演进越来越困难,x86的流水线已经非常深,微架构上也很难再有大的突破,x86也在寻求在芯片内集成更多的核。另一方面,ARM也面向数据中心领域推出了Cortex-X系列架构,不再一味追求performance per Watt,而是追求极致性能,即从原来的小核向大核演进。