大 创 实 验 室

更多内容请联系我(wǒ)们

聊聊(liáo)人工智能芯片

发表时间:2018-12-26 10:00作者:中科四平网址:http://www.daqing.bijie.shanxi.linyi.jiaxing.zz.pingliang.ww38.viennacitytours.com

人(rén)工(gōng)智能芯片主(zhǔ)要(yào)包括NVidia GPU、Google的TPU、Intel的Nervana、IBM的TreueNorth、微软(ruǎn)的DPU和BrainWave、百度的XPU、Xilinx的xDNN、寒武纪芯片、地平线以及深鉴科(kē)技的AI芯片等,基本上是GPU、FPGA、神经网络芯片(piàn)三分(fèn)天下的趋势,三种芯片(piàn)各有各自的优劣(liè),都在面向(xiàng)自己独特的细分市场。本章先聊一(yī)聊深度神经网络和NVidia GPU的(de)崛起。

   人(rén)工(gōng)智能的终极目标是模拟人脑,人脑大(dà)概有1000亿个神经元(yuán),1000万亿(yì)个突触,能够处理复杂(zá)的视觉、听觉、嗅觉、味觉、语言能力、理解能力、认知能力、情感控制、人体复杂(zá)机构控制、复杂心理和生理控制(zhì),而功耗只有10~20瓦(wǎ)。

这是人脑基本神经元和(hé)突触:

    这是(shì)人工神经元模拟神经(jīng)元(yuán):

微信图片_20181226100213.png

输入模拟神经元输入电信(xìn)号,权值模(mó)拟神经元之间的突触连接(jiē),激活(huó)函数模拟突触之间(jiān)的电(diàn)信号传导。

早在1981年David Hubel和Torsten Wiesel就发现(xiàn)了人的视觉(jiào)系统的信息处理是分(fèn)级(jí)的,因(yīn)此获得了(le)诺(nuò)贝尔医学奖。如图(tú)所示,从视网膜出发,经过低级的V1区边缘特征提取(qǔ),到V2区识别基本形状或(huò)目(mù)标的局部(bù),再到高层的目标(biāo)识(shí)别(例如识别人脸),以(yǐ)及到(dào)更高层的前额叶皮层进行分类判断等,人(rén)们意识到高层(céng)特征是低(dī)层特征的组合,从低层到高层越来(lái)越抽象,越(yuè)来越能表达语义或者意图(tú)。

深度神(shén)经(jīng)网络模型模拟(nǐ)人脑识别的分(fèn)层识别过程:

微信图片_20181226100220.png

深度神(shén)经网(wǎng)络的输入层模(mó)拟视觉(jiào)信号的输入,不同的隐藏层模拟不同级(jí)别的抽象(xiàng),输出层模拟输出的对象分类(lèi)或(huò)者语义等。

从上图的典型的人脸(liǎn)识别的训练任务来看,按(àn)照10层深度神经网络、训练(liàn)上百万张图片,大概需要30 Exaflops的计算(suàn)能力,如果还是用CPU来做训练(liàn),大概需(xū)要训练一(yī)年的时(shí)间,这显然是(shì)无法(fǎ)忍受的速度,亟待需要计算能(néng)力更强的人工神经网络芯片出现。

NVidia GPU的崛起

可能(néng)有(yǒu)很多(duō)人会问,目前(qián)在人工智能领域,NVidia GPU为什么具有无(wú)可撼动(dòng)的霸主地位,为什(shí)么AMD的GPU和NVidia GPU性能相差不多,但(dàn)是在(zài)人工智能(néng)领域(yù)的受欢迎(yíng)的程度却有天壤之(zhī)别。
我们知道(dào)GPU原本就是显卡(kǎ),它是为游戏和渲染(rǎn)而(ér)生的,它里(lǐ)面核心运(yùn)行单元是shader,专门(mén)用作像素、顶点、图形等渲染(rǎn)用的。
NVidia在2006年的时候跨(kuà)时代的推出了统一计算设备架构(gòu)CUDA(Compute Unified Device Architecture)以及对应的G80平台,第一次让(ràng)GPU具有可编程性,让GPU的核心流式处(chù)理器Streaming Processors(SPs)既(jì)具有处理像素、顶点、图形等渲染(rǎn)能力,又同时具备通(tōng)用的单精(jīng)度浮点处理(lǐ)能力,NVidia称之为GPGPU(General Purpose GPU),黄教主(zhǔ)的野心是让GPU既能做游戏(xì)和渲染也做并行度很高的通用计算。

2006年,第一(yī)代GPGPU架(jià)构G80

微信图片_20181226100229.png

G80有16组流式处理器Streaming Processors(SPs),每组(zǔ)SP里有16个计算核心,一共128个独(dú)立的计(jì)算核(hé)心(xīn),单精度峰值计算能力可达330 Gflops,而同期主流的Core2 Duo CPU只有50 Gflops的处理(lǐ)能(néng)力,更(gèng)为重要的是从G80架构开始,GPU开始支持可编程,所有(yǒu)的计(jì)算密集(jí)型的并行任务都有可能通过程序移植在(zài)GPU上运行(háng)起来。

CUDA的编程模(mó)型

CUDA将GPU的计算单元抽象(xiàng)成3个编程(chéng)层次:Grids、Blocks和Threads,一(yī)个CUDA kernel在(zài)执行(háng)的前会先把数据(jù)和指令传到GPU上,在执行的(de)时候会使(shǐ)用若(ruò)干个Grids,一个Grid里含有(yǒu)多(duō)个Blocks,一个Block里含有多(duō)个Threads,调(diào)度上一个Block的Threads会(huì)调度到(dào)一(yī)个独立的Streaming Processors上执行,而16/32个(gè)Threads称为一个(gè)Warp,Warp是GPU上指令(lìng)调度的最小单(dān)元,一个Warp会(huì)同时运行在16/32个计算核(hé)心上(shàng)。

微信图片_20181226100233.png

性能(néng)增(zēng)长远(yuǎn)超CPU战略

NVidia从2006年推出Tesla架(jià)构以来,不断的更新架构和性能,陆续推出了Femi、Maxwell、Pascal还有最新的Volta架构,基本上保持着2年(nián)性能翻(fān)1倍的增长态势。
而对CPU的性(xìng)能加速比,在单精度计算能力(lì)上保(bǎo)持着遥遥领先的态势,并且拉开的差(chà)距越来越大。

微(wēi)信图(tú)片_20181226100238.png

深度神经(jīng)网络+NVidia GPU掀起人工(gōng)智(zhì)能(néng)浪潮

深度(dù)神经网络+NVidia GPU掀起(qǐ)了业界的人工智能(néng)浪(làng)潮,不(bú)得不说这只是老黄整体(tǐ)战略的一个副产品,谁也没有想到,高性能计算领(lǐng)域的一个分支--人工智(zhì)能会如此(cǐ)火爆。
2011年,负责(zé)谷歌大(dà)脑的吴(wú)恩(ēn)达通(tōng)过让深(shēn)度神经(jīng)网(wǎng)络训练(liàn)图片,一(yī)周之内学会了识别猫,他用(yòng)了12片GPU代替了2000片CPU,这是世界上第一(yī)次让机器认识(shí)猫。
2015年,微软研究院用GPU加速(sù)的深度(dù)神经网络,在ImageNet比赛中获得了多项击败人的辨(biàn)识准确度,这是(shì)第一次机器视觉的(de)识别率打败了人眼的识别率(lǜ)(错误率5%),可以认为是人(rén)工智(zhì)能史上的一个(gè)重要(yào)里程(chéng)碑事件。
2016年,谷歌旗下Deepmind团队研发的机器人AlphaGo以4比1战胜(shèng)世界围棋冠军职业九段棋手李世石(AlphaGo的(de)神经网络训练用了50片GPU,走(zǒu)棋网络(luò)用了174片GPU),引发了围棋界的轩然大波(bō),因为(wéi)围棋一直被认为(wéi)是人类智力较量的巅峰,这可以看做是人工智(zhì)能史上的又一个重大里程碑事件。


山东省(shěng)济南市(shì)历下区舜华路750号大学科技园北区3号楼(lóu)
服务热线:13256445996                                  www.daqing.bijie.shanxi.linyi.jiaxing.zz.pingliang.ww38.viennacitytours.com

1XBET集团官网(中国)官方网站

1XBET集团官网(中国)官方网站