谷歌表示,其AI芯片烟雾CPU,GPU在性能测试中
IT监控顶部用于机器数据分析的使用
McAfee将威胁英特尔与AI相结合
有一种方法可以撤消微软更新阻止者造成的损坏
ico和政府帮助英国企业为Brexit做好准备
Facebook筹集了开发人员的身份工具
希思罗如何使用对人民的分析改造
BlackBerry Keyone销售延迟了一个月满足需求,TCL CEO说
纯度在下一个存储速度凹凸中添加更多NVME
AWS CEO Andy Jassy在Amazon确认Oracle Data Warehouse关闭
想从youtube赚钱吗?刚刚获得10k的意见
Crafty Ohio囚犯清除零件,建造了用于黑客攻击并在天花板上隐藏的PC
明智地强调2018年奖项的重要性
微软签署承诺协助障碍患者
法律委员会说,自驾车可能需要违法法律
古英国在巴斯的5克试验台上来到生命
汉考克揭示了NHS科技愿景
网络安全购物的陷阱:炒作和伪劣产品
雅虎至少支付8500万美元的数据违约定居点
约克青少年加冕2018年英国网络安全冠军
美国劳工部指责谷歌的妇女
只有10%的公司已经开始崛起的员工,因为自动化进来
针对2020的3D印刷部分肝脏移植
如果在法国驾驶时获得超速票据,请责备恐怖分子
臭名昭着的ios间谍软件有一个Android兄弟姐妹
最佳vmworld 2018欧洲用户奖:赢家
微软关闭了CodePlex开源项目网站
BlockChain可以帮助安全的医疗设备,改善患者隐私
CIO采访:Stephen Docherty在NHS数据共享
谷歌日历终于来到了iPad
不是错误:即使禁用宏,Outlook也会运行VBScript
超过80%的科技妇女将为年轻女性推荐技术职业
CIO和云:欧洲企业软件的未来
Filestack扭转了CDN的概念,以提供全球闪电快速文件上传
新加坡的日月蒙将区块链追踪苹果
迁移到云时的五个陷阱
物联网研发项目错过了1000万英镑的政府资金
最新的Wikileaks Dump公开了CIA方法来掩盖恶意软件
普利茅斯的Derriford医院在HSCN升级后有能力备用
更多的影子经纪人辐射:Doublepulsar零日感染了Windows PC的分数
Uber将混合云作为商业和地理扩张的路线
网络攻击中心关于乌克兰基础设施的网络钓鱼
家乐福踢出区块的食物可追溯性驱动器
这是星期三的AWS峰会宣布的一切
政府动员劝说技术部门以支持May-eu交易
Corvil具有真实的过去,但它的重点是未来
机器身份保护开发获取资金提升
周二准备好补丁:阻止Windows Update并忽略KB 3008923
每周包装:准备Windows 10创建者的时间更新
BA到Sue CBRE在May Bank Holiday DataceRe Suctage
您的位置:首页 >论坛 > 电子业界 >

谷歌表示,其AI芯片烟雾CPU,GPU在性能测试中

2021-08-16 18:44:08 [来源]:

四年前,谷歌面临着难题:如果所有用户每天都有三分钟的语音识别服务,该公司需要加倍数据中心的数量只是为了处理机器学习系统供电的所有请求这些服务。

该公司而不是购买一堆新的房地产和服务器,而不是为此目的而开始创建专用硬件,用于运行语音识别等机器学习应用程序。

结果是张量处理单元(TPU),旨在加速深神经网络的推断阶段的芯片。谷歌周三发布了一篇论文,铺设了公司在对比CPU和GPU上看到的业绩,无论是对原始的力量还是每瓦所消耗的功率的性能。

TPU在测试的机器学习推理任务中平均平均为15至30倍,而不是比较的服务器类英特尔·哈维尔CPU或NVIDIA K80 GPU测试。重要的是,TPU的每个瓦特的性能比用CPU和GPU找到的谷歌的差价为25至80倍。

考虑到公司强调建筑机器学习应用,驾驶这种性能增加对谷歌非常重要。这些收益验证了公司在建筑机器学习硬件时验证,这是一个难以获得传统硅的大规模性能升高的时间。

这不仅仅是学术练习。自2015年以来,谷歌在其数据中心中使用了TPU,他们已经使用了改进应用程序的性能,包括翻译和图像识别。TPUS在能效时特别有用,这是与在大规模尺度上使用硬件的成本相关的重要指标。

谷歌目的的其他关键指标之一是延迟,这是TPUS Excel与其他硅选项相比的位置。谷歌的一个杰出硬件工程师常规Jouppi表示,机器学习系统需要快速响应,以提供良好的用户体验。

“关键是,互联网需要时间,所以如果你使用基于因特网的服务器,需要从您的设备到云需要时间,所以返回所需时间,”Jouppi说。“网络和云中的各种东西 - 在数据中心 - 他们需要一些时间。如果你想要接近瞬间的反应,那就不会留下很多[时间]。“

谷歌在六种不同的神经网络推理应用中测试了芯片,代表谷歌的数据中心中所有这些应用的95%。所测试的应用程序包括DeepMind alphago,该系统在去年在五场比赛中击败了李塞托。

该公司测试了TPUS对阵硬件的TPU,在大致相同的时间内释放,以试图获得苹果对苹果性能比较。它可能的是较新的硬件至少将缩小性能差距。

TPU还有TPU的空间也是为了改善。使用NVIDIA K80 GPU中存在的GDDR5内存与TPU应提供Google测试的现有配置的性能改进。根据该公司的研究,几个应用程序的性能受到内存带宽的限制。

此外,谷歌文件的作者声称有更多的软件优化的空间,以提高性能。作者称为其中一个经过测试的卷积神经网络应用(作为CNN1中的称为CNN1)作为候选者。但是,由于使用TPU的现有性能获得,如果将进行这些优化,则不清楚。

虽然神经网络模仿神经元在人类中发射信息的方式,但CNNS专门针对大脑如何处理视觉信息而建模。

“由于CNN1目前在TPU上运行超过70倍而不是CPU,CNN1开发人员已经很开心,因此目前尚不清楚是否会执行此类优化时,”“作者写道。

TPU是Chip Lingo作为特定应用集成电路(ASIC)所熟知的。它们是为一项任务构建的自定义芯片,用指令集硬编码到芯片本身中。Jouppi表示,他没有过于关切,并指出TPU足以处理机器学习模型的变化。

“它不像它是为一个型号设计的,如果有人提出了一个新的模型,我们就必须夹在筹码或那样的东西中,”他说。

Google不是唯一专注于使用专用硬件进行机器学习的公司。Jouppi表示,他知道在空间中工作的几个启动,Microsoft在其数据中心部署了一个现场可编程门阵列,以加速网络和机器学习应用程序。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。