AWS G4旨在降低GPU功率AI推论的成本
亚马逊Web服务(AWS)公共云似乎已经削弱了其主要竞争对手,并引入了名为G4的新GPU(图形处理单元)EC2实例,该实例使用NVIDA V100 GPU。
AWS表示,新的G4实例旨在帮助加速机器学习推断和图形 - 密集型工作负载,这两者都是计算要求从额外的GPU加速度受益的任务。应用领域包括将元数据添加到图像,对象检测,推荐系统,自动语音识别和语言翻译。
AWS表示,G4实例可以用于训练人工智能(AI)算法,并为AI供电的应用运行推理引擎。它称GPU使其客户能够将机器学习培训从天到几小时减少,但AI中的实际成本正在运行AI算法。
“推论是实际占绝大多数机器学习的成本,”它说。“根据客户,机器学习推断可以代表运行机器学习工作负载的总体运营成本的高达90%。”
G4dn.xlarge的按需定价,四个虚拟核心实例,一个GPU和16GB内存,从每小时0.526美元开始。八个虚拟核心实例,32GB的RAM,费用为0.752美元。
相比之下,Google的一个GPU V100实例,拥有16GB的内存,目前在Google“Pre-Havive GPU价格”使用模型下定价为0.74美元。同时,Microsoft的NC6S V3在Azure上有6个V100核心和112GB的内存成本$ 2.2807每小时按需。
在AWS公共云上使用G4进行机器学习,通过Amazon Sagemaker或AWS深度学习AMIS(亚马逊机器图像)支持。AWS表示,它支持机器学习框架,如Tensorflow,Tensorrt,MXNet,Pytorch,Caffe2,CNTK和Chainer。
该公司计划为G4实例提供对亚马逊弹性推断的支持,其中要求将推理的成本削减高达75%。
根据AWS,G4实例也可用于图形 - 密集型工作负载。应用领域包括远程图形工作站,视频转码,照片 - 现实设计和云中的游戏流。它所述G4在上一代G3实例上提供高达1.8倍的图形性能增加,最高可达2倍的视频转码能力。
启动已经推出了一个新的AI芯片,具有10,000倍的带宽来加速人工智能培训。
最新的预测建议在人工智能上支出正在增加,并且需要原始机器学习性能的组织正在转向定制硬件。
“这些性能增强功能使客户能够在云中使用远程工作站以运行Autodesk Maya或3D Studio Max等图形密集型应用,以及有效地为电影和游戏创建照片逼真和高分辨率的3D内容,”亚马逊说。
副总裁Matt Garman在AWS计算服务,说:“通过新的G4实例,我们可以更实惠地将机器学习放在每个开发人员手中。并支持最新的视频解码协议,客户在G4实例上运行图形应用程序以相同的成本在G3实例上获得卓越的图形性能。“
游戏开发人员电子艺术是使用G4实例的组织之一。Erik Zigman,EA的云,社会,市场和云博彩工程副总裁说:“使用AWS的G4实例使我们能够建立经济高效和强大的服务,这些服务优化,为将在线游戏带到各种设备。”