
渲云GPU渲染全面升级!Tesla P40上线专享非凡体验

一个值得三维设计师击掌同乐的消息:渲云GPU渲染服务(http://www.xrender.com)将全面配备NVIDIA Tesla P40,可部署提供更大的吞吐量。每个GPU可带来47TOPS(万亿次运算/秒)的推理性能和INT8运算能力,使得一台配备8个Tesla P40的服务器可提供相当于超过140台CPU服务器的性能。Tesla P40 可在极其复杂的模型中实现实时响应,能够降低延迟,将性能提升为CPU的30倍以上。
TESLA P40加速器产品特点
➤ 140倍吞吐量应对爆炸性数据
Tesla P40配备新的Pascal架构,可带来超过47 TOPS的深度学习推理性能。在处理深度学习工作负载方面,一台使用8个Tesla P40服务器可替代140台只使用CPU的服务器,因而可以大幅提升吞吐量并降低购买成本。
➤ 单一训练和推理平台简化了操作
目前,深度学习模型在 GPU 服务器上接受训练,但在 CPU 服务器上部署,以便进行推理。Tesla P40 提供极简工作流程,因此组织可以使用相同的服务器进行迭代和部署。
➤ 强悍的实时推理能力
Tesla P40具备INT8运算能力,可在极其复杂的深度学习模型中实现实时响应,能将推理性能速度提升高达30倍。
➤ 超高显存配备及性能
密集型计算应用需要高性能计算单元,同时高速访问数据也非常重要。在很多HPC应用中,简单的提升HPC计算性能实际计算效率并不明显,除非显存性能也同时提升。基于这个原因,Tesla P40提供了更好的性能及显存规格,24GB,带宽346 GB/s,无论是在显存容量,还是显存频率上,都是远超同类产品。
对于消费级用户来说,GPU就是玩游戏。对于专业人员来说,GPU是计算工具。NVIDIA 针对消费级用户设计GeForce系列产品,针对专业领域企业级用户设计Tesla系列产品。与同类型产品相较,Tesla P40有哪些优势?
Tesla P40 与同类型产品比较
Tesla P40 VS GeForce 1080Ti
1、错误检测和纠正,术业有专攻
在计算领域,非常依赖于GPU返回数据的准确性,即使内存出现单比特错误也可能导致计算结果的极大误差。Tesla P40不仅能检测并纠正单比特错误也可以发现并警告双比特错误,这对保证计算结果的精准性来说非常重要。
2、显存性能及配备高人一等
系统内存越多,运行速度越快。尤其对于某些HPC应用程序来说,内存不够甚至不能执行单次运行。GeForce显卡只能提供12GB显存,而Tesla P40 GPU可提供2倍显存——24GB,这对GPU执行深度学习运算时使用更大的框架提供了支持。
3、双DMA引擎,赢在起跑线
GeForce产品一般只有单个DMA引擎,Tesla GPU产品采用双DMA引擎,数据可以在CPU和GPU之间同时输入和输出,无需等待,效率更高。
4、64-bit双精度浮点运算
P40拥有双精度浮点运算能力,对于专业领域来说,准确性是计算结果的重要指标,Tesla与GeForce的双精度浮点运算能力相差十几倍之多。