2. 由于 FPGA based KVS 方案能够在单节点服务器中提供远超传统方案的吞吐性能,因此仅需要部署少量的服务器就能够满足特定的性能指标要求(替代比可达 1:5),从而降低参数服务器的 TCO。
3. 通过使用 FPGA 来进行查表,能够有效地降 CPU 由于高频率更新而产生的性能抖动。
总结一下,英特尔® Stratix® 10 FPGA 为快手 LaoFe NDP 架构提供了富于弹性的可编程硬件能力,减少延时,实现精确控制,而且其单位算力功耗低、片上内存大,能够适用于延时要求高、批处理(Batch)比较小、并发性和重复性强的应用场景。
FPGA based KVS 方案与传统方案性能对比
英特尔® 至强® 可扩展处理器针对众多工作负载类型和性能等级而优化的平衡架构,其对于 LaoFe NDP 非常重要,能够为之提供内置的人工智能加速和高级安全功能,可提供无缝性能基础,帮助从边缘到云加快数据的变革性影响。除此以外它横跨计算、网络、存储的平台创新和硬件增强虚拟化,均支持新型内存创新,促进以经济实惠、灵活、可扩展的方式实现边缘到云的传输,从而一致地提供出色的企业对企业(B2B)和企业对消费者(B2C)体验。同时英特尔硬件增强的安全性有助于抵御恶意攻击,同时保持工作负载的完整性和性能。
英特尔® 傲腾™ 持久内存集高速、高性价比、大容量、持久数据保护和高级加密等优势于一体,在其推出之时便引发了巨大反响。它能够为 LaoFe NDP 增加全新的内存和存储层级,缩小内存和存储层次架构之间的关键差距,从而实现更智能、更灵活的架构。其能实现每台服务器的内存容量翻倍,且每台虚拟机的成本降低达 25%,在进行实时分析和 AI 工作负载等需要处理大量数据集的服务,性能提升可高达 2 倍。除此以外它还提供了内存模式(Memory Mode)和应用直接访问模式(App Direct Mode)两种模式。在内存模式下,英特尔® 傲腾™ 持久内存可作为经济高效的 DRAM 替代品。CPU 内存控制器会把持久内存视作易失性的系统内存,表现与 DRAM 类似,同时 CPU 内存控制器会将 DRAM 内存用作持久内存的高速缓存。该模式能够提供更大的内存容量,这对于异构计算的提升效果是巨大的。
软硬并进,异构即兼容
你见,或者不见,算力就在那里。异构计算衍生发展数十年,其就像一座矿山,等待用户的去发掘。宝剑赠英雄,开发者们如何充分挖掘现有异构硬件的性能,获得最优性价比的 IT 资源才是关键。
“软硬兼施”才能更好的应对异构计算的需求。
在硬件层面,英特尔提出 XPU 战略,完善在 CPU、GPU、ASIC、FPGA 领域的产品线。不仅通过性能核心和能效核心战略,使CPU中不同核心负责不同工作负载,实现 CPU 集群自身的异构,同时通过 AMX、SSE、AVX、AVX-512 等指令集扩展,大幅度提升 CPU 的 AI 运算性能。在全新的第四代英特尔®至强®可扩展处理器中,加入了更多异构加速引擎,比如加速内存拷贝的 DSA,加速网络处理的 DLB,加速大数据分析的 IAA,加速数据加解密、压缩解压缩的 QAT,使 CPU 弹性进一步提升,轻松应对多种工作负载的性能加速需求。
中国智能网版权所有,未经书面授权不得复制或建立镜像
Copyright 2001-2018 www.lplzn.com. All Rights Reserved