从云而上,以边缘为终。
计算支持的层面上云计算、雾计算、边缘计算等相继而起,从场景层面上,智能家居、工业制造、交通政务、环境勘测等各自芬芳。我们能看到的算力形态已开始百花争艳,而在我们看不到的地方,依然有着旺盛的算力需求。
随着“十四五”计划的不断落地,加快数字化发展,大力发展数字经济,打造具有国际竞争力的数字产业集群,全面实施智能制造行动计划,业已成为我国当前发展的重点之一。而企业想要从中脱颖而出,如何突破算力的迷局,找到更加高效的算力形态,就变得至关重要。据英特尔预测,全球的算力需求预计到 2025 年将提升 1000 倍。那么算力需求如此旺盛,哪里才能得到这样的算力呢?算力的形态如此丰富,最终的答案究竟是什么?是 CPU?GPU?ASIC?还是 FPGA?近年来,我们看到了一个更加可靠的答案,那就是:“我全都要。”
异构计算:不仅仅是多面手
“我全都要”并非一种贪心,而是一种趋势。
数字化建设的根源在数据,也在智能。而各行业日趋复杂的大数据和 AI 应用环境下,算力需求爆发式增长,这不仅是量在增加,形态也在变化。但是,作为一家企业,算力与架构及系统的绑定关系使得他们不可能频繁更换底层,因此,当算力的供给增长无法跟上算力需求的脚步,多元化算力的概念就被人开始提起。
异构计算是多元算力的典型。跨越标量(CPU)、矢量(GPU)、矩阵(ASIC)、空间(FPGA)的异构计算,如今已经成为企业推动 IT 基础设施重构的重要力量。其能够将不同架构的运算单元整合到一起进行并行计算,以最适合的专用硬件去做最适合的事如密集计算或外设管理等,从而达到性能和成本的最优化。因此很多企业开始尝试使用异构计算来化解算力瓶颈,挖掘和实现算力增长。
多元算力的应用场景正在变得越发广泛,以快手为例,其在内容生产、内容理解、内容分发、内容消费等过程中都多元算力有着大量需求。尤其是在推荐系统方面,快手采用了计算与存储分离的架构模式,推荐系统中的存储型服务主要是用来存储和实时更新上亿规模的用户画像、数十亿规模的短视频特征、以及千亿规模的排序模型参数。其中参数服务器是一个容量和带宽受限的系统,需要支撑每秒数亿次的KV请求;参数服务器的KV请求也高达每秒数亿次,大规模查表会消耗大量 CPU 资源,成为其性能的主要瓶颈。
异构计算正是快手与英特尔联手给出的答案,通过将负载卸载到专门优化的芯片上,将有助于消除性能瓶颈,在吞吐量与延时方面实现显著改善。
快手LaoFe NDP 异构计算架构
快手可提供异构加速选项的 LaoFe NDP 架构在计算层采用英特尔 CPU、FPGA、PMEM 等器件,实现了基于 LaoFeNDP 架构的 FPGA based KVS 实践落地,进一步提升快手在推荐、搜索、广告、风控等各种场景的应用性能。同时,其通过计算体系结构创新、软硬一体化、领域专用加速器设计,通过网络存、存储、计算三重加速来提供低延迟、高并发、高吞吐、低总体拥有成本(TCO)的基础资源。
中国智能网版权所有,未经书面授权不得复制或建立镜像
Copyright 2001-2018 www.lplzn.com. All Rights Reserved