在9月25日举办的“2021中国智能网卡研讨会”上,中国移动研究院数据中心网络项目经理王瑞雪女士分享了“运营商智能网卡部署场景探索及思考”。
智能网卡的应用场景和选择
关于虚拟化技术发展,最早是单服务器虚拟化,单服务器内物理资源共享、逻辑隔离,但没有实现跨节点共享、弹性资源收缩,后来逐步演进到资源池化,也实现了资源池内计算网络存储的虚拟化,通过云管平台进行统一调度,实现整个资源的共享。
期间也面临挑战:一,如何降低虚拟化本身带来的损耗来提升服务器的性能、业务性能将成为后续整个运营商数据中心演进的趋势。
二,近些年运营商云化的业务越来越多,5G核心网、4G核心网都在做云化的改造,数据中心的流量每年会以25%的速度增长,未来可能会变成100G接入;后摩尔定律时代,CPU 计算能力增速低于网络传输速率增速,且差距持续增大,将网络功能卸载到可编程硬件的需求愈发急迫。
以24核计算型服务器为例,网络功能占用6个core,虚拟化功能占用1个core,可用于VM的core数量为17个,可用CPU资源比例为70%。当网卡升级到100G时,CPU资源基本都被占用,算力资源基本不可用。
基于此,受市场需求的强驱动,在服务器侧引入智能网卡,将网络、存储、操作系统中不合适CPU处理的高性能数据处理功能卸载到硬件芯片执行,提升数据处理能力,释放CPU算力。
智能网卡能做什么?
王瑞雪介绍,智能网卡主要有五大应用场景:1)网络、存储等功能卸载,释放可用CPU资源,提高对外服务能力,增产增收;2)DPDK、SPDK和RDMA等技术集成,通过各种KernelBypass技术,在用户态完成业务处理,提高服务器性能,硬件替代CPU完成专业设备NFV后处理逻辑,实现硬件加速;3)针对特定业务逻辑进行硬件加速;4)解决裸金属存储网络的安全隐患,存储网络信息不再暴露给到用户权限界面之内,从而解决原有安全隐患;5)业务端到端网络可视化,将观察点从硬件交换机延伸到主机侧,实现网络端到端网络运维可视化。
王瑞雪指出,目前市场上加速芯片有多种选择,单一加速芯片难以满足复杂多样的加速场景,因此需要综合考虑业务需求、芯片能力以及加速芯片的产业成熟度、功耗等,选择适合的加速芯片,以达到更好的加速效果。
目前业内主流网卡分为四类:1)SOC是通过CPU上做业务功能加速,更适合业务初期,网络业务需求不是完全固定,这个过程中可编程和灵活性会更强一点。2)NP现在用的比较少,后续可能不是智能网卡主流的演进趋势。3)目前用的比较多的是FPGA+CPU,可编程、灵活性比较高,时延和功耗适中。4)ASIC芯片性能高,功耗低,成本也比较低,但灵活性也比较差,适合用在需求相对比较明确的时候,用ASIC来降低成本和功耗。
5G时代运营商网络演进趋势
“5G时代,运营商网络正在从自动化向智能化演进,从聚焦业务快速发放向数据高效处理、网络高效运维转变。大网上也是这样的趋势,数据中心网络也需要配合骨干网去做配套的演进。”王瑞雪表示。
具体表现在大带宽、低延时、可视化运维和NFV上所产生的影响。
一是大带宽的变化,数据驱动网络带宽以几何级数增长,接口速率向100G接入400G汇聚演进;
二是低时延的影响,分布式数据中心架构,我们希望算力向边缘移动,降低成本,同时降低功耗;
三是可视化运维影响,业务端到端网络流量可视化,端到端,不仅是虚机到虚机未来是需要跨骨干网的虚机到虚机的实现智能化、精细化运维;
四是NFV,对运营商网络比较特殊,尤其是5G时代,控制面网元已全面实现NFV化,这种网元对性能要求不是很高。未来随着虚拟化进度不断加深,会在边缘板、UPF、DPI、BRAS-U也做虚拟化,并逐步实现软硬解耦灵活弹性,这个过程中它对性能的要求不断增高,现在技术还没有办法满足。
运营商网络引入智能网卡后,可实现网络、存储、运维、业务能力卸载。
具体来讲,在网络功能卸载方面,持续向大规模、大带宽演进。中国移动IT云和网络云均采用混合SDN方案,面向不同业务提供虚拟机或裸机部署能力,面向虚拟化场景,引入智能网卡突破提升vSwitch转发性能和数据处理能力;面向裸机场景,引入智能网卡构建弹性裸金属服务。
在存储功能卸载方面。包括云盘挂载卸载和高性能存储协议卸载,前者通过支持virtio-blk,提高存储访问灵活性和安全性;后者面向边缘计算视频加速、CDN等场景,进一步提升存储协议处理性能,构建端到端低时延网络。
在运维能力卸载方面,满足业务网络端到端可视化的需求。传统SNMP协议,无法反映路径、丢包、时延等真实网络状态;随着VxLAN、RDMA等协议部署,网络转发行为愈发黑盒。引入智能网卡实现真正实现业务端到端网络可视化,降低CPU消耗。
在业务功能卸载方面,满足高性能网元虚拟化的需求。5G时代用户面网元大量下沉到边缘,以满足低时延、大带宽的业务需求,同时通过NFV技术,提升网元部署的灵活性,实现软硬件解耦;相对于传统专用硬件,虚拟化用户面网元采用CPU处理业务逻辑,导致网络功能受限、处理性能低。因此,UPF虚拟化采用智能网卡加速业务处理已成为业内主流方案。
演讲最后,王瑞雪表示,运营商网络引入智能网卡同样也面临着挑战,主要有两点:一是标准化待成熟,引入面临解耦压力。
运营商网络功能都是标准化的,而智能网卡的标准化还不够成熟。目前仅OVS转发面卸载,面临很强的解耦压力,还不能称为真正意义上的解耦。多云多业务场景需适配不用类型智能网卡,随着逐步引入存储功能卸载、业务功能卸载、运维功能卸载后,会迎来越来越多的异厂家、异构智能网卡及解耦场景。后续如何实现解耦标准化工作,是后续运营商落地智能网卡的关注点。
二是如何进行集成度、灵活性、可靠性取舍。如果将多个业务放在一张网卡上,实现高集成度、低成本,就有可能出现单网卡端口密度高、单网卡故障影响范围大的后果,影响运营商网络的高可靠和安全性。
王瑞雪表示,运营商引入智能网卡,将考虑其演进方向,为多业务场景提供灵活的功能,并将测试相关技术规范,助推智能网卡产业发展。
相关标签: