为满足大规模人工智能(AI)和高性能计算(HPC)不断增长的网络需求,包括 AMD、Arista、博通、思科、Eviden(Atos 公司)、HPE、英特尔、Meta 和 微软等在内的世界领先的云服务、半导体和系统提供商,已于2023年7月联合组建了超以太网联盟 (UEC)。
该联盟的技术目标是开发规范、API 和源代码来定义,包括以太网通信的协议、电信号和光信令特性、应用程序接口或数据结构;链路级和端到端网络传输协议,以扩展或替换现有的链路和传输协议;链路级和端到端拥塞、遥测和信令机制;软件、存储、管理和安全结构,以方便各种工作负载和操作环境。
截止今年3月中旬,UEC 共有715 名行业专家积极参与八个工作组,它们分别是物理层、链路层、传输层、软件层、存储、合规性、管理以及性能和调试工作组。目前,UEC规范的制定工作正在稳步推进,按照时间表,1.0 版本计划于2024 年第三季度公开发布。
正如UEC 1.0概述白皮书中所述,UEC致力于通过以太网上的 RDMA(远程直接内存访问)操作现代化来优化AI和HPC工作负载。UEC Transport (UET) 通过提供多种创新来实现这一目标,这些创新可实现更高的网络利用率和更低的尾部延迟,这两者对于减少 AI 和 HPC 作业完成时间都至关重要。
此前,AMD、博通 、英伟达、微软、是德科技、思科、IBM等科技公司已推出了另一种行业标准规范InfiniBand 。InfiniBand定义了用于互连服务器、通信基础设施设备、存储和嵌入式系统的输入/输出架构。而超以太网联盟 (UEC)正在推动的新规范被视为对InfiniBand构成威胁。