当前位置：首页 > 数据中心 > 正文

算力数据中心架构

数据中心
2024-05-05 06:39:21
2995

一、一文读懂智算中心网络

智能算力新时代：让网络架构变得更加智能

随着人工智能的广泛应用，从图像识别到自然语言处理，对计算的需求权力变得更加多样化。。智能计算中心应时代需求而应运而生，其核心在于集成CPU、GPU、ARM、FPGA等异构架构，以适应各种专业计算任务的挑战。2020年人工智能融入新基建、长三角地区快速发展以来，中国智能算力的崛起显得尤为重要。AI模型训练需要密集的矩阵运算，GPU等异构芯片的加速能力很重要。CPU负责交互和同步，深度学习则依赖GPU强大的处理能力，而FPGA和ASIC则展现出高效率。特定场景下的定制优势。

智能训练的分布式特性对网络提出了严格的要求。低时延、宽带宽、可靠的运维支持是智能计算中心网络的基石。面对大规模数据传输，尤其是矩阵运算，需要降低静态延迟（600ns-1us）并优化网络设计。网络跳数和动态延迟。数据中心网络必须支持高效的数据交换，包括通过RDMA技术实现低延迟的节点间通信，才能使大规模分布式训练顺利进行。

弹性扩展和提高资源利用率是智能计算中心网络的核心竞争力。大节点之间的互连需要高带宽和低丢包率，同时优化处理之间的数据访问效率。智能计算中心的网络架构不仅要支持生产、汇聚、调度、释放等多种算力模式，还要实现控制与转发分离，提高资源管理效率和算力调度功能。

在智能计算中心的网络设计中，各种架构策略各有优势。以CPU为中心的资源管理路径、内存管理的分离和独立扩展以及无服务器架构的去中心化都体现了网络在数据中心中的关键作用。例如，Fat-Tree架构（非阻塞、高度可扩展）适合GPU节点，而Dragonfly和Torus则在不同连接模式下提供灵活性。RoCEv2等互连协议使用PFC技术来防止丢包，但必须考虑负载均衡。然而，RoCEv2在入口空间上的限制可能会导致性能瓶颈。此时，InfiniBand网络的Credit信令机制对数据传输进行管理，防止缓冲区溢出，保证网络的高效运行。

智能计算中心网络设计必须考虑低时延、高可用性、节能、安全、可靠。这就要求网络设计者在满足高性能要求的同时，考虑全面的系统优化。中国信息通信研究院、百度智能云、中国移动等权威机构发布的白皮书和行动计划为我们提供了宝贵的指导和实践参考。

总之，智能计算能力的崛起推动了网络架构的创新，而高效、灵活的网络设计是智能计算中心的关键。在AI浪潮中，网络架构智能化能力的增强，将使智能计算中心的效率和效能提升到更高的水平。

二、英伟达发布"核弹"级芯片FF成首批合作者北京时间5月14日晚9点，英伟达CEO黄仁勋发布了一款基于Ampere架构的自动驾驶芯片。受疫情影响，黄仁勋在家厨房提前录制了演讲视频，用三个视频完成了2020年GTC主题演讲和新品发布会。
Ampere架构AI算力提升20倍
在自动驾驶方面，NVIDIACEO黄仁勋在短短几分钟内就迅速发布了基于Ampere架构的自动驾驶芯片。
Ampere是NVIDIA继2018年发布的图灵架构之后推出的最新一代GPU架构，也是NVIDIA推出的第八代GPU架构。黄仁勋表示：“Ampere架构的突破性设计为NVIDIA第八代GPU提供了迄今为止最大的性能飞跃，集成了AI训练和推理，其性能较上一代提升高达20倍。这是A100有史以来第一次可以在单一平台上加速横向扩展和横向扩展工作负载，同时提高吞吐量，同时降低数据中心成本“
”这是NVIDIA第八代GPU历史上最大的增幅。性能飞跃，”黄在视频中说道。据悉，第八代安培架构GPU采用台积电7nm工艺，并采用最新的3D封装技术。540亿个晶体管的集成也使得安培架构GPUA100成为全球最大的7nm芯片。三年前的V100采用的是台积电的12nmFFN制造工艺。
硬件方面，英伟达的自动驾驶芯片包括可以实现ADAS的OrinSoC、可以计算L2自动驾驶的芯片、DRIVEPegasusRobotaxi自动驾驶计算芯片。其中，可以实现ADAS的OrinSoc可以直接安装在汽车后视镜区域。整体尺寸非常小，可以与车载摄像头集成到一个小盒子里。该芯片的功耗仅为5W，计算能力可达10TOPS，这意味着每秒可以执行10万亿次运算。
软件方面，NVIDIA推出了NVIDIADrive软件平台。黄仁勋表示，NVIDIADrive自动驾驶软件平台涵盖了数据收集、训练模型、模拟，最后到实际应用。
事实上，Nvidia的软件和硬件平台并不是相互分离的，而是相互关联的。发布会上，英伟达CEO黄仁勋宣布，Ampere架构是单一可编程架构，生产的自动驾驶芯片将用于无人配送车、轿车、卡车等不同类型的车辆。使用范围更广。
三年前，NVIDIA推出了基于Volta架构的TeslaV100GPU，并推出了基于其的AI系统DGX-1。相比之下，首款基于安培架构的GPUA100是全球最大的7nm芯片。与Volta架构相比，其性能可提升高达20倍。一种架构可以同时用于云端和边缘。
同时，NVIDIA还重点强调了与宝马、法拉第、小鹏汽车、小马智行等车企的重磅合作，这意味着NVIDIA的计算平台和芯片已经全面渗透到汽车领域。
FF最新签约合作伙伴众多
法拉第未来（FF）今日宣布与英伟达达成长期战略合作伙伴关系。此外，英伟达已经与小马智行、小鹏汽车、Canoo等初创公司和车企就自动驾驶芯片展开实质性合作。预计Canoo将于2021年下半年作为共享汽车投产。
FF车型将搭载NVIDIA最先进的自动驾驶技术、FF91升级产品以及其新发布的FF81电动汽车，以及后续的FFV9和FF71车型在未来量产时也将采用NVIDIA最高端、最先进的自动驾驶汽车。驱动芯片平台保持FF在自动驾驶领域的产品竞争力。
小鹏方面，今年新推出的小鹏P7采用了NVIDIA的自动驾驶计算芯片，可实现L2级自动驾驶。自动驾驶测试公司小马智行也采用了NVIDIA的自动驾驶解决方案，目前已在中国和美国的部分城市启动了L4级自动驾驶汽车的载人测试。
自动驾驶测试公司小马智行也采用了NVIDIA的自动驾驶解决方案，在美国加州和中国部分城市推出了自动驾驶网约车服务。美国使用的现代Kona纯电动SUV车型搭载了NVIDIADRIVEAGXPegasus芯片。与上一代DRIVEAGXPegasus一样，它也拥有320TOPS的深度学习计算能力。
事实上，如果开发者使用基于Ampere架构的自动驾驶芯片进行开发，还可以配合Drive软件平台，顺利利用数据收集、训练模型、仿真等各个开发阶段，使整个自动驾驶驾驶技术从软件到算法的发展都是在软件平台上完成的。
绿清观察：
无论是国内还是全球，自动驾驶芯片的竞争都越来越激烈。国内华为海思、中科寒武纪、联发科、地平线、西晶科技、黑芝麻智能、四维图新都在发力自动驾驶芯片，并取得了一定成绩，但与国际芯片巨头英伟达平起平坐还需要时间、Mobileye和英特尔。
本文来自汽车之家车家号作者，不代表汽车之家观点和立场。