什么是多云网络(MCN)?
多云网络 (MCN) 指的是实现跨公有云和私有云环境的安全、一致连接的技术、架构和运维框架。它允许组织将运行在不同云提供商中的工作负载互连,同时保持统一的策略执行、性能管理和安全控制。
与单云部署不同,多云环境将应用程序、数据和服务分布在不同的平台和区域。这些环境通常包含混合基础设施,其中公有云与私有数据中心或托管设施集成。多云网络可确保可靠的云间通信,支持分布式工作负载,并实现对地理位置分散的资源进行集中管理。
随着企业规模扩大数字化运营,MCN 对于在复杂的云架构中保持性能、弹性和运营一致性至关重要。
企业为何采用多云网络
企业采用多云网络来支持分布式计算应用、降低对单一云服务提供商的依赖并提高运营灵活性。随着数字服务跨区域和跨平台扩展,企业需要跨云环境实现一致的连接性、治理和性能。
- 避免供应商锁定 - 实现工作负载在不同提供商之间的可移植性,减少对单一云平台的长期依赖。
- 提高弹性 - 将应用程序和数据分布在多个环境中,以最大限度地减少停机时间并减轻提供商级别的故障。
- 优化性能 - 将工作负载放置在更靠近用户或专用服务的位置,以减少延迟并提高应用程序响应速度。
- 监管合规性 - 通过将工作负载分配到特定地理区域或云提供商来支持数据驻留要求。
- 地理分布 - 通过在多个云区域部署服务来扩大全球覆盖范围,从而服务于分散的用户群。
多云网络的工作原理
多云网络可在运行于不同云提供商(以及在许多情况下,私有数据中心)的工作负载之间建立安全、高性能的连接。它创建了一个统一的网络层,从而实现跨环境的一致路由、策略执行和流量管理。
MCN通常通过以下机制的组合来运作:
- 组织使用加密的虚拟专用网络连接,通过公共互联网基础设施安全地连接云环境。
- 企业在云提供商之间或云与本地基础设施之间部署专用私有互连,以提高可靠性并降低延迟。
- 软件定义网络平台可对分布式云网络中的路由、分段和策略执行进行集中控制。
- 叠加网络技术创建抽象的、虚拟化的网络层,从而实现不同云提供商之间的连接标准化。
- 集中式策略管理系统在所有连接的环境中强制执行一致的安全规则、访问控制和流量策略。
这些机制共同实现了云到云的联网,支持分布式应用程序,并在多云架构中保持一致的操作控制。
多云网络与混合云网络
虽然多云网络和混合云网络相关,但它们针对的是不同的架构模型和连接要求。
多云网络的核心在于实现跨公有云平台的一致连接和治理。相比之下,混合云网络则侧重于将私有基础设施与公有云资源集成。许多企业同时部署这两种模式,这就需要能够大规模支持内部和外部集成的架构。
多云网络的关键组成部分
多云网络构建于分层功能之上,可实现一致的连接、跨环境强制执行策略并大规模维持运维控制。这些组件协同工作,消除了不同云服务提供商之间的网络差异,并在分布式云平台之间创建统一的架构。
连接性
连接性建立了将云提供商、区域和企业基础设施连接成一个统一网络的传输机制。它定义了流量如何在不同环境之间流动,以及如何在行政边界之间执行路由决策。
加密隧道可在共享基础设施上提供安全传输,而专用私有互连则可实现云平台和私有数据中心之间的确定性路由。高容量连接支持跨地理位置分散环境的持续云间数据交换和应用程序通信。
安全
安全功能确保策略的一致性,无论工作负载位于何处。由于每个云提供商实现网络控制的方式各不相同,因此集中式强制执行对于避免配置漂移和治理碎片化至关重要。
身份和访问管理系统提供跨平台的统一身份验证和授权。加密技术保护在不同环境间传输的数据,而分段框架则隔离工作负载,以强制执行信任边界并减少跨环境风险。
可见性和监测
可视性能够提供跨多个云网络的运行状况信息。如果没有整合的洞察,故障排除和合规性验证就会分散在各个提供商之间。
集中式管理系统将配置状态、路由策略和遥测数据聚合到一个统一的控制层中。流量分析和监控工具能够深入了解云间流量、利用率模式和策略执行情况,从而支持基于充分信息的架构和运维决策。
自动化
自动化能够实现对分布式网络环境的可扩展控制。随着多云架构的扩展,手动配置会增加风险并减慢部署速度。
策略驱动的编排实现了跨平台资源配置、路由更新和分段规则的标准化。自动化工作流确保了部署模型的一致性,降低了运维开销,并支持工作负载在云环境间动态扩展。
性能考量
在多云网络架构中,性能是关键的差异化因素。由于工作负载跨越不同的提供商和区域,延迟会直接影响实时应用程序、分布式数据库和事务系统。区域间延迟会影响用户体验和数据一致性,因此工作负载的放置成为一项至关重要的设计决策。
随着东西向流量、数据集复制和服务同步导致网络负载持续增加,带宽需求也随之增长。数据引力使大型数据集的迁移变得复杂,进而影响应用程序和存储资源的部署位置。
人工智能和分析工作负载进一步提高了对网络性能的要求。模型训练和分布式处理需要计算集群和存储系统之间具备高吞吐量、低延迟的连接。这些需求与数据中心网络架构设计直接相关,其中高带宽适配器、低延迟网络结构和可扩展的脊叶式架构能够确保云连接基础设施的可预测性能。
面向人工智能和分布式工作负载的多云网络
人工智能和分布式计算环境对多云网络架构提出了更高的要求。企业越来越多地进行跨云模型训练,以利用专用服务或区域可用的计算资源,这就要求不同环境之间保持稳定、高速的连接。跨提供商的数据集复制可以确保可用性和合规性,但也会增加网络流量和带宽消耗。分布式存储系统必须跨区域保持同步,以维护数据完整性并支持大规模分析工作流。
图形处理器 (GPU) 集群通信进一步提高了性能要求,尤其是在 AI 训练或推理工作负载跨越多个位置时。高吞吐量、低延迟的网络对于防止计算节点和存储系统之间出现瓶颈至关重要。在这些场景中,多云网络必须与数据中心基础设施设计紧密结合,以确保云连接环境能够大规模地支持持续的数据传输、并行处理和分布式 AI 流水线。
基础设施要求
多云网络需要可扩展的基础设施来支持分布式工作负载和安全、高性能的连接。随着云间流量的增长,底层计算、存储和网络必须能够大规模地保持稳定的性能。
计算
计算基础设施必须支持虚拟化、容器化和跨多个云平台运行的分布式应用程序。对于分析和人工智能工作负载而言,CPU、内存和加速器资源(包括GPU服务器配置)的可扩展性通常至关重要。
- 高性能服务器(例如刀片服务器)具有可扩展的处理器和内存配置,能够实现分布式处理和云集成工作负载。
- 虚拟化支持可确保跨多云环境的工作负载迁移和编排的一致性。
存储
存储平台必须在保持跨区域和跨提供商数据一致性的同时,维持高吞吐量。在分布式架构中,复制和同步至关重要。
- 分布式存储系统为跨越云和私有基础设施的工作负载提供弹性和可扩展性。
- 对象存储平台支持跨环境的非结构化数据、备份和 AI 数据集。
网络
网络基础设施必须在持续的云间流量下提供可预测的性能。随着东西向流量的增加,带宽和延迟成为关键的设计因素。
- 高带宽网络适配器可加速计算、存储和云网关之间的数据传输。
- 脊叶式架构提供可扩展、无阻塞的网络性能。
- 低延迟网络支持实时处理和分布式人工智能通信。
电力和冷却
更高的计算密度和持续的网络利用率会增加电力和散热需求。数据中心设计必须满足高性能工作负载的需求,同时保持效率。
多云网络中的安全与治理
安全和治理框架必须在所有互联的云环境中保持一致,以降低风险并保持运营控制。
- 一致的访问控制可确保不同提供商之间采用统一的身份验证和授权策略。
- 数据保护旨在保护传输中的信息以及分布式存储环境中的信息安全。
- 合规控制措施支持监管要求和数据驻留要求。
- 流量分段可隔离工作负载,从而减少横向移动并遏制威胁。
- 风险管理流程用于识别、评估和减轻多云架构中的风险敞口。
多云网络面临的挑战
尽管多云网络具有诸多优势,但也带来了架构和运维上的复杂性。
- 随着团队管理多个平台、工具和策略,运营复杂性也会增加。
- 当不同服务提供商之间的监控系统没有完全整合时,就会出现可视性差距。
- 不同的云网络模型和配置标准会带来集成方面的挑战。
- 性能不可预测性可能源于区域间延迟和供应商基础设施的差异。
- 随着数据传输和互连费用的增加,成本管理变得越来越困难。
结论
多云网络支持跨不同云环境构建灵活的分布式基础设施,是现代多云架构的关键层。通过支持安全、可扩展的云间网络连接,企业可以保持工作负载的迁移性、弹性和地域覆盖范围。然而,成功取决于周密的性能规划、延迟管理和带宽配置。最终,架构完善的计算、存储和企业网络基础设施为可靠、高性能的多云运行奠定了基础。
常见问题
- 哪些因素会影响云到云网络的成本?
云间网络成本取决于数据传输量、跨区域流量、运营商出口费用和专用互连服务。持续的东西向流量、数据复制和人工智能工作负载迁移会显著增加运营成本。 - 企业混合云网络有何不同?
混合云网络将私有基础设施与公共云平台连接起来,安全地将企业网络扩展到外部环境。它优先考虑本地系统和云资源之间的集成、合规性和一致的访问控制。 - 多云网络的主要运营挑战是什么?
多云网络会带来运营复杂性、可视性差距、集成挑战、性能波动和成本管理难题。企业需要集中化的治理和专业的网络架构规划,才能跨云服务提供商保持控制。