跳至主要内容

什么是工作负载?

工作量

在信息技术(IT)领域,工作负载指的是在基础设施环境中消耗IT资源的计算任务、应用程序、服务或进程。这些资源包括处理能力、内存、存储容量和网络带宽。从运行商业应用程序到处理人工智能模型,每一项数字操作都代表着在底层硬件和软件系统上运行的工作负载。

工作负载决定了基础设施的使用方式。它们决定了所需的性能水平、系统应如何扩展、数据如何存储和传输,以及如何确保可用性和弹性。在企业环境中,工作负载的范围可以从传统的业务应用程序和企业级 Web 工作负载,到大规模分析、虚拟化、高性能计算(HPC)以及由人工智能(AI)驱动的服务。

随着 IT 环境的不断演进,工作负载已不再局限于单台服务器或单个数据中心。它们可能运行在私有数据中心、公有云环境、混合部署以及边缘节点中。每项工作负载都具有独特的特性,这些特性会影响基础设施的设计,包括计算强度、内存消耗、对延迟的敏感度、存储吞吐量要求以及可扩展性需求。

了解什么是工作负载以及不同工作负载的行为特征,是设计高效、可扩展且节能的IT系统的基础。

IT 工作负载的类型

IT 工作负载因所支持的应用程序、处理的数据以及所需的性能水平而差异显著。有些工作负载需要强大的计算能力,而另一些则更重视存储容量、内存带宽或低延迟网络。了解工作负载类别有助于企业将基础设施资源与运营需求、可扩展性目标及效率目标相匹配。以下各节概述了现代企业、云和边缘环境中常见的主要工作负载类型。

计算密集型工作负载

计算密集型工作负载在执行复杂计算或大量并行任务时,高度依赖处理能力。此类工作负载会消耗大量中央处理器(CPU)或图形处理器(GPU)资源,常见于高性能计算(HPC)、科学仿真、金融建模以及媒体渲染等领域。

人工智能(AI)和机器学习(ML)的训练工作负载也属于这一类别,尤其是涉及大型数据集和深度神经网络时。此类环境通常受益于专为加速并行处理和提升性能效率而设计的GPU优化系统。

企业级 Web 工作负载

企业级 Web 工作负载支持基于 Web 的应用程序、电子商务平台、内容管理系统以及服务于业务运营的应用程序编程接口(API)。这些工作负载必须能够应对流量波动,保持高可用性,并实现水平扩展以满足不断增长的用户需求。

它们通常运行在虚拟化或容器化环境中,并部署在分布式基础设施上。为了确保性能的一致性和可扩展性,企业通常依赖于专为企业数据中心设计、能够支持高密度部署并确保可靠运行时间的可扩展机架式系统。

内存密集型工作负载

内存密集型工作负载依赖于大容量内存和高带宽来实时处理数据。内存数据库、实时分析平台和缓存系统需要快速访问存储在 RAM 中的数据,以最大限度地降低延迟并提高事务处理速度。

这些工作负载对内存架构和系统配置尤为敏感。合理的资源分配可确保在持续或不可预测的需求下,性能保持稳定。

存储密集型工作负载

存储密集型工作负载优先考虑大容量存储系统、快速的输入/输出性能以及数据持久性。此类工作负载的示例包括大数据分析、备份和灾难恢复环境、数据湖、视频归档以及企业文件系统。

此类工作负载可能需要高吞吐量的存储架构,并支持 NVMe 和软件定义存储等技术。基于大容量存储平台构建的基础设施能够提供所需的性能和可扩展性,从而高效管理庞大且不断增长的数据集。

云原生和分布式工作负载

云原生工作负载采用现代应用架构(如容器、微服务和编排框架)进行设计。与单体应用不同,这些工作负载由多个小型、独立的服务组成,这些服务可以单独扩展,且在更新时不会影响整个系统。

分布式计算模型通过将处理任务分散到多个系统中,从而增强了系统的弹性和可扩展性。支持这些架构的基础设施通常采用多节点服务器架构,以提升集群计算环境中的资源利用率、容错能力和水平扩展能力。

边缘工作负载

边缘工作负载是指需要在数据生成点附近进行数据处理的应用程序。此类工作负载通常对延迟或带宽要求较高,常见于电信、零售运营、制造系统、医疗保健环境以及智能基础设施部署中。

由于边缘工作负载通常在集中式设施之外运行,因此需要紧凑且可靠的基础设施,以适应分布式环境。部署过程中可采用专为支持本地化处理和业务连续性而设计的边缘计算系统

工作量特征与资源需求

每种工作负载都具有特定的技术特征,这些特征决定了基础设施的设计方式。这些特征会影响处理器的选择、内存容量、存储配置、网络带宽以及系统密度。了解工作负载的行为,有助于企业将资源配置与性能预期相匹配,同时保持效率和可扩展性。

计算需求通常是最直观的因素。人工智能训练、建模和高级分析需要由经过GPU优化的服务器提供的加速处理能力,而传统的企业应用程序则可能更注重均衡的CPU性能和虚拟化能力。

内存需求同样至关重要。内存数据库和实时分析平台依赖于大容量内存和高带宽,以避免性能瓶颈。存储密集型工作负载(包括大型数据库和数据湖)需要基于大容量存储平台构建的、具有一致吞吐量和可扩展性的架构,以便在数据量增长时保持响应能力。

可扩展性也决定了工作负载的设计。分布式和云原生应用程序通常依赖于多节点服务器架构和云原生基础设施平台,以支持水平扩展和应对需求波动。


 

工作负载的运行环境:数据中心、云、混合云和边缘

现代工作负载可根据业务目标、监管要求、性能预期和成本考量,部署在各种环境中。虽然工作负载类型决定了应用程序的行为方式,但部署模型则决定了这些工作负载的运行位置。

本地数据中心工作负载

本地部署使组织能够完全掌控基础设施、安全策略和合规管理。关键任务数据库、企业资源规划(ERP)系统以及企业内部 Web 工作负载通常运行在专用的企业数据中心内,这些数据中心旨在提供可预测的性能和高可用性。

基于刀片服务器或可扩展机架式系统构建的基础设施,能够实现高密度部署、集中管理以及长期的基础设施规划。

公有云工作负载

公有云环境提供弹性容量和按使用量计费的定价模式。当组织需要快速扩展、实现地理分布或降低资本支出时,通常会将工作负载部署到公有云上。

公有云部署通常基于专为虚拟化、容器化和大规模资源池化而设计的基础设施构建。

混合云工作负载

混合部署将本地基础设施与公有云基础设施相结合,使组织和企业能够根据性能、成本、数据主权或监管要求来部署工作负载。这种模式既支持工作负载的动态迁移,又能确保对敏感系统的控制权。

混合云企业战略通常依赖于可扩展的基础设施,这种基础设施能够在不同环境中保持一致的运行状态,支持工作负载的可移植性,并实现资源的均衡分配。

边缘部署

边缘部署将基础设施的覆盖范围从集中式数据中心延伸至更远的地方,以便在更接近用户、设备或数据源的位置进行实时处理。企业采用边缘战略,旨在降低延迟、减少带宽消耗并提升应用程序的响应速度。

此类环境通常依赖于专为分布式运行和空间受限场所设计的边缘计算平台

工作负载管理与优化

工作负载管理是指用于在应用程序和服务之间高效分配计算资源的流程和技术。随着企业需要在数据中心、云环境和边缘节点上运行日益多样化的工作负载,有效的工作负载管理对于维持性能、可靠性和成本控制至关重要。

从本质上讲,工作负载管理涉及监控资源利用率、平衡计算和内存分配,并确保应用程序获得所需容量,同时避免基础设施过度配置。虚拟化平台和容器编排框架支持动态资源分配,使工作负载能够根据实时需求进行扩展。对于流量模式多变的企业级 Web 工作负载和云原生应用程序而言,这种弹性尤为重要。

优化不仅限于扩展。它还包括使工作负载需求与系统架构相匹配,从而提高每瓦性能、降低延迟并提升吞吐量。计算密集型应用程序可借助 GPU 优化服务器提供的加速处理功能而受益,而数据密集型环境则依赖于专为提供稳定输入/输出性能而设计的大容量存储平台。分布式应用程序通常依赖于多节点服务器架构,以提高系统韧性和资源利用率。

通过持续评估工作负载行为和基础设施性能,企业可以提高资源利用率、降低运营成本,并确保 IT 环境能够持续响应不断变化的业务需求。有效的工作负载优化最终能够支持可扩展的增长,同时保持可预测且节能的运营。

工作负载关键性、安全性与基础设施设计

并非所有工作负载对业务的影响程度都相同。有些应用程序直接支持营收或关键业务运营,而另一些则仅用于内部或开发目的。因此,基础设施决策必须体现工作负载的优先级、风险承受能力、性能要求以及合规义务。评估工作负载的关键性,有助于企业使系统架构与服务水平预期、安全标准以及长期运营战略保持一致。

工作负载关键性与服务级别

工作负载通常根据其对业务连续性的重要性进行分类。任务关键型工作负载(例如事务性数据库或核心企业 Web 工作负载)需要高可用性、极低延迟以及严格的运行时间保障。业务关键型工作负载虽然可以容忍有限的停机时间,但仍要求性能可靠。非关键型工作负载(包括开发和测试环境)在资源分配方面通常具有更大的灵活性。

服务级别协议(SLA)规定了性能基准、正常运行时间目标和恢复目标。要满足这些要求,通常需要基于刀片服务器平台或多节点架构构建冗余、集群和容错架构。使基础设施与工作负载优先级保持一致,既能确保资源得到合理分配,又能最大限度地降低运营风险。

安全与合规要求

工作负载的敏感性对部署和基础设施设计有着显著影响。处理受监管、机密或专有数据的应用程序必须遵守严格的安全和合规标准。这些要求可能包括加密、访问控制、工作负载隔离、审计日志记录以及数据驻留政策。

某些工作负载可能需要保留在受控的本地环境中,以满足合规要求;而其他工作负载则可在混合云或云环境中运行。支持敏感应用程序的基础设施必须经过精心设计,在确保数据完整性和可用性的同时,不影响系统性能。专为安全且可扩展的部署而设计的平台(包括某些机架式系统)有助于企业平衡数据保护与运营效率。

分层基础设施设计

企业通常会实施分层基础设施策略,以使系统能力与工作负载的重要性及性能需求相匹配。

一级工作负载

一级工作负载是指对可用性、容错能力和性能一致性要求极高的关键任务型应用程序。此类环境通常依赖于高度冗余的架构以及专为确保持续运行而设计的企业级系统。

二级工作负载

第 2 层工作负载支持重要的业务功能,但在维护或突发事件期间可容忍有限的停机时间。该层的基础设施通常在保持可靠性的同时,兼顾性能与成本效益。

第3级工作负载

第3层工作负载包括开发、测试、归档或非关键服务。此类工作负载侧重于成本优化和资源整合,通常运行在共享或低密度系统上,例如用于归档或备份类应用程序的大容量存储系统。

通过采用分层基础设施设计,企业能够根据工作负载的优先级调整性能、安全性和投资水平,从而确保关键业务系统获得相应的资源,同时保持非关键应用程序的成本效益。

常见问题

  1. 工作负载与应用程序有何区别?
    应用程序是指执行特定任务的软件程序。工作负载则代表由一个或多个应用程序、服务和进程产生的总计算需求,其衡量标准是这些组件对计算、内存、存储和网络资源的综合消耗。
  2. 什么是企业级 Web 工作负载?
    企业级Web工作负载由支持核心业务功能的 Web 应用程序组成,包括电子商务平台、客户门户和 API。这些工作负载需要具备高可用性、可扩展性和稳定的性能,以应对波动的用户需求以及影响营收的业务操作。
  3. 什么是工作负载自动化?
    工作负载自动化利用软件工具,在无需人工干预的情况下对计算任务进行调度、执行和管理。它协调作业依赖关系、资源分配和弹性扩展活动,帮助企业提高效率、减少错误,并保持稳定的运营性能。
  4. 什么是云工作负载?
    云工作负载是指在公有云、私有云或混合云环境中运行的应用程序或服务。此类工作负载通常使用虚拟机或容器,并能利用弹性扩展性和分布式资源可用性带来的优势。
  5. 什么是关键任务工作负载?
    关键任务工作负载是指对核心业务运营至关重要的应用程序。其停机或性能中断可能会造成重大的财务或运营影响,因此需要具备高可用性、冗余性、明确的恢复目标以及严格的服务水平承诺。
  6. 工作负载如何影响基础设施设计?
    工作负载根据计算强度、内存使用情况、存储吞吐量、对延迟的敏感度以及可扩展性需求来决定基础设施的要求。了解这些因素,可确保系统架构能够提供适当的性能、可靠性和成本效益。
  7. 什么是工作负载可扩展性?
    工作负载可扩展性是指应用程序应对需求变化的能力。它可以通过增加系统资源进行垂直扩展,或通过将任务分布到多个系统上进行水平扩展,从而保持一致的性能。