Saltar al contenido principal

¿Qué es la carga de trabajo?

Carga de trabajo

En tecnología de la información (TI), una carga de trabajo se refiere a las tareas informáticas, aplicaciones, servicios o procesos que consumen recursos de TI dentro de un entorno de infraestructura. Estos recursos incluyen potencia de procesamiento, memoria, capacidad de almacenamiento y ancho de banda de red. Toda operación digital, desde la ejecución de una aplicación empresarial hasta el procesamiento de modelos de inteligencia artificial , representa una carga de trabajo que opera sobre sistemas de hardware y software subyacentes.

Las cargas de trabajo definen cómo se utiliza la infraestructura. Determinan el nivel de rendimiento requerido, la escalabilidad de los sistemas, el almacenamiento y la transferencia de datos, y el mantenimiento de la disponibilidad y la resiliencia. En entornos empresariales, las cargas de trabajo pueden abarcar desde aplicaciones comerciales tradicionales y cargas de trabajo web empresariales hasta análisis a gran escala, virtualización, computación de alto rendimiento (HPC) y servicios basados ​​en inteligencia artificial (IA).

A medida que evolucionan los entornos de TI, las cargas de trabajo ya no se limitan a un solo servidor o centro de datos. Pueden ejecutarse en centros de datos privados , entornos de nube pública, implementaciones híbridas y ubicaciones periféricas. Cada carga de trabajo tiene características únicas que influyen en el diseño de la infraestructura, como la intensidad de procesamiento, el consumo de memoria, la sensibilidad a la latencia, los requisitos de rendimiento del almacenamiento y las demandas de escalabilidad.

Comprender qué es una carga de trabajo y cómo se comportan las diferentes cargas de trabajo es fundamental para diseñar sistemas de TI eficientes, escalables y optimizados en cuanto al consumo de energía.

Tipos de cargas de trabajo de TI

Las cargas de trabajo de TI varían considerablemente según las aplicaciones que soportan, los datos que procesan y los niveles de rendimiento que requieren. Algunas exigen una gran capacidad de procesamiento, mientras que otras priorizan la capacidad de almacenamiento, el ancho de banda de la memoria o las redes de baja latencia. Comprender las categorías de cargas de trabajo ayuda a las organizaciones a alinear los recursos de infraestructura con las necesidades operativas, los objetivos de escalabilidad y las metas de eficiencia. Las siguientes secciones describen los principales tipos de cargas de trabajo que se encuentran en los entornos empresariales, de nube y de borde modernos.

Cargas de trabajo que requieren mucha capacidad de cálculo

Las cargas de trabajo que requieren un uso intensivo de recursos computacionales dependen en gran medida de la potencia de procesamiento para ejecutar cálculos complejos o grandes volúmenes de tareas paralelas. Estas cargas de trabajo consumen importantes recursos de la unidad central de procesamiento (CPU) o de la unidad de procesamiento gráfico (GPU) y son comunes en la computación de alto rendimiento (HPC), las simulaciones científicas, la modelización financiera y la renderización multimedia.

Las cargas de trabajo de entrenamiento en inteligencia artificial (IA) y aprendizaje automático (ML) también entran en esta categoría, especialmente cuando se utilizan grandes conjuntos de datos y redes neuronales profundas. Estos entornos suelen beneficiarse de sistemas optimizados para GPU, diseñados para acelerar el procesamiento paralelo y mejorar la eficiencia del rendimiento.

Cargas de trabajo web empresariales

Las cargas de trabajo web empresariales dan soporte a aplicaciones web, plataformas de comercio electrónico, sistemas de gestión de contenido e interfaces de programación de aplicaciones (API) que facilitan las operaciones comerciales. Estas cargas de trabajo deben gestionar patrones de tráfico fluctuantes, mantener una alta disponibilidad y escalar horizontalmente para satisfacer la creciente demanda de los usuarios.

Por lo general, operan en entornos virtualizados o en contenedores y se implementan en infraestructuras distribuidas. Para garantizar un rendimiento y una escalabilidad consistentes, las organizaciones suelen recurrir a sistemas escalables para montaje en rack, diseñados para implementaciones de alta densidad y un tiempo de actividad fiable en centros de datos empresariales.

Cargas de trabajo que requieren mucha memoria

Las cargas de trabajo que requieren un uso intensivo de memoria dependen de una gran capacidad de memoria y un ancho de banda elevado para procesar datos en tiempo real. Las bases de datos en memoria, las plataformas de análisis en tiempo real y los sistemas de almacenamiento en caché requieren un acceso rápido a los datos almacenados en la RAM para minimizar la latencia y mejorar la velocidad de las transacciones.

Estas cargas de trabajo son particularmente sensibles a la arquitectura de memoria y la configuración del sistema. Una asignación adecuada de recursos garantiza que el rendimiento se mantenga estable bajo una demanda constante o impredecible.

Cargas de trabajo con uso intensivo de almacenamiento

Las cargas de trabajo que requieren un uso intensivo de almacenamiento priorizan los sistemas de almacenamiento de alta capacidad, el rendimiento rápido de entrada/salida y la durabilidad de los datos. Algunos ejemplos son el análisis de macrodatos, los entornos de copia de seguridad y recuperación ante desastres, los lagos de datos, el archivado de vídeo y los sistemas de archivos empresariales.

Estas cargas de trabajo pueden requerir arquitecturas de almacenamiento de alto rendimiento y compatibilidad con tecnologías como: NVMe y almacenamiento definido por software. La infraestructura construida sobre plataformas de almacenamiento de alta capacidad puede proporcionar el rendimiento y la escalabilidad necesarios para gestionar conjuntos de datos grandes y en constante crecimiento de forma eficiente.

Cargas de trabajo nativas de la nube y distribuidas

Las cargas de trabajo nativas de la nube se diseñan utilizando arquitecturas de aplicaciones modernas, como contenedores, microservicios y marcos de orquestación. En lugar de funcionar como una única aplicación monolítica, estas cargas de trabajo se componen de servicios más pequeños e independientes que pueden escalarse individualmente y actualizarse sin interrumpir el funcionamiento de todo el sistema.

Los modelos de computación distribuida mejoran la resiliencia y la escalabilidad al distribuir el procesamiento entre múltiples sistemas. La infraestructura que soporta estas arquitecturas suele aprovechar las arquitecturas de servidores multinodo para mejorar la eficiencia de los recursos, la tolerancia a fallos y la escalabilidad horizontal en entornos de computación en clúster .

Cargas de trabajo en el borde

Las cargas de trabajo en el borde de la red son aplicaciones que requieren el procesamiento de datos cerca del punto de generación. Estas cargas de trabajo suelen ser sensibles a la latencia o al ancho de banda, y son comunes en telecomunicaciones, comercio minorista, sistemas de fabricación, entornos sanitarios e implementaciones de infraestructura inteligente.

Dado que las cargas de trabajo en el borde de la red suelen operar fuera de las instalaciones centralizadas, requieren una infraestructura compacta y fiable capaz de funcionar en entornos distribuidos. Las implementaciones pueden utilizar sistemas de computación perimetral diseñados para admitir el procesamiento localizado y la continuidad operativa.

Características de la carga de trabajo y requisitos de recursos

Cada carga de trabajo posee características técnicas específicas que determinan el diseño de la infraestructura. Estas características influyen en la selección del procesador, la capacidad de memoria, la configuración del almacenamiento, el ancho de banda de la red y la densidad del sistema. Comprender el comportamiento de las cargas de trabajo permite a las organizaciones alinear los recursos con las expectativas de rendimiento, manteniendo la eficiencia y la escalabilidad.

La demanda de computación suele ser el factor más visible. El entrenamiento, el modelado y el análisis avanzado de IA requieren un procesamiento acelerado compatible con servidores optimizados para GPU , mientras que las aplicaciones empresariales tradicionales pueden priorizar un rendimiento equilibrado de la CPU y capacidades de virtualización.

Los requisitos de memoria son igualmente importantes. Las bases de datos en memoria y las plataformas de análisis en tiempo real dependen de una gran capacidad de memoria y un ancho de banda elevado para evitar cuellos de botella en el rendimiento. Las cargas de trabajo que requieren un uso intensivo de almacenamiento, incluidas las bases de datos de gran tamaño y los lagos de datos, exigen un rendimiento constante y arquitecturas escalables basadas en plataformas de almacenamiento de alta capacidad para mantener la capacidad de respuesta a medida que aumenta el volumen de datos.

La escalabilidad también define el diseño de la carga de trabajo. Las aplicaciones distribuidas y nativas de la nube suelen depender de arquitecturas de servidores multinodo y plataformas de infraestructura nativas de la nube para admitir el escalado horizontal y la demanda fluctuante.


 

Dónde se ejecutan las cargas de trabajo: centro de datos, nube, entorno híbrido y entorno perimetral.

Las cargas de trabajo modernas pueden implementarse en diversos entornos, según los objetivos comerciales, los requisitos normativos, las expectativas de rendimiento y las consideraciones de costos. Si bien los tipos de carga de trabajo definen el comportamiento de las aplicaciones, los modelos de implementación determinan dónde operan dichas cargas.

Cargas de trabajo en centros de datos locales

Las implementaciones locales brindan a las organizaciones control total sobre la infraestructura, las políticas de seguridad y la gestión del cumplimiento normativo. Las bases de datos de misión crítica, los sistemas de planificación de recursos empresariales (ERP) y las cargas de trabajo web internas de la empresa suelen operar en centros de datos corporativos dedicados, diseñados para ofrecer un rendimiento predecible y una alta disponibilidad.

La infraestructura basada en servidores blade o sistemas escalables para montaje en rack permite un despliegue denso, una gestión centralizada y una planificación de la infraestructura a largo plazo.

Cargas de trabajo en la nube pública

Los entornos de nube pública ofrecen capacidad elástica y modelos de precios basados ​​en el consumo. Las organizaciones implementan cargas de trabajo en la nube pública cuando la escalabilidad rápida, la distribución geográfica o la reducción de los gastos de capital son prioritarias.

Las implementaciones en la nube pública suelen basarse en una infraestructura diseñada para la virtualización, la contenerización y la agrupación de recursos a gran escala.

Cargas de trabajo en la nube híbrida

Las implementaciones híbridas combinan infraestructura local y en la nube pública, lo que permite a las organizaciones y empresas ubicar las cargas de trabajo según el rendimiento, el costo, la soberanía de los datos o los requisitos normativos. Este modelo permite la movilidad dinámica de las cargas de trabajo, manteniendo al mismo tiempo el control sobre los sistemas sensibles.

Las estrategias empresariales híbridas suelen depender de una infraestructura escalable que pueda operar de forma consistente en diferentes entornos, lo que permite la portabilidad de las cargas de trabajo y una asignación equilibrada de recursos.

Implementaciones en el borde

Las implementaciones en el borde extienden la infraestructura más allá de los centros de datos centralizados para admitir el procesamiento en tiempo real más cerca de los usuarios, dispositivos o fuentes de datos. Las organizaciones adoptan estrategias en el borde para reducir la latencia, disminuir el consumo de ancho de banda y mejorar la capacidad de respuesta de las aplicaciones.

Estos entornos suelen depender de plataformas de computación perimetral diseñadas para el funcionamiento distribuido y ubicaciones con espacio limitado.

Gestión y optimización de la carga de trabajo

La gestión de la carga de trabajo se refiere a los procesos y tecnologías utilizados para asignar recursos informáticos de manera eficiente entre aplicaciones y servicios. A medida que las organizaciones operan cargas de trabajo cada vez más diversas en centros de datos, entornos de nube y ubicaciones periféricas, una gestión eficaz se vuelve esencial para mantener el rendimiento, la confiabilidad y el control de costos.

En esencia, la gestión de cargas de trabajo implica supervisar la utilización de recursos, equilibrar la asignación de recursos informáticos y de memoria, y garantizar que las aplicaciones reciban la capacidad que necesitan sin sobredimensionar la infraestructura. Las plataformas de virtualización y los marcos de orquestación de contenedores permiten una distribución dinámica de recursos, lo que posibilita que las cargas de trabajo escalen en respuesta a la demanda en tiempo real. Esta elasticidad es particularmente importante para las cargas de trabajo web empresariales y las aplicaciones nativas de la nube, que experimentan patrones de tráfico variables.

La optimización va más allá del escalado. Incluye la alineación de los requisitos de carga de trabajo con la arquitectura del sistema para mejorar el rendimiento por vatio, reducir la latencia y aumentar el rendimiento. Las aplicaciones con alta carga computacional pueden beneficiarse del procesamiento acelerado que ofrecen los servidores optimizados para GPU, mientras que los entornos con gran cantidad de datos dependen de plataformas de almacenamiento de alta capacidad diseñadas para un rendimiento de entrada/salida constante. Las aplicaciones distribuidas suelen recurrir a arquitecturas de servidores multinodo para mejorar la resiliencia y la eficiencia de los recursos.

Al evaluar continuamente el comportamiento de la carga de trabajo y el rendimiento de la infraestructura, las organizaciones pueden mejorar la utilización de los recursos, reducir los costos operativos y garantizar que los entornos de TI se adapten a las demandas cambiantes del negocio. En última instancia, la optimización eficaz de la carga de trabajo permite un crecimiento escalable a la vez que se mantienen operaciones predecibles y energéticamente eficientes.

Criticidad de la carga de trabajo, seguridad y diseño de infraestructura

No todas las cargas de trabajo tienen el mismo impacto en el negocio. Algunas aplicaciones contribuyen directamente a la generación de ingresos o a operaciones esenciales, mientras que otras tienen fines internos o de desarrollo. Por lo tanto, las decisiones sobre la infraestructura deben reflejar la prioridad de la carga de trabajo, la tolerancia al riesgo, los requisitos de rendimiento y las obligaciones regulatorias. Evaluar la criticidad de la carga de trabajo permite a las organizaciones alinear la arquitectura del sistema con las expectativas de nivel de servicio, los estándares de seguridad y la estrategia operativa a largo plazo.

Nivel de criticidad de la carga de trabajo y niveles de servicio

Las cargas de trabajo se clasifican habitualmente según su importancia para la continuidad del negocio. Las cargas de trabajo críticas, como las bases de datos transaccionales o las cargas de trabajo web empresariales principales, requieren alta disponibilidad, latencia mínima y garantías de tiempo de actividad estrictas. Las cargas de trabajo críticas para el negocio pueden tolerar un tiempo de inactividad limitado, pero aun así exigen un rendimiento fiable. Las cargas de trabajo no críticas, incluidos los entornos de desarrollo y pruebas, suelen permitir una mayor flexibilidad en la asignación de recursos.

Los acuerdos de nivel de servicio (SLA) definen parámetros de rendimiento, objetivos de disponibilidad y objetivos de recuperación. Para cumplir con estos requisitos, a menudo se requiere redundancia, agrupación en clústeres y arquitecturas tolerantes a fallos basadas en plataformas de servidores blade o arquitecturas multinodo. Alinear la infraestructura con la prioridad de la carga de trabajo garantiza una asignación adecuada de los recursos, minimizando al mismo tiempo el riesgo operativo.

Requisitos de seguridad y cumplimiento

La sensibilidad a la carga de trabajo influye significativamente en el diseño de la infraestructura y el despliegue. Las aplicaciones que procesan datos regulados, confidenciales o de propiedad exclusiva deben cumplir con estrictos estándares de seguridad y cumplimiento normativo. Estos requisitos pueden incluir cifrado, controles de acceso, aislamiento de la carga de trabajo, registro de auditoría y políticas de residencia de datos.

Para cumplir con las obligaciones regulatorias, ciertas cargas de trabajo deben permanecer en entornos locales controlados, mientras que otras pueden operar en modelos híbridos o en la nube. La infraestructura que soporta aplicaciones sensibles debe diseñarse para mantener la integridad y la disponibilidad de los datos sin comprometer el rendimiento. Las plataformas diseñadas para una implementación segura y escalable, incluidos algunos sistemas de montaje en rack, ayudan a las organizaciones a equilibrar la protección con la eficiencia operativa.

Diseño de infraestructura por niveles

Las organizaciones suelen implementar estrategias de infraestructura por niveles para adaptar las capacidades del sistema a la importancia de la carga de trabajo y a las necesidades de rendimiento.

Cargas de trabajo de nivel 1

Las cargas de trabajo de nivel 1 son aplicaciones de misión crítica que exigen máxima disponibilidad, tolerancia a fallos y consistencia en el rendimiento. Estos entornos suelen depender de arquitecturas altamente redundantes y sistemas de nivel empresarial diseñados para garantizar un tiempo de actividad continuo.

Cargas de trabajo de nivel 2

Las cargas de trabajo de nivel 2 dan soporte a funciones empresariales importantes, pero permiten un tiempo de inactividad limitado durante el mantenimiento o eventos inesperados. La infraestructura para este nivel suele equilibrar el rendimiento y la rentabilidad, manteniendo la fiabilidad.

Cargas de trabajo de nivel 3

Las cargas de trabajo de nivel 3 incluyen desarrollo, pruebas, archivado o servicios no esenciales. Estas cargas de trabajo priorizan la optimización de costos y la consolidación de recursos, y a menudo operan en sistemas compartidos o de menor densidad, como sistemas de almacenamiento de alta capacidad para aplicaciones centradas en el archivado o las copias de seguridad.

Mediante la implementación de un diseño de infraestructura por niveles , las organizaciones pueden alinear el rendimiento, la seguridad y los niveles de inversión con la prioridad de la carga de trabajo, garantizando que los sistemas de misión crítica reciban los recursos adecuados, mientras que las aplicaciones menos críticas siguen siendo rentables.

Preguntas frecuentes

  1. ¿Cuál es la diferencia entre una carga de trabajo y una aplicación?
    Una aplicación es un programa informático que realiza tareas específicas. La carga de trabajo representa la demanda total de computación generada por una o más aplicaciones, servicios y procesos, medida por su consumo combinado de recursos de computación, memoria, almacenamiento y red.
  2. ¿Qué es una carga de trabajo web empresarial?
    Una carga de trabajo web empresarial se compone de aplicaciones web que dan soporte a las funciones empresariales principales, como plataformas de comercio electrónico, portales de clientes y API. Estas cargas de trabajo requieren alta disponibilidad, escalabilidad y un rendimiento constante para gestionar la demanda fluctuante de los usuarios y las operaciones que afectan a los ingresos.
  3. ¿Qué es la automatización de la carga de trabajo?
    La automatización de la carga de trabajo utiliza herramientas de software para programar, ejecutar y gestionar tareas informáticas sin intervención manual. Coordina las dependencias entre trabajos, la asignación de recursos y las actividades de escalado, lo que ayuda a las organizaciones a mejorar la eficiencia, reducir errores y mantener un rendimiento operativo constante.
  4. ¿Qué es una carga de trabajo en la nube?
    Una carga de trabajo en la nube es una aplicación o servicio que se ejecuta en un entorno de nube pública, privada o híbrida. Estas cargas de trabajo suelen utilizar máquinas virtuales o contenedores y se benefician de la escalabilidad elástica y la disponibilidad de recursos distribuidos.
  5. ¿Qué son las cargas de trabajo de misión crítica?
    Las cargas de trabajo críticas son aplicaciones esenciales para las operaciones comerciales principales. El tiempo de inactividad o las interrupciones en el rendimiento pueden tener un impacto financiero u operativo significativo, lo que exige alta disponibilidad, redundancia, objetivos de recuperación definidos y compromisos estrictos de nivel de servicio.
  6. ¿Cómo influyen las cargas de trabajo en el diseño de la infraestructura?
    Las cargas de trabajo determinan los requisitos de infraestructura en función de la intensidad de procesamiento, el uso de memoria, el rendimiento del almacenamiento, la sensibilidad a la latencia y las necesidades de escalabilidad. Comprender estos factores garantiza que los sistemas se diseñen para ofrecer un rendimiento, una fiabilidad y una rentabilidad adecuados.
  7. ¿Qué es la escalabilidad de la carga de trabajo?
    La escalabilidad de la carga de trabajo es la capacidad de una aplicación para gestionar la demanda cambiante. Puede escalar verticalmente aumentando los recursos del sistema u horizontalmente distribuyendo las tareas entre varios sistemas para mantener un rendimiento constante.