¿Qué es la carga de trabajo?
En el ámbito de las tecnologías de la información (TI), una carga de trabajo hace referencia a las tareas informáticas, aplicaciones, servicios o procesos que consumen recursos de TI dentro de un entorno de infraestructura. Estos recursos incluyen la potencia de procesamiento, la memoria, la capacidad de almacenamiento y el ancho de banda de red. Toda operación digital, desde la ejecución de una aplicación empresarial hasta el procesamiento de modelos de inteligencia artificial, representa una carga de trabajo que opera sobre los sistemas de hardware y software subyacentes.
Las cargas de trabajo definen cómo se utiliza la infraestructura. Determinan el nivel de rendimiento requerido, cómo deben escalar los sistemas, cómo se almacenan y transfieren los datos, y cómo se mantienen la disponibilidad y la resiliencia. En entornos empresariales, las cargas de trabajo pueden abarcar desde aplicaciones empresariales tradicionales y cargas de trabajo web corporativas hasta análisis a gran escala, virtualización, computación de alto rendimiento (HPC) y servicios basados en inteligencia artificial (IA).
A medida que evolucionan los entornos de TI, las cargas de trabajo ya no se limitan a un único servidor o centro de datos. Pueden ejecutarse en centros de datos de gestión privada, entornos de nube pública, implementaciones híbridas y ubicaciones periféricas. Cada carga de trabajo presenta características únicas que influyen en el diseño de la infraestructura, entre ellas la intensidad de cálculo, el consumo de memoria, la sensibilidad a la latencia, los requisitos de rendimiento del almacenamiento y las exigencias de escalabilidad.
Comprender qué es una carga de trabajo y cómo se comportan las diferentes cargas de trabajo es fundamental para diseñar sistemas informáticos eficientes, escalables y con un consumo energético optimizado.
Tipos de cargas de trabajo de TI
Las cargas de trabajo de TI varían considerablemente en función de las aplicaciones que soportan, los datos que procesan y los niveles de rendimiento que requieren. Algunas cargas de trabajo exigen una gran potencia de cálculo, mientras que otras dan prioridad a la capacidad de almacenamiento, el ancho de banda de la memoria o las redes de baja latencia. Comprender las categorías de cargas de trabajo ayuda a las organizaciones a adaptar los recursos de infraestructura a las necesidades operativas, los objetivos de escalabilidad y las metas de eficiencia. En las secciones siguientes se describen los principales tipos de cargas de trabajo que se encuentran en los entornos empresariales, en la nube y en el perímetro actuales.
Cargas de trabajo que requieren un uso intensivo de recursos informáticos
Las cargas de trabajo que requieren un uso intensivo de recursos informáticos dependen en gran medida de la potencia de procesamiento para ejecutar cálculos complejos o grandes volúmenes de tareas en paralelo. Estas cargas de trabajo consumen una cantidad considerable de recursos de la unidad central de procesamiento (CPU) o de la unidad de procesamiento gráfico (GPU), y son habituales en la informática de alto rendimiento (HPC), las simulaciones científicas, la modelización financiera y el renderizado multimedia.
Las cargas de trabajo relacionadas con el entrenamiento de la inteligencia artificial (IA) y el aprendizaje automático (ML) también entran en esta categoría, especialmente cuando se trata de grandes conjuntos de datos y redes neuronales profundas. Estos entornos suelen beneficiarse de sistemas optimizados para GPU, diseñados para acelerar el procesamiento paralelo y mejorar la eficiencia del rendimiento.
Cargas de trabajo web corporativas
Las cargas de trabajo web empresariales dan soporte a aplicaciones basadas en la web, plataformas de comercio electrónico, sistemas de gestión de contenidos e interfaces de programación de aplicaciones (API) que prestan servicio a las operaciones empresariales. Estas cargas de trabajo deben gestionar patrones de tráfico variables, mantener una alta disponibilidad y escalar horizontalmente para dar respuesta a la creciente demanda de los usuarios.
Por lo general, operan en entornos virtualizados o en contenedores y se implementan en infraestructuras distribuidas. Para garantizar un rendimiento y una escalabilidad constantes, las organizaciones suelen recurrir a sistemas escalables de montaje en rack, diseñados para una implementación de alta densidad y un tiempo de actividad fiable en los centros de datos empresariales.
Cargas de trabajo que consumen mucha memoria
Las cargas de trabajo que consumen mucha memoria dependen de una gran capacidad de memoria y de un elevado ancho de banda para procesar datos en tiempo real. Las bases de datos en memoria, las plataformas de análisis en tiempo real y los sistemas de almacenamiento en caché requieren un acceso rápido a los datos almacenados en la RAM para minimizar la latencia y mejorar la velocidad de las transacciones.
Estas cargas de trabajo son especialmente sensibles a la arquitectura de la memoria y a la configuración del sistema. Una asignación adecuada de los recursos garantiza que el rendimiento se mantenga estable ante una demanda sostenida o impredecible.
Cargas de trabajo con un uso intensivo de almacenamiento
Las cargas de trabajo con un uso intensivo del almacenamiento dan prioridad a los sistemas de almacenamiento de gran capacidad, al rendimiento rápido de entrada/salida y a la durabilidad de los datos. Entre los ejemplos se incluyen el análisis de macrodatos, los entornos de copia de seguridad y recuperación ante desastres, los lagos de datos, el archivo de vídeo y los sistemas de archivos empresariales.
Estas cargas de trabajo pueden requerir arquitecturas de almacenamiento de alto rendimiento y compatibilidad con tecnologías como NVMe y el almacenamiento definido por software. Una infraestructura basada en plataformas de almacenamiento de gran capacidad puede proporcionar el rendimiento y la escalabilidad necesarios para gestionar de manera eficiente conjuntos de datos de gran tamaño y en constante crecimiento.
Cargas de trabajo nativas de la nube y distribuidas
Las cargas de trabajo nativas de la nube se diseñan utilizando arquitecturas de aplicaciones modernas, como contenedores, microservicios y marcos de orquestación. En lugar de funcionar como una única aplicación monolítica, estas cargas de trabajo se componen de servicios más pequeños e independientes que pueden escalarse de forma individual y actualizarse sin interrumpir el funcionamiento de todo el sistema.
Los modelos de computación distribuida mejoran la resiliencia y la escalabilidad al distribuir el procesamiento entre múltiples sistemas. La infraestructura que da soporte a estas arquitecturas suele aprovechar las arquitecturas de servidores con múltiples nodos para mejorar la eficiencia de los recursos, la tolerancia a fallos y la escalabilidad horizontal en entornos de computación en clúster.
Cargas de trabajo en el borde
Las cargas de trabajo en el borde son aplicaciones que requieren el procesamiento de datos cerca del punto de generación de los mismos. Estas cargas de trabajo suelen ser sensibles a la latencia o al ancho de banda, y son habituales en el sector de las telecomunicaciones, las operaciones minoristas, los sistemas de fabricación, los entornos sanitarios y las implementaciones de infraestructuras inteligentes.
Dado que las cargas de trabajo en el perímetro suelen operar fuera de las instalaciones centralizadas, requieren una infraestructura compacta y fiable capaz de funcionar en entornos distribuidos. Las implementaciones pueden utilizar sistemas de computación en el perímetro diseñados para permitir el procesamiento local y garantizar la continuidad operativa.
Características de la carga de trabajo y necesidades de recursos
Cada carga de trabajo presenta características técnicas específicas que determinan cómo debe diseñarse la infraestructura. Estas características influyen en la selección del procesador, la capacidad de memoria, la configuración del almacenamiento, el ancho de banda de la red y la densidad del sistema. Comprender el comportamiento de las cargas de trabajo permite a las organizaciones adaptar los recursos a las expectativas de rendimiento, al tiempo que se mantiene la eficiencia y la escalabilidad.
La demanda informática suele ser el factor más evidente. El entrenamiento de la IA, la creación de modelos y el análisis avanzado requieren un procesamiento acelerado respaldado por servidores optimizados para GPU, mientras que las aplicaciones empresariales tradicionales pueden dar prioridad a un rendimiento equilibrado de la CPU y a las capacidades de virtualización.
Los requisitos de memoria son igualmente importantes. Las bases de datos en memoria y las plataformas de análisis en tiempo real dependen de una gran capacidad de memoria y de un elevado ancho de banda para evitar cuellos de botella en el rendimiento. Las cargas de trabajo que requieren un gran volumen de almacenamiento, como las grandes bases de datos y los lagos de datos, exigen un rendimiento constante y arquitecturas escalables basadas en plataformas de almacenamiento de alta capacidad para mantener la capacidad de respuesta a medida que aumentan los volúmenes de datos.
La escalabilidad también determina el diseño de las cargas de trabajo. Las aplicaciones distribuidas y nativas de la nube suelen basarse en arquitecturas de servidores con múltiples nodos y en plataformas de infraestructura nativas de la nube para permitir el escalado horizontal y hacer frente a las fluctuaciones de la demanda.
Dónde se ejecutan las cargas de trabajo: centro de datos, nube, entornos híbridos y perímetro
Las cargas de trabajo modernas pueden implementarse en diversos entornos, en función de los objetivos empresariales, los requisitos normativos, las expectativas de rendimiento y las consideraciones de costes. Si bien los tipos de carga de trabajo definen el comportamiento de las aplicaciones, los modelos de implementación determinan dónde se ejecutan dichas cargas de trabajo.
Cargas de trabajo de centros de datos locales
Las implementaciones locales ofrecen a las organizaciones un control total sobre la infraestructura, las políticas de seguridad y la gestión del cumplimiento normativo. Las bases de datos de misión crítica, los sistemas de planificación de recursos empresariales (ERP) y las cargas de trabajo web internas de la empresa suelen funcionar en centros de datos corporativos dedicados, diseñados para ofrecer un rendimiento predecible y una alta disponibilidad.
Las infraestructuras basadas en servidores blade o en sistemas escalables de montaje en rack permiten una implementación densa, una gestión centralizada y una planificación de la infraestructura a largo plazo.
Cargas de trabajo en la nube pública
Los entornos de nube pública ofrecen capacidad elástica y modelos de precios basados en el consumo. Las organizaciones implementan cargas de trabajo en la nube pública cuando la escalabilidad rápida, la distribución geográfica o la reducción de los gastos de capital son una prioridad.
Las implementaciones en la nube pública suelen basarse en una infraestructura diseñada para la virtualización, la contenedorización y la puesta en común de recursos a gran escala.
Cargas de trabajo en la nube híbrida
Las implementaciones híbridas combinan la infraestructura local con la de la nube pública, lo que permite a las organizaciones y empresas distribuir las cargas de trabajo en función del rendimiento, el coste, la soberanía de los datos o los requisitos normativos. Este modelo permite una movilidad dinámica de las cargas de trabajo, al tiempo que se mantiene el control sobre los sistemas confidenciales.
Las estrategias empresariales híbridas suelen depender de una infraestructura escalable que pueda funcionar de manera coherente en todos los entornos, facilitando la portabilidad de las cargas de trabajo y una asignación equilibrada de los recursos.
Implementaciones en el borde
Las implementaciones en el borde amplían la infraestructura más allá de los centros de datos centralizados para permitir el procesamiento en tiempo real más cerca de los usuarios, los dispositivos o las fuentes de datos. Las organizaciones adoptan estrategias de borde para reducir la latencia, disminuir el consumo de ancho de banda y mejorar la capacidad de respuesta de las aplicaciones.
Estos entornos suelen basarse en plataformas de computación periférica diseñadas para el funcionamiento distribuido y para ubicaciones con limitaciones de espacio.
Gestión y optimización de la carga de trabajo
La gestión de la carga de trabajo se refiere a los procesos y tecnologías que se utilizan para distribuir de manera eficiente los recursos informáticos entre aplicaciones y servicios. A medida que las organizaciones gestionan cargas de trabajo cada vez más diversas en centros de datos, entornos en la nube y ubicaciones periféricas, una gestión eficaz se vuelve esencial para mantener el rendimiento, la fiabilidad y el control de los costes.
En esencia, la gestión de cargas de trabajo consiste en supervisar la utilización de los recursos, equilibrar la asignación de recursos de computación y memoria, y garantizar que las aplicaciones dispongan de la capacidad que necesitan sin sobreaprovisionar la infraestructura. Las plataformas de virtualización y los marcos de orquestación de contenedores permiten una distribución dinámica de los recursos, lo que permite que las cargas de trabajo se adapten en función de la demanda en tiempo real. Esta elasticidad resulta especialmente importante para las cargas de trabajo web corporativas y las aplicaciones nativas de la nube, que se enfrentan a patrones de tráfico variables.
La optimización va más allá del escalado. Implica adaptar los requisitos de las cargas de trabajo a la arquitectura del sistema para mejorar el rendimiento por vatio, reducir la latencia y aumentar el rendimiento. Las aplicaciones con un uso intensivo de recursos de cálculo pueden beneficiarse del procesamiento acelerado que ofrecen los servidores optimizados para GPU, mientras que los entornos con un uso intensivo de datos dependen de plataformas de almacenamiento de gran capacidad diseñadas para ofrecer un rendimiento constante en las operaciones de entrada y salida. Las aplicaciones distribuidas suelen basarse en arquitecturas de servidores de múltiples nodos para mejorar la resiliencia y la eficiencia de los recursos.
Mediante la evaluación continua del comportamiento de las cargas de trabajo y del rendimiento de la infraestructura, las organizaciones pueden mejorar la utilización, reducir los costes operativos y garantizar que los entornos de TI sigan respondiendo a las cambiantes necesidades empresariales. En última instancia, una optimización eficaz de las cargas de trabajo permite un crecimiento escalable, al tiempo que se mantienen unas operaciones predecibles y eficientes desde el punto de vista energético.
Criticidad de la carga de trabajo, seguridad y diseño de la infraestructura
No todas las cargas de trabajo tienen el mismo impacto en el negocio. Algunas aplicaciones contribuyen directamente a la generación de ingresos o a operaciones esenciales, mientras que otras tienen fines internos o de desarrollo. Por ello, las decisiones relativas a la infraestructura deben reflejar la prioridad de las cargas de trabajo, la tolerancia al riesgo, los requisitos de rendimiento y las obligaciones normativas. La evaluación de la importancia crítica de las cargas de trabajo permite a las organizaciones adaptar la arquitectura del sistema a las expectativas de nivel de servicio, las normas de seguridad y la estrategia operativa a largo plazo.
Crítica de la carga de trabajo y niveles de servicio
Las cargas de trabajo se clasifican habitualmente en función de su importancia para la continuidad del negocio. Las cargas de trabajo de misión crítica, como las bases de datos transaccionales o las cargas de trabajo web fundamentales de la empresa, requieren alta disponibilidad, una latencia mínima y garantías estrictas de tiempo de actividad. Las cargas de trabajo críticas para el negocio pueden tolerar un tiempo de inactividad limitado, pero siguen exigiendo un rendimiento fiable. Las cargas de trabajo no críticas, incluidos los entornos de desarrollo y pruebas, suelen permitir una mayor flexibilidad en la asignación de recursos.
Los acuerdos de nivel de servicio (SLA) definen los parámetros de rendimiento, los objetivos de disponibilidad y los objetivos de recuperación. El cumplimiento de estos requisitos suele implicar el uso de redundancia, clústeres y arquitecturas tolerantes a fallos basadas en plataformas de servidores blade o en arquitecturas de múltiples nodos. La adaptación de la infraestructura a la prioridad de las cargas de trabajo garantiza que los recursos se asignen de forma adecuada, al tiempo que se minimiza el riesgo operativo.
Requisitos de seguridad y cumplimiento normativo
La sensibilidad de las cargas de trabajo influye de manera significativa en el diseño de la infraestructura y la implementación. Las aplicaciones que procesan datos regulados, confidenciales o de propiedad exclusiva deben cumplir con estrictas normas de seguridad y cumplimiento normativo. Estos requisitos pueden incluir el cifrado, los controles de acceso, el aislamiento de las cargas de trabajo, el registro de auditoría y las políticas de residencia de datos.
Es posible que algunas cargas de trabajo deban permanecer en entornos locales controlados para cumplir con las obligaciones normativas, mientras que otras pueden funcionar en modelos híbridos o en la nube. La infraestructura que da soporte a aplicaciones sensibles debe diseñarse para mantener la integridad y la disponibilidad de los datos sin comprometer el rendimiento. Las plataformas diseñadas para una implementación segura y escalable, incluidos algunos sistemas de montaje en rack, ayudan a las organizaciones a equilibrar la protección con la eficiencia operativa.
Diseño de infraestructura por niveles
Las organizaciones suelen aplicar estrategias de infraestructura por niveles para adaptar las capacidades del sistema a la importancia de las cargas de trabajo y a las necesidades de rendimiento.
Cargas de trabajo de nivel 1
Las cargas de trabajo de nivel 1 son aplicaciones de misión crítica que exigen la máxima disponibilidad, tolerancia a fallos y rendimiento constante. Estos entornos suelen basarse en arquitecturas altamente redundantes y en sistemas de nivel empresarial diseñados para garantizar un tiempo de actividad continuo.
Cargas de trabajo de nivel 2
Las cargas de trabajo de nivel 2 dan soporte a funciones empresariales importantes, pero pueden permitir un tiempo de inactividad limitado durante el mantenimiento o en caso de incidencias imprevistas. La infraestructura de este nivel suele buscar un equilibrio entre el rendimiento y la rentabilidad, sin dejar de garantizar la fiabilidad.
Cargas de trabajo de nivel 3
Las cargas de trabajo de nivel 3 incluyen el desarrollo, las pruebas, el archivo o los servicios no esenciales. Estas cargas de trabajo dan prioridad a la optimización de costes y a la consolidación de recursos, y suelen ejecutarse en sistemas compartidos o de menor densidad, como los sistemas de almacenamiento de alta capacidad destinados a aplicaciones de archivo o de copia de seguridad.
Mediante la implementación de un diseño de infraestructura por niveles, las organizaciones pueden adaptar el rendimiento, la seguridad y los niveles de inversión a la prioridad de las cargas de trabajo, garantizando que los sistemas de misión crítica reciban los recursos adecuados, mientras que las aplicaciones menos críticas siguen siendo rentables.
Preguntas frecuentes
- ¿Cuál es la diferencia entre una carga de trabajo y una aplicación?
Una aplicación es un programa de software que realiza tareas específicas. Una carga de trabajo representa la demanda informática total generada por una o varias aplicaciones, servicios y procesos, medida en función de su consumo combinado de recursos informáticos, de memoria, de almacenamiento y de red. - ¿Qué es una carga de trabajo web empresarial?
Una carga de trabajo web empresarialconsiste en aplicaciones basadas en la web que dan soporte a funciones empresariales fundamentales, entre las que se incluyen plataformas de comercio electrónico, portales de clientes y API. Estas cargas de trabajo requieren alta disponibilidad, escalabilidad y un rendimiento constante para gestionar la demanda fluctuante de los usuarios y las operaciones que afectan a los ingresos. - ¿Qué es la automatización de cargas de trabajo?
La automatizaciónde cargas de trabajoutiliza herramientas de software para programar, ejecutar y gestionar tareas informáticas sin intervención manual. Coordina las dependencias entre tareas, la asignación de recursos y las actividades de escalado, lo que ayuda a las organizaciones a mejorar la eficiencia, reducir los errores y mantener un rendimiento operativo constante. - ¿Qué es una carga de trabajo en la nube?
Una carga de trabajo en la nubees una aplicación o un servicio que se ejecuta en un entorno de nube pública, privada o híbrida. Estas cargas de trabajo suelen utilizar máquinas virtuales o contenedores y se benefician de una escalabilidad elástica y de la disponibilidad de recursos distribuidos. - ¿Qué son las cargas de trabajo de misión crítica?
Las cargas de trabajo de misión críticason aplicaciones esenciales para las operaciones fundamentales de la empresa. El tiempo de inactividad o las interrupciones en el rendimiento pueden tener un impacto financiero u operativo significativo, por lo que requieren alta disponibilidad, redundancia, objetivos de recuperación definidos y compromisos estrictos en cuanto a los niveles de servicio. - ¿Cómo influyen las cargas de trabajo en el diseño de la infraestructura?
Las cargas de trabajo determinan los requisitos de la infraestructuraen función de la intensidad de cálculo, el uso de la memoria, el rendimiento del almacenamiento, la sensibilidad a la latencia y las necesidades de escalabilidad. Comprender estos factores garantiza que los sistemas se diseñen para ofrecer el rendimiento, la fiabilidad y la rentabilidad adecuados. - ¿Qué es la escalabilidad de la carga de trabajo?
La escalabilidad de la carga de trabajoes la capacidad de una aplicación para gestionar una demanda variable. Puede escalar verticalmente, aumentando los recursos del sistema, u horizontalmente, distribuyendo las tareas entre varios sistemas para mantener un rendimiento constante.