Mejoramiento de la agilidad de DevOps y protección la fuente de despliegue:

Con soluciones de garantía de negocios diseñadas para la era digital

El panorama completo

En la era digital, los servicios digitales se encuentran en el centro de la innovación disruptiva. La agilidad de la planificación, entrega, integración, comprobación y el despliegue continuos de aplicaciones y servicios marcan la diferencia entre ganadores y perdedores en este ambiente de negocios altamente competitivo. Si bien la automatización de estos procesos ofrece enormes ventajas para la entrega continua, desplaza la restricción al ambiente de producción que ahora bloquea el flujo mundial del flujo de valor a los clientes. Desafortunadamente, la telemetría de nivel de aplicación utilizada por los equipos de DevOps para el bucle de retroalimentación es ineficiente ya que muchas de las restricciones están a nivel del sistema. Estos incluyen todos los subsistemas arquitectónicos asociados con la prestación de servicios y la aplicación. Las capacidades de visibilidad, telemetría y evaluación de errores a nivel de sistema de NETSCOUT basadas en la monitorización y el análisis continuos del tráfico de IP empoderan a las organizaciones DevOps para que sean más ágiles y eficientes y ayuden a sus negocios a alcanzar una ventaja competitiva en el campo de batalla digital.

Los retos clave a los que se enfrenta DevOps y la solución NETSCOUT respectiva descrita en esta página se resumen en la tabla 1 a continuación.

Tabla 1: abordar los retos de DevOps

Retos de DevOps

Propuesta de valor de NETSCOUT

Ser más productivos y ágiles al ofrecer servicios más rápidamente, y con menos recursos Permitir que DevOps logre más con menos recursos con la plataforma de telemetría de nivel de servicio y la conciencia situacional común
Minimizar el impacto de la interrupción Reducir el tiempo medio de reparación (MTTR).
Analizar continuamente la capacidad mundial de recursos de TI y la disposición para desplegar nuevos servicios Bucle de retroalimentación eficaz basado en la monitorización y análisis continuo y en tiempo real de la capacidad de los recursos de prestación de servicios globales
Asegurar la calidad, la seguridad y la disponibilidad del servicio Soluciones de garantía de negocios para mitigar los riesgos asociados con la calidad del servicio, la seguridad y la disponibilidad

 

El enigma de la agilidad de DevOps


El DevOps está en el epicentro de esta innovación disruptiva y su rendimiento está directamente vinculado a los resultados de negocios corporativos. Desafortunadamente cuanto más alto la fuente de despliegue acelera la mayor resistencia que encuentra del creciente “caos creado debido a la mayor velocidad de operación. Mientras que la automatización y la adopción de los principios de liderazgo ágil ayuda a controlar este caos para la entrega continua, también aumenta el caos en el ambiente de producción. Como resultado, los equipos de operaciones pueden estar en riesgo de convertirse en el próximo cuello de botella que restringe el flujo global de la corriente de valor a los clientes. El primer paso que el equipo de operaciones tiene que emprender para enfrentar este reto es obtener una visibilidad continua y en tiempo real basada en la telemetría a nivel de sistema. El equipo de Ops necesita usar esta información para reducir el MTTR y establecer un bucle de retroalimentación eficaz con Dev, QA, Sec y OPS. Este objetivo es extremadamente difícil si no es imposible de lograr con las tecnologías tradicionales de gestión de rendimiento (Application Performance Management, APM) como los agentes y la instrumentación de códigos de bytes. La razón es que lo que las herramientas de APM revelan es la media luna, solo la telemetría a nivel de aplicación, a diferencia de toda la telemetría de extremo a extremo a nivel del sistema. Las soluciones de garantía de negocios (Business Assurance, BA) de NETSCOUT utilizan tecnologías basadas en el tráfico de IP para abordar este reto y ayudan a DevOps a obtener visibilidad a nivel de sistema para proteger la fuente de despliegue a una mayor velocidad de operación. Como se ilustra en la Figura 1 a continuación, este enfoque es más ágil y eficiente, ya que cualquier punto de instrumentación del tráfico de IP ofrece una visión a través de todas las aplicaciones y sus respectivos criterios de medición sin la necesidad de instrumentación de códigos de bytes de cada aplicación individual.

Aseguramiento del despliegue de DevOps
Figura 1: aseguramiento de la fuente de despliegue con visibilidad a nivel de sistema

“Ver toda la luna” [1]


Las soluciones de garantía de negocios de NETSCOUT empoderan a las organizaciones DevOps para ver "la totalidad de la luna" al monitorizar el tráfico de IP continuamente que atraviesa la infraestructura de prestación de servicios, detectando las degradaciones de servicio de forma proactiva y proporcionando información detallada procesable de todas las interdependencias de servicios necesarias para reducir el MTTR y resolver problemas antes de que los usuarios se vean afectados.

Esta visibilidad de extremo a extremo al nivel del sistema incluye la telemetría de criterios de medición de carga, latencia y fallas para todos los sistemas de prestación de servicios e interdependencias entre redes, servidores, habilitadores de servicio, bases de datos y aplicaciones. Esta información detallada no solo ayuda a mejorar la velocidad de planificación, entrega, integración, comprobación y despliegue continuos, sino que también optimiza las eficiencias y logra una ventaja competitiva.

Optimización de las eficiencias operacionales de DevOps


Si bien la comunicación fluida entre los equipos de Dev y Ops es un prerrequisito para aumentar la productividad de DevOps, no es suficiente. Incluso si, hipotéticamente hablando, el equipo de DevOps podría lograr una conciencia de situación común completamente transparente a través de los equipos de Dev y OPS, un análisis preciso de la "situación" influirá en la eficiencia de esta conciencia común. Si el análisis de la situación pudiera identificar rápidamente la raíz del problema nivel del sistema en todos los sistemas de TI pertinentes y en la aplicación, no solo reduciría drásticamente el MTTR, sino que también serviría como multiplicador de fuerza que permite a DevOps lograr más trabajo con menos recursos. Además, sería mucho más eficiente lograr esta reducción de MTTR sin la necesidad de que el equipo de desarrollo realice códigos de bytes de instrumentación para todas y cada una de las aplicaciones.

Por ejemplo, dado que sólo una parte de los problemas de prestación de servicios están relacionados con una aplicación específica, la productividad de los desarrolladores se optimiza si sólo se dedican cuando la raíz del problema está relacionada con su aplicación específica. Con la visibilidad de nivel de aplicación por otro lado, el equipo de desarrollo no sabría si la raíz de un problema de rendimiento de la aplicación está relacionada con su código de aplicación u otro sistema de TI. Esto resultará en un desperdicio de tiempo valioso por el equipo de desarrollo que necesita para ayudar a resolver problemas no relacionados con la aplicación. El equipo de Ops también terminaría gastando más tiempo en la resolución de problemas de la raíz del problema debido a la falta de visibilidad en las interdependencias a través de los sistemas de TI y las aplicaciones. Esto da como resultado la creación de “zonas de ineficiencia” tanto para Dev como para Ops debido al tiempo y esfuerzo desperdiciados como se ilustra en la figura 2 a continuación.

APM pone a la telemetría en escena
Figura 2: las ventajas de migrar a la telemetría a nivel de sistema: alta agilidad y eficiencia mejorada

El enfoque de telemetría a nivel de sistema utiliza una evaluación de errores de sistema eficaz basada en la visibilidad de extremo a extremo en todas las interdependencias de la prestación de servicios para identificar la causa raíz de los problemas de servicio rápidamente. El tiempo medio que toma una organización de TI para completar el proceso de clasificación se llama tiempo medio para el conocimiento (MTTK) y de acuerdo con la investigación ZK, MTTK explica 90 % del tiempo promedio total requerido para reparar (MTTR) un problema de rendimiento de servicio.

El enfoque de telemetría a nivel de sistema se basa en criterios de medición de rendimiento en toda la infraestructura de prestación de servicios que abarca nubes físicas y virtuales, en locales y fuera de los locales, privadas y públicas. Ofrece una capacidad única para analizar el rendimiento, los indicadores de tráfico, la carga y los fallos, así como ofrecer flujos de trabajo contextuales para la evaluación de errores y encontrar la raíz de los problemas rápidamente que causan la degradación del rendimiento de las aplicaciones. Una evaluación de errores de servicio eficaz puede acelerar MTTR significativamente por hasta 80 % que permite a los equipos de desarrollo centrar la mayor parte de su tiempo y esfuerzo productivamente en la entrega de nuevas aplicaciones y reduce la sobrecarga en las operaciones asociadas con las actividades de break-fix. Esto incluye el tiempo reducido invertido en el centro de control y las operaciones reducidas, y el costo de apoyo y la complejidad. La conclusión es que con la telemetría a nivel de sistema, las organizaciones de DevOps pueden ver “la totalidad de la luna”, [2]  y mejorar la velocidad y optimizar las eficiencias.

Fundación de telemetría a nivel de sistema: Smart Data y analítica superior

Smart Data


Si bien el logro de una visibilidad a nivel de sistema en todas las aplicaciones y sistemas de prestación de servicios y sus interdependencias puede sonar como algo muy exigente, es factible con Smart Data y analítica superior. Los datos de tráfico de IP son la base de Smart Data y se utilizan para generar metadatos altamente escalables que proporcionan una telemetría histórica y en tiempo real de todos los componentes del sistema, incluidas las redes físicas y virtuales, las aplicaciones de nivel N, las cargas de trabajo, los protocolos, servidores, bases de datos, usuarios y dispositivos. Las principales ventajas de utilizar los datos de tráfico de IP incluyen:

  • Telemetría a nivel de sistema y en tiempo real: dado que cada acción y transacción está encapsulada en paquetes de IP que atraviesan la infraestructura física y virtual, los datos de tráfico de IP ofrecen el mejor punto de vista para la visibilidad de extremo a extremo
  • Inteligencia procesable: el tráfico de IP contiene todos los datos [3]  necesarios para obtener un conocimiento profundo de los problemas de gestión de rendimiento de aplicaciones y sistemas
  • Información detallada de aplicaciones agnósticas: los datos de tráfico de IP se pueden utilizar para monitorizar cualquier aplicación tradicional, móvil, personalizada o estándar independiente del código fuente y sin necesidad de agentes o instrumentación de códigos de bytes
  • Mayor escalabilidad: la tecnología IP basada en estándares está bien estructurada y, por lo tanto, la más adecuada para la evaluación de errores del sistema escalable que requiere recopilar, normalizar, correlacionar, organizar y analizar de forma continua los grandes volúmenes de datos en un sistema de moda contextual

Combinación Smart Data con analítica superior


Figura 3: Fundación de telemetría a nivel de sistema: Combinación Smart Data con analítica superior

 

Analítica superior


Cuando Smart Data se combina con una analítica superior, puede revelar información detallada importante sobre las aplicaciones y los criterios de medición del rendimiento de servicio, como los volúmenes de tráfico de aplicaciones, los tiempos de respuesta del servidor de aplicaciones, los rendimientos de los servidores, los conteos de errores agregados y el error códigos específicos de los servidores de aplicaciones y dominio. Además, Smart Data puede revelar todas las dependencias de las aplicaciones y admitir la transición contextual a través de múltiples niveles de análisis que facilitan la entrega eficiente de las tareas de respuesta a incidentes a través de los diferentes grupos funcionales de TI en todo el proceso de evaluación de errores de la raíz del problema. Como tal, la entrega al equipo de desarrollo respectivo se hace solo necesaria si la raíz del problema está asociada con la aplicación específica que entregó.

La fase final de la optimización de DevOps se puede lograr con un análisis predictivo que detecta de forma proactiva las degradaciones de servicio antes de que se vean afectados varios usuarios. Al establecer las líneas de base de rendimiento automáticamente, se pueden generar alertas basadas en umbrales predefinidos o desviaciones de línea de base. Las desviaciones incluyen la utilización de enlaces ascendentes y descendentes, las tasas de error de transacción de aplicación y la capacidad de respuesta. El motor de analítica también necesita ajustar las líneas de base a lo largo del tiempo automáticamente para adaptarse a los cambios graduales en la utilización del servicio, y al mismo tiempo proporciona alertas oportunas sobre las anomalías de rendimiento. Al utilizar esta analítica predictiva, las organizaciones de DevOps pueden obtener visibilidad de los problemas de rendimiento de los servicios emergentes antes de que impacten a varios usuarios y contextualmente evaluar errores y analizar las pruebas de alerta y las causas subyacentes. El resultado global de la utilización de Smart Data y analítica superior es una reducción drástica de MTTK y MTTR como se ilustra en la figura 4 a continuación.

Reducción de MTTR
Figura 4: evaluación de errores del sistema eficaz con telemetría a nivel de sistema y analítica superior

Las ventajas adicionales de la telemetría a nivel de sistema y la evaluación de errores incluyen una mejor disponibilidad del servicio y la experiencia del usuario y la capacidad de escalar servicios para admitir millones de usuarios en el ambiente de producción.

Soluciones NETSCOUT para las necesidades de DevOps

Soluciones de eficiencia operacional
La plataforma de garantía de servicio nGeniusONE de NETSCOUT reduce drásticamente MTTR y MTTK, y sirve como multiplicador de fuerza que permite a Ops lograr más con menos recursos al reducir al mínimo el trabajo no planificado. Esta capacidad también maximiza la productividad de los desarrolladores al reducir la sobrecarga de lidiar con los problemas relacionados con otros sistemas de TI. Las eficiencias de núcleo se realizan con nGeniusONE al:

  • Detectar de las degradaciones de servicio proactivamente, ya sea basándose en desviaciones de las líneas de base de rendimiento o umbrales predefinidos
  • Admitir los flujos de trabajo de evaluación de errores del sistema de arriba hacia abajo que reducen el MTTK eficazmente al detectar la raíz del problema en todo el sistema, incluyendo la variedad de aplicaciones nivel N, sistemas de infraestructura de TI y todas sus respectivas interdependencias
  • Monitorizar sistemas heredados y aplicaciones nuevas e infraestructuras

Soluciones ágiles de despliegue continuo
La plataforma nGeniusONE de NETSCOUT ofrece telemetría relacionada con el tiempo real y el análisis de tendencias [4]  y analítica para proporcionar un bucle de retroalimentación que protege la fuente del despliegue y aumenta la agilidad de DevOps. Estas capacidades principales incluyen:

  • Información detallada granular de todos los sistemas de prestación de servicios y análisis de la raíz del problema teniendo en cuenta todas las interdependencias entre aplicaciones y en la infraestructura basada en la nube y localmente.
    • La tecnología Adaptive Service Intelligence (ASI) Plus que se ejecuta en dispositivos InfiniStreamNG ofrece visibilidad en tiempo real en sistemas DevOps e interdependencias, incluyendo redes físicas y virtuales, aplicaciones de nivel N, cargas de trabajo, protocolos, servidores, bases de datos, usuarios y dispositivos
    • La tecnología ASI Plus utiliza el tráfico de IP como fuente de Smart Data que es ideal para monitorizar microservicios y complejos en ambientes locales o en la nube
    • ASI eXtender (ASI-X) permite instrumentar y monitorizar cualquier aplicación personalizada rápidamente
  • Los cuadros de mandos personalizables, los informes y los mapas de dependencia de servicios ayudan a establecer una conciencia situacional común entre los equipos Dev, QA y Ops, y optimizan el bucle de retroalimentación
  • El nGeniusPULSE complementa las capacidades de nGeniusONE con visibilidad para la garantía de servicio de aplicaciones a través de las diversas combinaciones de empresas privadas, híbridas, SaaS y arquitecturas en la nube pública que se están desplegando hoy y por lo tanto son fundamentales para la fuente de despliegue

Planificación de DevOps
La plataforma nGeniusONE faculta a los equipos de Ops para reducir el riesgo de fiabilidad de la infraestructura de prestación de servicios asociado con el despliegue continuo con:

  • Análisis continuo y en tiempo real de la capacidad de los recursos de prestación de servicios mundiales, antes de que el equipo de Ops acepte el trabajo de Dev.
  • Esto incluye un mapa de dependencia de servicio automatizado que ofrece información detallada sobre la carga, la latencia y los fallos en toda la infraestructura de prestación de servicios, así como la capacidad de infraestructura a nivel de redes, enlaces y servidores
  • La adición de nGeniusPULSE con su capacidad para comprobar los servicios basados en la nube para la disponibilidad, respuesta y adherencia a los niveles de servicio, da a DevOps la información detallada del riesgo de fiabilidad asociado con el despliegue continuo

Mitigación de riesgos de negocios
Las soluciones de garantía de negocio de NETSCOUT ayudan a mitigar los riesgos de negocios y alcanzar resultados deseables. Esto se logra con:

  • Un conjunto de soluciones de garantía de servicio basadas en nGeniusONE y ASI que ayudan a reducir el MTTR y aumentar la calidad del servicio y la disponibilidad
  • Arbor Networks, la división de seguridad de NETSCOUT, ayuda a proteger la integridad y disponibilidad del servicio con la denegación de servicio distribuida (DDoS) y la amenaza persistente avanzada (APT)

Resumen

En la era digital, la organización DevOps puede marcar la diferencia entre el éxito corporativo y el fracaso. Los factores clave de éxito para DevOps son la agilidad, las eficiencias operacionales y la capacidad de reducir los riesgos empresariales que pueden impedir que la corporación logre los resultados deseados del negocio. Mientras que la automatización y la implementación de los principios ágiles por DevOps ayudaron a mejorar la velocidad y la eficiencia de la entrega continua, el ambiente de producción se ha convertido en la nueva restricción en el flujo de la corriente de valor a los clientes. Esta restricción no puede ser relajada de manera efectiva por equipos de operaciones que dependen de equipos de visibilidad y desarrollo a nivel de aplicación que necesitan realizar instrumentación de códigos de bytes para cada aplicación. Las capacidades de visibilidad, telemetría y evaluación de errores a nivel de sistema de NETSCOUT basadas en la monitorización y el análisis continuos del tráfico de IP empoderan a las organizaciones DevOps para que sean más ágiles y eficientes y ayuden a sus negocios a alcanzar una ventaja competitiva en el campo de batalla digital.

RECURSOS

Voz del cliente -

Fichas técnicas
Vistas rápidas

[1]De The Whole of the Moon lyrics - The Waterboys
[2]De The Whole of the Moon lyrics - The Waterboys
[3]Modelo de Open Systems Interconnection (OSI) niveles 2 a 7
[4]La telemetría es la terminología utilizada por DevOps e incluye criterios de medición de negocios, aplicaciones e infraestructuras necesarias para monitorizar la forma en que los sistemas operan en ambientes de producción