Gestión de
incidentes
La guía definitiva
¿Qué es la gestión de incidentes?
La guía de mejores prácticas para la gestión de servicios de ITIL ofrece una definición clara del propósito de la gestión de incidentes:
“…minimizar el impacto negativo de los incidentes mediante la restauración del funcionamiento normal del servicio lo más rápido posible.”
Fuente: AXELOS, Gestión de incidentes ITIL 4 Guía de fundamentos (2020)
A su vez, define a un incidente como “una interrupción no planificada de un servicio o la reducción de la calidad de un servicio.”
Cabe mencionar que la gestión de incidentes les brinda a las organizaciones un camino formalizado para manejar de manera consistente aquellos problemas de IT que tienen efectos adversos para los empleados, las operaciones del negocio, los resultados, e incluso los clientes.
La gestión de incidentes es una competencia que ha evolucionado desde que se presentó la primera versión de ITIL en 1989. Si bien el proceso se mantuvo relativamente sin modificaciones, la manera en que las competencias de gestión de incidentes se pusieron a disposición de los usuarios finales cambió considerablemente. Tal como lo hablaremos más adelante, la mesa de ayuda de IT, luego los Service Management de IT, y luego las herramientas de ITSM, proporcionan competencias habilitadoras para que el personal de soporte de IT gestione de manera efectiva los incidentes mediante una variedad de canales de contacto diferentes. Esto, a su vez, mejora la experiencia del usuario final y el desempeño del personal de soporte de IT.
La implementación de competencias de autoayuda y autoservicio para los usuarios finales, y la introducción de estrategias de “shift-left” cambiaron los modos de empleo de las competencias de gestión de incidentes. De modo que algunos de los incidentes que antes los trataba:
- El Service Management de IT y los analistas de Service Management (nivel 1) son “desviados” hacia el autoservicio (nivel 0)
- El personal de soporte de nivel 2 son “desplazados a la izquierda” (es decir, shift-left) al soporte de nivel 1
Por último, la inteligencia artificial (IA) y el machine learning en particular han traído a la mesa métodos adicionales para identificar, reportar y remediar incidentes. A estos se le suman las formas de trabajo Agile que ofrecen nuevas técnicas para gestionar incidentes, incluidas en ITIL 4 bajo el nombre de “enjambre” (swarming). Hablaremos de esto más adelante.
Independientemente de cómo se implemente o habilite la gestión de incidentes, es importante recordar que permite mantener a los servicios del negocio y IT disponibles y a los empleados, productivos. Además, si la gestión de incidentes es algo nuevo para ti y tu organización, quizás te sorprenda descubrir que ya cuentas con algo similar, incluso aunque lo llames de otra forma (como gestión de solicitudes o manejo de problemas).
¿Qué es la gestión de incidentes mayores?
Si bien la gestión de incidentes mayores no es el tema central de este artículo, es necesario mencionar su existencia. ITIL 4 define a un incidente mayor como: “un incidente con impacto empresarial significativo, que requiere una resolución coordinada inmediata”. Además, ofrece un modelo de gestión de incidentes mayores que empieza con establecer un criterio claro para diferenciar a los incidentes mayores de los desastres y otros incidentes. Es importante recordar que los incidentes mayores pueden variar entre organizaciones, ya que dependen de una serie de factores que van desde su estructura hasta su portafolio de servicios críticos del negocio.
Los incidentes mayores al ser incidentes que causan un impacto en el negocio, a menudo se los gestiona como emergencias que involucran recursos de IT significativos para encontrar una solución rápida y reactivar las operaciones del negocio.
¿Qué no es la gestión de incidentes?
A veces, además de conocer lo que algo es, también es importante saber lo que no es. En el caso de la gestión de incidentes, existen dos competencias similares, pero distintas, que se deben diferenciar de la gestión de incidentes:
- La gestión de solicitud de servicio
- La gestión de problemas
La primera de estas competencias se puede diferenciar si observamos qué es lo que trata, es decir, solicitudes de servicio en lugar de incidentes. ITIL 4 define a las solicitudes de servicio como “una solicitud de un usuario o un representante autorizado de un usuario que inicia una acción de servicio que se ha acordado como parte normal de la entrega del servicio”. Es una definición complicada que se puede entender mejor a través de algunos ejemplos:
- Una solicitud que inicia una acción de servicio. Por ejemplo, una solicitud de nuevo hardware, software o servicio
- Una solicitud de información. Por ejemplo, ¿cómo accedo a Microsoft Teams?
- Una solicitud de acceso a un recurso
- Comentarios, felicitaciones y quejas
Las distintas versiones de las mejores prácticas de ITIL siempre han mencionado que es importante tratar a los incidentes y solicitudes de servicio por separado debido a su relativa urgencia
La segunda de estas competencias también se diferencia si observamos lo que gestiona, es decir, problemas en lugar de incidentes. ITIL 4 define a un problema como “una causa o causa potencial, de uno o más incidentes”. En tal sentido, la gestión de problemas busca remover aquello que causa incidentes repetidos y su impacto.
Al igual que con las solicitudes de servicio, un diferenciador clave entre la gestión de incidentes y la gestión de problemas es la necesidad de urgencia. Si bien la velocidad es un factor importante para ambas, la realidad es que el tiempo necesario para sobrellevar actividades de gestión de problemas (incluida la identificación de las causas) es mucho más lento que el de la gestión de incidentes. Se puede hacer la analogía con la diferencia que existe entre la prevención de incendios y la extinción de incendios.
Para aprender más sobre la gestión de problemas, lee nuestra Guía Definitiva de la Gestión de Problemas, así como también la guía de mejores prácticas de ITIL para la gestión de incidentes, la gestión de solicitudes de servicio y la gestión de problemas.
¿Qué abarca la gestión de incidentes?
ITIL v3/2011 recomienda gestionar a los incidentes por medio de un proceso que incluye un número de pasos o actividades formales:
- Identificación y registro del incidente
- Clasificación y priorización inicial
- Escalado a procesos de gestión de incidentes mayores de ser necesario o invocación de procesos de gestión de solicitud de servicio si no se tratase de un incidente
- Diagnóstico inicial y escalado si es necesario
- Investigación y diagnóstico
- Resolución y recuperación
- Cierre del incidente
Con la propiedad, monitoreo, seguimiento y comunicación continua involucrada durante el proceso.
ITIL 4 actualizó esto, aunque solo un poco, para que sea un proceso de manejo y resolución de incidentes que forme parte de la práctica de gestión de incidentes (la cual también incluye el proceso de revisión periódico de incidentes):
- Detección del incidente
- Registro del incidente
- Clasificación del incidente
- Diagnóstico del incidente
- Resolución del incidente
- Cierre del incidente
- Cierre del incidente
Explore las diferencias entre ITIL v3/2011 e ITIL 4 aquí.
La necesidad y el beneficio de la gestión de incidentes
Existen muchos beneficios para una organización que posea una competencia formal de gestión de incidentes. Entre ellos podemos encontrar los siguientes:
- Disminuir el impacto de los incidentes de IT para maximizar la productividad de los empleados y potencialmente del negocio, y evitar perder la rentabilidad, la reputación o, incluso, a los clientes
- Reducir los costos del soporte de IT mediante la habilitación de procesos y herramientas de mejores prácticas
- Reducir los costos del soporte de IT mediante la habilitación de procesos y herramientas de mejores prácticas
- Utilizar recursos de IT potencialmente escasos de una mejor manera para que tu personal de soporte de IT sea más eficiente y efectivo
- Impulsar el conocimiento compartido para acelerar la resolución de incidentes
- Resolver problemas adversos antes de que impacten significativamente en las operaciones del negocio
- Mejorar la colaboración entre los equipos de IT y minimizar el “traspaso” de problemas
- Mejorar la experiencia del empleado y la percepción del negocio sobre IT
Gestión de incidentes en ITIL 4
vs. Gestión de incidentes en ITIL v3/201
Además de los cambios más generales que introdujo ITIL 4, como cambiar el enfoque de ITSM hacia uno más centrado en la gestión de servicios, los procesos por las prácticas, y la creación del sistema del valor del servicio, ITIL 4 también presentó cambios específicos para la gestión de incidentes. El más importante es la ausencia de un proceso de gestión de incidentes normativo, lo que significa que las organizaciones pueden crear su propia cadena de valor para gestionar incidentes, tomando la perspectiva del cliente en lugar de una más centrada en IT
También se introdujo el concepto de enjambre, en donde el manejo de los incidentes se realiza de manera colaborativa, es decir, ya no existen grupos de soporte escalonados y ningún tipo de escalado entre ellos. Por el contrario, un inconveniente es propiedad de un individuo desde el principio hasta su resolución y permite involucrar a las personas adecuadas para que brinden asistencia de ser necesario.
¿Cómo empezar con la gestión de incidentes?
La gestión de incidentes es uno de los procesos/prácticas de ITSM más sencillas de justificar, aunque, en ocasiones, se la percibe como “un costo de calidad”. Esta justificación es un gran punto de partida para introducir la gestión de incidentes, ya que la convierte en más que “algo bueno” y permite que su cobertura y ambiciones se amplíen mientras se formulan los costos y beneficios potenciales. Desde la nómina de empleados, los horarios de funcionamiento y los objetivos del nivel de servicio, hasta inversiones para habilitar herramientas de ITSM.
Tal como lo mencionamos más arriba, también existe la posibilidad de que tu organización ya se encuentre haciendo algo similar a la gestión de incidentes. Por tal motivo, es importante evaluar con detenimiento la situación actual para ver qué se puede seguir utilizando en lugar de arriesgarse a perder algo de valor en el afán de introducir una nueva forma de trabajo. Por ejemplo, quizás ya exista una práctica madura para el uso de las herramientas de soporte remoto.
Al momento de establecer, o mejorar, el alcance de la gestión de incidentes (y en línea con el nuevo enfoque de ITIL 4) es importante considerar cómo creará valor para el negocio. Lo ideal sería cambiar lo que tradicionalmente fue una competencia de soporte de IT para resolver inconvenientes por una que esté más enfocada en habilitar a los usuarios finales y aumentar su productividad.
Aprovecha la riqueza de la práctica disponible de gestión de incidentes en ITIL y otros recursos, incluidas las herramientas de ITSM. De todas maneras, en el largo plazo, necesitarás crear una competencia de gestión de incidentes que se adapte exclusivamente a tu organización (en lugar de una que haya surgido en una organización completamente distinta). Por ejemplo, los niveles de prioridad; algunos benchmarks pueden ser adecuados, pero otros necesitarán que se los evalúe y ajuste para satisfacer las necesidades de tu organización.
La mayoría de los proveedores de herramientas de ITSM han creado plantillas para la gestión de incidentes, los flujos de trabajo y las competencias de presentación de informes que se encuentran respaldadas por estas mejores prácticas y que podrían satisfacer las necesidades de tu organización o no. Es importante modificar aquellas prácticas de herramientas de ITSM “listas para usar” que vayan en contra de las necesidades de gestión de incidentes de tu organización, pero, al mismo tiempo, es importante conservar aquellas prácticas que mejor se adapten.
La implementación de niveles de prioridad en la gestión de incidentes, objetivos del nivel de servicio y métricas de desempeño es otra actividad clave que se recomienda trabajar en colaboración con otros stakeholders claves del negocio, reconociendo a su vez que se debe encontrar un balance entre estar a la altura de las expectativas e invertir sabiamente lo que probablemente sea un financiamiento limitado. Esto incluye empezar a entender el impacto de lo que el soporte de IT hace y no hace. Por ejemplo, si un retraso en la resolución de un problema es más costoso para tu organización que utilizar recursos adicionales de IT para asegurar una resolución más rápida.
Es importante que impulsen la gestión del conocimiento, el autoservicio y la automatización para hacer que la gestión de incidentes sea “mejor, rápida y rentable”. La gestión del conocimiento te permitirá encontrar resoluciones más rápidas y mejores (que a su vez son rentables). Mientras que el autoservicio, si se lo utiliza de manera correcta, les brindará a los usuarios finales rápido acceso a soluciones (potencialmente automatizadas) que le quitarán presión al personal de gestión de incidentes y reducirán los costos laborales. La automatización se podría decir que es “la frutilla del postre”, ya que garantiza que el trabajo y las resoluciones se efectúen más rápido, y amplía las competencias del personal no calificado, incluidos los mismos usuarios finales a través de la autoayuda.
Además, es recomendable que planees más allá de las competencias iniciales de gestión de incidentes, utilizando la mejora continua para identificar problemas y encontrar sistemáticamente estrategias para mejorar las operaciones y resultados de la práctica. También deberías adoptar la gestión de problemas mencionada más arriba para reducir el número de incidentes repetidos, aunque sea a menor escala para demostrar su valor.
¿Cómo ayudan las herramientas de ITSM con la gestión de incidentes?
Se podría decir que la gestión de incidentes es una “necesidad troncal” de las herramientas de ITSM. No solo porque es el proceso o práctica de ITSM más adoptado/usado, sino también porque la evolución de las herramientas de mesa de ayuda de IT, por medio de las herramientas de ITSM, las llevó a tratar solicitudes de gestión de errores de IT, es decir, gestionar incidentes. Por tal motivo, no es sorpresa que las herramientas de ITSM ofrezcan un mayor grado de habilitación para gestionar incidentes, a la par de sus tareas centrales como la habilitación de flujos de trabajo, la gestión del conocimiento, el autoservicio y la presentación de informes y analítica.
Por ejemplo, herramientas de monitoreo nativas o tercerizadas con competencias de correlación de eventos para la detección proactiva de inconvenientes. Acceso a información de rendimiento y estado del dispositivo, junto con una base de datos de gestión de la configuración (CMDB) y datos de los activos, para facilitar el diagnóstico de los incidentes. O la implementación de competencias nativas o tercerizadas para la orquestación o administración remota en la resolución de incidentes.
Al igual que con muchas competencias tradicionales de habilitación de la gestión de incidentes en herramientas de ITSM, existen cada vez más oportunidades para implementar competencias habilitadas por IA que permiten que la resolución de incidentes sea “mejor, rápida y rentable”. Estas incluyen las siguientes:
- Agentes virtuales (incluidos los chatbots) para la autoayuda de los usuarios finales. Estos pueden ser el primer punto de contacto con los usuarios finales, en caso de que la intervención humana no sea necesaria, aunque también puede brindarse. Por ejemplo, restablecer contraseñas, proporcionar conocimiento, registrar solicitudes de incidentes, monitorear el estado de las solicitudes de incidente o agendar una sesión de ingeniería virtual o presencial
- Agentes virtuales para aumentar el conocimiento del personal de soporte de IT. Por ejemplo, brindar automáticamente soluciones conocidas o errores similares en tiempo real y recomendar acciones automatizadas para brindar soluciones sencillas cuando sea adecuado
- Automatización inteligente. Esto significa automatizar tareas repetitivas a través de machine learning para reducir el nivel de inconvenientes de alto volumen y poco valor que recibe el personal de soporte de IT. Por ejemplo, la implementación de automatización inteligente para evaluar, clasificar, priorizar y dirigir solicitudes entrantes de incidentes (y solicitudes de servicio)
- Identificación predictiva de errores. Puede abarcar la identificación automatizada de problemas o incidentes mayores o la asignación de una solicitud entrante con un incidente mayor o problema conocido
- Competencias analíticas mejoradas. Incluye la identificación proactiva de problemas y una mayor visibilidad de los patrones y tendencias de desempeño del soporte de IT
La gestión de servicios empresariales agrega una dimensión extra a la gestión de incidentes
Si bien todo lo mencionado arriba se enfoca en la gestión de incidentes a través del lente de ITSM, la gestión de servicios empresariales (“la implementación de principios, prácticas y competencias de ITSM en otras funciones del negocio para mejorar sus operaciones, servicio, experiencias y resultados”) proporciona una dimensión extra al uso de la gestión de incidentes. De hecho, un estudio llevado a cabo por AXELOS y ITSM.tools demostró que la gestión de incidentes es la competencia de ITSM más compartida en las organizaciones; un 78% de las organizaciones ya cuentan con una estrategia de gestión de servicios empresariales en desarrollo.
Esto enfatiza la necesidad de que las prácticas de gestión de incidentes de tu organización estén optimizadas. Después de todo, compartir una práctica de ITSM subóptima en un intento por mejorar las operaciones y resultados de otras funciones del negocio es un enfoque defectuoso.
Preguntas frecuentes
Prueba a InvGate cómo tu solución ITSM
Pruébalo 30 días sin costo - Sin tarjeta de crédito