Gestão de
Incidentes

O Guia Definitivo

O que é gerenciamento de incidentes?

O organismo de orientação de melhores práticas de gerenciamento de serviços ITIL oferece uma declaração clara de propósito para o gerenciamento de incidentes:

“...para minimizar o impacto negativo dos incidentes, restaurando a operação normal do serviço o mais rápido possível.

Fonte: AXELOS, Guia Prático de Gerenciamento de Incidentes ITIL 4 (2020)

Quando um incidente é definido como "Uma interrupção não planejada de um serviço ou redução na qualidade de um serviço."

É importante ressaltar que o gerenciamento de incidentes proporciona às organizações uma maneira formalizada de lidar consistentemente com as questões de IT que estão afetando negativamente os funcionários, as operações e os resultados comerciais, e até mesmo os clientes.

O gerenciamento de incidentes como capacidade evoluiu desde a primeira versão da ITIL, introduzida em 1989. Embora o processo em si tenha permanecido relativamente semelhante, as formas pelas quais as capacidades de gerenciamento de incidentes são disponibilizadas aos usuários finais mudaram consideravelmente. Conforme abordado posteriormente, os balcões de ajuda de IT, depois os balcões de serviço de IT e, em seguida, as ferramentas ITSM fornecem capacidades para que a equipe de suporte de IT possa gerenciar efetivamente os incidentes através de uma variedade de canais de contato. Cada vez mais, de forma a melhorar tanto a experiência do usuário final quanto o desempenho da equipe de suporte de IT.

A adição de capacidades de auto-ajuda e auto-atendimento auto-atendimento do usuário final, e a introdução de estratégias de "mudança de esquerda", mudaram a forma como as capacidades de gerenciamento de incidentes são empregadas. De tal forma que alguns dos incidentes que foram tratados por:

  • Os analistas da central de serviço de IT e da central de serviço (Nível 1) são "desviados" para o auto-serviço (Nível 0).
  • O pessoal de apoio de nível 2 é "transferido para a esquerda" para o apoio de nível 1

Finalmente, a inteligência artificial (IA) - e o aprendizado de máquinas em particular - trouxe formas adicionais de identificar, relatar e remediar incidentes. Além disso, as formas ágeis de trabalho têm oferecido novas maneiras de gerenciar incidentes que são incluídos na ITIL 4 como "enxameação" - há mais sobre os dois últimos.

Não importa como o gerenciamento de incidentes é invocado ou ativado, o importante a lembrar é que ele ajuda a manter a IT e os serviços comerciais disponíveis e os funcionários produtivos. Além disso, se o gerenciamento de incidentes é novo para você e sua organização, você pode descobrir que você já faz alguma forma dele, mesmo se você o chamar de outra coisa (como gerenciamento de bilhetes ou tratamento de problemas).

What’s incident management?

O Gerenciamento de Serviços Empresariais oferece casos adicionais de uso do ITAM

Ainda que a gestão de grandes incidentes não seja uma área de foco aqui, vale a pena chamar a atenção para sua existência. A ITIL 4 define um incidente grave como: "Um incidente com impacto comercial significativo, exigindo uma resolução coordenada imediata". Ele também oferece um modelo de gerenciamento de incidentes graves que começa com o estabelecimento de critérios claros para distinguir incidentes graves de desastres e outros incidentes. É importante lembrar que o que define um incidente grave provavelmente variará entre organizações com base em uma variedade de fatores, desde como eles estão estruturados até sua carteira de serviços comerciais críticos.

Os grandes incidentes, como incidentes de impacto empresarial, são frequentemente tratados como uma situação em que é necessário que o maior número possível de pessoas contribua quando estão envolvidos recursos significativos de IT para ajudar a garantir tanto a rápida solução quanto a continuidade das operações comerciais.

What incident management isn’t

O que não é gerenciamento de incidentes

Às vezes, além de saber o que é algo, também é importante saber o que não é. No caso do gerenciamento de incidentes, existem duas capacidades de ITSM semelhantes, mas diferentes, que precisam ser vistas e tratadas como diferentes do gerenciamento de incidentes:

  • Gerenciamento de solicitações de serviços
  • Gerenciamento de problemas

A primeira dessas capacidades é melhor diferenciada pelo foco no que está sendo tratado, ou seja, as solicitações de serviço em vez de incidentes. A ITIL 4 define solicitações de serviço como "Uma solicitação de um usuário ou de um representante autorizado do usuário que inicia uma ação de serviço que foi acordada como parte normal da prestação do serviço". É uma definição complicada que é melhor entendida através de tipos de exemplo:

  • Uma solicitação que inicia uma ação de serviço, por exemplo, uma solicitação de novo hardware, software, ou um serviço
  • Um pedido de informações, por exemplo, como posso acessar as Equipes da Microsoft?
  • Uma solicitação de acesso a um recurso
  • A apresentação de feedback, elogios e reclamações

As várias versões das melhores práticas da ITIL há muito chamam a atenção para a importância de tratar incidentes e solicitações de serviços separadamente, devido à sua relativa urgência

A segunda dessas capacidades também é melhor diferenciada, começando com o que está sendo tratado, ou seja, problemas e não incidentes. A ITIL 4 define um problema como "Uma causa, ou causa potencial, de um ou mais incidentes". Tal gerenciamento de problemas está focado na remoção das coisas que causam incidentes repetidos e seu impacto.

Assim como nas solicitações de serviço, um diferencial chave entre o gerenciamento de incidentes e o gerenciamento de problemas é a necessidade de urgência. Embora a velocidade seja importante para ambos, a realidade é que o tempo necessário para realizar atividades de gerenciamento de problemas - incluindo a identificação das causas raiz - significa que ele opera em um ritmo muito mais lento do que o gerenciamento de incidentes. Isto pode ser pensado como prevenção de incêndios versus combate a incêndios.

Para saber mais sobre gerenciamento de problemas, leia o InvGate Definitive Guide to Problem Management. Além disso, o ITIL oferece orientação de melhores práticas sobre todos os três tipos de gerenciamento de incidentes, gerenciamento de solicitações de serviços e gerenciamento de problemas.

O que o gerenciamento de incidentes implica

A ITIL v3/2011 recomendou que os incidentes sejam gerenciados através de um processo, o que inclui uma série de etapas ou atividades formais:

  • Identificação e registro de incidentes.
  • Categorização inicial e priorização.
  • Escalação para o processo de gerenciamento de incidentes principais, se necessário, ou invocação do processo de gerenciamento da solicitação de serviço, se não for um incidente.
  • Diagnóstico inicial e escalonamento, se necessário.
  • Investigação e diagnóstico.
  • Resolução e recuperação.
  • Fechamento de incidentes.

Com propriedade contínua, monitoramento, rastreamento e comunicação envolvidos em todo o processo.

A ITIL 4 atualizou isto, embora apenas ligeiramente, para ser um processo de tratamento e resolução de incidentes que faz parte da prática de gerenciamento de incidentes (que também inclui o processo de revisão periódica de incidentes):

  • Detecção de incidentes.
  • Registro de Incidentes.
  • Classificação de Incidentes.
  • Diagnóstico de incidentes.
  • Resolução de incidentes.
  • Fechamento de incidentes.

Explore aqui as diferenças entre ITIL v3/2011 e ITIL 4.

What incident management entails

A necessidade e os benefícios da gestão de incidentes

Há muitos benefícios para uma organização com uma capacidade formal de gerenciamento de incidentes, entre eles

  • Redução do impacto de incidentes de IT para maximizar a produtividade dos funcionários e potencialmente da empresa e evitar a perda de receita, perda de reputação ou mesmo perda de clientes
  • Redução dos custos de suporte de IT através de processos de melhores práticas e capacitação de ferramentas
  • Melhor utilização de recursos de IT potencialmente escassos - tornando o pessoal de suporte de IT mais eficiente e eficaz
  • Alavancar o conhecimento compartilhado para acelerar a resolução de incidentes
  • Resolução de questões adversas antes que elas tenham um impacto significativo nas operações comerciais
  • Melhorar a colaboração entre as equipes de IT e minimizar as questões de "transferência de propriedade
  • Melhorar a experiência dos funcionários e as percepções da empresa sobre IT
Benefits of incident management

Gerenciamento de incidentes em ITIL 4
vs. gerenciamento de incidentes em ITIL v3/2011

The ITIL 4 Service Value System

IAlém das mudanças genéricas da ITIL 4 relacionadas a elementos como a ITIL ser gerenciamento de serviços e não ITSM, práticas ao invés de processos, e o sistema de valor do serviço, a ITIL 4 trouxe consigo algumas mudanças específicas de gerenciamento de incidentes. A chave é que não há mais um processo prescritivo de gerenciamento de incidentes, com organizações encorajadas a criar sua própria cadeia de valor para o gerenciamento de incidentes tendo uma visão centrada no cliente, em vez de IT.

Há também o conceito de swarming - onde o tratamento de incidentes é um esforço baseado na colaboração. Não há grupos de suporte escalonados e não há escalonamento entre eles. Em vez disso, uma questão é de propriedade de um indivíduo até sua resolução, com eles trazendo as pessoas certas para ajudar conforme necessário.

Cómo empezar con la gestión de incidentes

A gestão de incidentes é um dos processos/práticas de ITSM mais fáceis de justificar, apesar de às vezes ser visto como "um custo de qualidade". Esta justificativa é um ótimo ponto de partida para a introdução do gerenciamento de incidentes porque o torna mais do que "uma boa coisa a fazer" e permite que o escopo da cobertura do gerenciamento de incidentes e suas ambições sejam realçados à medida que os custos e benefícios potenciais são formulados. Desde o número de funcionários e tempos de operação, passando por metas de nível de serviço, até o investimento na capacitação da ferramenta ITSM.

Como mencionado anteriormente, há também a necessidade de apreciar que sua organização provavelmente já está fazendo alguma forma de gerenciamento de incidentes. Portanto, é importante avaliar completamente o status quo para ver o que pode continuar a ser usado em vez de potencialmente perder algo valioso na correria louca para introduzir uma nova forma de trabalho. Por exemplo, pode já haver práticas altamente maduras para o uso de ferramentas de suporte remoto.

Ao estabelecer - ou melhorar - o escopo do gerenciamento de incidentes, e de acordo com o novo foco da ITIL 4, é importante entender como ele criará valor comercial. O ideal é transferir o que tradicionalmente tem sido uma capacidade de suporte de IT para um que está focado em capacitar os usuários finais e melhorar sua produtividade.

Aproveite a riqueza da prática de gerenciamento de incidentes disponível na ITIL e em outros recursos, incluindo ferramentas ITSM. Mas, em última análise, você precisa criar uma capacidade de gerenciamento de incidentes que seja mais adequada à sua organização (em vez de uma que seja retirada de uma organização completamente não relacionada). Por exemplo, níveis de prioridade - alguns benchmarks podem se ajustar, mas outros precisarão ser avaliados e ajustados para atender às necessidades de sua organização.

A maioria dos fornecedores de ferramentas ITSM criou modelos de gerenciamento de incidentes, fluxos de trabalho e capacidades de relatórios com base em tais melhores práticas que podem ou não se adequar às necessidades de sua organização. Portanto, é importante que as práticas "out-of-the-box" da ferramenta ITSM sejam alteradas se forem contra as necessidades de gerenciamento de incidentes de sua organização, mas também é importante manter as melhores práticas que se adaptam.

O estabelecimento de níveis de prioridade de gerenciamento de incidentes, metas de nível de serviço e métricas de desempenho é outra atividade chave que é melhor feita em colaboração com as principais partes interessadas da empresa, embora reconhecendo que é necessário encontrar um equilíbrio entre atender às expectativas e gastar o que provavelmente será um financiamento limitado de forma sensata. Isto inclui começar a apreciar o impacto comercial do que o suporte de IT faz e não faz. Por exemplo, se o atraso na resolução de um problema custa mais à sua organização do que se recursos adicionais de IT forem utilizados para garantir uma resolução mais rápida.

Procure aproveitar todos os três métodos de gerenciamento de conhecimento, autoatendimento e automação para tornar o gerenciamento de incidentes os três "melhores, mais rápidos, mais baratos". A gestão do conhecimento ajudará com resoluções mais rápidas e melhores (que são, portanto, mais econômicas). Enquanto o auto-serviço, se bem feito, proporcionará aos usuários finais um acesso mais rápido - potencialmente automatizado - a soluções que aliviam a pressão sobre o pessoal de gerenciamento de incidentes e reduzem os custos de mão-de-obra. A automação é então a proverbial "cereja em cima da cereja", tornando o trabalho e as resoluções mais rápidos e ampliando as capacidades de pessoas não qualificadas, incluindo os usuários finais através da auto-ajuda.

Além disso, planejar além das capacidades iniciais de gerenciamento de incidentes usando a melhoria contínua para identificar problemas e encontrar sistematicamente maneiras de melhorar as operações e resultados da prática. O gerenciamento de problemas acima mencionado também deve ser adotado para reduzir o número de incidentes repetidos, mesmo que apenas iniciados de uma forma pequena para provar seu valor.

How to start with incident management
How ITSM tools help with incident management

Como as ferramentas ITSM ajudam na gestão de incidentes

Poder-se-ia argumentar que a gestão de incidentes é uma "necessidade de espinha dorsal" para ferramentas ITSM. Não apenas porque é o processo ou prática de ITSM mais adotado/usado, mas porque a evolução das ferramentas de help desk de IT até as ferramentas ITSM começou com a emissão de bilhetes para o gerenciamento de questões de IT, ou seja, gerenciamento de incidentes. Não é surpreendente que as ferramentas ITSM ofereçam um alto grau de capacitação para o gerenciamento de incidentes que vai além do núcleo de capacitação do fluxo de trabalho, gerenciamento do conhecimento, auto-serviço e relatórios e análises.

Por exemplo, ferramentas de monitoramento nativas ou de terceiros com recursos de correlação de eventos para detecção proativa de problemas. Acesso a dados de desempenho e status do dispositivo - juntamente com banco de dados de gerenciamento de configuração (CMDB) e dados de ativos - para facilitar o diagnóstico de incidentes. Ou o uso de recursos nativos ou de terceiros para orquestração ou administração remota na resolução de incidentes.

Assim como as muitas capacidades tradicionais de gerenciamento de incidentes das ferramentas ITSM, há cada vez mais oportunidades para que as capacidades habilitadas para IA ajudem nos três tipos de resolução de incidentes "melhor, mais rápido, mais barato". Estas incluem:

  • Agentes virtuais (incluindo chatbots) para auto-ajuda do usuário final. Estes podem atuar como o primeiro ponto de contato para os compromissos do usuário final, onde, se o envolvimento humano não for a resolução necessária, também pode ser fornecido. Por exemplo, redefinição automatizada de senha, fornecimento de conhecimento, registro de incidentes, verificação do status de incidentes ou agendamento de uma sessão de engenharia virtual ou presencial.
  • Agentes virtuais para aumentar o conhecimento da equipe de suporte de IT. Por exemplo, fornecimento automático de soluções conhecidas ou questões similares em tempo real. Além disso, recomenda ações automatizadas para fornecer resoluções com um clique, quando apropriado.
  • Automação inteligente. Esta é uma automatização repetitiva de tarefas usando o aprendizado da máquina para reduzir o nível de problemas de alto volume e baixo valor recebidos pela equipe de suporte de IT. Por exemplo, o uso da automação inteligente para avaliar, categorizar, priorizar e encaminhar bilhetes de incidentes (e solicitação de serviço) recebidos.
  • Identificação de questões preditivas. Seja a identificação automatizada de problemas ou incidentes maiores ou a ligação de um ticket de entrada com um incidente ou problema conhecido.
  • Melhoria das capacidades analíticas. Isto inclui tanto a identificação proativa de problemas como o aumento da visibilidade dos padrões e tendências de desempenho do suporte de IT.

O gerenciamento de serviços corporativos acrescenta uma dimensão extra ao gerenciamento de incidentes

Enquanto tudo isso tem sido focado no gerenciamento de incidentes através de uma lente ITSM, o gerenciamento de serviços empresariais - "o uso de princípios, práticas e capacidades de gerenciamento de serviços de IT (ITSM) por outras funções empresariais para melhorar suas operações, serviços, experiências e resultados" - fornece uma dimensão extra ao uso do gerenciamento de incidentes. De fato, pesquisas realizadas pela AXELOS e ferramentas ITSM descobriram que o gerenciamento de incidentes é a capacidade mais comumente compartilhada de ITSM entre as organizações - em 78% das organizações que já possuem uma estratégia de gerenciamento de serviços empresariais em voo.

Finalmente, algumas das melhores práticas da ITAM são direcionadas aos profissionais da ITAM. Existem múltiplas normas internacionais, a principal das quais é a ISO/IEC 19770-1 que "especifica os requisitos para o estabelecimento, implementação, manutenção e melhoria de um sistema de gestão de ativos de TI (ITAM), referido como um "sistema de gestão de ativos de TI" (ITAMS)".

Isto torna ainda mais importante que as práticas de gerenciamento de incidentes de sua organização sejam otimizadas. Afinal de contas, compartilhar uma prática de ITSM sub-ótima na tentativa de melhorar as operações e resultados de outras funções empresariais é uma abordagem com falhas.

Enterprise service management

Perguntas Frequentes

Processo de Gerenciamento de Incidentes refere-se a um conjunto de procedimentos e ações tomadas para responder e resolver incidentes críticos: a detecção e comunicação de incidentes, quem é responsável, quais ferramentas são utilizadas e as medidas tomadas para resolvê-lo.

Avalie o InvGate como sua solução ITSM e ITAM

30 dias de teste gratuito - Não é necessário cartão de crédito

Service Management

ITAM

Aprenda

InvGate

Compare com