Governança de TI x Gestão de TI: diferenças, princípios e objetivos
Governança de TI define direção: quem decide, com base em quais critérios, quais prioridades e quais riscos são aceitáveis. Foca em valor, risco, conformidade e alinhamento com o negócio.
Gestão de TI executa o dia a dia: planeja, constrói, opera e melhora serviços para cumprir metas definidas pela governança. Foca em entrega, eficiência e qualidade operacional.
Como diferenciar na prática (pergunta típica de prova)
- Governança: “O que deve ser feito e por quê?” (prioridades, apetite a risco, conformidade, investimentos).
- Gestão: “Como e quando vamos fazer?” (processos, equipes, ferramentas, rotinas, operação).
Exemplo bancário (Caixa): decisão x execução
- Governança: aprova meta de disponibilidade do Internet Banking (ex.: 99,95%), define tolerância a indisponibilidade, aprova orçamento para redundância e monitora riscos regulatórios.
- Gestão: implementa monitoramento, executa mudanças controladas, atende incidentes, mede SLAs e faz melhoria contínua.
ITIL: gestão de serviços aplicada ao atendimento e operação
ITIL organiza práticas para gerenciar serviços de TI com foco em entregar valor ao usuário/negócio. Em provas, é comum cobrarem a distinção entre incidente, problema, mudança e requisição, além de catálogo de serviços e acordos SLA/OLA/UC.
Catálogo de serviços e requisição de serviço
Catálogo de serviços é a lista estruturada do que a TI oferece (ex.: “Reset de senha”, “Acesso a sistema interno”, “Criação de usuário”, “Instalação de software homologado”, “Acesso VPN”). Ele define: descrição, elegibilidade, prazos, custos (quando aplicável) e canal de solicitação.
Requisição de serviço é um pedido padrão, geralmente de baixo risco e repetitivo, atendido por fluxo pré-definido (ex.: desbloqueio de usuário, inclusão em grupo, emissão de certificado).
Continue em nosso aplicativo
Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.
ou continue lendo abaixo...Baixar o aplicativo
Passo a passo prático: desenhando um fluxo de requisição (ex.: reset de senha)
- 1) Usuário solicita via portal/central (item do catálogo).
- 2) Sistema valida identidade (perguntas, MFA, validação por gestor, conforme política).
- 3) Ferramenta registra ticket e classifica como “requisição”.
- 4) Execução automática (quando possível) ou por equipe de suporte.
- 5) Confirmação com o usuário e encerramento com registro de evidências.
- 6) Métricas: tempo médio de atendimento, taxa de reabertura, volume por unidade/agência.
Incidente: restaurar o serviço rapidamente
Incidente é uma interrupção não planejada ou redução de qualidade de um serviço. O objetivo é restaurar o serviço o mais rápido possível, minimizando impacto.
Passo a passo prático: tratamento de incidente (ex.: lentidão no app bancário)
- 1) Detecção: monitoramento ou chamados de clientes/agências.
- 2) Registro: abrir ticket com horário, sintomas, serviço afetado, evidências.
- 3) Classificação e priorização: impacto x urgência (ex.: afeta transações Pix e login).
- 4) Diagnóstico inicial: checar dashboards, logs, dependências (rede, autenticação, banco de dados, filas).
- 5) Escalonamento: para time especialista (aplicação, infraestrutura, fornecedor).
- 6) Contorno (workaround): reduzir impacto (ex.: desativar funcionalidade não crítica, redirecionar tráfego, aumentar capacidade temporária).
- 7) Resolução e recuperação: corrigir e validar retorno do serviço.
- 8) Encerramento: registrar causa aparente, tempos, ações e lições.
Problema: eliminar causa raiz e evitar recorrência
Problema é a causa (ou potencial causa) de um ou mais incidentes. O objetivo é prevenir incidentes e reduzir impacto de incidentes inevitáveis por meio de análise de causa raiz e workarounds documentados.
Diferença-chave: incidente foca em restauração rápida; problema foca em causa raiz e recorrência.
Passo a passo prático: do incidente repetido ao problema (ex.: quedas intermitentes no login)
- 1) Identificar padrão: incidentes semelhantes em horários de pico.
- 2) Abrir registro de problema e relacionar incidentes.
- 3) Coletar evidências: métricas de autenticação, latência, erros, capacidade.
- 4) Analisar causa raiz (ex.: pool de conexões insuficiente, limite de threads, dependência externa instável).
- 5) Definir workaround (ex.: aumentar pool temporariamente, limitar requisições por IP).
- 6) Propor mudança definitiva (ex.: ajuste de configuração, correção de código, melhoria de infraestrutura).
- 7) Após mudança, monitorar redução de incidentes e atualizar base de conhecimento.
Mudança: controlar risco ao alterar o ambiente
Mudança é a adição, modificação ou remoção de algo que possa afetar serviços. O objetivo é reduzir risco e evitar incidentes causados por alterações mal planejadas.
Passo a passo prático: mudança controlada (ex.: atualização de certificado TLS do Internet Banking)
- 1) Registrar requisição de mudança (escopo, motivo, serviços afetados).
- 2) Avaliar risco e impacto (dependências, janelas, rollback).
- 3) Aprovação conforme tipo (padrão/normal/emergencial).
- 4) Planejar: checklist, comunicação, janela de mudança, testes.
- 5) Executar em janela aprovada com acompanhamento.
- 6) Validar: testes de acesso, transações, monitoramento.
- 7) Encerrar: evidências, lições aprendidas, atualização de documentação.
SLA, OLA e UC: compromissos e responsabilidades
- SLA (Service Level Agreement): acordo entre TI e cliente/negócio sobre níveis de serviço (ex.: disponibilidade, tempo de resposta, tempo de restauração).
- OLA (Operational Level Agreement): acordo interno entre equipes (ex.: suporte N1 e time de redes) para cumprir o SLA.
- UC (Underpinning Contract): contrato com fornecedor (ex.: link, nuvem, antifraude) que sustenta o SLA.
Raciocínio de prova: SLA é externo (TI x negócio), OLA é interno (entre áreas), UC é com terceiros.
COBIT: governança e controle em nível conceitual
COBIT é um framework de governança e gestão de TI orientado a objetivos e controles. Em provas, costuma aparecer como: foco em alinhamento com o negócio, entrega de valor, gestão de riscos, recursos e mensuração de desempenho, além dos domínios/processos em visão macro.
Domínios do COBIT (visão conceitual)
- EDM (Evaluate, Direct and Monitor): avaliar, direcionar e monitorar (núcleo de governança).
- APO (Align, Plan and Organize): alinhar, planejar e organizar (estratégia, arquitetura, portfólio, riscos).
- BAI (Build, Acquire and Implement): construir/adquirir e implementar (projetos, mudanças, liberações).
- DSS (Deliver, Service and Support): entregar, serviço e suporte (operação, incidentes, continuidade).
- MEA (Monitor, Evaluate and Assess): monitorar, avaliar e analisar (conformidade, auditoria, desempenho).
Como COBIT e ITIL se complementam
- COBIT ajuda a definir o que deve ser governado e como medir/monitorar (EDM/MEA).
- ITIL detalha como operar e melhorar serviços no dia a dia (incidentes, problemas, mudanças, SLAs).
- Exemplo: COBIT pode exigir controle e mensuração de disponibilidade (objetivo e monitoramento); ITIL operacionaliza com gestão de incidentes, mudanças e disponibilidade.
Métricas, KPIs e indicadores: medir para decidir
Métrica é uma medida (ex.: tempo de atendimento). KPI é uma métrica crítica ligada a objetivo (ex.: % de incidentes resolvidos dentro do SLA). Em governança, indicadores suportam decisões; em gestão, suportam melhoria operacional.
KPIs comuns em serviços de TI (com exemplos bancários)
- Disponibilidade do serviço (ex.: Internet Banking 99,95%).
- MTTR (tempo médio para restaurar): incidente crítico em canal digital.
- MTBF (tempo médio entre falhas): estabilidade de um componente (ex.: autenticação).
- % de cumprimento de SLA: incidentes resolvidos no prazo.
- Taxa de reabertura: chamados encerrados que voltam (qualidade da solução).
- Backlog de requisições: volume pendente no catálogo (ex.: acessos a sistemas internos).
- Change failure rate: % de mudanças que geram incidente/rollback (risco de mudança).
- Tempo de ciclo de mudança: da solicitação à implementação (agilidade com controle).
Passo a passo prático: definindo um KPI útil
- 1) Defina o objetivo (ex.: reduzir indisponibilidade do app em horário de pico).
- 2) Escolha a métrica que representa o objetivo (ex.: disponibilidade e MTTR).
- 3) Defina fórmula e fonte (monitoramento, ferramenta de chamados).
- 4) Estabeleça meta e tolerância (ex.: 99,9% mensal; MTTR < 30 min em P1).
- 5) Defina responsáveis e cadência de revisão (semanal/mensal).
- 6) Vincule ações: se meta não for atingida, abrir problema e plano de melhoria.
Gestão de capacidade e disponibilidade: manter serviço estável e dimensionado
Gestão de capacidade
Garante que recursos (CPU, memória, I/O, rede, licenças, filas, conexões) suportem demanda atual e futura com custo adequado. Em banco, picos podem ocorrer em dias de pagamento, campanhas, virada de mês e horários de maior acesso.
Passo a passo prático: capacidade para pico de acesso (ex.: pagamento de benefícios)
- 1) Identificar períodos críticos (calendário de pagamentos e janelas de maior uso).
- 2) Medir baseline (uso médio) e pico (p95/p99 de latência e consumo).
- 3) Encontrar gargalos (ex.: pool de conexões, fila de mensageria, limite de API).
- 4) Planejar ações: escalabilidade, otimização, cache, balanceamento, aumento de limites.
- 5) Testar (carga/estresse) e validar metas de desempenho.
- 6) Monitorar em produção e ajustar continuamente.
Gestão de disponibilidade
Foca em manter o serviço disponível conforme acordado (SLA), considerando redundância, monitoramento, resposta a incidentes e mudanças seguras. Disponibilidade não é só “ficar no ar”: inclui tempo de restauração, detecção rápida e prevenção de falhas recorrentes.
Exemplo prático: conectando disponibilidade a processos ITIL
- Incidente: queda do serviço, aciona restauração e comunicação.
- Problema: identifica causa raiz (ex.: falha em componente redundante que não assumiu).
- Mudança: corrige configuração/arquitetura para melhorar failover.
- KPIs: disponibilidade mensal, MTTR, taxa de incidentes P1.
Conexão entre processos em cenários de atendimento e operação bancária
Cenário 1: agência sem acesso ao sistema interno
- Incidente: indisponibilidade do sistema para a agência (prioridade alta por impacto operacional).
- OLA: suporte N1 deve diagnosticar em X minutos e escalar para redes em Y minutos.
- UC: se for link de telecom, aciona fornecedor conforme contrato.
- Problema: se ocorrer frequentemente na mesma região, investigar causa raiz (rota, equipamento, saturação).
- Capacidade: avaliar saturação em horários de pico e necessidade de upgrade.
Cenário 2: falha após implantação em canal digital
- Mudança: implantação foi uma mudança; se falhou, avaliar se houve teste insuficiente ou janela inadequada.
- Incidente: restaurar rapidamente (rollback pode ser o caminho mais rápido).
- Problema: analisar causa raiz (configuração, dependência, regressão).
- KPI: change failure rate e MTTR para P1.
Cenário 3: solicitação de acesso a sistema sensível
- Requisição: item do catálogo “concessão de acesso”.
- Controles: aprovações, segregação de funções, trilha de auditoria (conexão com governança e conformidade).
- Indicadores: tempo de atendimento, % de solicitações com documentação completa, retrabalho por falta de aprovação.
Questões de fixação (associação e escolha do processo adequado)
1) Associe o conceito ao termo
- a) Acordo entre TI e área de negócio com metas de disponibilidade e prazos
- b) Acordo interno entre equipes para suportar o SLA
- c) Contrato com fornecedor que sustenta níveis de serviço
- d) Interrupção não planejada que reduz a qualidade do serviço
- e) Causa raiz de um ou mais incidentes
Opções: (1) Incidente (2) Problema (3) SLA (4) OLA (5) UC
2) Marque o processo ITIL mais adequado
- a) Usuário solicita instalação de software homologado via portal
- b) Sistema de autenticação apresenta indisponibilidade e precisa voltar ao ar rapidamente
- c) Incidentes de lentidão se repetem toda segunda-feira no mesmo horário e é necessário eliminar a recorrência
- d) Será feita alteração de configuração em firewall que pode impactar canais digitais
Opções: (1) Requisição de serviço (2) Gerenciamento de Incidentes (3) Gerenciamento de Problemas (4) Gerenciamento de Mudanças
3) Governança x gestão (identifique)
- a) Definir apetite a risco para indisponibilidade de canais digitais e aprovar investimento em redundância
- b) Executar procedimento de rollback após falha em implantação
- c) Monitorar indicadores e cobrar plano de ação quando metas não são atingidas
- d) Operar central de serviços e cumprir prazos de atendimento do catálogo
Opções: (1) Governança de TI (2) Gestão de TI
4) COBIT (domínios em nível conceitual)
- a) Avaliar, direcionar e monitorar
- b) Entregar, serviço e suporte
- c) Monitorar, avaliar e analisar
- d) Construir/adquirir e implementar
- e) Alinhar, planejar e organizar
Opções: (1) APO (2) BAI (3) DSS (4) EDM (5) MEA
5) Indicadores: escolha o KPI mais alinhado
- a) Meta: reduzir impacto de incidentes críticos no Internet Banking
- b) Meta: reduzir falhas causadas por mudanças
- c) Meta: melhorar eficiência do atendimento de requisições do catálogo
Opções: (1) MTTR de P1 (2) Change failure rate (3) Tempo médio de atendimento de requisições