Todos os cursos > Concursos > Caixa econômica ::

Preparatório Caixa TI: Governança de TI e gestão de serviços (ITIL, COBIT e indicadores)

Capítulo 14

Tempo estimado de leitura: 11 minutos

Governança de TI x Gestão de TI: diferenças, princípios e objetivos

Governança de TI define direção: quem decide, com base em quais critérios, quais prioridades e quais riscos são aceitáveis. Foca em valor, risco, conformidade e alinhamento com o negócio.

Gestão de TI executa o dia a dia: planeja, constrói, opera e melhora serviços para cumprir metas definidas pela governança. Foca em entrega, eficiência e qualidade operacional.

Como diferenciar na prática (pergunta típica de prova)

Governança: “O que deve ser feito e por quê?” (prioridades, apetite a risco, conformidade, investimentos).
Gestão: “Como e quando vamos fazer?” (processos, equipes, ferramentas, rotinas, operação).

Exemplo bancário (Caixa): decisão x execução

Governança: aprova meta de disponibilidade do Internet Banking (ex.: 99,95%), define tolerância a indisponibilidade, aprova orçamento para redundância e monitora riscos regulatórios.
Gestão: implementa monitoramento, executa mudanças controladas, atende incidentes, mede SLAs e faz melhoria contínua.

ITIL: gestão de serviços aplicada ao atendimento e operação

ITIL organiza práticas para gerenciar serviços de TI com foco em entregar valor ao usuário/negócio. Em provas, é comum cobrarem a distinção entre incidente, problema, mudança e requisição, além de catálogo de serviços e acordos SLA/OLA/UC.

Catálogo de serviços e requisição de serviço

Catálogo de serviços é a lista estruturada do que a TI oferece (ex.: “Reset de senha”, “Acesso a sistema interno”, “Criação de usuário”, “Instalação de software homologado”, “Acesso VPN”). Ele define: descrição, elegibilidade, prazos, custos (quando aplicável) e canal de solicitação.

Requisição de serviço é um pedido padrão, geralmente de baixo risco e repetitivo, atendido por fluxo pré-definido (ex.: desbloqueio de usuário, inclusão em grupo, emissão de certificado).

Continue em nosso aplicativo e ...

Ouça o áudio com a tela desligada
Ganhe Certificado após a conclusão
+ de 5000 cursos para você explorar!

ou continue lendo abaixo...

Baixar o aplicativo

Passo a passo prático: desenhando um fluxo de requisição (ex.: reset de senha)

1) Usuário solicita via portal/central (item do catálogo).
2) Sistema valida identidade (perguntas, MFA, validação por gestor, conforme política).
3) Ferramenta registra ticket e classifica como “requisição”.
4) Execução automática (quando possível) ou por equipe de suporte.
5) Confirmação com o usuário e encerramento com registro de evidências.
6) Métricas: tempo médio de atendimento, taxa de reabertura, volume por unidade/agência.

Incidente: restaurar o serviço rapidamente

Incidente é uma interrupção não planejada ou redução de qualidade de um serviço. O objetivo é restaurar o serviço o mais rápido possível, minimizando impacto.

Passo a passo prático: tratamento de incidente (ex.: lentidão no app bancário)

1) Detecção: monitoramento ou chamados de clientes/agências.
2) Registro: abrir ticket com horário, sintomas, serviço afetado, evidências.
3) Classificação e priorização: impacto x urgência (ex.: afeta transações Pix e login).
4) Diagnóstico inicial: checar dashboards, logs, dependências (rede, autenticação, banco de dados, filas).
5) Escalonamento: para time especialista (aplicação, infraestrutura, fornecedor).
6) Contorno (workaround): reduzir impacto (ex.: desativar funcionalidade não crítica, redirecionar tráfego, aumentar capacidade temporária).
7) Resolução e recuperação: corrigir e validar retorno do serviço.
8) Encerramento: registrar causa aparente, tempos, ações e lições.

Problema: eliminar causa raiz e evitar recorrência

Problema é a causa (ou potencial causa) de um ou mais incidentes. O objetivo é prevenir incidentes e reduzir impacto de incidentes inevitáveis por meio de análise de causa raiz e workarounds documentados.

Diferença-chave: incidente foca em restauração rápida; problema foca em causa raiz e recorrência.

Passo a passo prático: do incidente repetido ao problema (ex.: quedas intermitentes no login)

1) Identificar padrão: incidentes semelhantes em horários de pico.
2) Abrir registro de problema e relacionar incidentes.
3) Coletar evidências: métricas de autenticação, latência, erros, capacidade.
4) Analisar causa raiz (ex.: pool de conexões insuficiente, limite de threads, dependência externa instável).
5) Definir workaround (ex.: aumentar pool temporariamente, limitar requisições por IP).
6) Propor mudança definitiva (ex.: ajuste de configuração, correção de código, melhoria de infraestrutura).
7) Após mudança, monitorar redução de incidentes e atualizar base de conhecimento.

Mudança: controlar risco ao alterar o ambiente

Mudança é a adição, modificação ou remoção de algo que possa afetar serviços. O objetivo é reduzir risco e evitar incidentes causados por alterações mal planejadas.

Passo a passo prático: mudança controlada (ex.: atualização de certificado TLS do Internet Banking)

1) Registrar requisição de mudança (escopo, motivo, serviços afetados).
2) Avaliar risco e impacto (dependências, janelas, rollback).
3) Aprovação conforme tipo (padrão/normal/emergencial).
4) Planejar: checklist, comunicação, janela de mudança, testes.
5) Executar em janela aprovada com acompanhamento.
6) Validar: testes de acesso, transações, monitoramento.
7) Encerrar: evidências, lições aprendidas, atualização de documentação.

SLA, OLA e UC: compromissos e responsabilidades

SLA (Service Level Agreement): acordo entre TI e cliente/negócio sobre níveis de serviço (ex.: disponibilidade, tempo de resposta, tempo de restauração).
OLA (Operational Level Agreement): acordo interno entre equipes (ex.: suporte N1 e time de redes) para cumprir o SLA.
UC (Underpinning Contract): contrato com fornecedor (ex.: link, nuvem, antifraude) que sustenta o SLA.

Raciocínio de prova: SLA é externo (TI x negócio), OLA é interno (entre áreas), UC é com terceiros.

COBIT: governança e controle em nível conceitual

COBIT é um framework de governança e gestão de TI orientado a objetivos e controles. Em provas, costuma aparecer como: foco em alinhamento com o negócio, entrega de valor, gestão de riscos, recursos e mensuração de desempenho, além dos domínios/processos em visão macro.

Domínios do COBIT (visão conceitual)

EDM (Evaluate, Direct and Monitor): avaliar, direcionar e monitorar (núcleo de governança).
APO (Align, Plan and Organize): alinhar, planejar e organizar (estratégia, arquitetura, portfólio, riscos).
BAI (Build, Acquire and Implement): construir/adquirir e implementar (projetos, mudanças, liberações).
DSS (Deliver, Service and Support): entregar, serviço e suporte (operação, incidentes, continuidade).
MEA (Monitor, Evaluate and Assess): monitorar, avaliar e analisar (conformidade, auditoria, desempenho).

Como COBIT e ITIL se complementam

COBIT ajuda a definir o que deve ser governado e como medir/monitorar (EDM/MEA).
ITIL detalha como operar e melhorar serviços no dia a dia (incidentes, problemas, mudanças, SLAs).
Exemplo: COBIT pode exigir controle e mensuração de disponibilidade (objetivo e monitoramento); ITIL operacionaliza com gestão de incidentes, mudanças e disponibilidade.

Métricas, KPIs e indicadores: medir para decidir

Métrica é uma medida (ex.: tempo de atendimento). KPI é uma métrica crítica ligada a objetivo (ex.: % de incidentes resolvidos dentro do SLA). Em governança, indicadores suportam decisões; em gestão, suportam melhoria operacional.

KPIs comuns em serviços de TI (com exemplos bancários)

Disponibilidade do serviço (ex.: Internet Banking 99,95%).
MTTR (tempo médio para restaurar): incidente crítico em canal digital.
MTBF (tempo médio entre falhas): estabilidade de um componente (ex.: autenticação).
% de cumprimento de SLA: incidentes resolvidos no prazo.
Taxa de reabertura: chamados encerrados que voltam (qualidade da solução).
Backlog de requisições: volume pendente no catálogo (ex.: acessos a sistemas internos).
Change failure rate: % de mudanças que geram incidente/rollback (risco de mudança).
Tempo de ciclo de mudança: da solicitação à implementação (agilidade com controle).

Passo a passo prático: definindo um KPI útil

1) Defina o objetivo (ex.: reduzir indisponibilidade do app em horário de pico).
2) Escolha a métrica que representa o objetivo (ex.: disponibilidade e MTTR).
3) Defina fórmula e fonte (monitoramento, ferramenta de chamados).
4) Estabeleça meta e tolerância (ex.: 99,9% mensal; MTTR < 30 min em P1).
5) Defina responsáveis e cadência de revisão (semanal/mensal).
6) Vincule ações: se meta não for atingida, abrir problema e plano de melhoria.

Gestão de capacidade e disponibilidade: manter serviço estável e dimensionado

Gestão de capacidade

Garante que recursos (CPU, memória, I/O, rede, licenças, filas, conexões) suportem demanda atual e futura com custo adequado. Em banco, picos podem ocorrer em dias de pagamento, campanhas, virada de mês e horários de maior acesso.

Passo a passo prático: capacidade para pico de acesso (ex.: pagamento de benefícios)

1) Identificar períodos críticos (calendário de pagamentos e janelas de maior uso).
2) Medir baseline (uso médio) e pico (p95/p99 de latência e consumo).
3) Encontrar gargalos (ex.: pool de conexões, fila de mensageria, limite de API).
4) Planejar ações: escalabilidade, otimização, cache, balanceamento, aumento de limites.
5) Testar (carga/estresse) e validar metas de desempenho.
6) Monitorar em produção e ajustar continuamente.

Gestão de disponibilidade

Foca em manter o serviço disponível conforme acordado (SLA), considerando redundância, monitoramento, resposta a incidentes e mudanças seguras. Disponibilidade não é só “ficar no ar”: inclui tempo de restauração, detecção rápida e prevenção de falhas recorrentes.

Exemplo prático: conectando disponibilidade a processos ITIL

Incidente: queda do serviço, aciona restauração e comunicação.
Problema: identifica causa raiz (ex.: falha em componente redundante que não assumiu).
Mudança: corrige configuração/arquitetura para melhorar failover.
KPIs: disponibilidade mensal, MTTR, taxa de incidentes P1.

Conexão entre processos em cenários de atendimento e operação bancária

Cenário 1: agência sem acesso ao sistema interno

Incidente: indisponibilidade do sistema para a agência (prioridade alta por impacto operacional).
OLA: suporte N1 deve diagnosticar em X minutos e escalar para redes em Y minutos.
UC: se for link de telecom, aciona fornecedor conforme contrato.
Problema: se ocorrer frequentemente na mesma região, investigar causa raiz (rota, equipamento, saturação).
Capacidade: avaliar saturação em horários de pico e necessidade de upgrade.

Cenário 2: falha após implantação em canal digital

Mudança: implantação foi uma mudança; se falhou, avaliar se houve teste insuficiente ou janela inadequada.
Incidente: restaurar rapidamente (rollback pode ser o caminho mais rápido).
Problema: analisar causa raiz (configuração, dependência, regressão).
KPI: change failure rate e MTTR para P1.

Cenário 3: solicitação de acesso a sistema sensível

Requisição: item do catálogo “concessão de acesso”.
Controles: aprovações, segregação de funções, trilha de auditoria (conexão com governança e conformidade).
Indicadores: tempo de atendimento, % de solicitações com documentação completa, retrabalho por falta de aprovação.

Questões de fixação (associação e escolha do processo adequado)

1) Associe o conceito ao termo

a) Acordo entre TI e área de negócio com metas de disponibilidade e prazos
b) Acordo interno entre equipes para suportar o SLA
c) Contrato com fornecedor que sustenta níveis de serviço
d) Interrupção não planejada que reduz a qualidade do serviço
e) Causa raiz de um ou mais incidentes

Opções: (1) Incidente (2) Problema (3) SLA (4) OLA (5) UC

2) Marque o processo ITIL mais adequado

a) Usuário solicita instalação de software homologado via portal
b) Sistema de autenticação apresenta indisponibilidade e precisa voltar ao ar rapidamente
c) Incidentes de lentidão se repetem toda segunda-feira no mesmo horário e é necessário eliminar a recorrência
d) Será feita alteração de configuração em firewall que pode impactar canais digitais

Opções: (1) Requisição de serviço (2) Gerenciamento de Incidentes (3) Gerenciamento de Problemas (4) Gerenciamento de Mudanças

3) Governança x gestão (identifique)

a) Definir apetite a risco para indisponibilidade de canais digitais e aprovar investimento em redundância
b) Executar procedimento de rollback após falha em implantação
c) Monitorar indicadores e cobrar plano de ação quando metas não são atingidas
d) Operar central de serviços e cumprir prazos de atendimento do catálogo

Opções: (1) Governança de TI (2) Gestão de TI

4) COBIT (domínios em nível conceitual)

a) Avaliar, direcionar e monitorar
b) Entregar, serviço e suporte
c) Monitorar, avaliar e analisar
d) Construir/adquirir e implementar
e) Alinhar, planejar e organizar

Opções: (1) APO (2) BAI (3) DSS (4) EDM (5) MEA

5) Indicadores: escolha o KPI mais alinhado

a) Meta: reduzir impacto de incidentes críticos no Internet Banking
b) Meta: reduzir falhas causadas por mudanças
c) Meta: melhorar eficiência do atendimento de requisições do catálogo

Opções: (1) MTTR de P1 (2) Change failure rate (3) Tempo médio de atendimento de requisições

Agora responda o exercício sobre o conteúdo:

Em um cenário de indisponibilidade no Internet Banking, qual situação caracteriza Governança de TI (e não Gestão de TI)?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Governança define direção: prioridades, metas, apetite a risco, conformidade e investimentos. Gestão executa a operação (monitorar, atender incidentes, aplicar rollback e cumprir SLAs).