A visualização Saúde responde a uma pergunta: "Com o que eu devo me preocupar agora?" Ela fica junto da Visão geral da tela inicial e é acessada pelo menu Visualização no topo da coluna da direita. Os achados são agrupados em três níveis de urgência, e cada um tem uma ação de um clique que coloca um prompt de correção no chat.
Onde ela fica
Olhe para a coluna da direita (a que tem os cartões dos seus workloads). No topo dessa coluna há um botão Visualização: Visão geral. Clique nele; o menu tem dois itens: Visão geral (o padrão, com os cartões dos seus workloads) e Saúde.
Um pequeno indicador colorido no botão Visualização sinaliza que há algo para verificar:
- Indicador vermelho — pelo menos um achado em Agir agora. Mude para Saúde para ver o que é.
- Indicador âmbar — apenas achados em Esta semana. Não é urgente, mas vale olhar em breve.
- Sem indicador — está tudo verde (ou ainda não há nada a relatar).
O indicador não aparece enquanto você já está na visualização Saúde (ali ele seria óbvio).
Os três níveis
Quando você está na visualização Saúde, o topo da página mostra três pílulas de contagem:
| Pílula | Cor | Significado |
|---|---|---|
| Agir agora | Vermelho | Algo está quebrado ou piorando ativamente. Resolva hoje. |
| Esta semana | Âmbar | Não está pegando fogo, mas ignorar por um mês ou dois provavelmente vai dar dor de cabeça. |
| Tudo certo | Verde | Confirmações positivas — coisas que estão configuradas corretamente. Útil para conferir se ficou tudo bem depois de mudanças. |
Abaixo das pílulas, os mesmos achados aparecem em uma lista contínua, agrupados por nível e ordenados do mais urgente para o menos urgente.
O que aparece
Os achados são derivados das sondagens regulares que o Server Manager faz no seu servidor (o inventário + as métricas que alimentam o restante da interface). Cada verificação tem um limite fixo; você verá um achado para cada condição real. O conjunto atual:
Vermelho — Agir agora
- Disco está N% cheio (≥ 90%) — quando o disco enche, os serviços começam a falhar. A ação ("Investigar disco") pede ao Faro para encontrar os maiores diretórios e qualquer desperdício do Docker, e então propor um plano de limpeza seguro.
Âmbar — Esta semana
- Disco está N% cheio (≥ 80%, < 90%) — ainda não é crítico, mas está subindo. A mesma ação de investigação da variante vermelha.
- RAM está N% em uso (≥ 90%) — lembre que o Linux usa RAM livre para cache, então uso alto nem sempre é um problema. A ação mostra os processos que mais consomem memória e eventuais OOM kills recentes para você avaliar.
- N contêiner(es) reiniciando — geralmente significa falha ao iniciar. A ação coleta os logs recentes dos contêineres afetados + pede ao Faro para explicar.
- N contêiner(es) parado(s) — paradas silenciosas (em vez de execução). A ação verifica códigos de saída + últimos logs.
- N site(s) servidos por HTTP sem TLS — um bloco do Caddy/nginx tem um domínio, mas não tem HTTPS. Quase sempre é erro de configuração, já que o Let's Encrypt é gratuito + automático. A ação ("Adicionar HTTPS") pede ao Faro para atualizar a configuração do proxy e verificar os problemas de certificado.
- N imagem(ns) de contêiner têm atualizações disponíveis — agregado entre todas as imagens (para você não receber N achados). Atualizações de imagem costumam incluir correções de segurança; a ação ("Revisar atualizações" / "Atualizar imagem") pede ao Faro para conferir changelogs e baixar a nova imagem com sua aprovação.
Verde — Tudo certo
- N site(s) configurados atrás do Caddy/Nginx — confirmação positiva de que seu proxy + sites estão conectados.
- N serviço(s) do sistema rodando normalmente — confirmação positiva de que os processos subjacentes gerenciados pelo systemd estão ativos.
Uma linha de achado, em detalhes
Cada linha em uma seção se parece com isto:
Partes:
- Ponto de gravidade à esquerda — corresponde à cor do nível.
- Mensagem — uma frase curta que nomeia o problema com números específicos (por exemplo, "Disco está 91% cheio — apenas 4 GB livres de 47 GB").
- "Me conte mais" — expande uma explicação do que o achado realmente significa e por que ele importa. Clique de novo para recolher.
- Botão de ação à direita — coloca um prompt pré-escrito no chat, pronto para enviar. O Faro assume a partir daí (com as confirmações de aprovação de sempre para qualquer coisa destrutiva).
- "✓ ok" em vez de um botão — para achados verdes, não há nada a fazer. A pílula é a indicação.
Exemplo: clicar na ação
O botão de ação não executa nada imediatamente — ele compõe um prompt e o coloca no campo de mensagem do chat, para que você possa ler o que será pedido, editar se quiser e apertar Enviar. Depois o Faro continua a partir daí.
Para correções destrutivas (limpeza, recriação de contêiner etc.), o Faro ainda pausa para pedir aprovação explícita em cada comando. O botão de ação da visualização Saúde é um atalho para iniciar a conversa, não uma execução com um clique.
Quando a visualização Saúde diz "nada a relatar ainda"
Você verá isso se acabou de conectar e as primeiras consultas de métricas + inventário ainda não retornaram (a primeira consulta de inventário roda imediatamente no início da sessão; as seguintes acontecem a cada 15 s). Até os dados chegarem, a visualização fica vazia.
Se você está conectado há algum tempo e ainda vê "nada a relatar ainda", é provável que uma consulta tenha falhado silenciosamente. Atualize a página; se o problema continuar, desconecte e conecte de novo para reiniciar o loop de consultas.
O que a visualização Saúde NÃO cobre
É importante saber o que fica fora do escopo:
- Saúde da aplicação dentro de um contêiner. "Meu WordPress está respondendo a tentativas de login?" "Minha consulta ao banco de dados está lenta?" Isso fica dentro da aplicação — a visualização Saúde vê que o contêiner está rodando, mas não sabe se a aplicação lá dentro está bem. Para sinais no nível da aplicação, use a aba Logs do painel de serviço do workload ou pergunte diretamente ao Faro.
- Conectividade de saída / dependências externas. "A API do Stripe está no ar?" "Meu SMTP de terceiros está funcionando?" O Server Manager não sonda endpoints externos a partir do seu servidor.
- Alcance de DNS dos seus domínios. A visualização verifica se os sites têm TLS, não se eles realmente resolvem para este servidor. Se você configurou um novo domínio e o DNS ainda não propagou, a visualização Saúde não vai perceber — ela só vê a configuração local do proxy.
- Postura de segurança. Sem varredura de CVE, sem detecção de anomalias em logs, sem status do fail2ban. Coisas como atualizações de imagem (um sinal de segurança) aparecem, mas uma visualização completa de segurança é um projeto separado. (Veja O Server Manager vai quebrar meu servidor? para saber o que é coberto em termos de padrões de segurança.)
Perguntas comuns
Eu sempre devo ter zero achados vermelhos + zero âmbar? Não necessariamente. Alguns achados âmbar (como 1–2 contêineres parados) podem ser intencionais (um ambiente de desenvolvimento pausado, um docker-compose down que você executou de propósito). A visualização mostra o estado — você decide se isso merece ação. As cores das pílulas são heurísticas, não ordens.
Posso dispensar / adiar um achado? Hoje não — a visualização reflete apenas o estado atual. Se um achado estiver errado ou você decidiu conviver com ele, ignore; ele continuará aparecendo até a condição subjacente mudar.
Por que meu disco está 92% cheio, mas a pílula "Agir agora" mostra 0? Provavelmente a sondagem ainda não rodou desde que o disco encheu. A visualização Saúde recalcula sempre que as métricas ou o inventário são atualizados — as métricas são consultadas a cada 3 segundos, e o inventário a cada 15 segundos. Se o número exibido estiver desatualizado, o achado correspondente também estará — aguarde alguns segundos.
O botão de ação não faz nada quando eu clico. Ele sempre deveria pelo menos preencher o campo do chat com o prompt de correção. Se isso visivelmente não acontecer (o campo continuar vazio), atualize a página e tente de novo.
As atualizações de imagem aparecem como um único achado, mas eu tenho 8 contêineres. Isso é intencional — listar cada uma individualmente dominaria a visualização. O prompt de ação lista todas as refs de imagem afetadas por nome para que o Faro possa revisá-las em conjunto.
O que acontece se meu servidor ficar inacessível? Nenhuma sondagem roda, nenhum achado é atualizado. A visualização Saúde mostra o último estado que viu, e a pílula do servidor na barra superior muda para desconectado (vermelho). Veja Recupere quando o SSH parar de funcionar para o caminho de volta.
Referência
Valores de limite (padrões atuais — eles podem mudar conforme as heurísticas forem ajustadas):
| Verificação | Limite |
|---|---|
| Disco cheio (vermelho) | metrics.diskPercent ≥ 90 |
| Aviso de disco (âmbar) | metrics.diskPercent ≥ 80 && < 90 |
| RAM alta (âmbar) | (ramUsedMB / ramTotalMB) ≥ 90% (cache incluído em ramUsedMB) |
| Contêiner reiniciando | A string de status do Docker corresponde a /restart/i (por exemplo, "Restarting (1) 5 seconds ago") |
| Contêiner parado | Status não está vazio E não começa com Up E não está reiniciando |
| Site sem TLS | Um site tem domain definido, mas tls é falso no inventário |
Cadência de atualização — métricas são consultadas a cada 3 segundos, inventário a cada 15 segundos. Os achados são recalculados a cada atualização de qualquer um dos dois.
De onde vêm os dados — da mesma sondagem de métricas ao vivo e inventário que alimenta o restante do app (CPU/RAM/disco, serviços em execução, contêineres Docker), com detecção de atualização por imagem em uma camada adicional. Os achados são recalculados a partir desse snapshot a cada atualização; nada é armazenado entre atualizações.