Grafana: o que é, como funciona e como criar dashboards

março 28, 2019 Pedro Tebaldi

Dashboards com Grafana|SQL server Dashboard Grafana|dashboard

Quando uma aplicação começa a degradar às 2h da manhã, a velocidade com que o time identifica a causa raiz depende diretamente de como os dados de observabilidade estão organizados e visualizados. O Grafana se tornou o padrão de facto para esse momento crítico: é a plataforma open source de visualização de métricas, logs e traces mais usada em ambientes de produção no mundo, com mais de 20 milhões de usuários.

Sua proposta é simples e poderosa: conectar qualquer fonte de dados e transformar os dados em dashboards interativos, alertas precisos e painéis de correlação que reduzem o tempo de diagnóstico. Não é uma ferramenta de coleta — é a camada de visualização e análise que se posiciona na frente do seu pipeline de telemetria.

Neste guia técnico, você vai entender o que é Grafana, como funciona sua arquitetura, as principais integrações e como ele se encaixa em uma estratégia de observabilidade moderna.

O que é Grafana?

Grafana é uma plataforma open source de visualização, análise e monitoramento que permite criar dashboards interativos conectados a múltiplas fontes de dados simultaneamente. Foi criado em 2014 por Torkel Ödegaard como um fork do Kibana focado em métricas, e evoluiu para suportar logs, traces e alertas em um único painel.

O projeto é mantido pela Grafana Labs, que também desenvolve o ecossistema LGTM: Loki (logs), a própria plataforma na visualização, Tempo (traces) e Mimir (métricas em escala). Esse ecossistema oferece uma alternativa open source completa ao stack de observabilidade proprietário de fornecedores como Datadog ou New Relic.

A documentação oficial está disponível aqui.

Arquitetura do Grafana: como funciona

Data Sources

O Grafana não armazena dados — ele se conecta a fontes externas via data sources. Cada data source é um plugin que define como a plataforma consulta e interpreta os dados de um backend específico. Os data sources nativos cobrem as principais ferramentas do mercado: métricas via Prometheus, Graphite e InfluxDB; logs via Loki e Elasticsearch; traces via Tempo, Jaeger e Zipkin; dados de bancos via PostgreSQL, MySQL e outros.

Essa arquitetura de plugins é tornando a ferramenta agnóstica de vendor: a mesma instalação pode visualizar dados de Prometheus, Elastic e Datadog simultaneamente no mesmo dashboard.

Dashboards e painéis

Um dashboard Grafana é composto por painéis (panels) — cada painel é uma visualização independente com sua própria query, tipo de gráfico e configurações de estilo. Os tipos de painel incluem: Time series (série temporal), Bar chart, Stat (valor único com tendência), Table, Heatmap, Logs, Traces e Node Graph.

A ferramenta usa uma linguagem de query específica por data source. Para Prometheus, a query usa PromQL. Para Loki, usa LogQL. Para Elasticsearch, usa a Query DSL. Ela transforma essas queries em visualizações sem que o engenheiro precise escrever código de frontend.

Alertas

O sistema de alertas unificado da plataforma (módulo Alerting) permite definir alertas baseados em qualquer data source. Um alerta é uma regra que avalia uma query periodicamente e dispara uma notificação quando uma condição é satisfeita — por exemplo, quando o P95 de latência supera 300ms por mais de 5 minutos.

A plataforma suporta múltiplos canais de notificação: PagerDuty, Opsgenie, Slack, email e webhooks. Integrado a uma estratégia de escalonamento de alertas, ele se torna o ponto central de disparo de incidentes.

Grafana e Prometheus: a integração fundamental

A combinação Grafana + Prometheus é o stack de monitoramento mais comum em ambientes Kubernetes e cloud-native. O Prometheus é responsável pela coleta e armazenamento de métricas via scraping; a ferramenta é responsável pela visualização e alertas sobre essas métricas.

O fluxo de trabalho é: aplicações expõem métricas no formato Prometheus via endpoint /metrics. O Prometheus coleta (scrape) essas métricas periodicamente. A plataforma consulta o Prometheus via PromQL e renderiza os dashboards.

Para times que usam OpenTelemetry, o pipeline se expande: as aplicações exportam métricas via OTLP para o OTel Collector, que as converte para o formato Prometheus ou as envia diretamente para Mimir — e o Grafana visualiza tudo da mesma forma.

Grafana no contexto da observabilidade moderna

O posicionamento correto do Grafana em uma arquitetura de observabilidade é como camada de visualização unificada: ele não substitui Prometheus, Loki, Tempo ou Jaeger — ele os conecta em uma experiência única de navegação.

A funcionalidade mais poderosa desse posicionamento é a correlação entre pilares: a partir de um spike de latência em um gráfico de métricas, é possível navegar diretamente para os logs do serviço no mesmo período (via Loki) e depois para os traces da requisição afetada (via Tempo) — tudo dentro do mesmo dashboard, sem trocar de ferramenta. Essa correlação é o que materializa a observabilidade end-to-end na prática operacional diária.

A referência técnica da ferramenta na CNCF está disponível aqui.

Grafana Cloud vs. Grafana self-hosted

O Grafana pode ser implantado de duas formas. O Grafana self-hosted é instalado na infraestrutura própria — disponível como binário, container Docker ou chart Helm para Kubernetes. É a opção escolhida por times que têm restrições de compliance ou preferem controle total da plataforma.

O Grafana Cloud é a versão gerenciada SaaS da Grafana Labs, com tier gratuito (14 dias de retenção, 10k métricas ativas, 50GB de logs e traces) e planos pagos por uso. Inclui alertas, dashboards e integrações pré-configuradas para as principais plataformas cloud.

Para times que estão iniciando uma estratégia de dashboards de observabilidade, o Grafana Cloud no tier gratuito é o ponto de partida mais rápido — não requer infraestrutura própria e já inclui Loki, Tempo e Mimir configurados.

Conclusão

O Grafana é hoje a camada de visualização padrão para estratégias de observabilidade modernas. Sua capacidade de conectar múltiplas fontes de dados — Prometheus, Loki, Tempo, Elasticsearch e dezenas de outros — em dashboards unificados com correlação entre métricas, logs e traces o torna indispensável para times de SRE e DevOps que precisam diagnosticar incidentes rapidamente.

A combinação Grafana + Prometheus + OpenTelemetry representa o stack open source mais adotado para observabilidade em ambientes cloud-native. Para estruturar sua estratégia de observabilidade com a plataforma e integração ao seu ambiente de produção, fale com nossos especialistas.

Perguntas Frequentes

O que é Grafana?

Grafana é uma plataforma open source de visualização e análise que permite criar dashboards interativos conectados a múltiplas fontes de dados. Suporta métricas (Prometheus, InfluxDB), logs (Loki, Elasticsearch) e traces (Tempo, Jaeger) simultaneamente no mesmo painel. É a ferramenta de visualização de observabilidade mais usada no mundo, com mais de 20 milhões de usuários.

Qual a diferença entre Grafana e Prometheus?

Prometheus é um sistema de coleta e armazenamento de métricas — ele faz o scraping dos endpoints das aplicações e persiste os dados em seu banco de séries temporais. Grafana é a camada de visualização e alertas — ele consulta o Prometheus via PromQL e transforma os dados em dashboards e gráficos. Os dois são complementares: Prometheus coleta, Grafana visualiza.

Grafana é gratuito?

Sim — o Grafana open source é gratuito e pode ser instalado em qualquer infraestrutura sem custo de licença. O Grafana Cloud tem um tier gratuito com 10 mil métricas ativas, 50GB de logs e 50GB de traces com 14 dias de retenção. Planos pagos são cobrados por volume de dados e recursos avançados como alertas ilimitados e retenção estendida.

Como o Grafana se integra com OpenTelemetry?

O Grafana se integra com OpenTelemetry como backend de visualização para os dados exportados via OTLP. O OTel Collector pode enviar métricas para Prometheus ou Mimir (visualizados no Grafana), logs para Loki e traces para Tempo — todos consultáveis no Grafana. A integração permite correlacionar os três pilares de observabilidade em um único dashboard com navegação entre métricas, logs e traces.

O que é o stack LGTM do Grafana Labs?

O stack LGTM é o conjunto de projetos open source da Grafana Labs que cobre os três pilares da observabilidade: Loki (logs), Grafana (visualização), Tempo (traces) e Mimir (métricas em escala). Juntos, formam uma alternativa open source completa aos stacks de observabilidade proprietários, compatível com OpenTelemetry e Prometheus.

Pedro Tebaldi

Trabalho há mais de 15 anos no mercado B2B de tecnologia e hoje atuo como Gerente de Marketing da OpServices e Líder em Projetos de Governança para Inteligência Artificial.

Grafana: o que é, como funciona e como criar dashboards

O que é Grafana?