15. Visualização de Dados com Matplotlib e Seaborn

A visualização de dados é uma etapa crucial na jornada analítica. É através dela que podemos transformar números e datasets complexos em gráficos e figuras que facilitam o entendimento e a comunicação de informações. Python, sendo uma das linguagens mais populares para análise de dados, oferece diversas bibliotecas para visualização, entre as quais Matplotlib e Seaborn se destacam.

Matplotlib: A Base da Visualização em Python

Matplotlib é uma biblioteca de plotagem 2D do Python que produz figuras de qualidade em uma variedade de formatos impressos e ambientes interativos em todas as plataformas. Ela pode ser usada em scripts Python, no shell Python e IPython, em cadernos Jupyter, em servidores de aplicativos da web e em quatro toolkits de interface gráfica.

Comandos simples podem produzir gráficos poderosos. A estrutura do Matplotlib é composta por uma série de módulos, sendo o pyplot um dos mais utilizados, por oferecer uma interface semelhante ao MATLAB que é particularmente amigável a usuários novos.

Gráficos Básicos com Matplotlib

Para começar a criar visualizações com Matplotlib, você deve primeiro entender a estrutura de uma figura. Uma figura no Matplotlib é composta por um ou mais Axes (eixos), que são áreas de plotagem onde os dados são exibidos. Cada Axis pode conter vários elementos, como linhas, marcadores, legendas, etc.

Um simples gráfico de linha pode ser criado com o seguinte código:


import matplotlib.pyplot as plt

# Dados
x = [1, 2, 3, 4]
y = [10, 20, 25, 30]

# Criação do gráfico
plt.plot(x, y)

# Exibição do gráfico
plt.show()

Este código irá gerar um gráfico de linha simples. O método plot() é usado para desenhar pontos no espaço de dados e, por padrão, os conecta com linhas. Finalmente, plt.show() exibe o gráfico na tela.

Personalizando Gráficos

Matplotlib oferece uma ampla gama de personalizações, desde cores e estilos de linha até a adição de texto e anotações. Por exemplo, você pode definir o título do gráfico e os rótulos dos eixos X e Y da seguinte maneira:


plt.plot(x, y)
plt.title('Exemplo de Gráfico de Linha')
plt.xlabel('Eixo X')
plt.ylabel('Eixo Y')
plt.show()

Além disso, é possível alterar o estilo das linhas, adicionar marcadores aos pontos de dados, configurar os limites dos eixos e muito mais.

Seaborn: Visualização de Dados Estatísticos

Seaborn é uma biblioteca de visualização de dados em Python baseada no Matplotlib que fornece uma interface de alto nível para a criação de gráficos estatísticos atraentes. Ela é construída sobre o Matplotlib e integra-se com as estruturas de dados do pandas.

Seaborn vem com uma série de gráficos integrados que são otimizados para visualização de dados estatísticos. Isso inclui gráficos de distribuição, gráficos de categorias, gráficos de matrizes e muito mais.

Gráficos de Distribuição

Um dos gráficos mais comuns em Seaborn é o gráfico de distribuição, que pode ser criado usando o método distplot(). Este gráfico combina um histograma com uma estimativa de densidade de kernel (KDE) ou pode ser usado para exibir apenas um desses componentes.


import seaborn as sns

# Dados
valores = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]

# Criação do gráfico de distribuição
sns.distplot(valores)

# Exibição do gráfico
plt.show()

Este código irá gerar um gráfico que mostra a distribuição dos valores, com um histograma e uma linha KDE por padrão.

Gráficos de Categorias

Seaborn também oferece gráficos específicos para variáveis categóricas, como boxplot, violinplot, e barplot. Esses gráficos são úteis para visualizar a distribuição de variáveis categóricas e a relação entre variáveis categóricas e contínuas.


# Dados categóricos e contínuos
categorias = ['Categoria A', 'Categoria B', 'Categoria C']
valores = [10, 20, 30]

# Criação de um gráfico de barras
sns.barplot(x=categorias, y=valores)

# Exibição do gráfico
plt.show()

Este exemplo cria um gráfico de barras que mostra a relação entre as categorias e seus respectivos valores.

Gráficos de Matriz

Gráficos de matriz, como o heatmap (mapa de calor), são excelentes para visualizar dados em forma de matrizes, como matrizes de correlação. Eles podem dar uma visão rápida das relações entre múltiplas variáveis.


import numpy as np

# Dados em forma de matriz
data = np.random.rand(4, 4)

# Criação de um mapa de calor
sns.heatmap(data)

# Exibição do gráfico
plt.show()

Este código gera um mapa de calor que representa a magnitude dos valores em uma matriz através de cores.

Conclusão

A visualização de dados é uma ferramenta poderosa para entender e comunicar informações complexas. Matplotlib e Seaborn são duas bibliotecas de visualização de dados em Python que oferecem funcionalidades robustas para criar uma ampla variedade de gráficos e figuras. Ao dominar essas bibliotecas, você pode desvendar os dados e contar histórias convincentes através de visualizações claras e informativas.

Por fim, ao criar um e-book sobre "Desvendando Dados com Python: Uma Jornada Analítica", é essencial incluir um capítulo dedicado à visualização de dados com Matplotlib e Seaborn, fornecendo exemplos práticos, dicas de personalização e melhores práticas para garantir que os leitores possam efetivamente comunicar suas análises de dados.

Agora responda o exercício sobre o conteúdo:

Qual das seguintes afirmações sobre a visualização de dados em Python é correta?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Imagem do artigo Análise Exploratória de Dados (EDA)

Próxima página do Ebook Gratuito:

64Análise Exploratória de Dados (EDA)

5 minutos

Ganhe seu Certificado deste Curso Gratuitamente! ao baixar o aplicativo Cursa e ler o ebook por lá. Disponível na Google Play ou App Store!

Disponível no Google Play Disponível no App Store

+ de 6,5 milhões
de alunos

Certificado Gratuito e
Válido em todo o Brasil

48 mil exercícios
gratuitos

4,8/5 classificação
nas lojas de apps

Cursos gratuitos em
vídeo, áudio e texto