5.13. Análise Exploratória de Dados com Matplotlib e Seaborn: Salvar visualizações em arquivos (PNG, JPG, etc.)

A análise exploratória de dados (EDA) é um passo fundamental no processo de aprendizado de máquina e deep learning, pois permite compreender melhor as características, padrões e relações presentes nos dados. Python, sendo uma das linguagens mais populares para ciência de dados, oferece bibliotecas poderosas como Matplotlib e Seaborn para visualização de dados. Uma parte crucial da EDA é a capacidade de salvar as visualizações criadas em arquivos como PNG, JPG, entre outros formatos, para que possam ser utilizadas em relatórios, apresentações ou simplesmente arquivadas para referência futura.

Matplotlib: Uma Introdução

Matplotlib é uma biblioteca de plotagem para a linguagem de programação Python e seu pacote de extensão numérica NumPy. Ela fornece uma interface orientada a objetos para embutir gráficos em aplicações usando kits de ferramentas GUI como Tkinter, wxPython, Qt ou GTK. Além disso, Matplotlib pode ser usado em scripts Python, nos shells Python e IPython, no Jupyter notebook, em servidores de aplicativos web e em quatro toolkits de interface gráfica.

Seaborn: Uma Introdução

Seaborn é uma biblioteca de visualização de dados Python baseada no Matplotlib. Ela fornece uma interface de alto nível para desenhar gráficos estatísticos atraentes e informativos. Seaborn é particularmente adequado para explorar e entender dados através de gráficos de alta qualidade. Ela trabalha bem com DataFrames do pandas e assume que os dados estão em um formato limpo e adequado para visualizações.

Salvando Visualizações com Matplotlib

Para salvar gráficos com Matplotlib, você pode usar o método savefig() do objeto Figure. Este método é muito flexível e permite especificar vários parâmetros para controlar a saída, como a resolução (DPI), o tamanho, o formato do arquivo e muito mais. Aqui está um exemplo básico de como salvar um gráfico:


import matplotlib.pyplot as plt

# Criando um gráfico simples
plt.plot([1, 2, 3], [4, 5, 6])
plt.title('Exemplo de Gráfico')

# Salvando o gráfico em um arquivo PNG
plt.savefig('meu_grafico.png')

# Também é possível especificar o DPI e o tamanho do gráfico
plt.savefig('meu_grafico_alta_resolucao.png', dpi=300)
plt.savefig('meu_grafico_tamanho_especifico.png', figsize=(10, 8))

Além do PNG, você pode salvar gráficos em outros formatos como JPG, SVG, PDF, entre outros, simplesmente alterando a extensão do arquivo no método savefig().

Salvando Visualizações com Seaborn

Como o Seaborn é construído em cima do Matplotlib, o processo de salvar gráficos é muito semelhante. No entanto, Seaborn adiciona algumas funcionalidades e estilos que podem ser muito úteis. Aqui está um exemplo de como salvar um gráfico de Seaborn:


import seaborn as sns
import matplotlib.pyplot as plt

# Carregando um dataset exemplo
tips = sns.load_dataset('tips')

# Criando um gráfico de barras com Seaborn
sns.barplot(x='day', y='total_bill', data=tips)

# Salvando o gráfico criado com Seaborn
plt.savefig('grafico_seaborn.png')

É importante notar que, ao usar Seaborn, você ainda está trabalhando com objetos do Matplotlib. Portanto, todas as funcionalidades de savefig() ainda estão disponíveis.

Configurações Avançadas ao Salvar Gráficos

Quando você está salvando gráficos para serem incluídos em publicações ou apresentações, pode ser necessário configurar detalhes adicionais, como transparência, qualidade e margens. Aqui estão algumas dicas:

  • Transparência: Para salvar um gráfico com fundo transparente, use o argumento transparent=True no método savefig().
  • Qualidade: Para gráficos rasterizados (como PNG ou JPG), o argumento dpi controla a qualidade da imagem. Um valor maior resulta em uma imagem mais nítida e maior.
  • Margens: Às vezes, os gráficos podem ser salvos com margens indesejadas. Você pode usar plt.tight_layout() antes de salvar a figura para otimizar o uso do espaço.

# Salvando com fundo transparente e margens otimizadas
plt.savefig('grafico_transparente.png', transparent=True, bbox_inches='tight')

Em conclusão, tanto Matplotlib quanto Seaborn oferecem ferramentas robustas para a criação e salvamento de visualizações de dados. A habilidade de salvar gráficos de forma eficiente e com alta qualidade é essencial para comunicar os resultados da sua análise exploratória de dados. Com a prática, você será capaz de criar visualizações que não apenas revelam insights valiosos sobre seus dados mas também se destacam em termos de clareza e impacto visual.

Agora responda o exercício sobre o conteúdo:

Qual dos seguintes métodos é usado para salvar visualizações de dados criadas com Matplotlib e Seaborn em arquivos como PNG, JPG, entre outros?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Imagem do artigo Análise Exploratória de Dados com Matplotlib e Seaborn: Interpretação e conclusões a partir de visualizações

Próxima página do Ebook Gratuito:

19Análise Exploratória de Dados com Matplotlib e Seaborn: Interpretação e conclusões a partir de visualizações

4 minutos

Ganhe seu Certificado deste Curso Gratuitamente! ao baixar o aplicativo Cursa e ler o ebook por lá. Disponível na Google Play ou App Store!

Disponível no Google Play Disponível no App Store

+ de 6,5 milhões
de alunos

Certificado Gratuito e
Válido em todo o Brasil

48 mil exercícios
gratuitos

4,8/5 classificação
nas lojas de apps

Cursos gratuitos em
vídeo, áudio e texto