5.9. Análisis exploratorio de datos con Matplotlib y Seaborn: creación de gráficos de líneas para series temporales

El análisis de datos exploratorios (EDA) es un paso fundamental en el proceso de aprendizaje automático y aprendizaje profundo. Permite a los científicos y analistas de datos comprender mejor las tendencias, patrones y relaciones dentro de los datos. En particular, para las series temporales, EDA es crucial para comprender cómo cambian los valores a lo largo del tiempo e identificar comportamientos estacionales o tendencias a largo plazo.

En este contexto, las bibliotecas Matplotlib y Seaborn en Python son herramientas poderosas para la visualización de datos. Ambos ofrecen una amplia gama de tipos y estilos de gráficos que se pueden personalizar para satisfacer las necesidades específicas de cualquier análisis. Nos centraremos en la creación de gráficos de líneas, que son particularmente útiles para visualizar series de tiempo.

Gráficos de líneas con Matplotlib

Matplotlib es una biblioteca de trazado 2D en Python que produce figuras con calidad de publicación en una variedad de formatos de impresión y entornos interactivos en todas las plataformas. Los gráficos de líneas con Matplotlib se crean usando la función plot(), que conecta puntos de datos con líneas.

Para comenzar, debe importar la biblioteca Matplotlib y luego preparar los datos de su serie temporal. Los datos pueden estar en cualquier estructura que pueda convertirse en listas o matrices de Python, como listas, matrices NumPy o Pandas DataFrames. A continuación se muestra un ejemplo básico de cómo crear un gráfico de líneas simple:


    importar matplotlib.pyplot como plt

    # Supongamos que tenemos dos listas: una para tiempo y otra para valores
    tiempo = ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04']
    valores = [10, 20, 15, 25]

    plt.plot(tiempo, valores)
    plt.xlabel('Tiempo')
    plt.ylabel('Valores')
    plt.title('Gráfico lineal de serie temporal simple')
    plt.mostrar()
    

Este código producirá un gráfico de líneas básico, pero a menudo necesitarás personalizar el gráfico para que sea más informativo. Por ejemplo, es posible que desees formatear las fechas en el eje x para que sean más legibles o agregar marcadores a cada punto de datos para que se destaquen.

Personalización con Matplotlib

Personalizar el gráfico de líneas puede incluir agregar una cuadrícula, cambiar el color de la línea, agregar marcadores, establecer límites de ejes y más. A continuación se muestran algunos ejemplos de cómo puede personalizar su gráfico de líneas:


    plt.plot(tiempo, valores, color='verde', marcador='o', estilo de línea='--')
    plt.grid(Verdadero)
    plt.xlim('2021-01-01', '2021-01-04')
    plt.ylim(0, 30)
    

En el ejemplo anterior, cambiamos el color de la línea a verde, agregamos marcadores circulares a cada punto de datos y usamos una línea discontinua. También activamos la cuadrícula y establecemos los límites para los ejes x e y.

Gráficos de líneas con Seaborn

Seaborn es una biblioteca de visualización de datos basada en Matplotlib que ofrece una interfaz de alto nivel para dibujar atractivos gráficos estadísticos. Para series temporales, la función lineplot() de Seaborn es una excelente opción, ya que ofrece funciones adicionales, como intervalos de confianza calculados automáticamente.

Al igual que con Matplotlib, debes importar la biblioteca Seaborn y preparar tus datos. A continuación se muestra un ejemplo de cómo crear un gráfico de líneas con Seaborn:


    importar seaborn como sns

    # Usando el mismo conjunto de datos que en el ejemplo anterior
    sns.lineplot(x=tiempo, y=valores)
    plt.xlabel('Tiempo')
    plt.ylabel('Valores')
    plt.title('Gráfico de líneas de series temporales con Seaborn')
    plt.mostrar()
    

Seaborn mejora automáticamente la estética de los gráficos y proporciona una visualización más pulida con menos código. Además, permite una fácil integración con Pandas DataFrames, lo cual resulta muy útil cuando se trabaja con series temporales.

Personalización con Seaborn

Personalizar gráficos de líneas en Seaborn es tan fácil como en Matplotlib. Puedes modificar la paleta de colores, agregar títulos, etiquetas y más. Además, Seaborn funciona bien con el contexto de estilo Matplotlib, lo que le permite utilizar comandos de Matplotlib para personalizar aún más la trama. A continuación se muestra un ejemplo de personalización con Seaborn:


    sns.lineplot(x=tiempo, y=valores, color='púrpura', marcador='s')
    plt.grid(Verdadero)
    plt.xticks(rotation=45) # Rotar etiquetas del eje x para una mejor legibilidad
    plt.tight_layout() #Ajusta automáticamente los parámetros de la subtrama.
    

En este ejemplo, cambiamos el color de la línea a violeta, agregamos marcadores cuadrados y rotamos las etiquetas del eje x para mejorar la legibilidad. Usar tight_layout() es una buena práctica para garantizar que no se corte nada al guardar o mostrar el gráfico.

Conclusión

El análisis exploratorio de datos es un paso crítico en el proceso de aprendizaje automático y aprendizaje profundo, y la visualización de datos juega un papel clave en este análisis. Los gráficos de líneas para series temporales son una herramienta esencial para comprender cómo varían los datos con el tiempo. Tanto Matplotlib como Seaborn son bibliotecas potentes que ofrecen una funcionalidad sólida para crear gráficos de líneas personalizados e informativos. Al dominar estas bibliotecas, podrá extraer información valiosa de sus datos y comunicar sus hallazgos de manera efectiva.

Ahora responde el ejercicio sobre el contenido:

¿Cuál de las siguientes afirmaciones sobre la creación de gráficos lineales para series temporales con Python es correcta?

¡Tienes razón! Felicitaciones, ahora pasa a la página siguiente.

¡Tú error! Inténtalo de nuevo.

Imagen del artículo Análisis exploratorio de datos con Matplotlib y Seaborn: personalización de gráficos (colores, títulos, etiquetas)

Siguiente página del libro electrónico gratuito:

15Análisis exploratorio de datos con Matplotlib y Seaborn: personalización de gráficos (colores, títulos, etiquetas)

5 minutos

¡Obtén tu certificado para este curso gratis! descargando la aplicación Cursa y leyendo el libro electrónico allí. ¡Disponible en Google Play o App Store!

Disponible en Google Play Disponible en App Store

+ 6,5 millones
estudiantes

Certificado gratuito y
válido con código QR

48 mil ejercicios
gratis

Calificación de 4.8/5
en tiendas de aplicaciones

Cursos gratuitos de
vídeo, audio y texto.