Curso Procesamiento de Datos con Python: Entornos y Aplicaciones

 13 mayo, 2015

El proyecto CloudPYME organiza el curso “Procesamiento de datos con Python: entornos y aplicaciones”, los días 16, 17 y 18 de junio.

Desde su aparición en 1991, Python se ha convertido en uno de los lenguajes de scripting más popular del mundo. En la última década su uso como herramienta de computación numérica, tanto en aplicaciones industriales como en el entorno científico, se ha multiplicado, siendo una alternativa popular a frameworks como Matlab, R, SAS, o Stata. Además de dar soporte a computación exploratoria y análisis, visualización y manipulación de datos, la fortaleza de Python como lenguaje de propósito general lo hace una alternativa excelente como lenguaje único para la construcción de aplicaciones basadas en el procesamiento de datos. Python proporciona además mecanismos que permiten la integración sencilla de códigos heredados (legacy codes) escritos en C, C++, o FORTRAN.

Mediante el uso de Python, el código de prototipado puede ser aprovechado durante la fase de desarrollo, eliminando la necesidad de utilizar diferentes entornos en diferentes fases de proyecto y aumentando la cohesión del código.

El objetivo fundamental del curso es el estudio del ecosistema Python como herramienta de análisis y exploración de datos. Comenzará con una introducción a la sintaxis y construcciones más usuales en Python, mostrando el uso de herramientas de representación, análisis y visualización de datos de bajo nivel: NumPy y matplotlib. Posteriormente se introducirán librerías de más alto nivel que facilitan la implementación, aceleran el desarrollo, y mejoran el rendimiento y la interoperabilidad, tales como Pandas o Pytables. Finalmente, se introducirán aspectos relativos a la obtención de alto rendimiento con Python: profiling, compilación a C, Cython, optimización de memoria, y uso de
entornos de computación paralela.

El curso será impartido por docentes de la Universidade da Coruña, durante tres días, y estará dividido en sesiones teórico-prácticas, con una duración total de 20 horas formativas.

Lugar de celebración del curso

CESGA (Centro de Supercomputación de Galicia).

Avda. de Vigo s/n (Campus Vida)

15705, Santiago de Compostela

(Cómo llegar en este enlace).

Python powered

Perfil del alumno

El curso se dirige a profesionales con experiencia en el uso de TIC interesados en el uso de lenguajes de desarrollo y prototipado rápido para la obtención, el análisis, la representación y el almacenamiento de datos científicos y de ingeniería. Aunque es necesario tener conocimientos previos de programación para aprovechar adecuadamente los contenidos del curso, no es necesaria la experiencia con Python.

Temario y estructura

El curso se estructurará en forma de tutorial alternando descripciones técnicas y ejemplos prácticos que serán realizados por los asistentes durante la clase con el apoyo del profesor.  Todas las sesiones incluirán teoría y resolución de problemas prácticos.

  1. Introducción a Python. Herramientas básicas de tratamiento,
    almacenamiento y visualización de datos.
  2. Tratamiento de datos con Pandas.
  3. Almacenamiento y visualización de datos.
  4. Entornos paralelos y de alto rendimiento.
Descargar programa (.pdf)
  • La asistencia al curso es gratuita.
  • Las plazas son limitadas (15) y se asignarán prioritariamente a trabajadores de empresas de la zona básica de actuación del programa POCTEP.
  • Duración: 20 horas
  • Se entregará certificado de asistencia.
  • El 9 de junio de 2015 finalizó el período de inscripción.

Horario

16, martes

17, miércoles

18, jueves

10:00-14:00

Introducción a Python.

  • Aspectos básicos. Entorno de desarrollo iPython.
  • Operadores y tipos. Instrucciones. Funciones. Módulos. Clases. Excepciones.

 

Tratamiento de datos con Pandas

  • Introducción a Pandas.
  • Almacenamiento de datos y formatos de ficheros.
  • Limpieza y transformación de datos.

Almacenamiento y visualización de datos.

  • Librerías de datos científicos: NetCDF, HDF5.
  • Pytables.
  • Unificación de fuentes de datos: Blaze.
  • Seaborn.
  • Gráficas interactivas: Bokeh.
14:00-16:00

Almuerzo

16:00-19:00

Herramientas básicas de tratamiento, almacenamiento y visualización de datos.

  • Herramientas integradas.
  • Entorno de ejecución iPython.
  • Numpy.
  • Matplotlib.
  • Formatos de texto: JSON, XML.

Tratamiento de datos con Pandas

  • Visualización.
  • Agregación y operaciones sobre grupos.
  • Series temporales.

Entornos paralelos y de alto rendimiento.

  • Profiling y mejoras de rendimiento: Cython.
  • Paralelización básica: módulos threading y multiprocessing.
  • Librerías de paralelización: pp, dispy, numba.
  • Entornos de paralelización: iPython, Anaconda.

Más información:

Si tiene cualquier duda puede contactar con nosotros en la dirección info@cloudpyme.eu.

El proyecto CloudPYME es una colaboración entre el CESGA, AIMEN, CATIM y AIMMAP cofinanciado con fondos FEDER a través de la tercera convocatoria del Programa Operativo de Cooperación Transfronteriza España – Portugal 2007-2013 POCTEP (0682_CLOUDPYME2_1_E).