Curso Procesamento de Datos con Python: Contornas e Aplicacións

 13 Maio, 2015

O proxecto CloudPYME organiza o  curso “Procesamento de datos con Python: Contornas e Aplicacións”, os días 16, 17 e 18 de xuño. Dende a súa aparición en 1991, Python converteuse nunha das linguaxes de scripting máis popular do mundo. Na derradeira década o seu uso como ferramenta de computación numérica, tanto en aplicacións industriais coma na contorna científica,  multiplicóuse, sendo unha alternativa popular a frameworks como Matlab, R, SAS, o Stata. Ademáis de dar soporte á computación exploratoria e análise, visualización e manipulación de datos, a fortaleza de Python coma linguaxe de propósito xeral faino unha alternativa excelente como linguaxe única para a construcción de aplicacións baseadas no procesamento de datos.

Python proporciona, ademáis, mecanismos que permiten a integración sinxela de códigos herdados (legacy codes) escribidos en C, C++, o FORTRAN. Mediante o uso de Python, o código de prototipado pode ser aproveitado durante a fase de desenvolvemento, eliminando a necesidade de empregar diferentes contornas en diferentes fases do proxecto e aumentando a cohesión do código.

O obxectivo fundamental do curso é estudo do ecosistema Python como ferramenta de análise e exploración de datos. Comezará cunha introdución á sintaxis e construcións máis usuais en Python, amosando o uso de ferramentas de representación, análise e visualización de datos de baixo nivel: NumPy e matplotlib. Posteriormente introduciránse librerías de máis alto nivel que facilitan a implementación, aceleran o desenvolvemento, e melloran o rendimento e a interoperabilidade, tales como Pandas ou Pytables. Finalmente, introduciránse aspectos relativos á obtención de alto rendimento con Python: profiling, compilación a C, Cython, optimización de memoria, e uso de contornas de computación paralela. O curso será impartido por docentes da Universidade da Coruña, durante tres días, e estará dividido en sesións teórico-prácticas, cunha duración total de 20 horas formativas.

Lugar de celebración do curso

CESGA (Centro de Supercomputación de Galicia).

Avda. de Vigo s/n (Campus Vida)

15705, Santiago de Compostela

(Cómo chegar neste enlace).

Python powered

Perfil do alumno

O curso diríxese a profesionais con experiencia no uso de TIC interesados no  uso de linguaxes de desenvolvemento e prototipado rápido para a obtención, o análise, a representación e o almacenamento de datos científicos e de inxeniería. Aínda que é necesario ter coñecementos previos de programación para aproveitar adecuadamente os contidos do curso, non é necesaria a experiencia co Python.

Temario e estrutura

O curso estruturaráse en forma de tutorial alternando descripcións técnicas e exemplos prácticos que serán realizados polos asistentes durante a clase co apoio do profesor.  Todas as sesións incluirán teoría e resolución de problemas prácticos.

  1. Introdución a Python. Ferramentas básicas de tratamento, almacenamento e visualización de datos.
  2. Tratamento de datos con Pandas.
  3. Almacenamento e visualización de datos.
  4. Contornas en paralelo e de alto rendimento.
Descargar programa (.pdf)
  • A asistencia ao curso é gratuita.
  • As prazas son limitadas (15) e serán atribuidos prioritariamente a traballadores de empresas da zona básica de actuación do programa POCTEP.
  • Duración do curso: 20 horas
  • Entregará-se certificado de participación.
  • O 9 de xuño de 2015 rematou o periodo de inscrición

Horario

16, martes

17, miércoles

18, jueves

10:00-14:00

Introducción a Python.

  • Aspectos básicos. Entorno de desarrollo iPython.
  • Operadores y tipos. Instrucciones. Funciones. Módulos. Clases. Excepciones.

Tratamiento de datos con Pandas

  • Introducción a Pandas.
  • Almacenamiento de datos y formatos de ficheros.
  • Limpieza y transformación de datos.

Almacenamiento y visualización de datos.

  • Librerías de datos científicos: NetCDF, HDF5.
  • Pytables.
  • Unificación de fuentes de datos: Blaze.
  • Seaborn.
  • Gráficas interactivas: Bokeh.
14:00-16:00

Almuerzo

16:00-19:00

Herramientas básicas de tratamiento, almacenamiento y visualización de datos.

  • Herramientas integradas.
  • Entorno de ejecución iPython.
  • Numpy.
  • Matplotlib.
  • Formatos de texto: JSON, XML.

Tratamiento de datos con Pandas

  • Visualización.
  • Agregación y operaciones sobre grupos.
  • Series temporales.

Entornos paralelos y de alto rendimiento.

  • Profiling y mejoras de rendimiento: Cython.
  • Paralelización básica: módulos threading y multiprocessing.
  • Librerías de paralelización: pp, dispy, numba.
  • Entornos de paralelización: iPython, Anaconda.

Máis información:

Se ten calquera dúbida pode contactar connosco na dirección info@cloudpyme.eu. O proxecto CloudPYME é unha colaboración entre o CESGA, AIMEN, CATIM e AIMMAP cofinanciado con fondos FEDER a través da terceira convocatoria do Programa Operativo de Cooperación Transfronteriza España – Portugal 2007-2013 POCTEP (0682_CLOUDPYME2_1_E).