Curso Procesamento de Datos con Python: Contornas e Aplicacións (2ª edición)

 12 Xuño, 2015

Debido á avalancha de solicitudes da primeira convocatoria, o proxecto CloudPYME organiza unha segunda edición do curso “Procesamento de datos con Python: contornas e aplicacións”, que se celebrará os días 13, 14, 15 e 16 de xullo de 2015.

Dende a súa aparición en 1991, Python converteuse nunha das linguaxes de scripting máis popular do mundo. Na derradeira década o seu uso como ferramenta de computación numérica, tanto en aplicacións industriais coma na contorna científica,  multiplicóuse, sendo unha alternativa popular a frameworks como Matlab, R, SAS, o Stata. Ademáis de dar soporte á computación exploratoria e análise, visualización e manipulación de datos, a fortaleza de Python coma linguaxe de propósito xeral faino unha alternativa excelente como linguaxe única para a construcción de aplicacións baseadas no procesamento de datos.

Python proporciona, ademáis, mecanismos que permiten a integración sinxela de códigos herdados (legacy codes) escribidos en C, C++, o FORTRAN. Mediante o uso de Python, o código de prototipado pode ser aproveitado durante a fase de desenvolvemento, eliminando a necesidade de empregar diferentes contornas en diferentes fases do proxecto e aumentando a cohesión do código.

O obxectivo fundamental do curso é estudo do ecosistema Python como ferramenta de análise e exploración de datos. Comezará cunha introdución á sintaxis e construcións máis usuais en Python, amosando o uso de ferramentas de representación, análise e visualización de datos de baixo nivel: NumPy e matplotlib. Posteriormente introduciránse librerías de máis alto nivel que facilitan a implementación, aceleran o desenvolvemento, e melloran o rendimento e a interoperabilidade, tales como Pandas ou Pytables. Finalmente, introduciránse aspectos relativos á obtención de alto rendimento con Python: profiling, compilación a C, Cython, optimización de memoria, e uso de contornas de computación paralela. O curso será impartido por docentes da Universidade da Coruña, durante tres días, e estará dividido en sesións teórico-prácticas, cunha duración total de 20 horas formativas.

Lugar de celebración do curso

CESGA (Centro de Supercomputación de Galicia).

Avda. de Vigo s/n (Campus Vida)

15705, Santiago de Compostela

(Cómo chegar neste enlace).

Inscripción cerrada

El aforo de esta 2ª edición se ha asignado a solicitantes en lista de espera de la primera convocatoria

Python powered

Perfil do alumno

O curso diríxese a profesionais con experiencia no uso de TIC interesados no  uso de linguaxes de desenvolvemento e prototipado rápido para a obtención, o análise, a representación e o almacenamento de datos científicos e de inxeniería. Aínda que é necesario ter coñecementos previos de programación para aproveitar adecuadamente os contidos do curso, non é necesaria a experiencia co Python.

Temario e estrutura

O curso estruturaráse en forma de tutorial alternando descripcións técnicas e exemplos prácticos que serán realizados polos asistentes durante a clase co apoio do profesor.  Todas as sesións incluirán teoría e resolución de problemas prácticos.

 1. Introdución a Python. Ferramentas básicas de tratamento, almacenamento e visualización de datos.
 2. Tratamento de datos con Pandas.
 3. Almacenamento e visualización de datos.
 4. Contornas en paralelo e de alto rendimento.
Descargar programa (.pdf)
 • A asistencia ao curso é gratuita.
 • As prazas son limitadas (15) e serán atribuidos prioritariamente a traballadores de empresas da zona básica de actuación do programa POCTEP.
 • Duración do curso: 20 horas (4 días, 5h/d)
 • Entregará-se certificado de participación.

Horario: 10:00 – 15:00

13, lúns

14, martes

15, mércores

16, xoves

Introdución a Python

 • Aspectos básicos.
 • Operadores e tipos. Instrucións. Funcións. Módulos. Clases. Excepcións.
 • Ferramentas integradas.
 • Contorna de execución iPython.
 • NumPy.

Introdución a Python (cont.)

 • Matplotlib.
 • Formatos de texto: JSON, XML.

Tratamento de datos con Pandas

 • Introdución a Pandas.
 • Almacenamento de datos e formatos de ficheros.
 • Limpeza e transformación de datos.

Tratamiento de datos con Pandas (cont.)

 • Visualización.
 • Agregación e operacións sobre grupos.
 • Series temporais.

Almacenamento e visualización de datos.

 • Librerías de datos científicos: NetCDF, HDF5.
 • Pytables.

Almacenamiento e visualización de datos (cont.)

 • Unificación de fontes de datos: Blaze.
 • Seaborn.
 • Gráficas interactivas: Bokeh.

  Contornas paralelas e de alto rendimento.

 • Profiling e melloras de rendimento: Cython.
 • Paralelización: módulos threading, multiprocessing, pp, dispy, numba.
 • Contornas de paralelización: iPython, Anaconda.

Máis información:

Se ten calquera dúbida pode contactar connosco na dirección info@cloudpyme.eu. O proxecto CloudPYME é unha colaboración entre o CESGA, AIMEN, CATIM e AIMMAP cofinanciado con fondos FEDER a través da terceira convocatoria do Programa Operativo de Cooperación Transfronteriza España – Portugal 2007-2013 POCTEP (0682_CLOUDPYME2_1_E).