Curso Procesamento de Datos con Python: Contornas e Aplicacións (3ª edición)

 22 Xuño, 2015

Despois da boa acollida das dúas primeiras edicións do curso en xuño e en xullo diste año, o proxecto CloudPYME organiza unha terceira edición do curso “Procesamento de datos con Python: contornas e aplicacións”, que se impartirá durante os días 22, 23 e 24 de setembro.

O proxecto CloudPYME organiza o curso “Procesamento de datos con Python: Contornas e Aplicacións”, os días 16, 17 e 18 de xuño. Dende a súa aparición en 1991, Python converteuse nunha das linguaxes de scripting máis popular do mundo. Na derradeira década o seu uso como ferramenta de computación numérica, tanto en aplicacións industriais coma na contorna científica, multiplicóuse, sendo unha alternativa popular a frameworks como Matlab, R, SAS, o Stata. Ademáis de dar soporte á computación exploratoria e análise, visualización e manipulación de datos, a fortaleza de Python coma linguaxe de propósito xeral faino unha alternativa excelente como linguaxe única para a construcción de aplicacións baseadas no procesamento de datos.

Python proporciona, ademáis, mecanismos que permiten a integración sinxela de códigos herdados (legacy codes) escribidos en C, C++, o FORTRAN. Mediante o uso de Python, o código de prototipado pode ser aproveitado durante a fase de desenvolvemento, eliminando a necesidade de empregar diferentes contornas en diferentes fases do proxecto e aumentando a cohesión do código.

O obxectivo fundamental do curso é estudo do ecosistema Python como ferramenta de análise e exploración de datos. Comezará cunha introdución á sintaxis e construcións máis usuais en Python, amosando o uso de ferramentas de representación, análise e visualización de datos de baixo nivel: NumPy e matplotlib. Posteriormente introduciránse librerías de máis alto nivel que facilitan a implementación, aceleran o desenvolvemento, e melloran o rendimento e a interoperabilidade, tales como Pandas ou Pytables. Finalmente, introduciránse aspectos relativos á obtención de alto rendimento con Python: profiling, compilación a C, Cython, optimización de memoria, e uso de contornas de computación paralela. O curso será impartido por docentes da Universidade da Coruña, durante tres días, e estará dividido en sesións teórico-prácticas, cunha duración total de 20 horas formativas.

Lugar de celebración do curso

CESGA (Centro de Supercomputación de Galicia).

Avda. de Vigo s/n (Campus Vida)

15705, Santiago de Compostela

(Cómo chegar neste enlace).

Python powered

Perfil do alumno

O curso diríxese a profesionais con experiencia no uso de TIC interesados no uso de linguaxes de desenvolvemento e prototipado rápido para a obtención, o análise, a representación e o almacenamento de datos científicos e de inxeniería. Aínda que é necesario ter coñecementos previos de programación para aproveitar adecuadamente os contidos do curso, non é necesaria a experiencia co Python.

Temario e estrutura

O curso estruturaráse en forma de tutorial alternando descripcións técnicas e exemplos prácticos que serán realizados polos asistentes durante a clase co apoio do profesor. Todas as sesións incluirán teoría e resolución de problemas prácticos.

  1. Introdución a Python. Ferramentas básicas de tratamento, almacenamento e visualización de datos.
  2. Tratamento de datos con Pandas.
  3. Almacenamento e visualización de datos.
  4. Contornas en paralelo e de alto rendimento.
Descargar programa (.pdf)
  • A asistencia ao curso é gratuita.
  • As prazas son limitadas (15) e serán atribuidos prioritariamente a traballadores de empresas da zona básica de actuación do programa POCTEP.
  • Duración do curso: 20 horas
  • Entregará-se certificado de participación.

Horario

22, martes

23, mércores

24, xoves

10:00-14:00

Introdución a Python.

  • Aspectos básicos. Contorna de desenvolvemento iPython.
  • Operadores e tipos. Instrucións. Funcións. Módulos. Clases. Excepcións.

Tratamento de datos con Pandas

  • Introdución a Pandas.
  • Almacenamento de datos e formatos de ficheiros.
  • Limpeza e transformación de datos.

Almacenamento e visualización de datos.

  • Librerías de datos científicos: NetCDF, HDF5.
  • Pytables.
  • Unificación de fontes de datos: Blaze.
  • Seaborn.
  • Gráficas interactivas: Bokeh.
14:00-15:30

Xantar

15:30-18:30

Ferramentas básicas de tratamento, almacenamento e visualización de datos.

  • Ferramentas integradas.
  • Contorna de execución iPython.
  • Numpy.
  • Matplotlib.
  • Formatos de texto: JSON, XML.

Tratamento de datos con Pandas (cont.)

  • Visualización.
  • Agregación e operacións sobre grupos.
  • Series temporais.

Contornas paralelas e de alto rendimento.

  • Profiling e melloras de rendimento: Cython.
  • Paralelización básica: módulos threading e multiprocessing.
  • Librerías de paralelización: pp, dispy, numba.
  • Contornas de paralelización: iPython, Anaconda.

Máis información:

Se ten calquera dúbida pode contactar connosco na dirección info@cloudpyme.eu. O proxecto CloudPYME é unha colaboración entre o CESGA, AIMEN, CATIM e AIMMAP cofinanciado con fondos FEDER a través da terceira convocatoria do Programa Operativo de Cooperación Transfronteriza España – Portugal 2007-2013 POCTEP (0682_CLOUDPYME2_1_E).