Curso Procesamento de Datos con Python: Contornas e Aplicacións (2ª edición)

 12 Xuño, 2015

Debido á avalancha de solicitudes da primeira convocatoria, o proxecto CloudPYME organiza unha segunda edición do curso “Procesamento de datos con Python: contornas e aplicacións”, que se celebrará os días 13, 14, 15 e 16 de xullo de 2015.

Dende a súa aparición en 1991, Python converteuse nunha das linguaxes de scripting máis popular do mundo. Na derradeira década o seu uso como ferramenta de computación numérica, tanto en aplicacións industriais coma na contorna científica,  multiplicóuse, sendo unha alternativa popular a frameworks como Matlab, R, SAS, o Stata. Ademáis de dar soporte á computación exploratoria e análise, visualización e manipulación de datos, a fortaleza de Python coma linguaxe de propósito xeral faino unha alternativa excelente como linguaxe única para a construcción de aplicacións baseadas no procesamento de datos.

Python proporciona, ademáis, mecanismos que permiten a integración sinxela de códigos herdados (legacy codes) escribidos en C, C++, o FORTRAN. Mediante o uso de Python, o código de prototipado pode ser aproveitado durante a fase de desenvolvemento, eliminando a necesidade de empregar diferentes contornas en diferentes fases do proxecto e aumentando a cohesión do código.

O obxectivo fundamental do curso é estudo do ecosistema Python como ferramenta de análise e exploración de datos. Comezará cunha introdución á sintaxis e construcións máis usuais en Python, amosando o uso de ferramentas de representación, análise e visualización de datos de baixo nivel: NumPy e matplotlib. Posteriormente introduciránse librerías de máis alto nivel que facilitan a implementación, aceleran o desenvolvemento, e melloran o rendimento e a interoperabilidade, tales como Pandas ou Pytables. Finalmente, introduciránse aspectos relativos á obtención de alto rendimento con Python: profiling, compilación a C, Cython, optimización de memoria, e uso de contornas de computación paralela. O curso será impartido por docentes da Universidade da Coruña, durante tres días, e estará dividido en sesións teórico-prácticas, cunha duración total de 20 horas formativas.

Lugar de celebración do curso

CESGA (Centro de Supercomputación de Galicia).

Avda. de Vigo s/n (Campus Vida)

15705, Santiago de Compostela

(Cómo chegar neste enlace).

Inscripción cerrada

El aforo de esta 2ª edición se ha asignado a solicitantes en lista de espera de la primera convocatoria

Python powered

Perfil do alumno

O curso diríxese a profesionais con experiencia no uso de TIC interesados no  uso de linguaxes de desenvolvemento e prototipado rápido para a obtención, o análise, a representación e o almacenamento de datos científicos e de inxeniería. Aínda que é necesario ter coñecementos previos de programación para aproveitar adecuadamente os contidos do curso, non é necesaria a experiencia co Python.

Temario e estrutura

O curso estruturaráse en forma de tutorial alternando descripcións técnicas e exemplos prácticos que serán realizados polos asistentes durante a clase co apoio do profesor.  Todas as sesións incluirán teoría e resolución de problemas prácticos.

  1. Introdución a Python. Ferramentas básicas de tratamento, almacenamento e visualización de datos.
  2. Tratamento de datos con Pandas.
  3. Almacenamento e visualización de datos.
  4. Contornas en paralelo e de alto rendimento.
Descargar programa (.pdf)
  • A asistencia ao curso é gratuita.
  • As prazas son limitadas (15) e serán atribuidos prioritariamente a traballadores de empresas da zona básica de actuación do programa POCTEP.
  • Duración do curso: 20 horas (4 días, 5h/d)
  • Entregará-se certificado de participación.

Horario: 10:00 – 15:00

13, lúns

14, martes

15, mércores

16, xoves

Introdución a Python

  • Aspectos básicos.
  • Operadores e tipos. Instrucións. Funcións. Módulos. Clases. Excepcións.
  • Ferramentas integradas.
  • Contorna de execución iPython.
  • NumPy.

Introdución a Python (cont.)

  • Matplotlib.
  • Formatos de texto: JSON, XML.

Tratamento de datos con Pandas

  • Introdución a Pandas.
  • Almacenamento de datos e formatos de ficheros.
  • Limpeza e transformación de datos.

Tratamiento de datos con Pandas (cont.)

  • Visualización.
  • Agregación e operacións sobre grupos.
  • Series temporais.

Almacenamento e visualización de datos.

  • Librerías de datos científicos: NetCDF, HDF5.
  • Pytables.

Almacenamiento e visualización de datos (cont.)

  • Unificación de fontes de datos: Blaze.
  • Seaborn.
  • Gráficas interactivas: Bokeh.

    Contornas paralelas e de alto rendimento.

  • Profiling e melloras de rendimento: Cython.
  • Paralelización: módulos threading, multiprocessing, pp, dispy, numba.
  • Contornas de paralelización: iPython, Anaconda.

Máis información:

Se ten calquera dúbida pode contactar connosco na dirección info@cloudpyme.eu. O proxecto CloudPYME é unha colaboración entre o CESGA, AIMEN, CATIM e AIMMAP cofinanciado con fondos FEDER a través da terceira convocatoria do Programa Operativo de Cooperación Transfronteriza España – Portugal 2007-2013 POCTEP (0682_CLOUDPYME2_1_E).