Publicado: 3 de agosto de 2022 - Última actualización: 9 de agosto de 2022
Curso del Centro Interdisciplinario en Ciencia de Datos y Aprendizaje Automático (CICADA), Espacio interdisciplinario – Udelar.
El próximo 9 de agosto de 2022 comienza el curso Aprendizaje Automático para Datos en Grafos.
Objetivos del curso: Los grafos (o redes) son una estructura de datos presente en muchísimas áreas de conocimiento: redes de telecomunicaciones, sistemas de recomendación, redes de regulación genética, estructuras de proteínas o movilidad urbana son solo algunos ejemplos. Básicamente, son entidades (nodos) que interactúan entre sí (aristas). Sobre estos datos existen muchos problemas interesantes de aprendizaje automático, donde básicamente se busca realizar predicciones o descubrir cierta estructura en los datos: detección de anomalías en una red inalámbrica, recomendación de libros a partir de clasificaciones anteriores y de otros usuarios, o clasificación del rol de ciertas proteínas en redes de interacción biológica. Sin embargo, está claro que técnicas de aprendizaje “tradicionales” (donde los datos son básicamente un vector o una matriz) que no toman en cuenta las relaciones entre las distintas entidades tendrán menor poder de generalización (y por lo tanto mucho peor desempeño) que aquellas que sí lo tomen en cuenta.
El objetivo general del curso es que los estudiantes puedan afrontar un problema de aprendizaje automático donde los datos se encuentran en forma de grafos. Se brindarán los conceptos teóricos fundamentales y las herramientas prácticas necesarias para ello. Al finalizar el curso los estudiantes serán capaces de implementar y entender distintas técnicas del estado del arte en inferencia y predicción en grafos.
Público objetivo: Estudiantes avanzados de grado o de posgrado con formación básica en álgebra lineal y probabilidad y cuyos intereses estén relacionados con el modelado, análisis estadístico y/o o visualización de datos en grafos. El curso espera llegar a estudiantes de programas de la Facultad de Ingeniería (IngeMat, MCDAA, etc.), pero también a estudiantes de posgrado por fuera de la facultad como la maestría en Bioinformática, maestría en Ciencias Cognitivas o maestría en Ciencias Ambientales. Cada estudiante podrá profundizar en alguno de los aspectos de su interés: modelado matemático, análisis descriptivo, visualización, análisis estadístico, etc.
Docentes: Paola Bermolen (Gr. 4, IMERL), Marcelo Fiori (Gr. 3, IMERL), Federico La Rocca (Gr. 4, IIE), Bernardo Marenco (Gr.2, IMERL) y Gonzalo Mateos (Associate Professor, University of Rochester, NY, USA).
Programas de posgrado: Maestría en Ingeniería Matemática (IngeMat), Maestría en Ciencia de
Datos (MCDAA)y Aprendizaje Automático, Maestría y Doctorado en Ingeniería Eléctrica.
Fecha de inicio y finalización: 09/08/2022 al 24/11/2022
Horario y salón: martes y jueves de 9.30 a 11.00, en el salón 101 de la Fing.
Inscripciones: https://bedelias.udelar.edu.uy/
Contacto por consultas: paola@fing.edu.uy
Toda la información del curso: https://eva.fing.edu.uy/course/view.php?id=1626§ion=0
Horas Presenciales: 60
N° de Créditos: 10
Conocimientos previos exigidos: Álgebra de matrices. Fundamentos de probabilidad y
estadística Programación a nivel básico.
Conocimientos previos recomendados: Conocimientos básicos en fundamentos de aprendizaje
automático. Programación en python científico.
Descripción de la metodología: El curso consta de dos clases teóricas presenciales durante 14 semanas además de seis clases prácticas asociadas a cada uno de los temas del curso.
Las clases de práctico incluyen un taller práctico en python que busca ilustrar algunos de los conceptos vistos en clase. Éstos serán realizados por los estudiantes y servirán sobre todo para auto-estudio y preparación del trabajo final. El objetivo es que luego de realizar el taller el estudiante sea capaz de levantar un conjunto de datos y aplicarle algunas de las técnicas que se verán en el curso, independientemente del trabajo final que elija.
Detalle de horas:
– Horas de clase (teórico): 48
– Horas de clase (práctico): 12
– Horas de consulta: 4
o Subtotal de horas presenciales: 60
– Horas de estudio: 20
– Horas de resolución de ejercicios/prácticos: 20
– Horas proyecto final/monografía: 50
o Total de horas de dedicación del estudiante: 150
Forma de evaluación: Entrega de ejercicios prácticos y/o en el lenguaje de programación phyton
(una entrega por cada clase de práctico) junto con un proyecto final. En el proyecto final, los estudiantes podrán investigar y aplicar algoritmos de aprendizaje automático en grafos del estado del arte, a una aplicación de su interés. Una vez concluido el componente instructivo del curso y realizada la entrega de ejercicios, los estudiantes deberán seleccionar un tema específico, relacionado con el material tratado
en clase, y realizar un estudio relativamente profundo del tema. Esto implica por ejemplo buscar fuentes de literatura (trabajos de investigación, libros de texto, etc.), y eventualmente realizar algunos análisis y/o simulaciones numéricas para experimentar con conjuntos de datos sobre grafos, y proporcionar un resumen detallado de las ideas principales en formato paper.