24.06.2019 |

El mundo de los datos y el aprendizaje automático

Máximo Gurméndez, director académico de la Licenciatura en Ciencia de Datos para Negocios, habló en una entrevista del libro que publicó recientemente junto a Saket Mengle: Mastering. Machine Learning on AWS

Lo difícil a veces no es llegar a los datos, sino saber cómo analizarlos. Sobre esto hablan los ingenieros Máximo Gurméndez, director académico de la nueva carrera en Ciencia de Datos para Negocios de la UM, y Saket Mengle, Director de Data Science en dataxu, en el libro Mastering. Machine Learning on AWS. En la publicación, los autores plantean problemas reales, similares a los que ellos han enfrentado en el pasado, e intentan aportar la teoría y métodos para solucionarlos con distintas tecnologías disponibles; por ejemplo, cómo estimar el valor de las casas a partir de datos o qué juego recomendar a cada persona en un parque de diversiones según fotografías de otros visitantes. En la siguiente entrevista, Gurméndez habla sobre el libro y reflexiona sobre Machine Learning (aprendizaje automático).  

¿Cómo surgió la iniciativa de esta publicación y cuáles son sus expectativas?

En realidad, fue por contacto directo de la editorial. Creemos que por haber participado en alguna de las conferencias en la temática. Más que nada, nos gustó la idea de escribir un libro y tachar un renglón del bucket list, pero, al redactarlo, nos dimos cuenta de que realmente había una brecha respecto a la información disponible sobre cómo solucionar un problema real de Machine Learning e hilvanar distintas tecnologías modernas en la nube de Amazon. La verdad es que no teníamos mucha expectativa sobre el impacto del libro, pero recibimos buena retroalimentación y entramos en algunos rankings que no esperábamos.  

¿De qué forma el libro ayuda a profundizar en técnicas de Machine Learning con Amazon Web Services (AWS)?

En los distintos capítulos del libro planteamos problemas reales, parecidos a los que tuvimos que solucionar en el pasado. Intentamos proveer la teoría y los métodos para resolverlos con distintas tecnologías disponibles. Por ejemplo, hay un capítulo sobre cómo estimar el valor de las casas a partir de los datos, otro sobre cómo predecir qué avisos publicitarios online mostrar a qué usuarios. Asimismo, en otro caso presentamos el problema de proveer recomendaciones sobre qué juegos y atracciones seleccionar para cada persona en un parque de diversiones en base a información fotográfica de visitantes pasados. La segunda parte del libro está dedicada a deep learning, reconocimiento de imágenes, reconocimiento de voz y chatbots

¿Cuáles son los conocimientos previos necesarios para leerlo?

Este libro es parte de una Mastering Series, por lo que se requiere que los lectores sepan algo de python (lenguaje de programación) y matemática a nivel universitario (cálculo y álgebra). No es un manual técnico sobre distintas tecnologías, por lo que no se necesita conocer Spark, Tensorflow o SageMaker de antemano. Es más bien una selección de problemas, tecnologías y teorías aplicadas a casos reales. 

¿Tu introducción en Machine Learning fue durante tu maestría en Northeastern University?

Ya en la Universidad de la República había tomado algunos cursos relacionados al tema, pero en Northeastern fue cuando realmente me enfoqué en Machine Learning, tanto en la parte curricular como en mi trabajo como investigador asistente del profesor Baclawski, quien, como dato curioso, patentó en 1997 la metodología MapReduce tan usada en Big Data, costándole a Google un juicio importante. Sin embargo, fue trabajando en la industria donde realmente me cerró todo.  

¿Cuál ha sido tu experiencia profesional en esta área en Montevideo Labs?

Hace diez años realicé una pasantía de verano en dataxu (Boston), en la cual por primera vez tuve contacto con Machine Learning a nivel laboral. Fue una experiencia muy rica, ya que pude trabajar con gente súper talentosa (incluidos profesores de MIT y expertos de clase mundial en el tema). Al final de mi maestría, estuve trabajando ahí como empleado y al tiempo me vine a Uruguay para luego fundar Montevideo Labs, que empezó con dataxu como primer cliente.

¿Y en la UM?

En la UM, empecé como profesor hace siete años con las materias Lógica Matemática, Análisis y Diseño de Algoritmos, Arquitectura de Software y Big Data Science. Intenté en estas asignaturas incluir casos reales que tuve que resolver en mi experiencia profesional. Me encanta la labor universitaria y hoy es un privilegio que muchos de mis exalumnos están dictando o ayudando en estos cursos.

¿Qué opinas sobre el desarrollo de Machine Learing en Uruguay y cuáles te parece que son los principales desafíos?

Creo que tanto en Uruguay como en el mundo hay mucho para recorrer en este camino, ya que no siempre es fácil incorporar exitosamente estas innovaciones a nivel organizacional. Muchas veces no se tiene el convencimiento de que la Ciencia de Datos a veces nos ayuda a tomar mejores decisiones de negocio que las que nuestra intuición determina. Otras veces, sí se tiene el convencimiento, pero no se tiene la expertise, los recursos humanos, los datos necesarios, o la cultura empresarial para llevar a cabo estos proyectos.

En ese sentido, ¿cómo te parece que puede ayudar la nueva Licenciatura en Ciencia de Datos para Negocios?

Lo bueno es que las nuevas generaciones están muy motivadas con este tipo de trabajo. Esto se vio reflejado en las inscripciones en la nueva licenciatura, que duplicaron lo que esperábamos y tenemos un grupo de excelentes alumnos muy motivados con los desafíos y las oportunidades de la nueva carrera. Al elaborar el programa, que es compatible con la doble titulación junto a la University of London, tomamos lo mejor de cada programa que estudiamos e incluimos aquellos temas que nos hubiera gustado cursar antes de chocarnos con la realidad profesional. Esperamos con la nueva carrera hacer un aporte para mejorar el rumbo y las oportunidades para Uruguay en este rubro.