La 4ta edición del Simposio Internacional en Gestión de la Información y Big data (SIMBig 2017) contó con la participación de alumnos, catedráticos entidades educativas peruanas y extranjeras, y gestores de empresas.
La Universidad del Pacífico (UP) fue sede de SIMBig 2017, evento realizado del 4 al 6 de setiembre. El importante encuentro, que contó con el apoyo de la carrera de Ingeniería de la Información de la UP, reunió a diferentes investigadores y alumnos de prestigiosas casas de estudio, como MIT (Massachusetts Institute of Technology), Stanford University, University of Illinois, San Francisco State University, Universidad de Hamburgo, University of Montpellier, Universidad Nacional de Córdova, Universidad de Sao Paulo, PUCP, UNMSM, UNI, entre otras.
La conferencia destacó debido a que cada panel fue una excelente oportunidad para que expertos de diversas partes del mundo presenten sus artículos académicos junto a sus pares peruanos, alumnos y catedráticos provenientes de la capital y del interior del país. En total, durante SIMBig 2017 se presentaron 25 artículos científicos más 5 presentaciones por parte de nuestros 5 invitados especiales (charlas magistrales).
La primera charla magistral estuvo a cargo de Regina Barzilay, catedrática del departamento de ingeniería eléctrica del MIT, quien desarrolló el tema: “Learning to cure”. La exposición mostró cómo las técnicas de procesamiento de lenguaje natural (NLP, por sus siglas en inglés) pueden ser usadas para mejorar la prevención, diagnóstico y tratamiento de enfermedades tan complejas como el cáncer. Enfatizando en la necesidad usar historiales clínicos y bases de datos. Asimismo, señaló que, contar con registros médicos electrónicos, que utilicen data estructurada, permitirá un progreso significativo en la calidad de la atención de los sistemas de salud.
La segunda charla magistral fue “Mining Structures from Massive Text Data: A Data-Driven Approach”, presentada por Jiawei Han, profesor del departamento de Computación Científica de University of Illinois. El catedrático explicó que la mayoría de datos son no estructurados, por ejemplo, los datos textuales (Twitter, Facebook, etc.). A través de sus investigaciones, Han evidenció que transformar estos datos en redes de información estructuradas permite la creación de nuevos y útiles conocimientos en diversos campos, como el educativo, recientemente la salud, entre otros.
“Making online datasets more searchable and accessible: The Cedar Project” fue el título de la charla realizada por Mark A. Musen, profesor de informática biomédica de Stanford University e investigador principal del Center for Expanded Data Annotation and Retrieval (Cedar). Musen resaltó la importancia que la información, trabajos y datos científicos se encuentren en línea, sean de fácil acceso y sencillos de buscar. De esa forma se permite que otros académicos y el público en general conozcan lo hecho por investigadores previamente, reutilicen o redescubran los datos y saquen el mayor beneficio posible a los resultados científicos.
Mark A. Musen, profesor de informática biomédica de Stanford University e investigador principal del Center for Expanded Data Annotation and Retrieval (Cedar).
Por su parte, Ravi Kumar, investigador senior de Google, efectuó la exposición “Sequences, Choices, and their Dynamics”. Kumar empezó indicando que las constantes secuencias generadas por el comportamiento de las personas están estrechamente ligadas a cómo estas toman sus decisiones. Así, manifestó Ravi, a través de las secuencias se pueden establecer diversos patrones de consumo: desde los restaurantes preferidos hasta los parámetros utilizados para elegir la música que uno va a escuchar. En su presentación, Ravi aseguró que esta clase de secuencias contienen una importante cantidad de información ordenada temporal permitiendo a las organizaciones conocer mejor a sus clientes, por ejemplo saber si es que los ítems que selecciona un individuo son populares, útiles, buenos o si el consumidor está comenzando a abandonarlos.
Finalmente, Clement Jonquet presentó “Challenges for ontology repositories and applications to biomedicine & agronomy”, en el cual menciona el gran crecimiento de ontologías y vocabularios que se está dando en los últimos 10 años. En esta presentación Jonquet establece la gran importancia que tiene la creación de ontologías para todos los sectores en especial en la biomedicina y en la agricultura, los obstáculos y retos que implica la construcción de estas. Asimismo, muestra nuevamente como el NLP es útil para la construcción automática de ontologías.
De esta forma SIMBig 2017 ha demostrado ser una oportunidad extraordinaria para conocer experiencias, investigaciones y tendencias internacionales en torno a la gestión de la información y big data. Además ha sido una ocasión ideal para estar al tanto de la más reciente producción científica peruana en estos campos.
Finalmente, las mejores contribuciones científicas de SIMBig 2017 serán publicadas en Springer, que es una de las casas editoriales de documentos científicos de mayor prestigio a nivel mundial.