Secciones

Experto abordará la inteligencia artificial desde el caso Wikipedia

JORNADAS. El doctor en Tecnología de la Información e investigador de Wikimedia Foundation Diego Sáez, dictará conferencias en la Uach.
E-mail Compartir

Victoria Gatica Villegas

Cómo se está utilizando el aprendizaje de máquinas y la inteligencia artificial en plataformas online? esa es la interrogante que será abordada en la charla "Inteligencia Artificial para humanos: ¿Oportunidad o amenaza?, el caso de Wikipedia", a cargo de Diego Sáez Trumper, doctor en Tecnología de la Información de la Universidad de Pompeu Fabra, Barcelona.

La charla, abierta a la comunidad, se realizará mañana a las 17.30 horas en la Sala de Humanidades de la Facultad de Filosofía y Humanidades, instancia en la que específicamente, se mostrará el caso de uso en Wikipedia, discutiendo las oportunidades y riesgos que traen consigo las nuevas tecnologías de la información.

La segunda actividad se llevará a cabo el jueves 5 a las 16 horas en le Laboratorio Kelluwen del Instituto de Informática de la Facultad de Ciencias de la Ingeniería, en el Campus Miraflores de la Uach. En la oportunidad, Diego Sáez dictará la charla-taller "Datos, recursos y herramientas (públicos) de Wikimedia Fundation", la cual necesita una inscripción previa que se debe realizar enviando un mail a mvernier@inf.uach.cl.

Wikimedia Foundation es la organización matríz de Wikipedia, su proyecto más exitoso y uno de los sitios web más visitados del mundo. Dentro de su política de transparencia, la fundación ofrece acceso a la mayor parte de la información que recolecta, además de una serie de recursos para interactuar con dichos datos.

Plataformas como Quarry (base de datos de SQL), Wikidata (SPARQL) o el WikiCommons (datos multimedia) son ejemplos de los datos y herramientas disponibles. En la charla-taller, se hará una revisión de estos y otros repositorios, además de compartir ejemplos de código en Python para trabajar con dicha información.

Inteligencia artificial

Hace seis meses que Diego Sáez trabaja en la Fundación Wikimedia, ONG que soporta toda la infraestructura de Wikipedia y que en su propia descripción, se define como una "enciclopedia libre, políglota y editada de manera colaborativa".

A la fecha, Wikipedia cuenta con más de 46 millones de artículos en 288 idiomas, los que han sido escritos de manera conjunta por voluntarios de todo el mundo, totalizando más de 2 mil millones de ediciones. "Nosotros no nos preocupamos del contenido, sino de tratar de ayudar a la comunidad que escribe a mejorar el contenido, lo que tiene que ver con encontrar sesgos que puedan haber o encontrar afirmaciones que no estén soportadas por referencias", puntualizó Sáez.

En ese sentido, el doctor en Tecnología de la Información, detalló que el trabajo que desarrolla actualmente en la Fundación Wikimedia, tiene relación con la creación de herramientas que amplían el rango de aprovechamiento de la información. "Lo que hago, es hacer algoritmos que permitan, por ejemplo aprovechar la información que está en un idioma, para que otro editor la pueda usar en otro idioma. En general son cosas de soporte a personas, en Wikipedia no hay contenidos que sean generados por inteligencia artificial, sino que son herramientas que nosotros le damos a quienes editan".

Pero, ¿Qué es la inteligencia artificial?. Precisamente, uno de los aspectos que Diego Sáez abordará en la charla, dice relación con su correcta definición, debido a que según explicó, "a veces hay un poco de sensacionalismo sobre estos temas y se usan unas representaciones de la inteligencia artificial que son un poco alejadas de la realidad".

A grandes rasgos, la inteligencia artificial, es permitir que máquinas puedan realizar actividades que normalmente están asociadas a la inteligencia humana. "En particular, son tareas que para un humano son bastante básicas, como por ejemplo reconocer en una imagen algún elemento en particular, no obstante, si hago que lo haga una máquina, requiere de cierta inteligencia", precisó Sáez.

En ese sentido, el investigador destacó que en la charla, la idea es explicar como funcionan realmente las aplicaciones que está teniendo hoy día el Internet. "Cualquier persona que use Facebook, Google, tenga Gmail o Whatsapp, está de alguna manera intermediada por algoritmos de inteligencia artificial. La idea es entregar algunas herramientas para entender un poco mejor que significa eso", puntualizó Sáez, quien antes de trabajar en la Fundación Wikipedia, fue investigador Yahoo! Labs en Barcelona.

Ciencia de datos

Las charlas y el taller que Diego Sáez dictará en Valdivia, se insertan en el proyecto Fondecyt "Redes sociales y medios de comunicación: Modelo de análisis basado en minería de datos para la comprensión del ecosistema informativo chileno y la educomunicación ciudadana en la red", liderado por el periodista y doctor en Percepción, Comunicación y Tiempos de la Universidad Autónoma de Barcelona, Luis Cárcamo,

Según detalló Cárcamo, las actividades que Sáez realizará en Valdivia, surgieron con el objetivo de "aportar con una mirada más amplia y en función de su nuevo trabajo en Wikimedia Foundation, para explicar que con la inteligencia no solo se realiza analítica Cambridge o se usa para vender productos en retail bajo el sistema de recomendación, sino que hay toda una línea de trabajo en inteligencia artificial para fortalecer el conocimiento o redes sociales reales, para la gente colabore entre sí y puedan buscar soluciones".

En ese sentido, Cárcamo destacó que el trabajo de la Fundación Wikimedia es ejemplar, "tienen un sistema de gobierno interno como ONG bastante horizontal, se trabaja desde las necesidades que van reportando los mismos usuarios y tratando de pensar en como mejorar y diversificar", explicó.

La idea inicial del proyecto Fondecyt 1150545, surgió en 2014, mientras Cárcamo realizaba una estancia postdoctoral en la Universidad Pompeu Fabra de Barcelona y trabajó junto a Diego Sáez.

En el proyecto, que se extiende entre 2016 y 2019, participan profesionales de diversas áreas del conocimiento: informática, comunicación e ingeniería. Inicialmente, en el equipo liderado por Luis Cárcamo como investigador responsable participaron Eliana Scheihing y Oscar Aguilera, a quien posteriormente se sumó Diego Sáez como profesor colaborador extranjero y el doctor en informática especialista en minería de textos, Matthieu Vernier.

"El objetivo del proyecto es diagnosticar el ecosistema de medios en Chile, pensando desde El Mercurio, hasta el Diario de Paillaco y su funcionamiento en redes sociales y no solo entenderlo como el gran circuito de medios en Santiago, sino considerar todas las regiones, porque en todas hay medios pequeños que aportan al ecosistema", dijo Cárcamo.

Y agregó que con la presencia de profesionales especializados en distintas áreas, lograron por ejemplo, hacer análisis de texto, sofisticando las herramientas que tenían pensado utilizar en un principio.

Para analizar información a través de la minería de datos, que consiste en la extracción de información de un conjunto de datos para transformarla en una estructura comprensible para su uso posterior, utilizaron crawlers (software automatizado que recolecta metódicamente datos textuales y frecuencias de emisión) y herramientas para su análisis.

Gracias al proyecto, cerca de diez estudiantes del área de la comunicación, ingeniería y derecho han hecho y están actualmente realizando investigación como tesistas, utilizando la minería de datos y los datos obtenidos.

Inteligencia artificial en minería de datos

E-mail Compartir

La minería de datos es un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. Su tarea, es el análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (análisis clúster), registros poco usuales (la detección de anomalías) y dependencias (minería por reglas de asociación).