Un joven argentino inventó un sistema que resume textos en forma automática

Augusto Villa Monte, de 31 años, desarrolló la técnica y, con ella, obtuvo un doble doctorado con la máxima calificación en la Universidad de La Plata y en la Universidad de Castilla La-Mancha, España. Los detalles del invento

Ciencia y Tecnología 25/01/2020 Luján 365 Luján 365
OCR47AIGTNC3FMCXANOLONIHLU

Augusto Villa Monte obtuvo con la máxima calificación posible dos títulos al mismo tiempo: el de Doctor en Ciencias Informáticas de la Universidad Nacional de La Plata y el de Doctor en Tecnologías Informáticas Avanzadas de la Universidad de Castilla La-Mancha, España. ¿Cómo lo logró? Creó un sistema que permite hacer resúmenes automáticamente.

Su tesis doctoral se tituló: “Generación automática inteligente de resúmenes de textos con técnicas de Soft Computing”. Las dos universidades lo calificaron con un 10 e incluso la casa de estudios española lo condecoró con una mención Cum Laude.

Augusto identificó una necesidad en el campo científico: los textos se multiplican y multiplican en formato digital al punto de volverse imposible de procesar, de separar lo esencial de lo accesorio. Por eso, pensó, era imprescindible una herramienta que pudiera dar, en forma automática, una clasificación.

"La información dejó de ser algo tan estructurado como antes. En en ese sentido, sabiendo que el volumen es inmenso entre libros, papers, noticias trabajé en que se pudiera recrear el criterio del usuario a la hora de hacer un resumen. Más allá de que está pensado para el campo académico, se puede aplicar sin problemas a otros textos que tengan características extraíbles”, contó a Infobae Villa Monte.

Esas características son las de cualquier texto formal: un título y distintos párrafos. Lo único que hasta el momento no podría resumir son chats. Su funcionamiento es fácil de explicar, pero difícil de desarrollar. Después de hacer un resumen como referencia, el sistema toma una serie de criterios, aprende de ellos y los replica en los siguientes textos.

Villa Monte hoy tiene 31 años, pero su experiencia en la técnica ya había comenzado en la carrera de grado. La investigación se extendió durante los seis años que dura el doctorado. “Se pudo haber terminado antes, pero los doctorados tienen una serie de plazos burocráticos. Hay que realizar un montón de cursos que te van orientando, después escribir la tesis, después sigue la evaluación, la defensa y la publicación”, señaló.

En su caso, el doctorado fue doble porque su tesis fue cotutelada por la universidad platense y la española. Más allá de que la tesis es una, la defensa se da ante un jurado compuesto entre las dos instituciones.

Te puede interesar esta noticia: YA PODÉS POSTULARTE PARA LAS PASANTÍAS RENTADAS 2020 EN YPF

Antes del doctorado, el joven se graduó en Sistemas en la UNLP. En la misma universidad trabaja. Se desempeña como investigador en el Laboratorio de Investigación en Informática. Allí creó una solución a través de inteligencia artificial, que clasifica la información de acuerdo a su importancia, sobre todo destinado a la medicina, donde la “investigación y la difusión de la información son fundamentales para su desarrollo”.

“La tesis que realicé desarrolla dos estrategias diferentes para construir resúmenes automáticos de textos, utilizando técnicas de soft computing que se emplean para solucionar problemas que manejan información incompleta, con incertidumbre y/o inexacta”, explicó Villa Monte.

La primera de ellas, agregó, “es una técnica de optimización mediante cúmulo de partículas que, a partir de la representación vectorial de los textos, construye un resumen extractivo combinando adecuadamente varias métricas de puntuación”.

La segunda metodología se vincula con el estudio de la causalidad. El análisis de los textos se hace a partir de la construcción de un grafo, a través del cual se obtienen relaciones causales. “Ambas estrategias implican fundamentalmente la clasificación de la información y reducen el volumen del texto considerando al receptor del resumen construido en cada caso. Por un lado, se identifican los criterios que utiliza el usuario para seleccionar las partes relevantes de un documento. Por el otro, se construye un grafo a partir de patrones textuales útiles para la toma de decisiones”, apuntó el investigador.

La herramienta todavía no está disponible. Por ahora, son solo códigos que requieren de una interfaz para que un usuario la pueda usar. Más allá de que podría ser un producto muy rentable, Villa Monte dice que no está entre sus planes hacer dinero con su invento. “Los investigadores no apuntamos a eso. Tratamos de generar desarrollos importantes para la sociedad”, comentó.

Fuente: INFOBAE

Te puede interesar
Lo más visto