Inicio » Instituto de Matemática, Física y Estadística aborda uso de minería de texto para optimizar revisiones científicas

El Instituto de Matemática, Física y Estadística (IMFE) de la Facultad de Ingeniería y Negocios de Universidad de Las Américas realizó el seminario Minería de texto y modelado de tópicos: una herramienta para la revisión sistemática de literatura científica, instancia que convocó a la comunidad académica interesada en ciencia de datos aplicada a la investigación.

La Dra. Jennyfer Portilla, académica de la Universidad del Valle (Colombia), expuso acerca del uso de técnicas de minería de texto y del modelo de Asignación Latente de Dirichlet (LDA) para organizar y analizar grandes volúmenes de información científica de manera automatizada.

Durante la jornada, el Director del IMFE, Dr. Ricardo Monje, destacó la relevancia de estas herramientas en el contexto actual. “Se trata de metodologías muy interesantes, especialmente para realizar revisiones sistemáticas de manera más eficiente y profunda”, acotó.

Aplicación en investigación científica

En su presentación, la Dra. Portilla abordó los desafíos que enfrentan las revisiones tradicionales, particularmente en áreas como la salud, donde existe una alta disponibilidad de publicaciones. En ese escenario, explicó que la minería de texto permite transformar grandes corpus documentales en conjuntos organizados de temas o tópicos.

El modelo LDA, eje del seminario, permite identificar automáticamente patrones dentro de textos, asumiendo que cada documento contiene una mezcla de temas, lo que facilita la clasificación y el análisis.

Instituto de Matemática, Física y Estadística aborda uso de minería de texto para optimizar revisiones científicas

Como ejemplo, presentó un caso aplicado al estudio del dengue. Tras analizar cientos de artículos científicos para identificar tendencias, enfoques de investigación y vacíos de conocimiento, la herramienta logró reducir significativamente el tiempo de revisión.

Reflexión sobre metodologías y alcances

En el espacio de preguntas, el Dr. Ricardo Monje planteó interrogantes sobre el impacto que podrían tener las decisiones metodológicas en los resultados del análisis.

“¿Se podría estudiar si el cambio en las fórmulas de búsqueda y palabras clave influye en la definición de los tópicos? Y también, ¿es factible realizar este tipo de análisis considerando artículos completos en lugar de solo resúmenes?”, consultó.

La Dra. Portilla explicó que ambos aspectos fueron considerados en su investigación. “Sí evaluamos ese efecto. Al inicio probamos sin filtrar palabras clave y observamos que términos como ‘dengue’ dominaban los resultados, dificultando la identificación de otros temas. Por eso, ajustamos la ecuación de búsqueda para lograr una mejor separación de tópicos”, precisó.

Sobre el uso de textos completos, añadió que “lo consideramos, pero nos encontramos con la limitación del acceso a artículos no abiertos. Al trabajar solo con resúmenes evitamos perder documentos relevantes. No obstante, es una línea posible, aunque requiere desarrollar estrategias para procesar archivos completos como PDF o HTML”.

Proyección y aporte académico

La expositora destacó que estas herramientas son replicables en diversas áreas del conocimiento, desde salud hasta educación y análisis de medios. Aseguró que su uso permite generar procesos más eficientes, reproducibles y basados en evidencia.

Esta actividad forma parte del ciclo de seminarios organizados por el IMFE, iniciativa que busca fortalecer la formación en análisis de datos y promover el intercambio académico internacional.

Compartir