Mapeando el viaje de quienes buscan: una inmersión técnica.


Abstract digital globe with green swirls and data points, representing global connectivity and data visualization.

Visión general

Con un enfoque en la evangelización, CV tiene una profunda pasión por comprender los viajes de fe de personas en todo el mundo que responden a nuestras iniciativas evangelísticas. En esta inmersión técnica profunda, lo guiamos a través de las técnicas de IA y las prácticas de ingeniería de datos (data engineering) que utilizamos para convertir más de 1,000 testimonios sin procesar —de quienes buscan respuestas sobre la vida— en un conjunto de datos estructurado que ofrece información sobre los caminos típicos hacia la fe, actualmente utilizados para informar parte de nuestro trabajo de evangelismo local y digital.

Enfoque y metodología

1. Preparación de datos, estandarización y extracción de información

La tarea inicial fue obtener datos de testimonios de diversas fuentes dentro de nuestra organización y combinarlos en un único conjunto de datos. Estos testimonios anónimos llegan a CV por medio de mecanismos (informes) vinculados a nuestras iniciativas evangelísticas. Este proceso involucró una estandarización cuidadosa de campos —como el país de misión y el grupo de personas— asegurando que los datos estuvieran listos para un procesamiento avanzado. Esta fase crucial de pre-procesamiento se logró utilizando bibliotecas de Python para la manipulación de datos.

Además, un aspecto clave de esta fase fue la extracción de información específica relacionada con la participación de los medios digitales en los eventos que cambiaron la vida de las personas en busca de la fe (seekers). Utilizamos un modelo LLaMA 2 alojado localmente, ejecutado en hardware Mac M-series, para identificar y extraer los nombres de las plataformas digitales mencionadas, como Facebook, WhatsApp y Teléfono, que posteriormente se estandarizaron en todo el conjunto de datos para garantizar la uniformidad.

2. Resumen con IA generativa

A cada testimonio se le asignó un identificador único. Utilizando el Mixtral 7x8B —un modelo de lenguaje de última generación alojado en un servidor seguro— empleamos IA generativa para resumir cada testimonio. El objetivo era destilar narrativas complejas y no estructuradas en resúmenes concisos que resaltaran los eventos clave que cambiaron la vida. Se aplicaron técnicas modernas de ingeniería de prompts para lograr los resúmenes más precisos y perspicaces. Una parte de estos resúmenes se sometió a una validación manual para garantizar que los resultados de la IA fueran tanto confiables como significativos.

3. Identificación de eventos mediante modelos temáticos

Los eventos clave resumidos de todos los testimonios se agruparon por similitud semántica. Se utilizó un algoritmo de última generación llamado “fast clustering” (agrupación rápida), que agrupaba eficazmente los resúmenes de sucesos similares, aunque estuvieran redactados de forma diferente. Este paso fue fundamental para identificar patrones comunes en todos los testimonios. Utilizamos el modelado temático, que consiste básicamente en analizar cada grupo (con ayuda de la IA) y asignarles nombres de acontecimientos únicos y significativos, como «Encuentro con el Evangelio», «Bautismo», «Discipulado», entre otros; cada una de los cuales representa un hito en el camino de fe de la persona que buscas respuestas a situaciones de la vida cotidiana (seekers).

4. Clasificación y etiquetado de eventos con IA

Con un inventario de eventos categorizados, el mismo modelo de IA utilizado para el resumen se empleó para clasificar y etiquetar cada punto en el resumen con el nombre de un evento apropiado—un proceso conocido como clasificación de temas (asignando etiquetas a diferentes secciones de texto basadas en su contenido). Nuevamente, se utilizaron técnicas modernas de ingeniería de prompts para garantizar que el etiquetado fuera preciso y contextualmente apropiado. La validación manual y la corrección de estas etiquetas mejoraron aún más la calidad del conjunto de datos.

5. Visualización y análisis

La culminación de este proceso fue un conjunto de datos curado, estructurado en formato CSV, que incluía identificadores de testimonios, países, grupos de personas, información de plataformas digitales y una lista secuenciada de eventos que cambiaron la vida para cada testimonio. Para dar vida a estos datos, utilizamos Power BI (una herramienta para crear informes visuales y tableros) para realizar análisis visuales avanzados. Los eventos y sus transiciones se visualizaron utilizando diagramas de red y diagramas de flujo de secuencia (representaciones visuales que muestran las relaciones y el orden de los eventos), proporcionando una representación intuitiva y poderosa de las similitudes y aspectos únicos de cada viaje de fe.

Conclusión

Este enfoque no solo transformó testimonios sin procesar y no estructurados en un conjunto de datos estructurado y preciso, sino que también proporcionó una metodología escalable para futuros proyectos que involucren análisis de texto a gran escala, extracción de información y reconocimiento de patrones utilizando IA. El informe de Power BI a continuación proporciona una descripción general de algunas de las conclusiones de este trabajo.

(Solo disponible en inglés.)

 

Disponible solo en inglés.

Si desea contribuir a esta base de datos de testimonios, no dudes en ponerte en contacto con nosotros.
 

Para leer más acerca de este tema:

Artículo destacado

LLMs en evangelismo: Balance entre el riesgo y oportunidad