Mapeando a jornada dos que buscam sua fé: Um mergulho técnico profundo


Abstract digital globe with green swirls and data points, representing global connectivity and data visualization.

Visão geral

Com foco em evangelismo, a CV é profundamente apaixonada por entender as jornadas de fé de pessoas em todo o mundo que respondem às nossas iniciativas evangelísticas.

Neste mergulho técnico profundo, vamos conduzir você através das técnicas de IA e práticas de engenharia de dados que usamos para converter mais de 1.000 testemunhos brutos de seekers em um conjunto de dados estruturado que oferece insights sobre caminhos típicos para a fé, atualmente usados ​​para informar alguns de nossos trabalhos de evangelismo local e digital.

Abordagem e metodologia

1. Preparação de dados, padronização e extração de informações

A tarefa inicial era obter dados de depoimentos de várias fontes diferentes dentro de nossa organização e combiná-los em um único conjunto de dados. Esses depoimentos anônimos chegam até a CV por meio de mecanismos de relatórios vinculados às nossas iniciativas evangelísticas. Esse processo envolveu a padronização cuidadosa de campos como o país da missão e o grupo de pessoas, garantindo que os dados estivessem prontos para processamento avançado. Essa fase crucial de pré-processamento foi realizada usando bibliotecas Python para manipulação de dados.

Além disso, um aspecto fundamental dessa fase foi a extração de informações específicas sobre o envolvimento da mídia digital nos eventos transformadores da vida de um seeker, alguém em busca de respostas. Utilizamos um modelo LLaMA 2 hospedado localmente, em execução no hardware Mac série M, para identificar e extrair os nomes das plataformas digitais mencionadas, como Facebook, WhatsApp e Phone, que foram posteriormente padronizadas no conjunto de dados para garantir uniformidade.

2. Resumo com IA generativa

Cada depoimento recebeu então um identificador exclusivo. Usando o Mixtral 7x8B, um modelo de ampla linguagem de última geração hospedado em um servidor seguro. Empregamos IA generativa para resumir cada testemunho. O objetivo era destilar narrativas complexas e não estruturadas em resumos concisos que destacassem eventos-chave que mudassem a vida. Técnicas modernas de engenharia de prompt foram aplicadas para obter os resumos mais precisos e perspicazes. Uma parte desses resumos passou por validação manual para garantir que as saídas da IA ​​fossem confiáveis ​​e significativas.

3. Identificando eventos usando modelagem de tópicos

Os principais eventos resumidos em todos os depoimentos foram agrupados com base na similaridade semântica. Usamos um algoritmo de última geração chamado agrupamento rápido, que agrupou com eficiência resumos de eventos semelhantes, mesmo que redigidos de forma diferente. Esta etapa foi fundamental para identificar padrões comuns de eventos em todos os depoimentos. Usamos modelagem de tópicos, que é basicamente analisar cada cluster (auxiliado por IA) e atribuir nomes de eventos exclusivos e significativos a eles, como "Encontrei o Evangelho", "Batismo", "Discipulado" etc., cada um representando um marco na jornada de fé do buscador.

4. Classificação e marcação de eventos com IA

Com um inventário de eventos categorizados, o mesmo modelo de IA usado para resumo foi empregado para classificar e marcar cada ponto de resumo com o nome de evento apropriado — um processo conhecido como classificação de tópicos (atribuindo rótulos a diferentes seções de texto com base em seu conteúdo). Novamente, técnicas modernas de engenharia de prompt foram usadas para garantir que a marcação fosse precisa e contextualmente apropriada. A validação e correção manual dessas tags melhoraram ainda mais a qualidade do conjunto de dados.

5. Visualização e Análise

O ponto culminante desse processo foi um conjunto de dados com curadoria, estruturado em formato CSV, que incluía IDs de depoimentos, países, grupos de pessoas, informações de plataforma digital e uma lista sequenciada de eventos transformadores de vida para cada depoimento.

O ponto culminante desse processo foi um conjunto de dados com curadoria, estruturado em formato CSV, que incluía IDs de testemunhos, países, grupos de pessoas, informações de plataforma digital e uma lista sequenciada de eventos transformadores de vida para cada testemunho. Para dar vida a esses dados, utilizamos o Power BI para executar análises visuais avançadas. Os eventos e suas transições foram visualizados usando diagramas de rede e fluxogramas de sequência, fornecendo uma representação intuitiva e poderosa das semelhanças e aspectos únicos de cada jornada de fé.

Conclusão

Essa abordagem não apenas transformou depoimentos brutos e não estruturados em um conjunto de dados estruturado e preciso, mas também forneceu uma metodologia escalável para projetos futuros envolvendo análise de texto em larga escala, extração de informações e reconhecimento de padrões usando IA. O relatório do Power BI abaixo fornece uma visão geral de algumas das conclusões deste trabalho.

(Conteúdo apenas em inglês.)

Se você deseja contribuir para esta base de dados de testemunhos, por favor entre em contato. 

Para ler mais, acesse:

Artigo de destaque

LLMs no Evangelismo: Equilibrando Riscos e Oportunidades