Signa_Lab ITESO comparte sus cuadernos
Detalle BN6
- Inicio
- Signa_Lab ITESO comparte sus cuadernos
![Thumbnail](/documents/107335/9502115/ITESO_VictorHugoAbregoPalomaLopezPortilloyEduardoGarciadeQuevedo2.jpg/967e9b5e-27fd-36e6-fb57-8b706d70d3d1)
Signa_Lab ITESO comparte sus cuadernos
El laboratorio de investigación, producción y desarrollo sociodigital del ITESO ha publicado tres materiales que permiten recopilar, procesar y analizar grandes cantidades de información para generar análisis cualitativos y producir visualizaciones de estos.
Édgar Velasco
Imaginemos que estamos ante un proyecto, cualquier proyecto, que implica procesar grandes cantidades de información. Muy grandes y, además, desorganizadas. Imaginemos que queremos, por ejemplo, encontrar términos que se repiten para luego analizar cómo se vinculan. Algo que hace muy bien, por ejemplo, el ya cotidiano ChatGPT. Algo que, por cierto, no sabemos cómo hace, porque maneja un código cerrado y, además, habría que darle toda esa información. Y, por otra parte, tampoco sabemos programar. ¿Y si hubiera una guía que permitiera cargar toda esa información a una plataforma transparente, de código abierto, y que guiara al usuario por los rudimentos de la programación para adaptar su uso a sus necesidades? Eso es, precisamente, lo que ha diseñado Signa_Lab ITESO con sus Cuadernos de procesamiento y análisis de información con inteligencia artificial.
Todo comenzó cuando Signa_Lab ITESO fue elegido por el Instituto Nacional Electoral (INE) para procesar las preguntas que se usarían en el primer debate entre las y el candidato a la Presidencia de México en el proceso electoral de 2024. O no exactamente, porque desde antes venían trabajando en el desarrollo de estas guías. Diego Arredondo, coordinador de Desarrollo Tecnológico y Documentación del laboratorio, explica que desde antes ya venían explorando la posibilidad de “hacer una inmersión en construir herramientas de inteligencia artificial. Cuando se presentó la oportunidad de trabajar con el INE ya habíamos avanzado en el desarrollo”. Paloma López Portillo, académica del Departamento de Estudios Socioculturales (Deso) y coordinadora general de Signa_Lab ITESO, explica que en esa ocasión el laboratorio recibió 24 mil preguntas, que habían sido recabadas por el instituto a través de las redes sociales. “Realizamos un proceso iterativo, en el que dimos varias pasadas a las preguntas para organizar toda la información”, añade.
Víctor Hugo Ábrego, también académico del Deso y coordinador ejecutivo de Signa_Lab ITESO, dice que en ese proceso de sistematización de la información surgió una de las herramientas más valiosas de los cuadernos: la posibilidad de generar diccionarios. “Estos diccionarios permiten orientar los análisis y las búsquedas, para organizar la información y realizar consultas semánticas a partir de términos y palabras que sean de interés para la investigación, o también para descartar las que no”. Eduardo García de Quevedo, responsable técnico del equipo, agrega que, en su conjunto, los cuadernos “son herramientas muy amplias que permiten organizar, analizar y categorizar para entender cómo se relacionan las palabras y qué discursos se pueden identificar”.
Cuadernos, en plural. Y secuenciales: el primero de ellos permite cargar, limpiar y depurar la información; el segundo enseña a generar embeddings y la “clusterización” —en castellano: muestra cómo producir visualizaciones interactivas y organizar la información en campos semánticos adaptados a las necesidades de la persona investigadora—, y el tercero permite realizar consultas específicas a partir de los diccionarios creados para cada caso y recibir respuestas —como con ChatGPT, pero mejor. ¿Por qué mejor? Porque todo ocurre de manera transparente a través de una plataforma de código abierto—. Con un mucho de razón y otro tanto de poesía, Víctor Hugo Ábrego lo resume así: “Los cuadernos amplían la capacidad de sistematizar el hallazgo y crear geografías de la memoria para entenderla y habitarla”.
La transparencia del proyecto no se queda en el espacio digital, sino que también permea en el ánimo del equipo de Signa_Lab ITESO. Por eso, señalan que, al igual que ocurre con cualquier inteligencia artificial, el desarrollo que han realizado no está exento de sesgos porque, dice Arredondo, “todos los modelos del lenguaje los tienen, son parte del proceso”. Sin embargo dice que a diferencia de lo que ocurre con plataformas como ChatGPT en este caso buscaron un modelo que permitiera “poner al centro [del desarrollo tecnológico] la agencia humana, que permita tener claro qué queremos hacer y para qué”.
Este proyecto del laboratorio se inscribe en una historia de trabajo que no se limita a la recopilación, análisis e interpretación de la información, sino que también busca desarrollar herramientas y tecnología para realizar esas tareas, un trabajo que se realiza en diálogo permanente y del que forman parte primordial las y los estudiantes del ITESO. En el caso de los cuadernos, el equipo de Signa_Lab ITESO contó con el trabajo de José Luis Almendárez, que cursaba la carrera de Ingeniería y Ciencia de Datos, y de Javier de la Torre Silva, de Ingeniería en Sistemas Computacionales.
En la era en que todo se aprende por TikTok y YouTube —“todos somos hijos del tutorial”, dice Víctor Hugo Ábrego—, los Cuadernos de procesamiento y análisis de información con inteligencia artificial pretenden ser eso: un tutorial que guíe paso a paso a cualquier persona interesada en procesar, sistematizar, analizar y visualizar grandes, muy grandes, cantidades de información. ¿Cómo? Ya lo dice una vieja consigna: “Hágalo usted mismo”, aquí están los cuadernos: http://github.com/signalab/generador-embeddings/.
Noticia
Humanidades
signa_lab iteso