Cuerpo, escritura y género. Marcadores para el análisis digital de textos
RESULTADO DE INVESTIGACIÓN: Proyecto: “Educación, Escritura y Género en la Nueva España” – Instituto de Investigaciones sobre la Universidad y la Educación, Facultad de Filosofía y Letras FFyL, Universidad Nacional Autónoma de México UNAM, México D.F., México
Reseña*
Nuestra propuesta es utilizar una metodología desarrollada en el ámbito del cómputo, para aplicarla en la investigación en las humanidades.
En este sentido, el proyecto parte de una pregunta de investigación propia de las humanidades: ¿cuáles son las diferencias de género en el discurso sobre el cuerpo de hombres y mujeres en el mundo novohispano?
Y a ella buscamos responder generando marcadores XML (tags), sobre la base del sistema TEI Lite de la Text Encoding Iniciative (un estándar utilizado por la comunidad de investigación en humanidades digitales), para identificar, interpretar y recuperar automáticamente, al procesar digitalmente los documentos, las variantes de género en el discurso sobre el cuerpo en obras novohispanas.
Nuestro corpus de investigación está formado por dos colecciones académicas ya establecidas y en crecimiento: una sobre la escritura de las mujeres, desarrollada por el Seminario de escritos de Mujeres del Instituto de Investigaciones Sobre la Universidad y la Educación de la UNAM, y otra de textos astrológico/astronómicos escritos por hombres, desarrollado por la Biblioteca Digital del Pensamiento Novohispano, un proyecto de la Facultad de Filosofía y Letras de la UNAM, que en conjunto conforman un fondo inicial de 20 obras para su marcado y su estudio.
El desarrollo del proyecto contempla cuatro etapas fundamentales. La primera es la generación de los marcadores con los cuales identificar en los textos las variantes de género en el discurso sobre el cuerpo. La segunda consiste, propiamente, en el marcado de los textos con las categorías creadas. En la tercera, los textos maracados son procesados para indexar automáticamente: a) Los pasajes en que se habla del cuerpo por género, b) Los términos de la retórica sobre el cuerpo por género y c) las partes del cuerpo a las que cada género alude.
Finalmente, en la última etapa se sistematiza la información obtenida y se identifican los hallazgos tanto cualitativos como cuantitativos, relativos a la ocurrencia de ciertos términos. Los resultados obtenidos se presentaran en artículos individuales a lo largo del proyecto, y en la elaboración de un libro colectivo en la etapa final del mismo.
La hipótesis general del proyecto es que la generación de marcas adecuadas y el procesamiento digital de los textos, ofrecen datos fundamentales para investigar en humanidades, pero sobre todo, permiten ampliar los propósitos y las dimensiones del campo de estudio y búsqueda, que las técnicas tradicionales de lectura de textos, no permitirían. En este sentido, para el caso de nuestra investigación, la creación de marcas para distinguir las diferencias entre las retoricas masculinas y femeninas sobre el cuerpo humano en los siglos XVI al XVIII, harán posible manejar un conjunto de cuerpos textuales amplios, que de otra forma difícilmente podríamos trabajar.
*Universidad Nacional Autónoma de México (UNAM) @epriani / Clara Inés Ramírez González - Coordinadora General del Archivo Histórico de la Universidad Nacional Autónoma de México – AHUNAM / ahunam_iisue@unam.mx