formatos

En el seminario de historia digital del que participamos varixs integrantes de este proyecto tuvimos una clase práctica en la que Facundo Iturburu contó y mostró cómo hizo un tutorial de The Programming Historian (español). Ese tutorial ( Visualización y animación de tablas históricas con R) lo escribió Marcelo Raimundo, a quien invitamos a participar de la reunión. Teníamos entonces una situación de auto-aprendizaje puesta a consideración de un grupo de estudiantes y docentes universitarios, reunidos por video-conferencia por la pandemia de Covid-19, y del autor del tutorial.

Asistíamos, en otro plano, al relato documentado de un aprendizaje de un historiador que tiene como fuentes primarias, en su investigación, sentencias de tribunales de trabajo de mediados del siglo XX, que seguía los pasos de un artículo que trataba con fuentes policiales de un período cercano (1959). Facundo utiliza bases de datos relacionales y formularios de Microsoft Access para cargar sus datos, y Marcelo Raimundo utiliza R para cargar e interpretar datos tabulados de sus fuentes escritas y digitalizadas.

El paso de datos hallados en fuentes históricas a formatos digitales no es un mecanismo, es más bien un conjunto de desafíos que la conversación en esa clase fue tratando de advertir y pensar. Bases de datos relacionales, bases de datos jerárquicas, texto separado por comas, codificaciones, importaciones, cargas, conversiones, uso de interfases gráficas y línea de comando, cuadros de doble entrada, dataframes, vectores, etc. Hay muchas palabras que indican procedimientos con objetos relacionados con información o datos. «Formato» es una palabra que remite a la cultura escrita y al mundo de los impresos pero en las constelaciones digitales posee variaciones sutiles, que se desplazan todavía más por las lenguas y los lenguajes. Formatear, parsear, mapear, transformar, convertir, (de)codificar: voces que se acercan y se rechazan en las muchas dimensiones del «cacharreo» en el escritorio de trabajo de la investigación social.

Mi pregunta, la pregunta que quiero dejar anotada, es la siguiente. La decisión de «quedarse» con lenguajes de programación (R o Python, digamos), con aplicaciones (Gephi, Voyant Tools, Mallet), con bibliotecas de R o Python (Tidyverse, Pandas) no parece ser muy relevante en los relatos de autoaprendizaje. Es lógico: se decide sobre lo que no se conoce mucho, se decide para comenzar el ascenso en una larga curva de aprendizaje. Pero mi pregunta es si el formato de nuestras herramientas (dataframes, tablas y relaciones, filtros y agrupamientos y queries) nos define (determina) el mundo en el que disponemos y representamos los datos. Si alguien que usa matrices de viejo estilo entiende una partida de tetris de un modo distinto a quien utiliza numpy. Pregunto porque luego debo comprender si al utilizar listas y tablas para clasificar eventos de una conflictividad social tomados de una lista hecha por la policía, no estoy «comprando» dos maneras de comprender el mundo, sin ponerlas en discusión. Dos arquetipos para comprender esto: el medio es el mensaje o la pantalla de matrix.

El binomio ‘forma/contenido’ se nos presenta bastante seguido. En algunos casos se muestra como variación de otros tándems (‘pensamiento/acción’, ‘virtual/actual’), y en otros lo podemos percibir como capa de sentido (como pasa con el texto de Roland Barthes, «El mito hoy», con los discos físicos y lógicos en una PC, o como le pasa a quien trabaja con dos monitores, o a quien puede jugar ajedrez a ciegas). ¿Los datos son una cosa y otra cosa son los formatos? Una vez que hemos aceptado un no como respuesta a esa pregunta, ¿realmente creemos que la tipografía o las ediciones de las obras de Walter Scott deben ser parte de la historia de esos textos (aunque un sí como respuesta nos obligue a enfrentar el uso común del término «metadatos»)? ¿nos declaramos creyentes de la dialéctica forma/contenido pero alimentamos el fueguito de la Cosa? Mencioné a Walter Scott porque se sabe que era popular y legítimo (véase un gráfico de F. Moretti en uno los increíbles panfletos de su laboratorio) pero también porque las ediciones de sus obras completas cambiaron rotundamente la manera de leerlo (hay una prueba -una de los pocas- en la historia del libro y la lectura que confirma que la materialidad del libro merece ser analizada y tiene a W. Scott como protagonista). Pero si pensamos en el procesador de texto o en el buscador que usamos en nuestros escritorios, tal vez no terminemos de convencernos de la importancia de los formatos en la interpretación humanística.

Para algunas personas, el microsoft word (su versión 2.0) cambió completamente la forma de percibir el texto, que pasó de visualizarse como una hoja en blanco a ser concebido como un conjunto de párrafos. ¿Fue así como lo percibimos? M. kirschenbaum investigó las ideas que muchos intelectuales tenían sobre este asunto. Las metáforas y asociaciones en ese libro expresan mucho, porque no parece que existan muchos modos además del afectivo para relacionarse con las interfases (exitosas).

Pero ¿qué pasa con el poder clasificatorio en los procedimientos de intercambio de datos? Lo pregunto porque esta reflexión puede comenzar con guiños al mundo del arte pero debe terminar también ahí: no hay mucho que se pueda hacer con las 300 dimensiones de cada registro del dataset Word2Vec si no es a través de visualizaciones, a través del uso de gráficos para «leer» la información. Con el tiempo, arriesgo, la forma de los datos termina siendo la forma en que los vemos, y siempre podremos decir que es destino o aberración, pero ya es tarde, ya hemos decidido cuál programa utilizar, ya no hay tiempo para estudiar otros, tal vez ni siquiera podamos «ver» el cono de sombra de la elección.