Los lectores se han hecho leer (también)

Ha llegado el momento de mi investigación en el que los cuestionamientos duros y las dificultades se apresuraron todas juntas. La base de datos inicial – la medusa – ha resultado un trabajo relativamente claro y simple de organizar. De hecho, es el esqueleto que va a sostener todo lo demás: los aparatos editorial y literario/periodístico de Orsai son en sí el lado autorial, pero ¿qué hay de los lectores?

¿Los lectores? Los lectores se han hecho escuchar leer (también).

Los nodos de las piezas que componen la base de datos se han multiplicado, al menos, por 100 en las respuestas de los lectores. En promedio cada una de las noventa y tantas entradas de blog en el periodo que cubro (septiembre de 2009 al presente) recibe 300 comentarios, las casi 200 piezas de la revista publicadas hasta ahora al rededor de 150 y los blogs “menores” entre 50 y 70. Sin hacer la matemática exacta estamos hablando de cualquier cosa entre 50 y 70 mil comentarios de los lectores. (Finalmente estoy viviendo en carne propia el término que se repite en todos los ensayos sobre Humanidades Digitales: large datasets). Es realmente impresionante que incluso en número de palabras cualquier texto de Orsai se multiplica exponencialmente en manos de los lectores. Alegremente esto confirma un punto clave de la parte teórica de la tesis: la cualidad orgánica de un texto en su contexto (en su comunidad para decirlo de forma menos cacofónica) es que un input mínimo produce un output mucho mayor. Para los que seguimos a Boyd, esto es, incluso, un aspecto que distingue el hecho de leer en sí.

Entonces el problema es cómo manejar todo esto para poder analizarlo. Tres opciones claras, aunque seguro se me están pasando otras. Si alguien tiene sugerencias son infinitamente bienvenidas.

1) Comentario por comentario a la base de datos tal y como está el esquema. Sus ventajas son claras, sería una especie de close reading que permitiría un nivel de detalle del análisis minucioso, como poder identificar, e incluso caracterizar, a algunos de los lectores casi como si se tratara de personajes; notar los matices de las intervenciones de los lectores, etc. Sus desventajas no hay ni que mencionarlas.

2) Hacer una clasificación breve de nodos tipo, no más de 20 tal vez, en las que acomode (si bien un poco arbitrariamente – ahí la prueba de que todo esto sigue siendo labor interpretativa) cada comentario. Por ejemplo: en una categoría todos los “pri”, “dos”, “tres” que siempre aparecen al principio, en otra los agradecimientos a los autores, en otra las correcciones de estilo, etc. Lo que se volvería visible aquí es la frecuencia con la que los lectores recurren al tipo de comentario en qué piezas. ¿Quién sabe? A lo mejor todos los tipos de comentarios están balanceados en cada pieza o, dependiendo del tema de la pieza, predomina alguno.

3) El distant reading – probablemente usando el NLTK de Python – para formar una base de datos paralela que pueda empalmarse a la medusa. Con esta metodología podría, por ejemplo, obtener buenas mediciones de la frecuencia con la que los comentarios “pri” aparecen y ver como se distribuyen a lo largo del corpus de Orsai, o qué tan común es que los lectores se dirijan a los autores a otros lectores, establecer palabras clave que denoten emociones despertadas en los lectores o formas en las que se relacionan con el proyecto en general, no sería tan complicado. Me atrae mucho probar esta metodología aunque el nivel de detalle puede no ser minucioso en el sentido en el que lo sería con la primera opción, el dataset es tan grande que la información que obtenga de este análisis dificilmente sería irrelevante. Desventajas: apenas estoy aprendiendo a usar Python.

Independientemente de con qué metodología termine hay dos cosas que me tienen fascinada – incluir el dataset enorme hace necesario poner el énfasis en las “manifestaciones” de los lectores, de ninguna forma aisladas de los textos primarios, sino al contrario casi como parte de ellos. Y dos, observar cómo se ha establecido la comunidad en términos textuales.

La pequeña medusa

Esta es la pequeña medusa de información que salió de mis primeros esfuerzos picando datos.

 

Todavía no está anotada ni filtrada de ninguna forma, pero hay dos cosas que se ven ya muy obviamente. En primer lugar la separación clara de la mano editorial (lado derecho) y de los artículos de la revista (lado izquierdo). Aunque siempre he tenido la impresión de que estaban completamenten entrecruzados, no es descabellado decir que pertenecen, en gran medida, a diferentes ámbitos y que, a partir de aquí muy claramente tienen un peso análogo. En segundo lugar, notaran dos nodos color azul que sobresalen por encima de casi todos los otros. Se trata nada más ni nada menos que del editor/autor Hernán Casciari y su jefe de redacción Chiri (Christian) Basilis. Nunca hubo duda de que el trabajo de estos dos personajes ha sido el motor de Orsai desde el inicio, lo que es interesante es ver la forma en la que sirven de puente entre el “mundo Orsai” y la nube de la izquiera que es el contenido “duro” de la revista. El extremo de la derecha, la colita de la medusa es el nuevo aparato bloguístico que introdujeron Casciari y Basilis para reportar lo que sucede en todos los frentes de Orsai (revista, bar, blog). Todos los puntitos verdes son las piezas varias, los rojos son los géneros y los amarillos son los medios (Orsai 1, Orsai 2, Blog, etc).

Los dos siguientes pasos van a ser cruciales. Primero hacer una tipificación de todas la piezas de acuerdo a su tema (término que sigue en debate). Donde espero encontrar que un tema muy recurrente será otras piezas, otros medios y los propios autores. El último y más preocupante es ver dónde se ha formado la comunidad de lectores ¿más al rededor de la nube de contenido duro de la revista? o ¿más del lado del mundo Orsai? Yo creo que va a ser esto último.