Los lectores se han hecho leer (también)

Ha llegado el momento de mi investigación en el que los cuestionamientos duros y las dificultades se apresuraron todas juntas. La base de datos inicial – la medusa – ha resultado un trabajo relativamente claro y simple de organizar. De hecho, es el esqueleto que va a sostener todo lo demás: los aparatos editorial y literario/periodístico de Orsai son en sí el lado autorial, pero ¿qué hay de los lectores?

¿Los lectores? Los lectores se han hecho escuchar leer (también).

Los nodos de las piezas que componen la base de datos se han multiplicado, al menos, por 100 en las respuestas de los lectores. En promedio cada una de las noventa y tantas entradas de blog en el periodo que cubro (septiembre de 2009 al presente) recibe 300 comentarios, las casi 200 piezas de la revista publicadas hasta ahora al rededor de 150 y los blogs “menores” entre 50 y 70. Sin hacer la matemática exacta estamos hablando de cualquier cosa entre 50 y 70 mil comentarios de los lectores. (Finalmente estoy viviendo en carne propia el término que se repite en todos los ensayos sobre Humanidades Digitales: large datasets). Es realmente impresionante que incluso en número de palabras cualquier texto de Orsai se multiplica exponencialmente en manos de los lectores. Alegremente esto confirma un punto clave de la parte teórica de la tesis: la cualidad orgánica de un texto en su contexto (en su comunidad para decirlo de forma menos cacofónica) es que un input mínimo produce un output mucho mayor. Para los que seguimos a Boyd, esto es, incluso, un aspecto que distingue el hecho de leer en sí.

Entonces el problema es cómo manejar todo esto para poder analizarlo. Tres opciones claras, aunque seguro se me están pasando otras. Si alguien tiene sugerencias son infinitamente bienvenidas.

1) Comentario por comentario a la base de datos tal y como está el esquema. Sus ventajas son claras, sería una especie de close reading que permitiría un nivel de detalle del análisis minucioso, como poder identificar, e incluso caracterizar, a algunos de los lectores casi como si se tratara de personajes; notar los matices de las intervenciones de los lectores, etc. Sus desventajas no hay ni que mencionarlas.

2) Hacer una clasificación breve de nodos tipo, no más de 20 tal vez, en las que acomode (si bien un poco arbitrariamente – ahí la prueba de que todo esto sigue siendo labor interpretativa) cada comentario. Por ejemplo: en una categoría todos los “pri”, “dos”, “tres” que siempre aparecen al principio, en otra los agradecimientos a los autores, en otra las correcciones de estilo, etc. Lo que se volvería visible aquí es la frecuencia con la que los lectores recurren al tipo de comentario en qué piezas. ¿Quién sabe? A lo mejor todos los tipos de comentarios están balanceados en cada pieza o, dependiendo del tema de la pieza, predomina alguno.

3) El distant reading – probablemente usando el NLTK de Python – para formar una base de datos paralela que pueda empalmarse a la medusa. Con esta metodología podría, por ejemplo, obtener buenas mediciones de la frecuencia con la que los comentarios “pri” aparecen y ver como se distribuyen a lo largo del corpus de Orsai, o qué tan común es que los lectores se dirijan a los autores a otros lectores, establecer palabras clave que denoten emociones despertadas en los lectores o formas en las que se relacionan con el proyecto en general, no sería tan complicado. Me atrae mucho probar esta metodología aunque el nivel de detalle puede no ser minucioso en el sentido en el que lo sería con la primera opción, el dataset es tan grande que la información que obtenga de este análisis dificilmente sería irrelevante. Desventajas: apenas estoy aprendiendo a usar Python.

Independientemente de con qué metodología termine hay dos cosas que me tienen fascinada – incluir el dataset enorme hace necesario poner el énfasis en las “manifestaciones” de los lectores, de ninguna forma aisladas de los textos primarios, sino al contrario casi como parte de ellos. Y dos, observar cómo se ha establecido la comunidad en términos textuales.

El esquema para el análisis de red

Esta semana, finalmente, dejé las teorías un poco de lado. Puse a dormir mi largo capítulo que cual célula está próximo a bipartirse. En vez de poner todo en el mismo saco, un capítulo tratará de narrativa en el contexto de teoría biocultural y el otro de narrativa en nuevos medios e intermedialidad.

El análisis de mi estudio de caso, Orsai, había sido por meses pospuesto. Hacer una base de datos relacional requiere sobre todo paciencia y un esquema lo más claro (im)posible. Con el lab más tranquilo de lo que nunca antes lo había visto, llegó la inspiración, así que empecé haciendo el esquema de análisis que está aquí abajo

Muchos de los términos que manejo son bastante amplios, por ejemplo, género dependiendo del medio en el que se publique la pieza puede referirse a “crónica narrativa” en la Revista o a la sección de “lectores” en el blog de la redacción de la Editorial. Esta clasificación la tomo prestada de la propia editorial y en sí, del sitio web repositorio de (casi) todo Orsai. Sistematizando los datos me he dado cuenta que su clasificación (y reclasificación, porque muchos textos han sido mudados de medio) tiene inconsistencias, lo cual lo hace más interesante todavía. Para organizar eso yo de otra forma voy a usar los temas. Aún dudo si tema será la palabra más adecuada; en sí la idea es de qué se trata algo o a qué se refiere (sobre todo busco cuando una pieza se refiere a otra pieza). Pieza también es poco restrictiva y, en el contexto intermedial de Orsai, se puede referir a una entrada de blog, a un tweet o a cualquiera de los artículos de la revista, incluidas las “entradas” y las “sobremesas”. La idea de no hacer diferencias muy tajantes entre las diferentes piezas es manejarlas en el nivel más básico de algo que se lee sin importar en dónde, en qué o su supuesto rigor literario, periodístico, ortográfico o lo que sea. Por otra parte, aunque también se leen, los comentarios se diferencian de las piezas en que los unos derivan de las otras. X pieza da lugar Y/Z comentarios. Etcétera.

La parte que involucra a los lectores y a sus comentarios va a ser la parte más difícil de sistematizar e introducir en la base de datos. Si consideramos que, en promedio, cada entrada de blog tiene doscientos comentarios y cada artículo de la revista unos sesenta, el número de entradas se multiplica y se multiplica. No sólo eso, dudo si todos los comentarios deben ser considerados como tales o si debe haber una subclasificación de ellos que dejen ver la diferencia entre los “pri”, “segundo”, “top ten” que abren la conversación en el blog y los que proponen, critican y glosan las piezas. Los primeros aunque no aportan mucho contenido, son claros indicadores de la comunidad de lectores y sus hábitos, los segundos tienen más contenido y bien pueden ser aislados buscar realmente una conversación con el autor o con los otros lectores. Tampoco he decidido si deberé clasificarlos como positivos, negativos, neutrales – la discusión se pone muy emocional en Orsai, debo decirles.

Ahora, por si toda la discusión teórica que va a ir antes del análisis de los datos no crea suficientes preguntas, la base de datos (lo puedo ver ya) va a obligar muchas otras. Entre las más obvias (estás las podrán ver desde el esquema) están:

¿Qué temas son los más recurrentes? ¿En qué medio se dan esos temas?

¿Qué piezas o qué género de piezas producen más comentarios? ¿Qué tipo de comentarios?

¿Qué tipo de conversación se da? ¿Lector/Autor? ¿Lector/Lector? ¿Cuántos lectores realmente están activos en la comunidad de Orsai?

¿Cuál ha sido el desarrollo de la comunidad? ¿Es más internacional, más local? ¿Ha ido cambiando con el tiempo?

Y finalmente ver si se comprueba mi (hipó)tesis de qué el éxito de Orsai es la construcción de su propia mitología a través de elementos metaficcionales presentes en distintos medios.

Continuará… (por varios meses)

Los números y las comunidades de lectores.

En los últimos días he estado recolectando datos duros sobre la cantidad de texto que se publica en redes sociales y plataformas de blog. Los número son impresionantes. A finales del año pasado Twitter anunció que había llegado a 250 millones de tuits por día: un total de 35 mil millones de caracteres. Asumiendo que, en promedio grande, una página tiene 3500 caracteres, el total de texto publicado en Twitter equivale a 10 millones de páginas o 20 mil libros de 500 páginas, escritos y leídos todos los días.

De forma similar, las estadísticas de WordPress señalan un total de casi 72 millones de sitios de WP en el mundo y 500 mil nuevos posts diarios. Corríjanme, por favor, si estoy equivocada: WP es la plataforma de blog más usada en el mundo y se estima que reúne algo menos de la mitad de los blogs existentes. Por lo tanto, la cantidad de texto publicado en blogs debe ser casi imposible de calcular, pero el resultado debe ser tan apabullante como el de Twitter.

Sobra decir que aunque toda esta información está disponible a uno parece imposible incluso pensarla. No solamente eso, se ha vuelto lugar común, demasiado común, el decir que el 99.9% es basura, como los virus y microbios que matan los jabones y desinfectantes. Desde luego un gran porcentaje, muy posiblemente la mayoría de todo ese texto sí será basura. No obstante, así se trate de una minúscula porción, habrá, sin duda, muchísimo material de valor. Por números nada más se ha vuelto imposible ignorarlo y descartarlo como basura o, en el mejor de los casos, como la proverbial aguja en el pajar. Desde luego al no haber un sistema editorial – un filtro que decida lo que es digno de leerse y lo que no contamos únicamente con los instintos propios, o eso parecería. Ya lo dijo K. Fitzpatrick en el contexto académico, el reconocimiento proviene ahora desde la recepción de una comunidad de lectores. Exactamente lo mismo ocurre con la literatura publicada en Internet.

Esta cuestión de la formación de comunidades de lectores es lo que realmente me intriga actualmente. Las redes sociales, sin duda juegan un papel fundamental para dibujar las líneas que unen un texto en particular con sus lectores y a ellos con otros lectores y con otros textos y los lectores de éstos. Eso ya también se está volviendo lugar común: el poder de las redes sociales para formar comunidades, pero ellas son, a mi parecer, las calles del vecindario por donde pasamos todos los vecinos – lo cual no siempre causa que sepamos siquiera nuestros nombre, mucho menos que nos consideremos parte de una comunidad. Debe entonces de haber no solamente una cuestión comunicativa: un poder intercambiar opiniones, sino un querer hacerlo. Una voluntad de formar parte de una comunidad, una socialidad, me van a perdonar la expresión, muy animal – es decir muy primaria. Aquí está el meollo.