Los lectores se han hecho leer (también)

Ha llegado el momento de mi investigación en el que los cuestionamientos duros y las dificultades se apresuraron todas juntas. La base de datos inicial – la medusa – ha resultado un trabajo relativamente claro y simple de organizar. De hecho, es el esqueleto que va a sostener todo lo demás: los aparatos editorial y literario/periodístico de Orsai son en sí el lado autorial, pero ¿qué hay de los lectores?

¿Los lectores? Los lectores se han hecho escuchar leer (también).

Los nodos de las piezas que componen la base de datos se han multiplicado, al menos, por 100 en las respuestas de los lectores. En promedio cada una de las noventa y tantas entradas de blog en el periodo que cubro (septiembre de 2009 al presente) recibe 300 comentarios, las casi 200 piezas de la revista publicadas hasta ahora al rededor de 150 y los blogs “menores” entre 50 y 70. Sin hacer la matemática exacta estamos hablando de cualquier cosa entre 50 y 70 mil comentarios de los lectores. (Finalmente estoy viviendo en carne propia el término que se repite en todos los ensayos sobre Humanidades Digitales: large datasets). Es realmente impresionante que incluso en número de palabras cualquier texto de Orsai se multiplica exponencialmente en manos de los lectores. Alegremente esto confirma un punto clave de la parte teórica de la tesis: la cualidad orgánica de un texto en su contexto (en su comunidad para decirlo de forma menos cacofónica) es que un input mínimo produce un output mucho mayor. Para los que seguimos a Boyd, esto es, incluso, un aspecto que distingue el hecho de leer en sí.

Entonces el problema es cómo manejar todo esto para poder analizarlo. Tres opciones claras, aunque seguro se me están pasando otras. Si alguien tiene sugerencias son infinitamente bienvenidas.

1) Comentario por comentario a la base de datos tal y como está el esquema. Sus ventajas son claras, sería una especie de close reading que permitiría un nivel de detalle del análisis minucioso, como poder identificar, e incluso caracterizar, a algunos de los lectores casi como si se tratara de personajes; notar los matices de las intervenciones de los lectores, etc. Sus desventajas no hay ni que mencionarlas.

2) Hacer una clasificación breve de nodos tipo, no más de 20 tal vez, en las que acomode (si bien un poco arbitrariamente – ahí la prueba de que todo esto sigue siendo labor interpretativa) cada comentario. Por ejemplo: en una categoría todos los “pri”, “dos”, “tres” que siempre aparecen al principio, en otra los agradecimientos a los autores, en otra las correcciones de estilo, etc. Lo que se volvería visible aquí es la frecuencia con la que los lectores recurren al tipo de comentario en qué piezas. ¿Quién sabe? A lo mejor todos los tipos de comentarios están balanceados en cada pieza o, dependiendo del tema de la pieza, predomina alguno.

3) El distant reading – probablemente usando el NLTK de Python – para formar una base de datos paralela que pueda empalmarse a la medusa. Con esta metodología podría, por ejemplo, obtener buenas mediciones de la frecuencia con la que los comentarios “pri” aparecen y ver como se distribuyen a lo largo del corpus de Orsai, o qué tan común es que los lectores se dirijan a los autores a otros lectores, establecer palabras clave que denoten emociones despertadas en los lectores o formas en las que se relacionan con el proyecto en general, no sería tan complicado. Me atrae mucho probar esta metodología aunque el nivel de detalle puede no ser minucioso en el sentido en el que lo sería con la primera opción, el dataset es tan grande que la información que obtenga de este análisis dificilmente sería irrelevante. Desventajas: apenas estoy aprendiendo a usar Python.

Independientemente de con qué metodología termine hay dos cosas que me tienen fascinada – incluir el dataset enorme hace necesario poner el énfasis en las “manifestaciones” de los lectores, de ninguna forma aisladas de los textos primarios, sino al contrario casi como parte de ellos. Y dos, observar cómo se ha establecido la comunidad en términos textuales.

Historias de lectura

Me parece bastante lógico comenzar este blog hablando sobre dos libros que hasta el momento han sentado la base (la preliminar de preliminares) de cómo entiendo la lectura. A History of Reading de Alberto Manguel y Proust and the Squid de Maryanne Wolf. Para quienes no los conozcan, Manguel además de académico, fue de adolescente lector de Borges, después de un encuentro en la librería Pygmalion en Buenos Aires; Maryanne Wolf es investigadora de desarrollo infantil en la universidad de Tufts y se ha dedicado con especial interés al estudio de la dislexia. Ambos autores, esto ha sido lo que más me ha atraído de sus textos, abordan la lectura panorámicamente, si bien cada uno desde perspectivas únicas.

Temprano en su libro Manguel se maravilla con el proceso histórico mediante el cual la humanidad aprendió a leer. A partir los mismos códices y las tablillas de barro de Tell Brak y, más adelante, de pinturas y esculturas de personajes leyendo, el autor nos lleva de la mano (su prosa, de hecho, sí es muy cálida) por momentos paradigmáticos en la historia de la lectura, uno de mis favoritos, el primer registro escrito de un lector silencioso, San Ambrosio, quien produjo tanto asombro en su maestro, San Agustín, que lo llevó a escribir sobre él. La invención de la imprenta y la popularización de la lectura pasa desapercibida a Manguel, sobre todo en tanto dio lugar a una lectura privada, ya no sólo privada porque se realiza en silencio – en la propia cabeza – sino también en un espacio cerrado y privado. En oposición a esto, el autor argentino pasa páginas fascinándonos con sus experiencias con la lectura en voz alta: el que nos lean y leer para alguien más. Las tecnologías de lectura y edición están presentes en su historia de la lectura como un recordatorio de la incomodidad que pasé los cuatro años de licenciatura en los que leí casi exclusivamente fotocopias, de los placeres de hojear un libro nuevo, con olor a nuevo, de los años que he usado lentes y me ha inculcado la curiosidad de saber si algunas de las piezas de mobiliario diseñadas exclusivamente para leer tienen alguna ventaja de la misma forma en la que me pregunto si comprar un i-pad haría más sencillas mis lecturas en pantalla.

Curiosamente – o tal vez, obviamente – Maryanne Wolf también comienza su discusión de la lectura con las tablillas de barro de Tell Brak. Aunque para ella también es un hito histórico de la humanidad, su verdadero interés radica en la forma en la que el cerebro humano adquirió la lectura, o mejor dicho, el lenguaje escrito. Para Wolf la lectura no es una capacidad humana, es decir, no hay una parte del cerebro que sirva para leer, como sí las hay para ver y para hacer conceptualizaciones (neurocientíficos corríjanme si estoy diciendo algo mal). Para ella, detrás de cada nueva tecnología de lectura, de cada método de enseñanza, incluso cada alfabeto, hay un proceso mediante el cual áreas del cerebro dedicadas a distintas funciones (percepción visual, pensamiento conceptual, lenguaje simbólico) se vinculan para formar redes que hacen posible la lectura. A la humanidad, dice Wolf, le tomó unos dos mil años aprender a leer, a los niños actualmente unos dos mil días. El proceso al que Wolf se dedica en el Center for Reading and Language Research comprende el estudio de los pre-lectores (los niños a los que se lee), los lectores novicios (los niños que comienzan a adquirir lenguaje escrito), los lectores fluidos, los lectores expertos. A lo largo del proceso, los investigadores han podido ver cambios significativos en las conexiones cerebrales de los niños, pero la mayor fuente de datos para Wolf y sus colegas ha sido el estudio de la dislexia – la incapacidad o dificultad de adquirir la lectura.

Hay tres, creo que son tres, aspectos que quiero resaltar de estas lecturas. En primer lugar las dos formas de aproximarse al hecho de leer: Manguel como historia personal e historia de la humanidad, Wolf como desarrollo personal y desarrollo de la humanidad. Sin duda ambos proponen un proceso que nos define como especie, pero también con individuos. En segundo lugar, la historia de la lectura es tanto cultural como biológica. La afortunada coincidencia de haber leído a ambos autores casi simultáneamente me deja muy en claro que Manguel y Wolf se basan, desde distintas perspectivas, en los mismos datos, las misma evidencias, los mismos registros de lectura y, a partir de ellos, nos ofrecen tanto imágenes cerebrales como representaciones de personajes inmersos en una lectura, tanto procesos neuronales complejísimos que suceden en milésimas de segundos como apasionantes anécdotas personales (de las que seguramente todos tenemos alguna) sobre lecturas embriagantes. Finalmente, que la lectura como hecho o desarrollo prácticamente fundacional de la humanidad como la entendemos actualmente es un área que no distingue disciplinas.

Un cuarto punto, a manera de post data, es sólo la mención de lo vertiginoso que es leer sobre leer. Inténtenlo.