martes, 11 de mayo de 2010

La creciente dificultad léxica de la ciencia

Los científicos han dejado de ser personajes públicos hace años. Bien pocos avances científicos se pueden entender fácilmente. La frontera del conocimiento está muy lejos de lo que se explica en bachillerato. Pero hay una cuestión más que a menudo pasa desapercibida: el lenguaje que se utiliza en ciencia es cada vez más complejo.

Unas pocas entradas atrás comentábamos sobre la ley de distribución estadística de las palabras que conforman textos: la Ley de Zipf. En un estudio (publicado en Nature en 1992 y disponible en preprint aquí) se utiliza una esa idea, sofisticándola un poco, para generar un índice de dificultad léxica de los textos. Es un índice relativo, y para darle un valor absoluto el autor utiliza como referencia los periódicos. Se asume que el lenguaje de los periódicos generalistas es el cero de dificultad léxica. Frente a él las locuciones de un granjero hablándole a sus vacas puntúa -59, los cómics -27, Science 28 y Cell 38. Pero más interesante aún resulta que se puede hacer un seguimiento en el tiempo. Suponiendo que los periódicos se mantienen como nivel de referencia en todo momento, se puede medir la dificultad de una publicación en distintos momentos del tiempo.

Aplicando esta metodología se comprueba que la dificultad puramente léxica de los textos científicos se ha incrementado sensiblemente a lo largo del siglo XX. Hay datos sorprendentes, como que hasta 1947 Nature mantuvo un nivel próximo a 0. Se puede analizar este aumento de dificultad por disciplinas, por tipo de revistas, y respecto de la política editorial de las mismas (ver texto original).

Yo me quedo con dos ideas: hoy en día los cualquier texto científico utiliza un léxico sensiblemente más complejo que el utilizado por la población en general (indicado por los periódicos). Aunque Scientific American (Mundo Científico) se ha complicado menos que revistas más especializadas, ha perdido el nivel léxico de la calle, y el hueco no se ha cubierto. Según el autor del trabajo no hay revistas de divulgación con índice de dificultad léxica 0.

Lo que no queda claro es la causa última de la complicación del lenguaje científico. Puede deberse a que los temas de trabajo se especializan, se diversifican y crean jergas específicas. Pero no sería de extrañar que hubiese otros motivos. No deja de ser curiosa la coincidencia del despegue de la dificultad léxica con el comienzo de la evaluación de los científicos por número de publicaciones. En todo caso esta cuestión queda abierta por ahora.
Publicar un comentario en la entrada