miércoles, 4 de septiembre de 2013

Analisis de legibilidad usando R

Algunos discursos emitidos por H. Chávez durante 1999. Algunas características descriptivas

Algunos discursos emitidos por H. Chávez durante 1999. Algunas características descriptvas

Analizamos algunos discursos emitidos por el presidente Chávez en 1999 desde el punto de vista de la legibilidad. Entiendo por ésta la facilidad o dificultad que tendría una persona para entender el discurso emitido, una vez transcrito y, por extensión, en el momento de la emisión del mismo discurso. La trancripción de los discursos se ha obtenido de Hugo Chávez Frías en La BitBliotecaUsamos el paquete koRpus, que ha sido diseñado justamente para caracterizar discursos y para hacer análsisi de atribución, es decir, detectar si un texto proviene o no de un autor dado.

require(koRpus)
# usamos la funcion tokeniza para dividir cada discurso en tokens
a2 <- tokenize("~/1999cartailich.txt", lang = "es")

Vamos a darles nombres más adecuados a los discursos

textos <- c("carta.bill.clinton", "carta.ilich.ramirez", "carta.csj", "cien.dias", 
    "desfile.jul05", "discurso.proceres", "jesus.urdaneta", "juramentacion.gabinete", 
    "toma.posesion")

Para evaluar la legibilidad de los discursos de Chávez, tomaremos como refrencia a sigiente tabla:

lecturaDf
##           Instruccion Lineas Grados_educacion
## 1        Rudimentario    150              1.5
## 2              Basica    200              3.6
## 3          Intermedia    250              7.2
## 4 Intermedio superior    300             12.0
## 5            Avanzado    350             16.0

Aplicando la funcion readibility(), y quedándonos solo con el indicadore “ARI”

## Loading required package: ggplot2
qplot(data = chavezLectura, reorder(Textos, ARI), ARI, xlab = "textos", ylab = "indicador") + 
    coord_flip()

plot of chunk grafico

Observamos que, primer lugar, Chávez nunca empleó un lenguaje que exigiera un nivel comprensión lectora básico o rudimentario. En segundo lugar, observamos que Chávez ajusta el nivel de compresión exigido de sus oyente de acuerdo al contexto. Así, en las cuatro cartas enviadas, textos que podemos considerar formales, emplea un lenguaje para un público con formación de cuarto nivel. Mientras que en las entrevistas (jesus.urdaneta) mantiene un nivel de básico superior a intermedio. Finalmente, sus discursos emitidos en cadena nacional (juramentacion.gabinete, cien.dias) mantienen de exigencia para un público con nivel de bachillerto completo.

No hay comentarios: