sábado, 7 de septiembre de 2013

Rgraphviz. Bajando el nivel de asociacion y visualizando el peso de los vinculos

Hugo Chávez. Asociaciones entre términos presentes en algunos de sus discursos, 1999-2002.

Hugo Chávez. Asociaciones entre términos presentes en algunos de sus discursos, 1999-2002.

En el post anterior visualizamos las asociaciones en veinte términos seleccionados al azar con la funcion plot() incorporada en el paquete tm en combinación con el el paquete Rgraphviz de Bioconductor. Usamos, además, los valores por defecto de la función plot. En este post cambiaremos algunos valores de tal forma que podemos obtener mayor información de la visualización de las asociaciones

Cambiando algunos valores de la función plot: corThreshold y weighting

Podemos usar el parámetro weighting y cambiár el parámetro corThreshold para, por un lado, observar, usando el grosor de las líneas, las asociaciones más, o menos, fuertes en los términos, y para encontrar asociaciones más, o menos, fuertes.

set.seed(2345)
plot(tdm.99, corThreshold = 0.2, weighting = TRUE)

plot of chunk creaAsociacionesBioconductor

Podemos visualizar, por un lado, asociaciones débiles, como la que existe entre arena y adriani asi como asociaciones muy fuertes como la que existe entre los términos arena-adriani-electricos-enfermedades-pensamos gracias a la posibilidad de visualizar el peso de cada asociacion por medio de los vínculos. Por otra parte, al bajar el nivel requerido de asociación, alqunos términos que en el post anterior aparecian desconectados se han incorporado a la grafica. Ello nos indica que eran parte de la “conversación” pero que los términos se emplearon mucho menos que aquellos que presentan asociaciones más fuertes.

No hay comentarios: