Hugo Chávez. Programas de gobierno y planes de desarrollo. Comparaciones
Empleando la técnica de minería de texto, haremos un análisis descritivo de los textos de los programas de gobierno presentados por por H. Chávez entre 1998 y 2012. Los textos se han obtenidos de la página web del Ministerio del Poder Popular para la Planificación y el Desarrollo. Usamos el paquete tm, Text Mining, de R.
Queremos observar si existe o no relación entre los diferentes programas de gobierno y planes de desarrollo, trantando de observar, si existe, en qué momentos se detectan cambios en las propuestas del fallecido presidente Chávez o, si por el contrario, ha habido continuidad entre ellos.
Dado que hemos obtenidos estos discursos directamente de la web y no disponen de metadata, creamos entonces esta informacion.
meta(discursos, tag = "Author") <- c(rep("Hugo Chavez", 6))
meta(discursos, tag = "Heading") <- c("continuarRevolucion", "motoresConstituyentes",
"programaEconomico00", "programaPatria", "programaEcoTrans00", "revolucionDemocratica")
meta(discursos, tag = "Description") <- c("anio_2000", "anio_2007", "anio_1999",
"anio_2013", "anio_2001", "anio_1998")
meta(discursos, tag = "ID") <- c(rep("propuestas_electorales"))
meta(discursos, tag = "Language") <- c(rep("Spanish", 6))
meta(discursos, tag = "Origen") <- c(rep("www.mppef.gob.ve", 6))
A partir de las funciones Corpus(), TextMatrixDocument(), y de las transformaciones que se incluyen en el paquete tm, creamos algunas funciones propias: Con ella extraemos los términos más frecuentes en cada uno de los discursos emitidos durante el lapso analizado.
Obtengamos una relación del número de palabras en cada uno de los años analizados:
disLimpios <- limpiar_corpus_es(discursos)
Hagamos ahora la distribución de frecuencia, que nos permitirá crear luego la visualizacion de los términos más frecuentes
Creamos la visualización
hacer_nubes(disDf)
No hay comentarios.:
Publicar un comentario