martes, 28 de mayo de 2024

Análisis bibliométrico

Paradigma. Resiliencia de un concepto

Paradigma. Resiliencia de un concepto

Autor/a

Beatriz Valdez


Empleo los paquetes ngramr y bibliometrix para analizar la evolución y uso del término paradigma, de acuerdo como lo propuso y definio T. Kuhn en su obra Las revoluciones científicas, RC

Paradigma. Resiliencia de un concepto

Pese al amplio debate que se generó en los años siguientes a la primera edición de RC, el concepto se continuó usando extensamente, en particular en las ciencias sociales. Una búsqueda en Google Académico con la expresión “paradigma” devuelve un total de 3.150.000 resultados, en tanto que usando “paradigm” devuelve 5.710,000 resultados. Con estas tendencias presentes quiero analizar de qué forma emplean los autores la palabra en el contenido de sus artículos. Me he planteado las siguiente preguntas ¿Es posible determinar en qué sentido emplean los autores “paradigma” a partir del análisis de los títulos? Si es posible determinar el sentido a partir de los títulos ¿en qué campos se emplea con mayor insistencia? ¿En qué posición estamos en el presente con respecto a la forma en que se entiende paradigma? ¿Justifica la posición actual con respecto al concepto paradigma la ampliación del concepto seleccionar o promover el concepto de matriz disciplinaria?

Procedimiento de análisis

Para responder las preguntas que me he planteado seguiré tres estrategias. La primera consistirá en hacer una búsqueda de las palabras “paradigma”/ “paradigm” usando el visualizador de ngrams de Google. Para esto emplearé el paquete ngramr. En segundo lugar, haré una búsqueda en Google Académico, CrossRef y Semantic Scholar de esos términos. La metadata obtenida será bajada en formato “.csv” y se procesará en con el software R. Una vez subida la metadata a R con el paquete Bibliometrix se procederá a consolidarla y a depurarla, esto es, excluir los registros repetidos, y los que carezcan de título o de autor. Por último, se visualizará la tendencia de aparición de los términos, tanto los capturados con ngramr, como la que surge de la información de la metadata. Finalmente se procederá a analizar los abstracts y/o el título de los artículos más citados y de los artículos publicados a partir de 2015 que están presentes en la muestra.

Búsqueda

Para obtener la tendencia en el uso de las palabras “paradigm” y “paradigma” empleando Google Nviewer se empleó, por un lado, la palabra clave “paradigm” y, posteriormente, se empleó la palabra clave “paradigma”. El corpus empleando en ambos casos fue en el idioma inglés de 2019, con una ventana temporal entre 1800 y 2019. Se obtuvo en total 440 observaciones, en cuyo contenido, durante el lapso analizado, la palabra ha aparecido 17 millones de veces aproximadamente.

Se llevó a cabo sendas búsquedas en las API de Google Académico, CrossRef y Semantic Scholar. La palabra clave empleada fue 1) “paradigm”, 2) “paradigma”. La primera, capturó metadata proveniente de publicaciones en inglés. La segunda, publicadas en idiomas en los que se emplea la palabra paradigma. Posteriormente se seleccionó sólo los documentos publicados en castellano y portugués.

Muestra.

Se obtuvo una muestra de 5.763 metadatos para “paradigm”. Se consolidó los resultados provenientes de las tres API y se procedió a eliminar los resultados repetidos. La muestra final fue de 4.012 observaciones, que cubren 82 años: desde 1940 hasta 2022. Los documentos presentan un promedio de 13 años de publicación, un promedio de 49 citas y 5 citas promedio por autor.

La palabra “paradigma” se buscó exclusivamente en la API de Google Académico. Se obtuvo una muestra de 1000 referencias. De estas se seleccionaron 131 metadatos correspondientes a publicaciones en idiomas castellano o en idioma portugués.

promedios_PoP(paradigma2) %>% 
  as.data.frame() %>% 
  rownames_to_column(var = " " ) %>% 
  flextable::flextable() %>% 
    flextable::autofit()   
Paradigma. Resumen global de la metadata

Informacion General

Lapso:

1940 : 2022

Años prom.:

12.628

Citas prom.:

49.38

Citas prom/aut.:

4.983

Nro. Fuentes:

4012

Otros criterio de exclusión

Además de los criterios señalados arriba, documentos publicados en idiomas distintos a inglés, castellano y portugués, metadata repetida, también excluí metadata en las que faltaba el título o el autor. Se eliminó, sin prescendir de la metadata, los abstracts de los documentos obtenidos de Google Académico. En esta API el abstract que se obtiene es truncada y rara vez las líneas disponible hacen sentido. Eliminé también aquellas referencias en las que sólo aparecía cualquiera de las palabras: index, letter, editorial, front matter, end matter, bibliografía, cartas al editor, dedicatoria, condolencias, conferencia, erratum errata, addendum, addenda, o cualesquiera otra palabra que, claramente, significaba un parcelamiento fallido de la metadata.

Pre-procesamientos

Los data bibliográfica se limpió siguiendo los criterios anteriores. Para ello se empleó uno o todas las herramientas que se especifican a continuación:

  • Openrefine
  • Microsoft Excel
  • Notepad++
  • R

La data que se limpió empleando Openrefine y, o, Microsoft Excel y Notepad++ se guardó en formato .csv o .txt y se subió a la consola de R.

Para procesar la data se empleó los paquetes:

  • tidyverse
  • bibliometrix
  • ggthemes
  • flextable
  • ngramr

Paradigm/Paradigma. Tendencias

La búsqueda de los términoss “paradigm” y “paradigma” empleando la Api de Google Books Ngram Viewer nos indica, si tomamos la frecuencia de aparición de los términos, que hay un uso creciente de éstos especialmente a partir de los años cincuenta. Ambos términos han sido empleado de forma creciente, pero con picos que sugieren que ha habido temporadas las que el uso ha sido más activos. Se observa un salto grande en la presencia de ambos términos en el corpus analizado, hacia 2010 aproximadamente, luego de lo cual ha iniciado un periodo progresivo de decrecimiento.

Si tomamos en cuenta no la frecuencia sino la variación en el uso del concepto en el tiempo, se puede notar un patrón que indica periodos en los que se le emplea con mucha insistencia seguida disminuciones importantes en la presencia del concepto. Se observa que durante los años sesenta y hasta aproximadamente los 70 ambos conceptos se usaban de forma no constante, pero con tendencia creciente, pero que desde estos años la presencia ha sido decreciente, salvo hacia 2010 cuando se produce un importante salto en el uso de “paradigm”.

#|warning: false
#|message:false 

paradigmas_ptes %>% 
    select(AU = Authors,
         TI = Title, 
         SO = Source,
         DT = Type, 
         AB = Abstract,
         TC = Cites, 
         PY = Year,
         PU = Publisher,
         #AUr = ArticleURL, 
         #CUr = CitesURL, 
         GS = GSRank,
         #QD = QueryDate, 
         #DI = DOI, 
         #SN = ISSN, 
         #CU = CitationURL,
         #VL = Volume,
         #IS = Issue, 
         #BP = StartPage,
         #EP = EndPage,       
         I1 = ECC, 
         I2 = CitesPerYear, 
         I3 = CitesPerAuthor,
         I4 = AuthorCount, 
         I5 = Age,
         idioma 
  ) -> paradigmas_ptes
paradigma_ngr %>% 
  mutate(Year = year(as.Date(Year, "%Y")),
         Phrase = str_to_title(Phrase)) %>% 
  ggplot(aes(Year, Count, color=Phrase)) +
  geom_line() +
  geom_line(linewidth = 1) +
  geom_hline(yintercept = 0, linewidth = 1, colour="#333333")+
  theme_tufte()+
  scale_colour_manual(values = c("Paradigm" = "violetred4",
             "Paradigma" = "#386cb0"), 
                      name = "Tópicos:") +
  # cambio etiquetas de los ejes
  labs(x= "Año", y = "Conteo") +
  # agrego lineas verticales y horizontales
  theme(panel.grid.major = element_line(color = "#eeeeee"),
        # disminuyo el color de los sticks
        axis.ticks = element_line(color = "#eeeeee" )
  ) +
  # cambio los titulos
  theme( legend.position = "top",
    strip.text = element_text(size  = 18,  hjust = 0,
                                   face = "bold"),
         strip.text.y =  element_text(size  = 13,  hjust = 0.5,
                                      face = "bold"),
         # titulos de los ejes
         axis.title = element_text(size = rel(0.7),
                                   face = "bold.italic"),
         # textos en los ejes
         axis.text = element_text(
           size = rel(0.6))) +
  scale_y_continuous(labels = label_number())

Paradigm/paradigma como palabra clave

Buscando ahora la palabra “paradigm”/“paradigma” usando Google Scholar, CrossRef y Semantic Scholar, en el título y, o, en el campo de descriptores, se observa que en el caso de “paradigm” el uso de la palabra se intensifica sobre todo a partir de 1960, lo que es consistente con el debate que emergió a partir de la publicación de RC. La tendencia en el uso de la palabra se incrementa en los años subsguientes con periodos en los que decrece y otros en los que retoma su tendencia creciente.

paradigma2 %>% 
  count(PY) %>% 
  mutate(atras = lead(n),
         variacion = (atras - n)/n) %>% 
  ggplot(aes(PY, n))  +
  geom_line()+
  geom_area(fill = '#002F80', alpha = .5,
            color = '#002F80')+
  geom_hline(yintercept = 0, linewidth = 1, colour="#333333")+
  theme_tufte()+
  # cambio etiquetas de los ejes
  labs(x= "Año", y = "Conteo", 
       caption = "Data obtenida a través de Google Académico") +
  # agrego lineas verticales y horizontales
  theme(panel.grid.major = element_line(color = "#eeeeee"),
        # disminuyo el color de los sticks
        axis.ticks = element_line(color = "#eeeeee" )
  ) +
  # cambio los titulos
  theme( legend.position = "top",
         strip.text = element_text(size  = 18,  hjust = 0,
                                   face = "bold"),
         strip.text.y =  element_text(size  = 13,  hjust = 0.5,
                                      face = "bold"),
         # titulos de los ejes
         axis.title = element_text(size = rel(0.7),
                                   face = "bold.italic"),
         # textos en los ejes
         axis.text = element_text(
           size = rel(0.6))
         ,axis.title.y = element_text(vjust = 1, angle = 0)
         ,axis.title.x = element_text(hjust = 0))

En Portugués y en castellano se observa una tendencia más o menos similar a la notada en el aparte anterior.

# visualizo
paradigmas_ptes %>% 
  group_by(idioma) %>% 
  count(PY) %>% 
  mutate(relativo = n/sum(n),
         atras = lead(n),
           variacion = (atras - n)/n) %>% 
    ungroup() %>% 
    ggplot(aes(PY, relativo, fill = idioma 
             ,color = idioma))  +
    #geom_line()+
    geom_area(alpha = .5
              )+
    geom_hline(yintercept = 0, linewidth = 1, colour="#333333")+
    theme_tufte()+
  scale_fill_manual(values =  c("Es" = "violetred"     
                                ,"Pt" = "aquamarine")
                    ,name = "Idioma: ") +
  scale_color_manual(values =  c("Es" = "violetred",    
                                 "Pt" = "aquamarine"),
                     name = "") +
  guides(col= "none", fill = guide_legend("Idioma: "))+
    # cambio etiquetas de los ejes
    labs(x= "Año", y = "Conteo", 
         caption = "Data obtenida a través de Google Académico") +
    # agrego lineas verticales y horizontales
    theme(panel.grid.major = element_line(color = "#eeeeee"),
          # disminuyo el color de los sticks
          axis.ticks = element_line(color = "#eeeeee" )
    ) +
    # cambio los titulos
    theme( legend.position = "top",
           strip.text = element_text(size  = 18, 
                                     hjust = 0,
                                     face = "bold"),
           strip.text.y =  element_text(size  = 13, 
                                        hjust = 0.5,
                                        face = "bold"),
           # titulos de los ejes
           axis.title = element_text(size = rel(0.7),
                                     face = "bold.italic"),
           # textos en los ejes
           axis.text = element_text(
             size = rel(0.6))
           ,axis.title.y = element_text(vjust = 1
                                        ,angle = 0)
           ,axis.title.x = element_text(hjust = 0))

paradigmas_ptes %>% 
  group_by(idioma) %>% 
  count(PY) %>% 
  mutate(relativo = n/sum(n),
         atras = lead(n),
           variacion = (atras - n)/n) %>% 
    ungroup() %>% 
    ggplot(aes(PY,variacion, 
             color = idioma))  +
    geom_line()+
    #geom_area(alpha = .5
     #         )+
    geom_hline(yintercept = 0, linewidth = 1, colour="#333333")+
    theme_tufte()+
    scale_color_manual(values =  c("Es" = "violetred",    
                                 "Pt" = "aquamarine"),
                     name = "Idioma: ") +
      # cambio etiquetas de los ejes
    labs(x= "Año", y = "Variación", 
         caption = "Data obtenida a través de Google Académico") +
    # agrego lineas verticales y horizontales
    theme(panel.grid.major = element_line(color = "#eeeeee"),
          # disminuyo el color de los sticks
          axis.ticks = element_line(color = "#eeeeee" )
    ) +
    # cambio los titulos
    theme( legend.position = "top",
           strip.text = element_text(size  = 18, 
                                     hjust = 0,
                                     face = "bold"),
           strip.text.y =  element_text(size  = 13, 
                                        hjust = 0.5,
                                        face = "bold"),
           # titulos de los ejes
           axis.title = element_text(size = rel(0.7),
                                     face = "bold.italic"),
           # textos en los ejes
           axis.text = element_text(
             size = rel(0.6))
           ,axis.title.y = element_text(vjust = 1
                                        ,angle = 0)
           ,axis.title.x = element_text(hjust = 0))
Warning: Removed 2 rows containing missing values (`geom_line()`).

Paradigm/paradigma. Significado a partir de los títulos.

paradigmas_ptes %>% 
  mutate(contenido = NA) %>% 
  mutate(contenido = ifelse(idioma =="Pt", qdap::rm_stopwords(TI,
                                      portugues,
                                      separate = FALSE),
                            qdap::rm_stopwords(TI,
                                      lex$palabras,
                                      separate = FALSE)
         )) %>% 
  unnest_tokens(palabras, contenido) %>% 
  filter(str_detect(palabras, "[a-z]")) -> paradigma_ptes_l

# bigramas

paradigmas_ptes %>% 
  mutate(contenido = NA) %>% 
  mutate(contenido = ifelse(idioma =="Pt", qdap::rm_stopwords(TI,
                                      portugues,
                                      separate = FALSE),
                            qdap::rm_stopwords(TI,
                                      lex$palabras,
                                      separate = FALSE)
         )) %>% 
  unnest_tokens(palabras, contenido,  token ="ngrams", n = 2) %>% 
  filter(str_detect(palabras, "[a-z]")) -> paradigma_ptes_l2

Paradigm. Presencia del término según frecuencia y año

Los bigramas me sugieren que, en general, los diferentes artículos escritos en inglés y recuperados a través de las APIs empleadas y que versan sobre p”paradigm” tienden a plantear la discusión desde la perspectiva de ejemplar, modelo, forma de hacer las cosas. Lo que Masterman denomina “paradigmas constructivos”, o, de acuerdo con Kuhn paradigma en sentido sociológico. En general se observa que el sentido subyacente es la necesidad de un cambio en la forma de hacer las cosas o con el impulso hacia ese cambio.

Puede observarse, además, que las áreas en las que más frecuentemente se ha planteado este tema han sido en salud, educación/proceso de aprendizaje, gerencia/negocios, políticas e investigación. La inteligencia artificial y la pandemia de Covid-19 emergen como temas relacionados con paradigmas.

Los artículos

En grafo de bigramas con los títulos de las publicaciones en castellano sugieren que la discusión en estas publicaciones se ha dado en las tres perspectiva sugeridas por Masterman: paradigmas metafísicos, paradigmas sociológicos y paradigmas constructivos, o lo que es equivalente a las dos perspectivas indicadas por Kuhn: en sentio sociológico y en sentido filosófico. La discusión se ha dado sobre todo en el área educativa; pero también se observa que se ha discutido en contexto económico, reducción de la pobreza y en la comunicación. Las tecnologías de la información parecen tener algo que ver on los paradimas.

# |warning: false
# |message: false
#|fig-height: 10
#|fig-wight: 10
paquetesRedes()
paradigma_ptes_l2_separated <- paradigma_ptes_l2 %>%
  separate(palabras, c("palabra1", "palabra2"), sep =" ") %>% 
  filter(idioma == "Pt") %>% 
  count(palabra1, palabra2, sort = TRUE) %>%
  na.omit() %>% 
  filter(n > 1) %>% 
  graph_from_data_frame() -> pt_g





set.seed(2016) 
a <- grid::arrow(type = "closed", length = unit(.10, "inches")) 

ggraph(pt_g, layout = "fr") + 
  geom_edge_link(aes(edge_alpha = n), 
                 show.legend = FALSE, arrow = a, 
                 end_cap = circle(.07, 'inches')) + 
  geom_node_point(color = "aquamarine", size = 3) + 
  geom_node_text(aes(label = name), vjust = 1, hjust = 1) + 
   theme_void()

En portugués parece predominar la discusión de paradigma en su sentido sociológico. Este debate parece provenir sobre todo del área de la salud, la gestión y la comunicación.

#|fig-height: 10
#|fig-wight: 10 
paradigma_ptes_l2_separated <- paradigma_ptes_l2 %>%
  separate(palabras, c("palabra1", "palabra2"), sep =" ") %>% 
  filter(idioma == "Pt") %>% 
  count(palabra1, palabra2, sort = TRUE) %>%
  na.omit() %>% 
  filter(n > 1) %>% 
  graph_from_data_frame() -> Es_g

set.seed(2016) 
a <- grid::arrow(type = "closed", length = unit(.10, "inches")) 
ggraph(Es_g, layout = "fr") + 
  geom_edge_link(aes(edge_alpha = n), 
                 show.legend = FALSE, arrow = a, 
                 end_cap = circle(.07, 'inches')) + 
  geom_node_point(color = "violetred", size = 3) + 
  geom_node_text(aes(label = name), vjust = 1, hjust = 1) + 
  theme_void()

Paradigma. Campos del saber

Aun cuando ya se observado los campos del saber en los que se ha centrado el debate de las publicaciones obtenidas tanto en idioma inglés como en castellano y portugués, deseo observar esto con mayor detalle. Para ello generaré palabras claves a partir de los títulos

library(bibliometrix)
paradigma2 <- extraigo_terminos(paradigma2)

   PARADIGM       SHIFT  MANAGEMENT DEVELOPMENT   EDUCATION      CHANGE 
       3313        1999         328         240         135         128 
       TIME      SOCIAL      HEALTH       STUDY    LEARNING      POLICY 
         91          90          89          89          88          88 
    SYSTEMS    ANALYSIS      CANCER    APPROACH    BUSINESS       HUMAN 
         88          82          79          78          74          67 
      MODEL   TREATMENT      DESIGN        CASE      SYSTEM      THEORY 
         65          65          64          63          63          63 
    SCIENCE 
         62 
masCitadosPortugues <- extraigo_terminos(masCitadosPortugues, 
                                         language = "portuguese")

    PARADIGMA    PARADIGMAS            DE            DA            DO 
           30            29            26            21            14 
         NOVO            NA            UM         NOVOS      EDUCAÇÃO 
           13            12            11             9             7 
           EM            NO         SAÚDE           DAS            OS 
            7             7             7             6             6 
ADMINISTRAÇÃO            AO          PARA      PRÁTICAS  ALTERNATIVAS 
            5             5             5             5             4 
      PÚBLICA        BRASIL           COM            EA   EDUCACIONAL 
            4             3             3             3             3 
masCitadosCastellano <- extraigo_terminos(masCitadosCastellano, 
                                         language = "spanish")

           DE     PARADIGMA    PARADIGMAS           DEL INVESTIGACIÓN 
           66            35            29            15            13 
        NUEVO        SOCIAL     EDUCACIÓN     EDUCATIVA         HACIA 
            9             9             8             7             7 
     CIENCIAS      SOCIALES       AMÉRICA        LATINA  CONOCIMIENTO 
            6             6             5             5             4 
       NUEVOS   CUALITATIVA   CUALITATIVO    DESARROLLO      ECONOMÍA 
            4             3             3             3             3 
    EDUCATIVO       ENFOQUE       ESTUDIO        NUEVAS      SUPERIOR 
            3             3             3             3             3 

Definiciones y aclaratorias

Metadatos. Datos que describen otros datos. En el contexto de la bibliometría y, en general, de referencias bibliográficas, los metadatos son los campos empleados para describir un documento dado. El mínimo de metadatos incluye, autor, título, fecha de publicación y editorial.

No hay comentarios.: