Medidas de similitud y análisis de cluster
recomendadores R package ‘recommeder’ Beatriz Valdez En el post sobre recomendadores mencionamos tres distancias, entre las muchas posibles, que pueden emplearse para recomendar un producto: la distancia euclídea, la distancia coseno y la distancia de pearson. En este post exploro un poco más estas distancias, empleando la data sobre críticos y películas que usé en aquel post y la visualizo empleando cluster jerárquicos. Medidas de distancias Medí las similitudes o distancias entre los críticos entre sí y entre las películas entre sí. Existen numerosas medidas que podrían emplearse, tres de ellas, las más empleadas son las distancia euclídea, coseno y correlación. Veamos su aplicación con la data sobre críticos y películas empleadas en el post anterior. selecciono <- as.data.frame(criticos[, 2:7], row.names = criticos$persona) # euclidea eucli <-dist(selecciono, method = ...