Werden Horrorfilme generell schlechter bewertet als andere? Mit dem bei Kaggle verfügbaren Datensatz kann man der Antwort auf diese Frage näher kommen.
Um den Datensatz auszuwerten haben wir R benutzt:
movies <- read.csv("tmdb_5000_movies.csv")
cat("Average rating of horror movies:", mean(horror$vote_average), "\n")
cat("Average rating of non-horror movies:", mean(non_horror$vote_average), "\n")
Output:
Average rating of horror movies: 5.62659
Average rating of non-horror movies: 6.148576
Ein erster Blick auf die Verteilungen der Bewertungen von Horrorfilmen und Nicht-Horrofilmen gibt erste Einblicke:
Als weiteres Indiz kann der t-Test benutzt werden:
hm.test <-t.test(horror$vote_average, non_horror$vote_average, alternative = "less")
cat("t-test:", hm.test$p.value, "\n")
Output:
t-test: 3.147833e-22
Könnte es sein, dass das daran liegt, dass Horrorfilme oft Low Budget Filme sind und deshalb schlechter bewertet werden? Schauen wir uns das doch nochmal genauer an:
revenue_limit <- 1000000
successful_horror <- horror[horror$revenue > revenue_limit,]
successful_non_horror <- non_horror[non_horror$revenue > revenue_limit,]
cat("Average rating of successful horror movies:", mean(successful_horror$vote_average), "\n")
cat("Average rating of successful non-horror movies:", mean(successful_non_horror$vote_average), "\n")
Output:
Average rating of successful horror movies: 5.882243
Average rating of successful non-horror movies: 6.36733
Doch auch hier sind die Bewertungen ähnlich verteilt:
Es scheint also, als ob Horrorfilme bei TMDb im Schnitt einen ganzen Punkt schlechter bewertet werden als der Gesamtkorpus.
Der gesamte Code befindet sich auf GitHub.