Bewertung von Horrorfilmen

Werden Horrorfilme generell schlechter bewertet als andere? Mit dem bei Kaggle verfügbaren Datensatz kann man der Antwort auf diese Frage näher kommen.

Um den Datensatz auszuwerten haben wir R benutzt:

movies <- read.csv("tmdb_5000_movies.csv")
cat("Average rating of horror movies:", mean(horror$vote_average), "\n")
cat("Average rating of non-horror movies:", mean(non_horror$vote_average), "\n")

Output:

Average rating of horror movies: 5.62659
Average rating of non-horror movies: 6.148576

Ein erster Blick auf die Verteilungen der Bewertungen von Horrorfilmen und Nicht-Horrofilmen gibt erste Einblicke:

average horror movie rating

Als weiteres Indiz kann der t-Test benutzt werden:

hm.test <-t.test(horror$vote_average, non_horror$vote_average, alternative = "less")
cat("t-test:", hm.test$p.value, "\n")

Output:

t-test: 3.147833e-22

Könnte es sein, dass das daran liegt, dass Horrorfilme oft Low Budget Filme sind und deshalb schlechter bewertet werden? Schauen wir uns das doch nochmal genauer an:

revenue_limit <- 1000000
successful_horror <- horror[horror$revenue > revenue_limit,]
successful_non_horror <- non_horror[non_horror$revenue > revenue_limit,]
cat("Average rating of successful horror movies:", mean(successful_horror$vote_average), "\n")
cat("Average rating of successful non-horror movies:", mean(successful_non_horror$vote_average), "\n")

Output:

Average rating of successful horror movies: 5.882243
Average rating of successful non-horror movies: 6.36733

Doch auch hier sind die Bewertungen ähnlich verteilt:

average successful horror movie rating

Es scheint also, als ob Horrorfilme bei TMDb im Schnitt einen ganzen Punkt schlechter bewertet werden als der Gesamtkorpus.

Der gesamte Code befindet sich auf GitHub.

Zuletzt bearbeitet am