Forscher haben vor kurzem damit begonnen, Daten auf Online-Plattformen wie Amazons Mechanical Turk zu sammeln. Der Vorteil dieser Plattformen, wie z. B. der einfache Zugang zu repräsentativeren Stichproben, wird jedoch durch ein Problem erkauft, das erst kürzlich entdeckt wurde: statistische Bots. Diese Bots werden in großem Umfang eingesetzt, um automatisch Umfragen von Personen auszufüllen, die einen finanziellen Vorteil daraus ziehen. Sie verunreinigen alle Daten, die von Online-Plattformen stammen. In diesem Artikel stellen wir ein latentes Bayes'sches Klassenmodell vor, das routinemäßig angewendet werden kann, um statistische Bots in Online-Fragebögen und -Tests zu identifizieren. Das Modell ist sehr flexibel und basiert auf plausiblen Annahmen, die in den meisten empirischen Situationen erfüllt sind. Es bietet einen konfirmatorischen Rahmen, da die latenten Klassen in ihrer Bedeutung (Bots vs. Nicht-Bots) vorgegeben sind. In einer Simulationsstudie zeigen wir sehr vorteilhafte Schätzungseigenschaften, die (a) Bots identifizieren und (b) gleichzeitig unverzerrte Schätzungen für die übrigen Teilnehmer liefern. Wir veranschaulichen das Modell und seine Fähigkeiten anhand von Daten aus einer empirischen Umfrage zur politischen Gesinnung mit bekannten Bots.
Zachary Joseph Roman, Holger Brandt, & Jason Michael Miller (accepted for publication). Automated Bot Detection using Bayesian Latent Class Models in Online Surveys. Frontiers in Psychology