Projektseminar

Datenaufbereitung IV & Annahmen

Julius Klingelhoefer

2022-12-02

Erhebungs-Updates

Compliance I

ggplotly(daily_plot)

Stand 2022-12-02 00:23:39

Compliance II

Stand 2022-12-02 00:23:40

Von Ihnen #2

  • Wie lief es bei der Rekrutierung?

  • Welche Maßnahmen haben Sie durchgeführt und welche waren erfolgreich?

Throwback zur letzten Woche

Live-Coding-Session

💻

Gemeinsame Besprechung der Compliance-Berechnung

💻

Mehrebenenanalyse: Refresher

Back to the Basics

  • In der Realität (fast) überall komplexe hierarchische Strukturen:

    • (L1 geschachtelt in L2)
  • Vernachlässigung von Mehrebenenstruktur kann falsche Aussagen produzieren

  • Mehrebenenalyse

    • Kontrolliert und modelliert Abhängigkeit

    • Ermöglicht die Untersuchung des Zusammenwirkens verschiedener Ebenen

  • Mehrebenenmodelle: konzeptionelle Erweiterung der (linearen) Regression:

    • statt OLS: (Restricted) Maximum Likehood-Schätzung

    • Großteil der Annahmen gleich wie OLS-Regression

Überprüfung der Annahmen

Mit dem performance-Package1:

Übersicht über alle Tests:

#|eval: false
m0_disco = dl %>% lmer(disco_i ~ 1 + (1 | id), data = ., REML = FALSE)
plot_check = m0_disco %>% performance::check_model()

Linearität

diagnostics = m0_disco %>% 
  performance::check_model()

lin = diagnostics$NCV %>%
  ggplot(aes(x, y)) +
  geom_point() +
  geom_abline(
    slope = 0, intercept = 0, linetype = "dashed",
    color = "red"
  ) +
  geom_smooth() +
  labs(
    x = "Fitted values", y = "Residuals",
    title = "Linearity"
  ) +
  theme_pubr()

Normalverteilung der Residuen

plot(performance::check_normality(x = m0_disco, type = "qq"))

Heteroskedastizität

plot(performance::check_heteroscedasticity(m0_disco))

Outlier

m0_disco %>% performance::check_outliers() %>% plot()

Fragen?

Arbeitsauftrag

  1. Suchen Sie sich eine für Ihre Analysen zentrale abhängige Variable heraus
  2. Betrachten Sie die Verteilung der Variablen und die Annahmen anhand des Nullmodells
  3. Überprüfen und Interpretieren Sie graphisch die Annahmen
  4. Bitte rechnen Sie noch keine Modelle mit Prädiktoren, bis die Erhebung abgeschlossen ist