library(dplyr)
library(tidyr)
library(kableExtra) # Tabellen

Aufgabe 4

Bei einem häufig genutzten Werkstoff, der auf drei verschiedene Weisen hergestellt werden kann, vermutet man je nach Herstellungsweise einen unterschiedlichen Gehalt an einer krebserregenden Substanz. Von dem Werkstoff wurden für jede der drei Herstellungsmethoden vier Proben je 100 Gramm genommen und folgende fiktive Werte für den Gehalt an dieser speziellen krebserregenden Substanz in Milligramm pro Methode gemessen.

gehalt <- tibble::tribble(
  ~Methode1, ~Methode2, ~Methode3,
  61,        62,        65,
  58,        59,        62,
  60,        61,        63,
  60,        61,        62
) %>%
  pivot_longer(cols = 1:3, names_to = "Methode", values_to = "Gehalt") 

a)

Schätzen Sie die Gruppenmittelwerte und die Differenz vom Gesamtmittelwert und interpretieren Sie die Resultate.

mean_gehalt <- mean(gehalt$Gehalt)

gehalt %>%
  group_by(Methode) %>%
  summarize(
    mean = mean(Gehalt),
    diff_mean = round(mean - mean_gehalt, 3)
  ) %>%
  kable(
    booktabs = TRUE, 
    col.names = c("Methode", "Mittelwert", "Differenz vom Gesamt-MW")
  ) %>%
  kable_styling(position = "center")
Methode Mittelwert Differenz vom Gesamt-MW
Methode1 59.75 -1.417
Methode2 60.75 -0.417
Methode3 63.00 1.833

Der Werkstoffgehalt bei Methode 3 liegt deutlich über dem von Methoden 1 und 2, wobei der Gehalt bei Methode 3 auch deutlich über dem Gesamtmittelwert (61.17) liegt, wobei Methoden 1 und 2 knapp (Methode 2) bzw. genauso eindeutig (Methode 1) unter dem Gesamtmittelwert liegen. Methoden 1 und 2 könnten sich also ähnlich sein.

b)

Gehen Sie davon aus, dass der Gehalt an der krebserregenden Substanz approximativ normalverteilt ist und prüfen Sie zum Signifikanzniveau \(\alpha = 0.05\), ob sich die drei Herstellungsmethoden hinsichtlich des Gehalts der krebserregenden Substanz im Werkstoff unterscheiden.

mod4 <- aov(Gehalt ~ Methode, data = gehalt)

pander::pander(mod4)
Analysis of Variance Model
  Df Sum Sq Mean Sq F value Pr(>F)
Methode 2 22.17 11.08 6.435 0.01839
Residuals 9 15.5 1.722 NA NA

Der mittlere Werkstoffgehalt unterscheidet sich zwischen den Methoden signifikant (\(p < 0.05\)).

c)

Testen Sie die paarweisen Unterschiede mit einem geeigneten Verfahren. Warum entscheiden Sie sich gerade für dieses Verfahren? Welche Herstellungsmethoden unterscheiden sich hinsichtlich des Gehalts an der krebserregenden Substanz im Werkstoff?

Testauswahl:

  • Scheffé scheidet aus, weil wir “nur” 3 Tests machen, und Scheffé da eher konservativ wäre
  • Dunnett scheidet aus, weil wir keine vorgegebene Referenzkategorie haben
  • Bonferroni ist sowieso nie der beste

→ Unter den verbleibenden Alternativen sollte Tukey eine valide Option darstellen. Möglicherweise wäre ein Dunnett-Test auch sinnvoll, wenn wir wirklich Methoden 1 und 2 explizit mit Methode 3 vergleichen wollen.

TukeyHSD(mod4, conf.level = .95) %>%
  tidy() %>%
  mutate(
    comparison = sub("-", " - ", comparison),
    ci = glue::glue("({round(conf.low, 2)}, {round(conf.high, 2)})")
  ) %>%
  dplyr::select(comparison, estimate, ci, adj.p.value) %>%
  kable(
    booktabs = TRUE, digits = 3,
    col.names = c("Vergleich", "Differenz", "CI", "p")
  ) %>%
  kable_styling(position = "center")
Vergleich Differenz CI p
Methode2 - Methode1 1.00 (-1.59, 3.59) 0.550
Methode3 - Methode1 3.25 (0.66, 5.84) 0.017
Methode3 - Methode2 2.25 (-0.34, 4.84) 0.088

Signfifikant unterscheiden sich nur Methoden 1 und 3 voneinander.

Aufgabe 5

Sie interessieren sich für den Vergleich des durchschnittlichen Gewichts dreier Apfelsorten. Leider ist bei einem Sturm fast die komplette Ernte vernichtet worden und Sie finden von den Sorten Sonnenschein und Morgenröte jeweils nur vier brauchbare Äpfel und von der dritten Sorte Jonas fünf Äpfel.

äpfel <- tibble::tribble(
  ~sonnenschein, ~morgenröte, ~jonas,
  97.1,          99.3,        102.5,
  99.5,          100.3,       100.9,
  98.8,          101.3,       101.6,
  98.3,          99,          101.8,
  NA,            NA,          101.4
) %>% 
  pivot_longer(cols = sonnenschein:jonas, names_to = "Sorte", values_to = "Gewicht") %>%
  filter(!is.na(Gewicht))

Beschreibe \(Y_{ij}\) mit \(i = 1, 2, 3\) und \(j = 1, \ldots, m_i\) das Gewicht der Äpfel. Außerdem seien die \(Y_{ij}\) stochastisch unabhängige normalverteilte Zufallsvariablen mit Erwartungswert \(\theta_i\) und Varianz \(\sigma^2 > 0\).

a)

Testen Sie die Nullhypothesen der paarweisen Gleichheit der Mittelwerte anhand des Tests von Scheffé zum multiplen Niveau \(\alpha = 0.05\).

mod5 <- aov(Gewicht ~ Sorte, data = äpfel)

DescTools::ScheffeTest(mod5)$Sorte %>%
  as_tibble(rownames = "Vergleich") %>%
  mutate(
    Vergleich = sub("-", " - ", Vergleich),
    pval = ifelse(pval < 0.05, cell_spec(x = round(pval, 4), bold = TRUE), round(pval, 4)),
    ci = glue::glue("({round(lwr.ci, 2)}, {round(upr.ci, 2)})")
  ) %>%
  dplyr::select(Vergleich, Differenz = diff, CI = ci, p = pval) %>%
  kable(booktabs = TRUE, escape = FALSE) %>%
  kable_styling(position = "center")
Vergleich Differenz CI p
morgenröte - jonas -1.665 (-3.35, 0.02) 0.053
sonnenschein - jonas -3.215 (-4.9, -1.53) 0.001
sonnenschein - morgenröte -1.550 (-3.33, 0.23) 0.0887

Signifikant unterscheiden sich Sorten Sonnenschein und Jonas (p < 0.05). Hätten wir einen weniger konservativen Test verwendet, hätten wir vielleicht sogar den Unterschied zwischen Morgenröte und Jonas als signifikant betrachtet.

b)

Berechnen Sie auch die simultanen Konfidenzintervalle und führen Sie die Testentscheidung anhand dieser Konfienzintervalle durch.

Die Konfidenzintervalle sind in der vorigen Tabelle aufgeführt. Wir sehen, dass das Konfidenzintervall für den Mittelwertsunterschied zwischen Sorten Sonnenschein und Jonas die 0 nicht mit einschließt, weshalb wir diesen Unterschied als einziges als signifikant betrachten.

(Auch wenn wir bei Morgenröte und Jonas ziemlich hart an der Grenze sind, analog a)