1.1 Beispieldaten

Als Anwendungsbeispiele werden einige Datensätze verwendet, die verschiedene Probleme illustrieren:

  • azprocedure: Patienten kardiovaskulärer Behandlungen in Arizona
    • Count: los, Dauer eines Krankenhausaufenthalts in Tagen (1 - 83)
    • Kovariablen:
      • sex: Male (1), female(0)
      • admit: Type of admission. Urgent/emergency (1), elective (0)
  • rwm5yr (rwm1984): “German health registry” 1984-1988 (bzw. nur 1984)
    • Count: docvis: Anzahl der Arztbesuche (0 - 121)
    • Kovariablen:
      • outwork: Arbeitslos (1), arbeitend (0)
      • age: Alter (25 - 64)
  • fish: Geangelte Fische an einem Campingwochenende
    • Count: count, Anzahl der Fische
    • Kovariablen:
      • child: Anzahl der Kinder in der Campergruppe
      • persons: Anzahl der Personen in der Campergruppe
      • camper: [0, 1] Hat die Gruppe einen Campingwagen mitgebracht?

Diese Datensätze finden sich entweder in R-packages oder auf der website der UCLA IDRE:

Dataset R Package Quelle
azprocedure COUNT Hilbe (2014)
rwm5yr COUNT Hilbe (2014)
rwm1984 COUNT Hilbe (2014)
nuts COUNT Hilbe (2014)
fish UCLA IDRE (https://stats.idre.ucla.edu)

Daten aus Hilbe (2014) sind zusätzlich verfügbar als CSV (HILBE-MCD-CVS-data) auf der Website des Autors.

Die Datensätze des UCLA IDRE können wie folgt eingelesen werden:

fish <- haven::read_sas("https://stats.idre.ucla.edu/stat/sas/code/fish.sas7bdat")

fish <- within(fish, {
    nofish <- factor(nofish)
    livebait <- factor(livebait)
    camper <- factor(camper)
})

# Cache locally
saveRDS(fish, "data/fish.rds")

# Read from cache later:
# fish <- readRDS("data/fish.rds")

Um Daten aus R direkt in SAS-freundlichem sas7bdat zu speichern, kann folgender Code unter Verwendung des packages haven verwendet werden:

# Install package 'haven' if required
if (!("haven" %in% installed.packages())) {
   install.packages("haven")
}
# Load some example data
data("azprocedure", package = "COUNT")
# Write in SAS-format
haven::write_sas(azprocedure, "path/to/saved/file.sas7bdat")

Literatur

Hilbe, Joseph M. 2014. Modeling Count Data. Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9781139236065.