DataFrame

Ich habe schon im Kapitel 5.5. Matrix gesagt, dass Matrizen wie Excel Tabellen sind, aber die tatsächlichen Excel Tabellen sind DataFrames.

DataFrame ist ein mächtiger Datentyp in R, der sehr oft für Datenanalyse benutzt wird. In DataFrames können wir etliche Daten in etlichen Kategorien in etlichen Datentypen speichern, um daraufhin Grafen oder Statistiken erstellen zu können.

ItemPriceIn stockInhouse-brand
Juicy Apples1.997true
Bananas1.8952false
............

Um einen DatenFrame zu erstellen, benutzt man die data.frame Funktion:

name <- c("Marc", "Thomas", "Leon", "Rüdiger")
age <- c(25, 23, 26, 26)
child <- c(FALSE, TRUE, FALSE, TRUE)

df <- data.frame(name, age, child)

Der Output von der Varibale df sieht wie folgt aus:

     name age child
1    Marc  25 FALSE
2  Thomas  23  TRUE
3    Leon  26 FALSE
4 Rüdiger  26  TRUE

Die data.frame Funktion erkennt automtisch anhand der Variablennamen, die wir innerhalb der () Klammern schreiben, dass die 3 Spalten die Name: name, age, child haben sollen, aber wir können die Namen der Spalten auch selber bestimmen:

df <- data.frame("Vorname" = name,
                 "Alter" = age,
                 "Hat_Kinder" = child)
  Vorname Alter Hat_Kinder
1    Marc    25      FALSE
2  Thomas    23       TRUE
3    Leon    26      FALSE
4 Rüdiger    26       TRUE