Wichtige Funktionen
DataFrame sortieren
Sowie in Excel können wir auch ein df sortieren:
sort(people$age) # -> [1] 23 25 26 26 38
order(people$age) # -> [1] 2 1 3 4 5
order returnt die indexe der Zeilen sortiert nach dem Alter um eine sortierte df zu bekommen:
people[order(people$age),] ## für aufsteigend nach dem alter
people[order(people$age, decreasing = TRUE),] ## absteigend
dim
dim(customerData) # gette dimensions -> 5 (rows) 4 (columns)
colnames und rownames
colnames(people) ## gette column names
rownames(people) ## gette row names
ncol und nrow
ncol(people) ## Zahl der column
nrow(people) ## Zahl der rows
subset
subset(people, height > 179) ## filtering
people[people$height > 179,] ## macht das selbe wie subset
str und summary
str(people) ## printed "str"ucture eines R-Objektes in diesem Fall
summary(people) ## gibt uns "result summaries"
fivenum
fivenum(people) ## Tukey's five nummer summary (minimum, lower-hinge, median, upper-hinge, maximum)
DataFrame als Datei abspeichern
printet es alle wichtigen Infos des people df
write.csv(people, "people.csv") ## speicher df als csv Datei auf dem Filesystem ab
write.csv(people, "people.csv", row.names=FALSE) ## um die Zeilennummern zu entfernen
people <- read.csv("people.csv") ## um eine csv Datei als df zu lesen/laden