Lehrende: Dr. Maria Bobrowski; Dr. Niels Schwab
Veranstaltungsart:
Übung
Anzeige im Stundenplan:
Semesterwochenstunden:
2
Credits:
4,0
Unterrichtssprache:
Deutsch
Min. | Max. Teilnehmerzahl:
10 | 25
Kommentare/ Inhalte:
Die frei verfügbare Statistiksoftware R ist ein Werkzeug zur statistischen Datenanalyse und (räumlichen) grafischen Darstellung von Daten und Ergebnissen. R ist eine Standardsoftware für statistische Auswertungen im wissenschaftlichen Bereich und in Unternehmen.
Lernziel:
Die Teilnehmenden wiederholen Statistik- und R-Grundlagen und vertiefen diese im Anschluss anhand von räumlichen Vegetationsdaten. Bei der Vertiefung verstehen sie das Prinzip der Regressionsanalyse und dessen Interpretation. Sie analysieren dazu biogeographische Datensätze und nutzen dabei R zur Berechnung von linearen Regressionsmodellen, multiplen linearen Regressionen und verallgemeinerten linearen Modellen. Darüber hinaus werden die Studierenden die GIS-Funktionalitäten von R kennen lernen. Sie erarbeiten sich anhand von praxisnahen Übungen den Einstieg in statistische Analyseverfahren mit biogeographischen Schwerpunkten.
Es wird Selbstsicherheit beim Umgang mit quantitativen Methoden und R-Funktionen erreicht. Die Übertragbarkeit der Methoden auf andere, z.B. von den Teilnehmenden selbst erhobene oder gemessene Datensätze werden diskutiert. Somit sind sie in der Lage, eigene Analysen selbstständig durchzuführen. Damit kann dieser Kurs als Ausgangspunkt für den weitergehenden Einsatz von R in individuellen Fragestellungen (z.B. Abschlussarbeiten, Praktika, Projekte, …) dienen.
Vorgehen:
Zunächst werden Grundlagen der Bedienung von R und die praktische Anwendung einfacher deskriptiver quantitativer Methoden wiederholt. Aus den Grundlagen-Kursen bekannte statistischen Verfahren und R-Funktionen werden zur Auffrischung gemeinsam diskutiert und angewendet. Als Schwerpunkt der Übung entwickeln die Teilnehmenden ausgehend von Korrelationsanalysen lineare Regressionsmodelle in R. Der Blockkurs umfasst die Themen:
- Grundlagen von R, Installation des Basispakets sowie dessen Erweiterungen (Wiederholung)
- Graphische Benutzeroberflächen für R, insbes. R Studio, Nutzung der internen Hilfe-Funktionen, Hilfen im Internet (Wiederholung)
- Datenimport und -manipulation, Interaktion mit Tabellenkalkulationsprogrammen, z.B. MS Excel (Wiederholung)
- Berechnung von deskriptiven Statistiken wie Mittelwert, Standardabweichung, Median, Quantile, Häufigkeitsverteilungen (Wiederholung)
- Visualisierung der Daten mittels einfacher Grafiken: Histogramme, Boxplots, Balken- und Streudiagramme (Wiederholung)
- Korrelationsanalyse
- Regressionsanalyse: einfache und multiple lineare Modelle (LM), verallgemeinerte lineare Modelle (GLM)
- visuelle und numerische Prüfung der Modellgüte anhand von unterschiedlichen Evaluationskriterien (R2, AIC, BIC)
- Interpretation der Modelle: Beschreibung der Beziehung zwischen der abhängigen und den unabhängigen Variablen
- R als Geographisches Informationssystem (GIS), SAGA GIS und R
Literatur:
- Alexandrowicz, R. W. (2013). R in 10 Schritten. Einführung in die statistische Programmierumgebung. Wien: facultas wuv / UTB.
- Beierkuhnlein, C. (2007): Biogeographie. Stuttgart: UTB / Ulmer.
- Hatzinger, R., Hornik, K., Nagel, H. & Maier, M. (2014). R: Einführung durch angewandte Statistik. 2. Auflage, Hallbergmoos: Pearson.
- Schwab, N., Gottschalk, R., Werner, M., Bobrowski, B., Weidinger, J. (2018): RLab - Skriptbasierte modulare Umweltstatistik. http://rlab.blogs.uni-hamburg.de [01.02.2018]
- Zuur, A. F., Ieno, E. N. & Meesters, E. (2009). A beginner's guide to R. New York: Springer.
Zusätzliche Hinweise zu Prüfungen:
Aktive Mitarbeit, Übungsaufgaben, eine Hausaufgabe und eine Abschlussaufgabe
|