Sie erhalten einen Überblick über R mit der Entwicklungsumgebung (IDE) RStudio und lernen die Grundlagen zur Benutzung kennen, z.B. Variablen zuweisen, Pakete installieren und laden. Sie kennen wichtige Datentypen in R (vector, factor array) und nach der Statistik Einführung können Sie schnell grundlegende deskriptive Statistiken der Daten berechnen. Wichtige Lagemaße (Mittelwert, Median, Quantile) und Streuungsmaße (Varianz, Standard Abweichung) der Statistik und die Umsetzung in R sind Ihnen bekannt. Desweiteren werden Häufigkeitstabellen und Kreuztabellen und bedingte Wahrscheinlichkeiten behandelt.
Nach diesem Statistik Kurs kennen Sie bekannte Verteilungen, wissen was Dichtefunktion und Verteilungsfunktion ist und können Zufallszahlen aus einer Verteilung ziehen.
Für die Grundlagen der Datenanalyse wird das Paket data.table verwendet. Es ist neben dem tidyverse-Paketen (u.a. mit dplyr) das beliebteste Paket zur Analyse von Daten. Sie können Daten einlesen und schreiben, Statistiken auf den Daten berechnen und fehlende Daten ergänzen. Data.table ist im Vergleich zu tidyverse insbesondere für größere Datenmengen effizienter. Die data.tables entsprechen den häufig in der statistischen Programmiersprache R verwendeten data.frames und ermöglichen eine elegante Analyse der Daten. In diesem Kurs wird nicht dplyr bzw. tidyverse geschult.
In der deskriptiven, bivariaten Statistik werden Korrelationsanalysen durchgeführt und die bekannten Korrelationsmaße Korrelationskoeffizient nach Pearson und Rangkorrelation nach Spearman behandelt.
Das beliebteste Paket zur Erstellung von Grafiken, ggplot2, und die dahinterliegende grammar of graphics wird durchgenommen. Sie können eigene Visualisierungen erstellen, anpassen, abspeichern und kennen die Grundlagen, um Plots individuell anzupassen. Sie beherrschen die Grundlagen von statistischen Tests (Stichprobe, Nullhypothese, Signifikanz, Konfidenzintervall) und können Mittelwertsvergleiche mit dem t-Test durchführen. Häufige Pre-Tests für die Überprüfung der Voraussetzungen vom t-Test und nicht-parametrische Tests sind Ihnen geläufig.
Diese Statistik Weiterbildung beinhaltet auch ein einfaches Verfahren des Machine Learnings, welches ein Standardverfahren der Statistik ist: die lineare Regression. Sie lernen die theoretischen Grundlagen kennen, können den Algorithmus in R umsetzen und die Ergebnisse interpretieren.
Die Einstiegshürde für die Benutzung von R für Statistik und Datenanalyse ist genommen, so dass Sie eigenständig Ihr Wissen nach dem R und Statistik Intensivkurs erweitern können. Durch die kleine Gruppengrößen und die eigene Umsetzung auf Ihrem Laptop mit Unterstützung des Dozenten wird eine hohe Qualität und ein bestmöglicher Lernerfolg sichergestellt.
- Überblick über R mit der Entwicklungsumgebung (IDE) RStudio und lernen die Grundlagen zur Benutzung kennen, z.B. Variablen zuweisen, Pakete installieren und laden.
- wichtige Datentypen in R (vector, factor array)
- nach der Statistik Einführung können Sie schnell grundlegende deskriptive Statistiken der Daten berechnen.
- Wichtige Lagemaße (Mittelwert, Median, Quantile) und
- Streuungsmaße (Varianz, Standard Abweichung)
- Häufigkeitstabellen und Kreuztabellen
- bedingte Wahrscheinlichkeiten
- bekannte Verteilungen
- Dichtefunktion und Verteilungsfunktion
Für die Grundlagen der Datenanalyse wird das Paket data.table verwendet. Es ist neben dem tidyverse-Paketen (u.a. mit dplyr) das beliebteste Paket zur Analyse von Daten. Sie können
- Daten einlesen und schreiben,
- Statistiken auf den Daten berechnen und fehlende Daten ergänzen.
In der deskriptiven, bivariaten Statistik werden Korrelationsanalysen durchgeführt und die bekannten Korrelationsmaße Korrelationskoeffizient nach Pearson und Rangkorrelation nach Spearman behandelt.
Das beliebteste Paket zur Erstellung von Grafiken, ggplot2, und die dahinterliegende grammar of graphics wird durchgenommen:
- Sie können eigene Visualisierungen erstellen, anpassen, abspeichern
- kennen die Grundlagen, um Plots individuell anzupassen.
- beherrschen die Grundlagen von statistischen Tests (Stichprobe, Nullhypothese, Signifikanz, Konfidenzintervall)
- können Mittelwertsvergleiche mit dem t-Test durchführen. Häufige Pre-Tests für die Überprüfung der Voraussetzungen vom t-Test und nicht-parametrische Tests sind Ihnen geläufig.
Diese Statistik Weiterbildung beinhaltet auch ein einfaches Verfahren des Machine Learnings, welches ein Standardverfahren der Statistik ist: die lineare Regression.
Durch die kleine Gruppengrößen und die eigene Umsetzung von Übungsaufgaben auf Ihrem Laptop mit Unterstützung des Dozenten wird eine hohe Qualität und ein bestmöglicher Lernerfolg sichergestellt.