Data Science Stipendium
Enable AI möchte mit dem Data Science Stipendium Studenten, die sich in dem Themengebiet Data Science weiterbilden möchten, unterstützen.
Wir bieten einen kostenlosen Data Science Kurs exklusiv für Studenten an.
Aktuell können wir das Stipendium wegen verschiedener Gründe leider nicht anbieten. Sobald wir dies wieder anbieten veröffentlichen wir Termine auf unserer Website. Ab diesem Zeitpunkt können Sie sich dann dafür wieder bewerben. Entschuldigen Sie, dass aktuell nicht die Möglichkeiten dafür vorliegen.
Inhalte auf einen Blick
- Wichtige Datenstrukturen
- pandas Data.Frame
- Statistiken berechnen
- Eine eigene Funktion schreiben
- Grafiken mit seaborn erstellen
- Daten einlesen und schreiben (csv, xls, pickle)
- Machine Learning Einführung
- Lineare Regression, Entscheidungsbaum, K-Means
- Train-Test-Split, Kreuzvalidierung
Data Science Stipendium
- Dauer: 3 Tage
- Format: Live-Online
- Level: Anfänger in Python mit Programmiererfahrung in einer anderen Sprache
- Anteil Coding: 60%
- Sprache: Python
- Bibliotheken: pandas, matplotlib, seaborn, scikit-learn
- Skript: .pdf (Theorie, Aufgaben & Lösungen)
Data Science Stipendium
- Dauer: 2 Tage
- Format: Live-Online
- Level: Anfänger in Python mit Programmiererfahrung in einer anderen Sprache
- Anteil Coding: 60%
- Sprache: Python
- Bibliotheken: pandas, matplotlib, seaborn, scikit-learn
- Skript: .pdf (Theorie, Aufgaben & Lösungen)
Inhalte auf einen Blick
- Wichtige Datenstrukturen
- pandas Data.Frame
- Statistiken berechnen
- Eine eigene Funktion schreiben
- Grafiken mit seaborn erstellen
- Daten einlesen und schreiben (csv, xls, pickle)
- Machine Learning Einführung
- Lineare Regression, Entscheidungsbaum, K-Means
- Train-Test-Split, Kreuzvalidierung
Voraussetzungen
- Das Enable AI Stipendium richtet sich an Studenten aller Fachrichtungen, die Methoden von Data Science besser verstehen und anwenden möchten.
- Promotionsstudenten sind von dem Stipendium ausgenommen.
- Erste Erfahrungen im Programmieren sind notwendig, jedoch müssen diese nicht in Python sein.
- Bitte beachtet auch die Voraussetzungen, welche im Reiter „Organisatorisches“ genannt werden, damit der Kurs auch zu Euch passt.
- Die Auswahl wird aufgrund des Motivationsschreibens, des bisherigen Werdegangs und der ehrenamtlichen Tätigkeiten getroffen.
Bewerbungsdetails
- Bewerbungen sind fortlaufend möglich an die stipendium@enable-ai.de. In den Betreff der Bewerbungsemail kannst Du Präferenzen für einen Termin angeben.
- Deine Bewerbungsunterlagen enthalten einen Lebenslauf, Angaben bisheriger Studienleistungen und ein Motivationsschreiben (max 1/2 Seite), aus dem hervorgeht, warum Du Dich im Bereich Data Science weiterbilden möchtest bzw. welche konkreten Projekte Du umsetzen möchtest.
Nächsten Termine
Das Data Science Stipendium findet als Live-Online Kurs (mit Zoom, o.ä) statt. Die Teilnahme an dem Kurs ist kostenlos. Du benötigst nur einen Rechner mit Internetzugang.
Der nächste 2 Tages Kurs findet an folgendem Termin statt (Änderungen vorbehalten):
- Wir überarbeiten gerade das Angebot bzgl. des Stipendiums und veröffentlichen den Termin, sobald dieser fest steht.
- Kursinhalte
- Organisatorisches
- Tag 1
- Tag 2
09:00 – 09:15
Begrüßung und Organisatorisches
- Vorstellungsrunde
- Erwartungen der Teilnehmer
09:15 – 10:45
Grundlagen von Python
- Neue Pakete installieren
- Spyder als Entwicklungsumgebung/IDE
- Funktionen und Methoden
- Wichtige Aspekte von Python im Vergleich zu anderen Programmiersprachen
10:45 – 11:00
Kaffeepause
11:00 – 12:30
Das Paket pandas – Data.Frame
- Struktur (Zeilen, Spalten) eines DataFrames
- Auswahl einer Zeile/Spalte
- Zeilen/Spalten erstellen, löschen, ändern
- Boolean indexing: eine logische Abfrage zur Selektion von Zeilen
- Daten zusammenfassen, um einen Überblick zu erhalten.
12:30 – 13:30
Mittagspause
13:30 – 15:00
Berechnen von Statistiken direkt im pandas Data.Frame
- Einfache Statistiken direkt auf einem Data.Frame (Mittelwert, Min, Max, Summe, Median, Varianz,…)
- Zusammenfassen und Filtern von Daten
- Fehlende Werte ersetzen
- Kreuztabelle (Kontingenztafel)
15:00 – 15:15
Kaffeepause
15:15 – 17:00
Daten einlesen und schreiben
- Das Arbeitsverzeichnis in Python und der IDE spyder setzen
- Ein CSV bzw. Excel einlesen und schreiben
- Von einer URL einlesen
- Überblick über nützliche Parameter
- Lesen und Schreiben vom Python Format pickle
- Umgang mit großen Daten
09:00 – 09:15
Rückblick und offene Fragen von Tag 1
09:15 – 10:45
Datenvisualisierung mit seaborn / matplotlib
- Die wichtigsten Grundlagen von matplotlib
- Achsen-Beschriftung, Legende, Titel ändern
- Einen Plot speichern
- In seaborn Linienplot, Boxplot, Histogram, Scatterplot, Barplot erstellen
- Darstellungen (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable variieren oder festsetzen
10:45 – 11:00
Kaffeepause
11:00 – 12:30
Überblick über Machine Learning
- Einführung in Machine Learning
- Anwendungsbeispiele von Machine Learning
- Künstliche Intelligenz – Machine Learning – Deep Learning
- Unterschied Supervised – Unsupervised Learning (überwachtes – unüberwachtes Lernen)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
12:30 – 13:30
Mittagspause
13:30 – 15:00
Entscheidungsbaum mit scikit-learn
- Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
- Grundlagen des Algorithmus
- Umsetzung in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Anpassen von Hyperparametern im Training
15:00 – 15:15
Kaffeepause
15:15 – 17:00
Ensemble Methods
- Ein Ensemble aus verschiedenen Algorithmen in scikit-learn umsetzen
- Random Forest zur Klassifizierung und zur Regression
- Ada Boost zur Klassifizierung und zur Regression
- Hyperparameter anpassen
- Ergebnissvalidierung
Zielgruppe für das Data Science Stipendium
Das Data Science Stipendium ist ideal für Teilnehmer, welche die Anwendung von Python erlernen möchten, um Daten zu analysieren und Machine Learning Algorithmen zu programmieren. Angesprochen sind Anwender, welche die Data Science Grundlagen lernen möchten.
Voraussetzungen für das Data Science Stipendium
Um die Data Science Grundlagen in Python zu lernen, benötigen Sie keine Vorkenntnisse in Python. Jedoch sollten Sie über Grundkenntnisse in einer anderen Programmiersprache besitzen, damit bekannt ist, was eine Variable, eine Funktion bzw. eine for-Schleife ist.
Das Data Science Stipendium beinhaltet Machine Learning Algorithmen, welche auf statistischen Verfahren aufbauen, wodurch grundlegende Kenntnisse der Statistik notwendig sind. Begriffe wie Mittelwert, Median, Standardabweichung oder Normalverteilung sollten Ihnen bekannt sein. Auch Symbole in der Mathematik, wie das Integral oder das Summenzeichen oder Begriffe der Mathematik, wie Funktion und Ableitung sind sehr empfohlen. Logische Operatoren Und-Oder-Nicht werden auch kurz verwendet.
Die Studierenden sollten Vorerfahrung mit dem Umgang von Daten haben, z.B. in Excel oder einer BI-Software, damit Konzepte einer spaltenweisen Berechnung bzw. einfache Statistiken (Mittelwert, Varianz) bekannt sind.
Unterrichtssprache ist Deutsch oder Englisch (bitte Ausschreibung des Kurses beachten). Die Folien sind auf Englisch, da Python und die Dokumentation der Pakete sowie Fachbegriffe des Machine Learnings auf Englisch sind. Ein englischer Text sollte daher verstanden werden, um der Schulung folgen zu können.
Didaktischer Aufbau des Data Science Stipendium Kurses
Der Data Science Stipendium Kurs beinhaltet viele Programmieraufgaben. Die Teilnehmer lösen diese selbstständig mit der Unterstützung des Trainers mit Python mit dem Ziel, das Erlernte einzuüben und zu vertiefen. Individuelle Unklarheiten können vom Trainer direkt beantwortet werden.
Technik im im Data Science Stipendium Kurs
- Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
- Bitte prüfen Sie, ob Ihr Laptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Kurs online zum Download zur Verfügung gestellt. Sie erhalten vor der Schulung per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
- In der Schulung wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).
Data Science Stipendium
- Dauer: 2 Tage
- Format: Live-Online
- Level: Anfänger in Python mit Programmiererfahrung in einer anderen Sprache
- Anteil Coding: 60%
- Sprache: Python
- Bibliotheken: pandas, matplotlib, seaborn, scikit-learn
- Skript: .pdf (Theorie, Aufgaben & Lösungen)
Inhalte auf einen Blick
- Wichtige Datenstrukturen
- pandas Data.Frame
- Statistiken berechnen
- Eine eigene Funktion schreiben
- Grafiken mit seaborn erstellen
- Daten einlesen und schreiben (csv, xls, pickle)
- Machine Learning Einführung
- Lineare Regression, Entscheidungsbaum, K-Means
- Train-Test-Split, Kreuzvalidierung