Data Science Stipendium

Enable AI möchte mit dem Data Science Stipendium Studierende, die sich in dem Themengebiet Data Science weiterbilden möchten, unterstützen.

Wir bieten zweimal im Jahr einen kostenlosen Data Science Kurs exklusiv für Studierende an.

Ein Kurs davon wird auf Deutsch gehalten, ein Kurs auf Englisch. Die nächsten Termine für die Kurse finden Sie weiter unten auf der Seite.

Inhalte auf einen Blick

Data Science Stipendium

Data Science Stipendium

Inhalte auf einen Blick

  • Das Enable AI Stipendium richtet sich an Studierende aller Fachrichtungen, die Methoden von Data Science besser verstehen und anwenden möchten.
  • Promotionsstudierende sind von dem Stipendium ausgenommen.
  • Erste Erfahrungen im Programmieren sind notwendig, jedoch müssen diese nicht in Python sein.
  • Bitte beachtet auch die Voraussetzungen, welche im Reiter „Organisatorisches“ genannt werden, damit der Kurs auch zu Euch passt.
  • Die Auswahl wird aufgrund des Motivationsschreibens, des bisherigen Werdegangs und der ehrenamtlichen Tätigkeiten getroffen.
  • Bewerbungen sind fortlaufend möglich an die stipendium@enable-ai.de. In den Betreff der Bewerbungsemail kannst Du Präferenzen für einen Termin angeben.
  • Deine Bewerbungsunterlagen enthalten einen Lebenslauf, Angaben bisheriger Studienleistungen und ein Motivationsschreiben (max 1/2 Seite), aus dem hervorgeht, warum Du Dich im Bereich Data Science weiterbilden möchtest bzw. welche konkreten Projekte Du umsetzen möchtest.

Das Data Science Stipendium findet als Live-Online Kurs (mit Zoom, o.ä) statt. Die Teilnahme an dem Kurs ist kostenlos. Du benötigst nur einen Rechner mit Internetzugang. 

Die nächsten 2 Tages Kurse finden an folgenden Terminen statt (Änderungen vorbehalten):

  • (Kurs auf Deutsch) Donnerstag 18 bis Samstag 20. März 2021 (ausnahmsweise über drei Tage)
  • (training in English) Oktober / November 2021. Genauer Termin wird noch bekanntgegeben.
09:00 – 09:15
Begrüßung und Organisatorisches
  • Vorstellungsrunde
  • Erwartungen der Teilnehmer
09:15 – 10:45
Grundlagen-python.jpg
Grundlagen von Python
  • Neue Pakete installieren
  • Spyder als Entwicklungsumgebung/IDE
  • Funktionen und Methoden
  • Wichtige Aspekte von Python im Vergleich zu anderen Programmiersprachen 
10:45 – 11:00
Kaffeepause
11:00 – 12:30
Data-Frame-Pandas.jpg
Das Paket pandas – Data.Frame​
  • Struktur (Zeilen, Spalten) eines DataFrames
  • Auswahl einer Zeile/Spalte
  • Zeilen/Spalten erstellen, löschen, ändern
  • Boolean indexing: eine logische Abfrage zur Selektion von Zeilen
  • Daten zusammenfassen, um einen Überblick zu erhalten.
12:30 – 13:30
Mittagspause
13:30 – 15:00
Statistiken.jpg
Berechnen von Statistiken direkt im pandas Data.Frame​
  • Einfache Statistiken direkt auf einem Data.Frame (Mittelwert, Min, Max, Summe, Median, Varianz,…)
  • Zusammenfassen und Filtern von Daten
  • Fehlende Werte ersetzen
  • Kreuztabelle (Kontingenztafel)
15:00 – 15:15
Kaffeepause
15:15 – 17:00
Daten Einlesen in Python
Daten einlesen und schreiben
  • Das Arbeitsverzeichnis in Python und der IDE spyder setzen
  • Ein CSV bzw. Excel einlesen und schreiben
  • Von einer URL einlesen
  • Überblick über nützliche Parameter
  • Lesen und Schreiben vom Python Format pickle
  • Umgang mit großen Daten
09:00 – 09:15
Rückblick und offene Fragen von Tag 1
09:15 – 10:45
seaborn, python Paket zum plotten
Datenvisualisierung mit seaborn / matplotlib
  • Die wichtigsten Grundlagen von matplotlib
  • Achsen-Beschriftung, Legende, Titel ändern
  • Einen Plot speichern
  • In seaborn Linienplot, Boxplot, Histogram, Scatterplot, Barplot erstellen
  • Darstellungen (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable variieren oder festsetzen
10:45 – 11:00
Kaffeepause
11:00 – 12:30
Machine Learning Grundlagen
Überblick über Machine Learning
  • Einführung in Machine Learning
  • Anwendungsbeispiele von Machine Learning
  • Künstliche Intelligenz – Machine Learning – Deep Learning
  • Unterschied Supervised – Unsupervised Learning (überwachtes – unüberwachtes Lernen)
  • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
12:30 – 13:30
Mittagspause
13:30 – 15:00
Entscheidungsbaum
Entscheidungsbaum mit scikit-learn
  • Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
  • Grundlagen des Algorithmus
  • Umsetzung in Python
  • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
  • Anpassen von Hyperparametern im Training
15:00 – 15:15
Kaffeepause
15:15 – 17:00
Ensemble Methoden, eine Algorithmenklasse des Machine Learning
Ensemble Methods
  • Ein Ensemble aus verschiedenen Algorithmen in scikit-learn umsetzen
  • Random Forest zur Klassifizierung und zur Regression
  • Ada Boost zur Klassifizierung und zur Regression
  • Hyperparameter anpassen
  • Ergebnissvalidierung

Zielgruppe für das Data Science Stipendium

Das Data Science Stipendium ist ideal für Teilnehmer, welche die Anwendung von Python erlernen möchten, um Daten zu analysieren und Machine Learning Algorithmen zu programmieren. Angesprochen sind Anwender, welche die Data Science Grundlagen lernen möchten.

Voraussetzungen für das Data Science Stipendium

Um die Data Science Grundlagen in Python zu lernen, benötigen Sie keine Vorkenntnisse in Python. Jedoch sollten Sie über Grundkenntnisse in einer anderen Programmiersprache besitzen, damit bekannt ist, was eine Variable, eine Funktion bzw. eine for-Schleife ist.

Das Data Science Stipendium beinhaltet Machine Learning Algorithmen, welche auf statistischen Verfahren aufbauen, wodurch grundlegende Kenntnisse der Statistik notwendig sind. Begriffe wie Mittelwert, Median, Standardabweichung oder Normalverteilung sollten Ihnen bekannt sein. Auch Symbole in der Mathematik, wie das Integral oder das Summenzeichen oder Begriffe der Mathematik, wie Funktion und Ableitung sind sehr empfohlen. Logische Operatoren Und-Oder-Nicht werden auch kurz verwendet.

Die Studierenden sollten Vorerfahrung mit dem Umgang von Daten haben, z.B. in Excel oder einer BI-Software, damit Konzepte einer spaltenweisen Berechnung bzw. einfache Statistiken (Mittelwert, Varianz) bekannt sind.

Unterrichtssprache ist Deutsch oder Englisch (bitte Ausschreibung des Kurses beachten). Die Folien sind auf Englisch, da Python und die Dokumentation der Pakete sowie Fachbegriffe des Machine Learnings auf Englisch sind. Ein englischer Text sollte daher verstanden werden, um der Schulung folgen zu können.

Didaktischer Aufbau des Data Science Stipendium Kurses

Der Data Science Stipendium Kurs beinhaltet viele Programmieraufgaben. Die Teilnehmer lösen diese selbstständig mit der Unterstützung des Trainers mit Python mit dem Ziel, das Erlernte einzuüben und zu vertiefen. Individuelle Unklarheiten können vom Trainer direkt beantwortet werden.

Technik im im Data Science Stipendium Kurs

  • Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
  • Bitte prüfen Sie, ob Ihr Laptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Kurs online zum Download zur Verfügung gestellt. Sie erhalten vor der Schulung per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
  • In der Schulung wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Data Science Stipendium

Inhalte auf einen Blick