Data Science in R Kurs

Schulung der Grundlagen von Machine Learning, Datenanalyse, Data Mining mit RStudio

(*) zzgl. MwSt    (**) inkl. MwSt
Termin
Ort
Belegung
Preise

17.06.21 –
21.06.21

Live-Online
Zoom Meeting
1.525,00  (*)
1.814,75 € (**)

20.09.21 –
22.09.21

Stuttgart
Königsstraße 10c
1.525,00  (*)
1.814,75 € (**)

06.12.21 –
08.12.21

Stuttgart
Königsstraße 10c
1.525,00  (*)
1.814,75 € (**)

Seminarinhalte auf einen Blick

Über die Schulung

Data Science Kurs im Detail

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Kundenbewertungen & Erfahrungen zu Enable AI. Mehr Infos anzeigen.

Über den Datascience in R Kurs

Seminar auf einen Blick

Data Science Kurs im Detail

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Innere einer HDD Festplatte. Data Science braucht Daten.

Der dreitägige Kurs führt in die Verwendung von R für Data Science ein, erklärt die Grundlagen von datascience (Data Mining) und die Verwendung von R. Das notwendige theoretische Verständnis wird geschult mit dem Ziel die Verfahren praktisch in R und RStudio umsetzen zu können. Am Ende der Schulung können Sie selbstständig erste Datenanalysen in R umsetzen und Machine Learning Algorithmen für die Datenanalyse oder das Data Mining mit R einsetzen.

Das Paket data.table ist ein Schwerpunkt dieser datascience in R Schulung, da dieses Paket speziell für Data Science entwickelt wurde und aufgrund seiner Performance überzeugt. Die data.tables entsprechen den häufig in der statistischen Programmiersprache R verwendeten data.frames und ermöglichen eine elegante Analyse der Daten.

Das Paket ggplot2 wird für die Erstellung von Plots und Grafiken erläutert. ggplot2 ist eines der beliebtesten Pakete in R für die Visualisierung.

Nach den Grundlagen der Datenanalyse mit R erhalten Sie einen Überblick über Algorithmen im Machine Learning, welche wir in R selbst programmieren werden. Ein wichtiger Bestandteil der Data Mining Schulung ist das eigenständige Arbeiten und Lösen von Übungsaufgaben, so dass Sie mit Hilfe des Trainers das Besprochene direkt in der Praxis umsetzen und anwenden können.

In diesem Kurs erhalten Sie einen Überblick über die in der Statistik, datascience und Machine Learning viel benutzten Programmiersprache R. Als Entwicklungsumgebung/IDE wird RStudio verwendet, die am Meisten verwendete Umgebung für R. Nach dem Seminar können Sie Daten aus verschiedenen Formaten einlesen, Daten mit ggplot2 plotten bzw. Daten mit data.table bereinigen (fehlende Werte ersetzen, Zeilen und Spalten anpassen, neue Spalten erzeugen).

Sie kennen die wichtigsten Datentypen in R, können eigene einfache Funktionen schreiben und kennen die Umsetzung von Control Flows (For-Schleife, If-Else) in R. Sie verstehen das Grundkonzept eines data.table und können damit Data Wrangling und Data Cleaning durchführen.

Die Einteilung von Machine Learning in supervised-unsupervised und Reinforcement Learning wird vorgestellt und Sie können eigenständig Algorithmen in R trainieren, validieren, einen Train-Test Split durchführen und Gütekriterien zur Beurteilung eines Algorithmus berechnen und interpretieren. Bekannte Algorithmen im Machine Learning werden erläutert und Sie können die verschiedenen Algorithmen verstehen und in R im Code schreiben. Das Seminar umfasst Algorithmen für die Regression, Klassifikation und dem Clustering: Lineare Regression, Logistische Regression, Entscheidungsbaum, Random Forest, k-means clustering.

Nach der Schulung ist die Einstiegshürde für die Benutzung von R im Machine Learning und Data Science genommen, so dass Sie eigenständig Ihr Wissen erweitern können. Der Schwerpunkt im Kurs liegt auf der eigenen Umsetzung in RStudio mit Unterstützung des Dozenten.

10:00 – 10:15
Begrüßung und Organisatorisches
  • Vorstellungsrunde
  • Erwartungen der Teilnehmer
10:15 – 11:45
Grundlagen in R
Einführung in R & Wichtige Datenstrukturen
  • R und RStudio
  • Installation und Laden von Paketen
  • Wie finde ich weiterführende Informationen?
  • Welchen Unterschied hat R zu anderen Programmiersprachen?
  • Grundlegende Datenstrukturen in R
11:45 – 12:00
Kaffeepause
12:00 – 13:30
data table in R
Data.table Paket – Einführung
  • Einführung in die Besonderheit vom data.table Paket und Ähnlichkeit zu SQL-Abfragen
  • Erzeugen eines data.table
  • Möglichkeiten, Zeilen und Spalten zu extrahieren
  • Berechnungen direkt auf Spalten durchführen
  • Berechnungen nach Variablen gruppieren
13:30 – 14:30
Mittagspause
14:30 – 16:00
Daten Einlesen mit R
Daten einlesen und schreiben
  • Das Arbeitsverzeichnis in R und RStudio setzen
  • Ein CSV, Excel bzw SPSS Datei einlesen / schreiben
  • Überblick über nützliche Parameter
  • Die fread() Funktion für große Datenmengen
  • Abfragen aus einer Datenbank (SQLite)
16:00 – 16:15
Kaffeepause
16:15 – 18:00
Datenmanipulation mit data table in R
Datenmanipulation
  • Manipulationen auf einem data.table bei Zeilen und Spalten
  • Zusammenfassen und Filtern von Daten
  • Variablen erstellen, löschen, ändern
  • Fehlende Werte ersetzen
  • lapply() und die Anwendung in einem data.table (mit .SD und .SDcols)
09:00 – 09:15
Rückblick und offene Fragen von Tag 1
09:15 – 10:45
control flows in R
Control Flows (Kontrollstrukturen)
  • Eine eigene Funktion schreiben
  • Default Parameter in einer Funktion setzen
  • For Schleifen
  • If-Else Bedingungen
  • While Schleife
10:45 – 11:00
Kaffeepause
11:00 – 12:30
Beispiel von ggplot2
Datenvisualisierung mit ggplot2
  • Das Konzept hinter der Grammar of Graphics
  • Die Layer von ggplot2 zur Erstellung erster Plots und zum Plotten von Statistiken
  • Darstellungen (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable variieren oder festsetzen
  • Mehrere Subplots erstellen, Plots anpassen und speichern
12:30 – 13:30
Mittagspause
13:30 – 15:00
statistik in R
Berechnen von Statistiken direkt im data.table
  • Deskriptive Statistiken
  • Zufallszahlen aus verschiedenen Verteilungen ziehen
  • Korrelationen (Spearman, Pearson)
15:00 – 15:15
Kaffeepause
15:15 – 17:00
Machine Learning Grundlagen
Überblick über Machine Learning
  • Einführung in Machine Learning
  • Anwendungsbeispiele von Machine Learning
  • Künstliche Intelligenz – Machine Learning – Deep Learning
  • Unterschied Supervised – Unsupervised Learning (überwachtes – unüberwachtes Lernen)
  • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
09:00 – 09:15
Rückblick und offene Fragen von Tag 2
09:15 – 10:45
Lineare Regression in R
Lineare Regression
  • Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
  • Grundlagen des Algorithmus
  • Umsetzung in R
  • Validieren der Ergebnisse (mean squared error)
  • cross-validation (Kreuzvalidierung)
11:45 – 12:00
Kaffeepause
12:00 – 13:30
Entscheidungsbaum
Entscheidungsbaum in R
  • Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
  • Grundlagen des Algorithmus
  • Umsetzung in R
  • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
  • Anpassen von Hyperparametern im Training
  • cross-validation (Kreuzvalidierung)
13:30 – 14:30
Mittagspause
12:00 – 13:30
logistische Regression in R
Logistische Regression in R
  • Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
  • Grundlagen des Algorithmus
  • Umsetzung in R
  • Validieren der Ergebnisse (u.a. AIC; BIC; confusion matrix, sensitivity, accuracy)
  • ROC curve und AUC
  • Interpretation der Ergebnisse
  • cross-validation (Kreuzvalidierung)
16:00 – 16:15
Kaffeepause
16:15 – 18:00
SVM (Support Vector Machine) ein Machine Learning Algorithmus
Weitere Machine Learning Algorithmen in R
  • Überblick der Algorithmen Support Vector Machine (SVM), Random Forest und K-means
  • Umsetzung der Algorithmen in R
  • Validieren der Ergebnisse

Zielgruppe der Data Mining mit R Schulung

Dieses Seminar für Data Science und Datenanalyse mit R richtet sich an Personen, die in ihrem Unternehmen als data scientists, Machine Learning engineers oder Data Analysts, o.ä. tätig sind bzw. tätig werden. Der Einsatz von Machine Learning Algorithmen ist bei den Teilnehmern auch geplant.

Voraussetzungen für den Data Science in R Kurs

Diese Schulung, um R für Data Mining und Machine Learning einzusetzen, benötigt keine Vorkenntnisse in R. Jedoch sind grundlegende Kenntnisse einer anderen Programmiersprache nötig, da wir in R Variablen anlegen, diesen Werte zuweisen und eigene Funktionen oder for-Schleifen schreiben.

Statistische Grundlagen sind auch notwendig. Teilnehmer sollten folgende Begriffe kennen: Mittelwert, Standardabweichung, Median, Normalverteilung. Auch das Summenzeichen, das Integral oder eine mathematische Funktion sollte bekannt sein. Sehr hilfreich ist Kenntnis der drei logischen Operatoren UND, ODER, NICHT.

Da wir Daten mit R analysieren, sollten die Teilnehmer bereits mit Daten in Excel oder einer BI-Software gearbeitet haben, denn wir berechnen bspw. spaltenweise einfache Statistiken wie den Mittelwert oder die Varianz.

Die Dokumentation und weiterführende Einträge über R sind im Internet meist auf Englisch. Daher werden die Folien dieses Kurses auf Englisch sein. Das Seminar selbst wird auf Deutsch gehalten.

Didaktischer Aufbau des Datenanalyse Seminars

In dieser Data Mining Schulung steht die Praxis im Vordergrund. Teilnehmer programmieren selbstständig mit RStudio, so dass sie das Erlernte einüben können und Unklarheiten sofort geklärt werden können. Der Trainer unterstützt bei den Lösungen und hilft auch weiterführende Fragestellungen zu beantworten.

Technik im datascience mit R Seminar

  • Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
  • Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
  • Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
  • Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschalten ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.
  • In der Schulung wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Für das Seminar ist folgendes Buch als Ergänzung hilfreich: Hadley Wickham: R for Data Science. Grundsätzlich wird alles Wissen und Codebeispiele im Kurs so erklärt, dass es nicht nötig ist vor dem Kurs ein Buch zu lesen. Sie sollten lediglich darauf achten, dass Sie die Voraussetzungen (siehe Reiter Organisatorisches –> Voraussetzungen) erfüllen.

Wir bieten den Kurs in folgender Stadt an: Stuttgart. Falls Sie die Schulung gerne in einer anderen Stadt oder direkt bei Ihnen im Unternehmen besuchen möchten, kontaktieren Sie uns gerne.

Definitiv. Sie werden sich im Kurs wohlfühlen. Die erste von vier Lektionen am ersten Tag schafft die Grundlagen und sie können den Editor gleich selbst ausprobieren. Ab der zweiten Lektion ist mindestens die Hälfte der Zeit zum selbstständigen Üben, so dass Sie das Besprochene direkt coden können und selbst erkennen, wo noch Fragen bestehen, die Sie mit dem Dozenten direkt besprechen können.

Im Seminar enthält jeder Block (meist über etwa 90 Minuten) eine oder mehrere Theorie- und Praxiseinheiten. Die Theorieeinheit dient dazu, Ihnen das nötige Wissen zu vermitteln, um die Übungsaufgaben zu verstehen und selbstständig lösen zu können. Wir verzichten auf langatmige, wissenschaftliche Theorieeinheiten und konzentrieren uns auf den theoretischen Stoff der zu einem besseren Verständnis beiträgt. Der Fokus liegt auf der Praxis, d.h. dem Codeschreiben und Lösen von kleinen Verständnisaufgaben zum Lernstoff. Fragen von Teilnehmern sind jederzeit möglich. Während der Praxiseinheit werden die Fragen individuell vom Dozenten beantwortet. Fragen von allgemeinem Interesse werden allen Teilnehmern erklärt. Die Folien, welche die Theorie und weitere Erklärungen vom Code enthalten erhalten Sie als pdf und in gedruckter Version. Codebeispiele und die Musterlösung der Übungsaufgaben liegen digital vor.

Die Übungen bestehen hauptsächlich aus Coding Aufgaben, d.h. Sie schreiben entweder kurze Codebeispiele oder Sie werden gefragt, Codelücken in einem bestehenden Code zu ergänzen. Letzteres schult auch das Codeverstehen. Die Aufgaben sind so gewählt, dass die wichtigen Aufgaben von allen Teilnehmern in der verfügbaren Zeit gelöst werden können. Wir haben Coding Aufgaben unterschiedlichen Schwierigkeitsgrades vorbereitet, so dass schnellere Teilnehmer oder Teilnehmer mit Vorwissen zusätzlich an weiteren Aufgaben üben können. Desweiteren gibt es für manche Kapitel kurze Kontrollfragen zum Theorieteil.

Über den Datascience in R Kurs

Seminar auf einen Blick

Data Science Kurs im Detail

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Warum bei Enable AI buchen

Leistungen im Kurs

Durchführungsgarantie

Die Trainer, die in exklusiver Kooperation mit Enable AI zusammen arbeiten, kommen alle aus der Praxis und vermitteln praxisnahes, aktuelles Wissen auf leicht verständliche Art und Weise mit dem Ziel, dass Sie in Ihrer Arbeit das Wissen direkt anwenden können.

Zufriedenheitsgarantie

Sollten Sie in einem mehrtägigen Seminar bis zum Ende des ersten Seminartags merken, dass dieses Seminar nicht Ihren Erwartungen entspricht, sprechen Sie bitte mit dem Kursleiter am ersten Seminartag und es wird Ihnen die volle Kursgebühr inkl. Anreise (30 cent / km bzw. Bahnfahrt 2. Klasse) erstattet. Ohne Wenn und Aber.

Wissensgarantie

Falls Ihr(e) MitarbeiterIn unerwarteterweise innerhalb eines halben Jahres nach dem Besuchen eines Kurses für mehr als 6 Monate (Krankheit, Elternzeit, Sabbatical,...) ihr Unternehmen verlässt, darf kostenlos ein Kollege innerhalb eines Jahres ab dem Verlassen des Kollegens ein stattfindendes Seminar mit demselben Inhalt besuchen.

Hands-on Schulungen

Die Kurse sind hands-on Trainings, mit vielen Coding Übungen (inkl. digitalen Musterlösungen). Denn durch praktische Beispiele lernt man am meisten.

Individuelle Schulungen

Wenn es im Interessen der Schulungsgruppe ist, ändert der Trainer das Seminar nach Ihren Wünschen ab bzw. integriert Ihre Daten nach Rücksprache in den Kurs.

Aktualisierte Schulungen

Sollten Sie eine Schulung zweimal besuchen, wird diese nicht identisch sein. Ihr Feedback wird berücksichtigt und die Schulungen werden an die aktuelle Themen in Forschung und Entwicklung angepasst.

Trainer aus der Praxis

Die Trainer, die in exklusiver Kooperation mit Enable AI zusammen arbeiten, kommen alle aus der Praxis und vermitteln praxisnahes, aktuelles Wissen auf leicht verständliche Art und Weise mit dem Ziel, dass Sie in Ihrer Arbeit das Wissen direkt anwenden können.

Kleine Gruppen

Garantierte maximale Gruppengröße von 10 Teilnehmern. Im Durchschnitt besuchen 6 Teilnehmer einen Kurs.

Fundiertes Wissen

Vor der Zusammenarbeit werden unsere Trainer geprüft. Alle besitzen fundierte Kenntnisse, u.a. durch Studium, Promotion und Berufserfahrung in den Bereichen Mathematik, Informatik, Statistik und Machine/Deep Learning.

Thematisch ähnliche
Schulungen

Auswahl ähnlicher Kurse wie der R Data Science Kurs

Weitere Seminare und Termine

Die nächsten Kurse

Übersicht über die kommenden Schulungen in Machine Learning, Deep Learning, Data Science und Statistik.

(3 Tage) Kompakter Einstieg in Python für Datenanalyse und Data Science. Grundlagen über pandas DataFrame, Grafiken erstellen, Machine Learning und erste Algorithmen (Regression, Entscheidungsbaum, K-Means Clustering). Verwendete Pakete: pandas, seaborn, scikit-learn.

(3 Tage) Einführung in DL mit Schwerpunkt Bilddaten. Allgemeine Theorie der Neuronalen Netze und Umsetzung mit Keras / Tensorflow (Python) auf high-performance GPUs. Use-Cases aus dem Image Processing: Bildklassifizierung, Objektdetektierung mit Bounding Boxes, Semantische Segmentierung.

(2 Tage) Aufbauend auf Kenntnissen in Python, werden supervised und unsupervised Machine Learning Algorithmen in scikit-learn umgesetzt und die wichtigsten Schritte beim Trainieren der Algorithmen erklärt, u.a.: Regression, Entscheidungsbaum, Ensembles, Neuronales Netz, K-Means, DBSCAN Clustering.

(5 Tage) Einstieg in die Programmiersprache Python mit Fokus auf Data Science / Machine Learning. Mit u.a. folgenden Algorithmen: Regression, Random Forest, Clustering. Verwendete Pakete: pandas, numpy, matplotlib, seaborn, scikit-learn, statsmodels.

(1 Tag) Einführung in Künstliche Intelligenz, Maschinelles Lernen und Deep Learning: Voraussetzungen, Möglichkeiten und Grenzen der KI. Zielgruppe sind Führungskräfte, welche das Potential von KI in ihrem Unternehmen realistisch einschätzen möchten.

(3 Tage) Einführung in die Programmiersprache Python für Programmierer mit Grundkenntnissen einer anderen Programmiersprache. Vorstellung häufig gebrauchter Python Bibliotheken und Einführung in die Objektorientierte Programmierung.

3 Tages Kurs (R) mit einer knappen Einführung in die Statistik. Der Fokus liegt auf der Umsetzung der intuitiv erklärten Theorie in R, um Statistiken auf Daten eigenständig berechnen zu können und Daten mit dem data.table Paket analysieren zu können.

(3 Tage) Einführung in DL mit Schwerpunkt Bilddaten. Allgemeine Theorie der Neuronalen Netze und Umsetzung mit Keras / Tensorflow (Python) auf high-performance GPUs. Use-Cases aus dem Image Processing: Bildklassifizierung, Objektdetektierung mit Bounding Boxes, Semantische Segmentierung.

(3 Tage) Kompakter Einstieg in Python für Datenanalyse und Data Science. Grundlagen über pandas DataFrame, Grafiken erstellen, Machine Learning und erste Algorithmen (Regression, Entscheidungsbaum, K-Means Clustering). Verwendete Pakete: pandas, seaborn, scikit-learn.

(3 Tage) Grundlagen von Deep-Learning. Theorie der Neuronalen Netze und praktische Umsetzung mit Keras / Tensorflow (Python) auf high-performance GPUs. Einführung in CNNs, RNNs und LSTMs zur Bearbeitung von Bild-, Text- und Sequenzdaten. Training bei wenig Daten. Bekannte Netzwerkarchitekturen.

(2 Tage) Aufbauend auf Kenntnissen in Python, werden supervised und unsupervised Machine Learning Algorithmen in scikit-learn umgesetzt und die wichtigsten Schritte beim Trainieren der Algorithmen erklärt, u.a.: Regression, Entscheidungsbaum, Ensembles, Neuronales Netz, K-Means, DBSCAN Clustering.

(3 Tage) Einführung in die Datenanalyse und Machine Learning mit R. Wichtige Datenstrukturen in R, das Paket data.table für effiziente Datenanalyse. Statistiken berechnen. Eigene Funktionen schreiben. Plotten mit ggplot2. Erste ML-Algorithmen (Regression, Entscheidungsbaum, K-Means Clustering).

(1 Tag) Einführung in Künstliche Intelligenz, Maschinelles Lernen und Deep Learning: Voraussetzungen, Möglichkeiten und Grenzen der KI. Zielgruppe sind Führungskräfte, welche das Potential von KI in ihrem Unternehmen realistisch einschätzen möchten.

(3 Tage) Einführung in die Programmiersprache Python für Programmierer mit Grundkenntnissen einer anderen Programmiersprache. Vorstellung häufig gebrauchter Python Bibliotheken und Einführung in die Objektorientierte Programmierung.

(2 Tage) Aufbauend auf Kenntnissen in Python, werden supervised und unsupervised Machine Learning Algorithmen in scikit-learn umgesetzt und die wichtigsten Schritte beim Trainieren der Algorithmen erklärt, u.a.: Regression, Entscheidungsbaum, Ensembles, Neuronales Netz, K-Means, DBSCAN Clustering.

(3 Tage) Kompakter Einstieg in Python für Datenanalyse und Data Science. Grundlagen über pandas DataFrame, Grafiken erstellen, Machine Learning und erste Algorithmen (Regression, Entscheidungsbaum, K-Means Clustering). Verwendete Pakete: pandas, seaborn, scikit-learn.

(3 Tage) Einführung in DL mit Schwerpunkt Bilddaten. Allgemeine Theorie der Neuronalen Netze und Umsetzung mit Keras / Tensorflow (Python) auf high-performance GPUs. Use-Cases aus dem Image Processing: Bildklassifizierung, Objektdetektierung mit Bounding Boxes, Semantische Segmentierung.

3 Tages Kurs (R) mit einer knappen Einführung in die Statistik. Der Fokus liegt auf der Umsetzung der intuitiv erklärten Theorie in R, um Statistiken auf Daten eigenständig berechnen zu können und Daten mit dem data.table Paket analysieren zu können.

(5 Tage) Einstieg in die Programmiersprache Python mit Fokus auf Data Science / Machine Learning. Mit u.a. folgenden Algorithmen: Regression, Random Forest, Clustering. Verwendete Pakete: pandas, numpy, matplotlib, seaborn, scikit-learn, statsmodels.

(3 Tage) Grundlagen von Deep-Learning. Theorie der Neuronalen Netze und praktische Umsetzung mit Keras / Tensorflow (Python) auf high-performance GPUs. Einführung in CNNs, RNNs und LSTMs zur Bearbeitung von Bild-, Text- und Sequenzdaten. Training bei wenig Daten. Bekannte Netzwerkarchitekturen.

(3 Tage) Einführung in die Datenanalyse und Machine Learning mit R. Wichtige Datenstrukturen in R, das Paket data.table für effiziente Datenanalyse. Statistiken berechnen. Eigene Funktionen schreiben. Plotten mit ggplot2. Erste ML-Algorithmen (Regression, Entscheidungsbaum, K-Means Clustering).

(1 Tag) Einführung in Künstliche Intelligenz, Maschinelles Lernen und Deep Learning: Voraussetzungen, Möglichkeiten und Grenzen der KI. Zielgruppe sind Führungskräfte, welche das Potential von KI in ihrem Unternehmen realistisch einschätzen möchten.

(3 Tage) Kompakter Einstieg in Python für Datenanalyse und Data Science. Grundlagen über pandas DataFrame, Grafiken erstellen, Machine Learning und erste Algorithmen (Regression, Entscheidungsbaum, K-Means Clustering). Verwendete Pakete: pandas, seaborn, scikit-learn.

(3 Tage) Einführung in die Programmiersprache Python für Programmierer mit Grundkenntnissen einer anderen Programmiersprache. Vorstellung häufig gebrauchter Python Bibliotheken und Einführung in die Objektorientierte Programmierung.

(3 Tage) Einführung in DL mit Schwerpunkt Bilddaten. Allgemeine Theorie der Neuronalen Netze und Umsetzung mit Keras / Tensorflow (Python) auf high-performance GPUs. Use-Cases aus dem Image Processing: Bildklassifizierung, Objektdetektierung mit Bounding Boxes, Semantische Segmentierung.

(1 Tag) Einführung in Künstliche Intelligenz, Maschinelles Lernen und Deep Learning: Voraussetzungen, Möglichkeiten und Grenzen der KI. Zielgruppe sind Führungskräfte, welche das Potential von KI in ihrem Unternehmen realistisch einschätzen möchten.

(2 Tage) Aufbauend auf Kenntnissen in Python, werden supervised und unsupervised Machine Learning Algorithmen in scikit-learn umgesetzt und die wichtigsten Schritte beim Trainieren der Algorithmen erklärt, u.a.: Regression, Entscheidungsbaum, Ensembles, Neuronales Netz, K-Means, DBSCAN Clustering.

3 Tages Kurs (R) mit einer knappen Einführung in die Statistik. Der Fokus liegt auf der Umsetzung der intuitiv erklärten Theorie in R, um Statistiken auf Daten eigenständig berechnen zu können und Daten mit dem data.table Paket analysieren zu können.

(3 Tage) Grundlagen von Deep-Learning. Theorie der Neuronalen Netze und praktische Umsetzung mit Keras / Tensorflow (Python) auf high-performance GPUs. Einführung in CNNs, RNNs und LSTMs zur Bearbeitung von Bild-, Text- und Sequenzdaten. Training bei wenig Daten. Bekannte Netzwerkarchitekturen.

(3 Tage) Einführung in die Datenanalyse und Machine Learning mit R. Wichtige Datenstrukturen in R, das Paket data.table für effiziente Datenanalyse. Statistiken berechnen. Eigene Funktionen schreiben. Plotten mit ggplot2. Erste ML-Algorithmen (Regression, Entscheidungsbaum, K-Means Clustering).