Mo 08.07 -
Di 09.07.24

Live-Online
Zoom Meeting

1.290,00 € (*)
1.535,10 € (**)

Do 14.11 -
Fr 15.11.24

Live-Online
Zoom Meeting

1.290,00 € (*)
1.535,10 € (**)

Beschreibung des Big Data Kurses

Der Kurs gliedert sich thematisch in drei Breiche, die die Teilnehmer schrittweise an Apache Spark heranführen.

Der erste (eher theoretische) Teil gibt einen knappen Überblick aktueller Technologien zur Speicherung und Verarbeitung großer Datenmengen (Hadoop und Kubernetes), und welchen Platz Spark als wichtiges Datenverarbeitungsframework darin einnimmt.

Der zweite, praktisch angelegte Teil umfasst eine ausführliche Einführung in die Arbeit mit Apache Spark mit Python (PySpark). Dieses Modul stellt den Kern des Workshops dar. Dementsprechend werden dabei alle wichtigen Punkte angesprochen:

• Einladen von Daten
• Datenaufbereitung (Transformation, Filtern, Joinen, Aggregation)
• Anbindung verschiedener Datenquellen
• Ausführungsmodelle von Apache Spark
• Integration von dem Python Data Science Module Pandas und wichtige Unterschiede

Die Teilnehmer werden all diese Schritte direkt an praktischen Beispielen und Übungen umsetzen. Zusätzlich werden auch gängige Grundkonzepte zur Datenorganisation in Big Data Projekten angesprochen.

Der dritte Teil behandelt schließlich die in Spark vorhandenen Möglichkeiten zur Datenanalyse und zum maschinellen Lernen (ML). Es werden kurz die grundlegenden Konzepte und Vorgehensweisen von ML erläutert und an einem Beispiel mit PySpark praktisch angewandt.

Der Kurs gliedert sich thematisch in drei Breiche, die die Teilnehmer schrittweise an Apache Spark heranführen.

Was lernen Sie im PySpark Seminar?

Der Fokus des Workshops liegt auf dem Umgang mit PySpark zur Verarbeitung und Analyse großer Datenmengen. Der Bereich „Machine Learning“ wird im letzten Teil ebenfalls besprochen, jedoch wird das Thema aufgrund der inherenten Komplexität theoretisch nur knapp umrissen. Im Mittelpunkt steht vielmehr, welche Möglichkeiten Apache Spark zu diesem Anwendungsgebiet anbietet, und unter welchen Bedingungen der Einsatz von PySpark anderen Alternativen vorzuziehen ist.

Der Workshop versetzt die Teilnehmer in die Lage, selbständig Daten mit Hilfe von Apache Spark zu transformieren und analyieren.

DSBoot – Data Science Bootcamp Weiterbildung

Python - 5 Tage

Sie erlernen einen umfassenden Einstieg in die Programmiersprache Python mit Fokus auf Data Science und Machine Learning. Nach dem Seminar sind sie fähig einfache Datenanalysen in Ihrem Unternehmen durchzuführen und ihre erworbende Kenntnisse selbständig zu vertiefen. U.a. folgende Python Pakete werden erläutert: pandas, numpy, matplotlib, seaborn, scikit-learn, statsmodels.

DataVis – Datenvisualisierung Dashboards in Python

Python – 2 Tage

In dieser Schulung lernen Sie, wie Sie schnell und effektiv Ihre Daten und Ergebnisse mit Python visualisieren und mit anderen teilen können. Auch die interaktive Visualisierung wird behandelt. Verwendete Python Pakete sind: pandas, matplotlib, plotly, rise, ipywidgets, voila, streamlit.

Excel Power Pivot Schulung

1 Tag - Microsoft Excel

Big Data in Excel: Der Schwerpunkt des Seminars liegt in der Aufbereitung und Verknüpfung unterschiedlicher Tabellen oder – allgemein gesprochen: wie kann man (große) Datenmengen aus unterschiedlichen Quellen verarbeiten? Ziel ist es mit Hilfe des Datenmodells komplexe Auswertungen vereinfacht durchzuführen.

MLPy – Machine Learning Kurs

Python - 2 Tage

Aufbauend auf Python Grundkenntnissen, werden supervised und unsupervised Machine Learning Algorithmen in scikit-learn und die wichtigsten Schritte beim Trainieren der Algorithmen behandelt. Folgende Algorithmen werden erläutert: Lineare & Logistische Regression, Entscheidungsbaum, Ensembles, Neuronales Netz (MLP), K-Nearest Neighbor, K-means, DBSCAN Clustering.

Big Data Analytics Seminar mit PySpark

Verarbeitung von großen Datenmengen mit Apache Spark und Python

Kurs auf einen Blick

Über die Schulung

Ihr Trainer für den Kurs

Schulung auf einen Blick

Beschreibung des Big Data Kurses

Was lernen Sie im PySpark Seminar?

Organisatorisches

Zielgruppe der Big Data Analytics Weiterbildung

Voraussetzungen für das Big Data Analytics Seminar

Didaktischer Aufbau des Big Data PySpark Kurs

Technik in der Big Data Analytics Weiterbildung

Inhouseschulung / Firmenschulung

Termin (2 Tage)/ (4 Vormittage)	Ort	Belegung	Preise
Mo 08.07 - Di 09.07.24	Live-Online Zoom Meeting		1.290,00 € () 1.535,10 € (*)	BUCHEN
Do 14.11 - Fr 15.11.24	Live-Online Zoom Meeting		1.290,00 € () 1.535,10 € (*)	BUCHEN