Seminarziel
Daten entstehen überall. Sie werden in der Unternehmenssoftware bereitgestellt, lassen sich aus IoT-Geräten generieren, entstehen in Smartphones, Autos, zuhause. Die Analyse dieser „Big Data“ wird somit immer wichtiger. Dieses Seminar vermittelt die Grundlagen der Datenanalysen und der heute eingesetzten Technologien. Auf Basis von Apache Spark und der Programmiersprache Python werden anhand von umfassenden Echtdaten erste Analysen erstellt.
Seminarinhalt
Predictive Data Science
Im Kurs werden nicht nur die umfangreichen Möglichkeiten vermittelt, mit Datenanalysen Zielbilder für die (mögliche) Zukunft abzuleiten, sondern auch ganz handfeste Basics:
- Daten im Cluster analysieren mit dem Resilient Distributed Dataset
- Analysescripte funktional in Python schreiben
- Umgang mit dem Jupyter Notebook
- Umgang mit riesigen Echtdaten (Open Data), z.B. Geburtsstatistiken, Taxirouten und Verkehrsdaten
- Ausblick: Nutzung der Cloud-Infrastruktur für riesige Datenmengen und Künstliche Intelligenz zur Mustererkennung in großen aggregierten Datenmengen
Zielgruppe
Dieses Seminar ist für alle Berufssparten, die mit Datenanalyse umgehen, konzipiert.
Voraussetzungen
Programmierkenntnisse, z.B. in Python, sind von Vorteil, aber nicht notwendig.