Lehrveranstaltungen in der Informatik

Big Data - Darstellung und Analyse großer Datenmengen

Prof. Dr. M. Zachow

zurück zurück

Inhalt

Vorlesung

  • Grundlagen und Einführung
  • Datenbank-Technologien aus dem NoSQL-Umfeld
  • Ecosysteme und Infrastrukturen (z.B. Apache Hadoop)
  • Verteilte Datenbanken, Clustering und Cloud-Lösungen
  • Business Intelligence
  • Analyse, Algorithmen und Machine Learning
  • Datenvisualisierung

 

Labor

In den begleitenden Laboren wird die Datenanalyse und Visualisierung existierender Datensets (Stichwort Open Data) praktisch erprobt.

Die Zuordnung zu einem der Schwerpunkte [Sec, Mob, Hci] richtet sich nach dem thematischen Schwerpunkt der durchgeführten Datenanalyse und der Hausarbeit.

Organisation

Sommersemester, Vorlesung / Labor  4-std.

Sprache: deutsch

Präsenzstudium: 60 h, Eigenstudium: 120 h
Gesamtaufwand: 180 h

Leistungspunkte (credit points): 6

Prüfung: PL (HA, Arb, Vortr)

Lernvoraussetzungen

Sie kennen Grundlagen von relationalen und NoSQL-Datenbanken sowie fundamentale Standard-Algorithmen. Sie können objektorientiert programmieren und entsprechende Algorithmen implementieren. Sie kennen Architekturen von Web-Anwendungen.

Lernziele

Sie verstehen die Grundlagen von Big Data, sowohl technologisch als auch methodisch. Sie können Big-Data-Projekte planen, beurteilen, umsetzen und betreiben. Sie kennen Verfahren zur Aufbereitung, Analyse und Darstellung von Daten und können diese kontextgebunden einsetzen.

Literatur

D. Miner, A.Shook: MapReduce Design Patterns. O'Reilly (2012)

R. Wartala: Hadoop. Open Source Press (2012)