15a81d7f37 | ||
---|---|---|
Preprocess | ||
container | ||
data | ||
datase_init | ||
LICENSE | ||
README.md | ||
Titanic.ipynb |
README.md
BDEA_Aufgabe1
Repository für die erste Aufgabe von BDEA im SoSe 2024
Aufgabestellung
Aufgabentyp: Individual (keine Teamaufgabe)
Erstellen Sie ein Notebook-basiertes Tutorial, in dem Sie eine beliebige Datenbank (SQL oder NoSQL (außer Postgres)) in einem Docker-Container ausführen und einen beliebigen Daten-Import mit einer beispielhaften Datenanalyse zeigen (!= dem Bsp. aus der Vorlesung). Seien Sie gerne kreativ.
Die Datenanalyse soll dabei interaktiv in Form von Notebooks demonstriert werden (entweder Apache Zeppelin oder JupyterLab). Verwenden sie geeignete Visualisierungsmöglichkeiten (Analysefunktionen zur Aggregation, Tabellen und Plots) um ihre gewonnenen Daten übersichtlich zu veranschaulichen. Fügen Sie für ihre Analyseschritte jeweils geeignete Beschreibungen hinzu damit diese nachvollziehbar sind.
Das Tutorial soll zwischen 10 und 15 min dauern (d.h. Lesedauer) und hat als Zielgruppe Ihre Mitstudierenden aus der Veranstaltung, die auf dieser Basis in der Lage sein sollen, die Analyse nachzuvollziehen.
Bitte geben Sie (1) alle verwendeten Quellen zu Ihrem Tutorial nach guter wissenschaftlicher Praxis im Notebook an, und (2) geben Sie die verwendeten Notebooks die alle demonstrierten Anfragen enthalten ab. Dritte sollten in der Lage sein ihr Tutorial lokal auszuführen.
Optional (!): Wenn sie möchten, können Sie gerne ein entsprechendes Video Tutorial anfertigen.
Bewertet werden vor allem Kreativität der Aufgabe, Sorgfalt und didaktischer Aufbau bzw. Nachvollziehbarkeit.
Quellen
https://www.kaggle.com/datasets/sakshisatre/titanic-dataset/data https://chat.openai.com/
Commands init db in docker (Mit beigefügte container nicht notwendig)
- copy init.sql to /tmp/init.sql
- copy data/passengers.csv to /var/lib/mysql-files/passengers.csv
mysql -u root -p
SET sql_mode = '';
source /tmp/init.sql;