Repository für die erste Aufgabe von BDEA im SoSe 2024
 
Go to file
Alejandro Restrepo Klinge 15a81d7f37 updated readme 2024-04-19 10:33:06 +02:00
Preprocess Added content to repo 2024-04-18 08:36:22 +02:00
container Added content to repo 2024-04-18 08:36:22 +02:00
data Added content to repo 2024-04-18 08:36:22 +02:00
datase_init Added content to repo 2024-04-18 08:36:22 +02:00
LICENSE Initial commit 2024-04-18 08:12:53 +02:00
README.md updated readme 2024-04-19 10:33:06 +02:00
Titanic.ipynb Final version of notebook 2024-04-19 10:30:49 +02:00

README.md

BDEA_Aufgabe1

Repository für die erste Aufgabe von BDEA im SoSe 2024

Aufgabestellung

Aufgabentyp: Individual (keine Teamaufgabe)

Erstellen Sie ein Notebook-basiertes Tutorial, in dem Sie eine beliebige Datenbank (SQL oder NoSQL (außer Postgres)) in einem Docker-Container ausführen und einen beliebigen Daten-Import mit einer beispielhaften Datenanalyse zeigen (!= dem Bsp. aus der Vorlesung). Seien Sie gerne kreativ.

Die Datenanalyse soll dabei interaktiv in Form von Notebooks demonstriert werden (entweder Apache Zeppelin oder JupyterLab). Verwenden sie geeignete Visualisierungsmöglichkeiten (Analysefunktionen zur Aggregation, Tabellen und Plots) um ihre gewonnenen Daten übersichtlich zu veranschaulichen. Fügen Sie für ihre Analyseschritte jeweils geeignete Beschreibungen hinzu damit diese nachvollziehbar sind.

Das Tutorial soll zwischen 10 und 15 min dauern (d.h. Lesedauer) und hat als Zielgruppe Ihre Mitstudierenden aus der Veranstaltung, die auf dieser Basis in der Lage sein sollen, die Analyse nachzuvollziehen.

Bitte geben Sie (1) alle verwendeten Quellen zu Ihrem Tutorial nach guter wissenschaftlicher Praxis im Notebook an, und (2) geben Sie die verwendeten Notebooks die alle demonstrierten Anfragen enthalten ab. Dritte sollten in der Lage sein ihr Tutorial lokal auszuführen.

Optional (!): Wenn sie möchten, können Sie gerne ein entsprechendes Video Tutorial anfertigen.

Bewertet werden vor allem Kreativität der Aufgabe, Sorgfalt und didaktischer Aufbau bzw. Nachvollziehbarkeit.

Quellen

https://www.kaggle.com/datasets/sakshisatre/titanic-dataset/data https://chat.openai.com/

Commands init db in docker (Mit beigefügte container nicht notwendig)

  1. copy init.sql to /tmp/init.sql
  2. copy data/passengers.csv to /var/lib/mysql-files/passengers.csv
mysql -u root -p
SET sql_mode = '';
source /tmp/init.sql;