diff --git a/lego/paper/KGR_paper1_lego.tex b/lego/paper/KGR_paper1_lego.tex index aec0d33..6ef0e47 100644 --- a/lego/paper/KGR_paper1_lego.tex +++ b/lego/paper/KGR_paper1_lego.tex @@ -116,6 +116,8 @@ \caption{Datenbankschema \textit{Rebrickable} \cite{FreeLEGOCatalog}} \end{figure} + Der Datensatz konnte über die URL \url{https://rebrickable.com/downloads/} erhalten werden. + \subsection{Brickset} \textit{Brickset} ist primär eine Datenbank von Lego-Sets. Dazu dient die Seite als News-Portal, Tracking-Möglichkeit und Review-Seite über Lego-Sets. \textit{Brickset} finanziert sich über Affiliate Marketing \cite{BricksetHomePage2026}. Die Seite wurde ausgewählt, um den von \textit{Rebrickable} erhaltenen Datensatz über Sets anzureichern, um bspw. Verpackungsdimensionen, Modelldimensionen, \ac{UVP} und die \ac{EAN}. @@ -131,6 +133,13 @@ \end{tabularx} \end{table} + Der Datensatz konnte mithilfe einer Export Funktion von Brickset erhalten werden. + \begin{itemize} + \item Die Daten über Lego-Teile konnten direkt über die URL \url{https://brickset.com/exportscripts/parts/list} abgerufen werden. + \item LEGO-Minifiguren über: \url{http://brickset.com/exportscripts/minifigs/list} + \item LEGO-Sets über: \url{http://brickset.com/exportscripts/sets/list}, jedoch muss in der selbigen Session die URL \url{https://brickset.com/sets/theme-{theme}} besucht werden + \end{itemize} + \subsection{Bricklink} \textit{Bricklink} ist eine Website, die als Marktplatz zum Kauf und Verkauf von einzelnen Lego-Teilen fungiert. \textit{Bricklink} ist ebenso Anbieter der Software \textit{Bricklink Studio}, einer Anwendung zum Entwurf, Rendern und Erstellen von Anleitungen für Lego-Sets. Die Teileliste, eines in \textit{Bricklink Studio} kann zu \textit{Bricklink} übertragen werden, um Lego Sets in die Realität zu bringen \cite{BrickLinkBuySell}.\\ Der Datensatz enthält grundlegende Daten über Minifiguren, Einzelteile und Sets von Lego. @@ -146,6 +155,8 @@ \end{tabularx} \end{table} + Der \textit{Bricklink}-Datensatz konnte über HTML-Scraping der Seite \url{https://www.bricklink.com/catalogSearch.asp?v=C} erhalten werden. + \subsection{Merlins Steine} \textit{Merlins Steine} ist eine Website, die sich auf die Berichterstattung von Reviews zu Klemmbausteinen spezifiziert. Um auf entsprechende Sets zu referenzieren beinhaltet \textit{Merlins Steine} eine Datenbank an Klemmbausteinen, die über 30000 Sets unterschiedlicher Marken enthält. Merlins Steine finanziert sich über Affiliate Marketing. \cite{SetDatenbankSetDB}.\\ @@ -162,11 +173,23 @@ \end{tabularx} \end{table} + Die Indizierung der Sets nach ID konnte über die URL \url{https://www.merlinssteine.de/setdb/hersteller/{hersteller}/} erhalten werden. Für jedes einzelne Set wurde die Haupt-Seite des Sets \url{https://www.merlinssteine.de/sets/{set_id}/} aufgerufen um zusätzliche Daten zu erhalten. Da die Felder der Hauptseiten für Sets nicht einheitlich befüllt waren, mussten die Daten transformiert werden. + \section{Implementierung} \subsection{Integrationsprozess} - Jedes von Lego veröffentlichte Teil besitzt der Form zugrunde eine eindeutige Teile-Nummer. + Jedes von Lego veröffentlichte Teil besitzt der Form zugrunde eine eindeutige Teile-Nummer, auch Design-ID genannt. Die Teilenummer wird nur aufgrund der Form eines Legosteins vergeben und kann auf dem Lego-Stein abgelesen werden. Üblicherweise besitzt eine Design-ID 4-5 Stellen. Abhängig von der Form, Farbe und des Drucks besitzt jeder Lego-Stein eine 6-7 stellige Element-ID. Diese Element-ID lässt sich Lego-Sets besitzen ebenfalls eine Set-Nummer. Allerdings gibt es spezielle Lego-Sets, welche in Teil-Sets aufgegliedert werden oder mehrere Bauvarianten besitzen \cite{FreeLEGOCatalog}. Diese sind in der Modellierung dieser Arbeit nicht weiter berücksichtigt. Stattdessen wird das zugrundeliegende Hauptset betrachtet. Lego-Minifiguren erhalten durch Lego keine eindeutige Identifikationsnummer. Zur eindeutigen Identifikation wird die von \textit{Rebrickable} vergebene ID verwendet.\\ + Da die einzige Quelle für andere Hersteller nur \textit{Merlins Steine} ist und diese nur Sets enthält, wird der Hersteller in der IRI miteinbezogen. + \begin{verbatim} + https://thm.de/set/{brand}/{id} + \end{verbatim} + + \begin{figure}[H] + \includegraphics[width=\columnwidth]{bilder/example_part_number.png} + \caption{Lego Stein mit Teile-Nummer (Design-ID) 41769} + \label{fig:lego_example_part_number} + \end{figure} %Verwandte Objekte erkennen (Schema Alignment) @@ -180,6 +203,8 @@ \subsection{Ergebnis} + Das Projekt kann unter der URL: \url{https://gitty.informatik.hs-mannheim.de/2211275/kgr} betrachtet werden. + \subsection{Beispiel-Queries} \subsection{Abdeckung} diff --git a/lego/paper/bilder/example_part_number.png b/lego/paper/bilder/example_part_number.png new file mode 100644 index 0000000..91d3d8d Binary files /dev/null and b/lego/paper/bilder/example_part_number.png differ