Artikel ursprünglich veröffentlicht am LinkedIn.
Ich kann die Bedeutung des Datenmodells, das hinter jedem Embedded-Analytics-Projekt steckt, nicht genug betonen.
Das Datenmodell ist die Grundlage für Berechnungen, Datenkonzepte und Beziehungen, die die Visualisierungsausgabe für den Endbenutzer, der sie verwendet, verständlich und logisch machen.
Was ist also ein Datenmodell? Ein Datenmodell ist die Struktur, die die Beziehungen zwischen Datenelementen definiert.
Es gibt Datenbankdatenmodelle, wie sie Sie in einer Postgres- oder MySQL-Datenbank erstellen, und analytische Datenmodelle, die für analytische Berechnungen und die Erstellung von Dashboards verwendet werden. Es kombiniert normalerweise Daten aus verschiedenen Quellen: Datenbanken, Dateien, APIs usw.
Ein gut gestaltetes analytisches Datenmodell sollte:
- Bieten Sie eine einheitliche Ansicht von Daten aus mehreren Quellen.
- Stellen Sie die Grundlage für Ihre Daten bereit Sicherheit.
- Bereitstellen aussagekräftige Namen, also Semantik, für die Datenkonzepte. Normalerweise sind die Daten in Datenbanken codiert, sodass sie nicht für das erwartete visuelle Ergebnis geeignet sind. Der Benutzer sollte mühelos in die Daten navigieren.
- Bereitstellen hierarchische Strukturen mit einem Niveau von Granularität wird vom Endbenutzer benötigt, der die Datenausgabe/Dashboards verwenden wird. Eine Standorthierarchie (wie Sie den Standort aufschlüsseln) könnte beispielsweise entweder aus Kontinent, Land, Stadt oder Bundesland, Stadt oder Postleitzahl bestehen.
- Aktiviere effizient Datenabfrage und -verarbeitung, was für die Leistung entscheidend ist. Dies kann auf verschiedene Arten erreicht werden, je nachdem, was die zugrunde liegende Abfrage ist. Schreiben Sie mir einen Kommentar, wenn Sie mehr erfahren möchten.
- Sei wartbar auf lange Sicht. Eine saubere und klare Datenmodelldefinition ermöglicht ein langfristig effizientes Management.
Zusammenfassend: Nehmen Sie die Erstellung Ihres Datenmodells nicht als selbstverständlich an! Berücksichtigen Sie die Daten in den verschiedenen Quellen, die benötigte Endbenutzerleistung und wie Sie sie auf lange Sicht wartbar machen können.
Passt auf euch auf! (Von dir und deinem Datenmodell!)