Article initialement publié sur LinkedIn.
Je ne saurais trop insister sur l'importance du modèle de données qui sous-tend tout projet d'analyse embarquée.
Le modèle de données est le pilier des calculs, des concepts de données et des relations qui rendront le résultat de visualisation compréhensible et logique pour l'utilisateur final qui le consomme.
Qu'est-ce qu'un modèle de données ? Un modèle de données est la structure qui définit les relations entre les éléments de données.
Il existe des modèles de données de base de données, tels que ceux que vous créez dans une base de données Postgres ou MySQL, et des modèles de données analytiques, utilisés pour effectuer des calculs analytiques et créer des tableaux de bord. Il combine généralement des données provenant de différentes sources : bases de données, fichiers, API, etc.
Un bien conçu modèle de données analytiques devrait :
- Fournissez un vue unifiée de données provenant de sources multiples.
- Fournissez la base de vos données sécurité.
- Fournir noms significatifs, c'est-à-dire la sémantique, pour les concepts de données. Habituellement, les données des bases de données sont codées et ne sont pas adaptées au résultat visuel attendu. L'utilisateur doit accéder aux données sans effort.
- Fournir structures hiérarchiques avec un niveau de granularité nécessaires à l'utilisateur final qui consommera les données de sortie et les tableaux de bord. Par exemple, une hiérarchie de lieux (la façon dont vous pouvez accéder à l'emplacement) peut être un continent, un pays, une ville ou un État, une ville ou un code postal.
- Activer efficace l'interrogation et le traitement des données, qui sont essentiels pour les performances. Cela peut être réalisé de plusieurs manières en fonction de la requête sous-jacente, envoyez-moi un commentaire si vous souhaitez en savoir plus.
- Être maintenable à long terme. Une définition claire et claire du modèle de données permet une gestion efficace à long terme.
En résumé, ne tenez pas pour acquis la création de votre modèle de données ! Tenez compte des données des différentes sources, des résultats nécessaires pour l'utilisateur final et de la manière de les rendre maintenables à long terme.
Prends soin de toi ! (De vous et de votre modèle de données !)