Couches Sémantiques et Tableaux de Bord : un seul Graphique et une seule Requête SQL ?

Nathalie Leroy
Nathalie Leroy
May 2, 2024

Cet article explore la valeur des couches sémantiques dans les flux de travail de visualisation des données et présente de nombreux avantages lorsqu'il s'agit d'effectuer des analyses avancées par rapport aux requêtes directes vers les bases de données. Qu'il s'agisse d'un modèle de données convivial pour les entreprises, de performances améliorées ou d'une cohérence et d'une sécurité accrues des données, les couches sémantiques constituent une base solide pour créer des visualisations pertinentes et efficaces.

TABLE DES MATIÈRES
Une image schématique des couches sémantiques et des tableaux de bord
Analyses
Tableaux de bord
Tout
Sémantique
Technologie

Lors de la création de rapports et de tableaux de bord, la première idée consiste à connecter directement une bibliothèque de graphiques contenant un ensemble de requêtes SQL à la base de données, mais est-ce suffisant ?

Il existe de merveilleuses bibliothèques disponibles pour toutes sortes de visualisations de données intéressantes, telles que HighCharts, qui peut afficher des données à la fois de manière scientifique et extrèmement esthétique; AmCharts, connus pour leurs capacités étendues à représenter les données sous forme de faits concrets ou d'histoires captivantes ; et d'autres comme Google Charts, D3.js, et Charts.js.

Une fois que nous avons choisi notre bibliothèque, nous devons « simplement » accéder à la base de données, extraire les données, effectuer des calculs et des agrégations, mettre en œuvre des contraintes de sécurité et de confidentialité et introduire un éditeur convivial par glisser-déposer pour créer de nouveaux rapports et informations selon les besoins. De plus, nous devons les intégrer dans les logiciels existants, rester à jour en fonction des mises à jour des navigateurs et des demandes des clients, améliorer les performances, et voilà !

Tout à coup, ce mot « juste » semble être une entreprise de grande envergure et penser au cycle de vie complet des logiciels et de la logique métier, des exigences aux tests d'intégration finaux, ne facilite pas les choses.

Cet article abordera les points suivants :

  • Qu'est-ce qu'une couche sémantique ?
  • Tirer parti des avantages des couches sémantiques dans la visualisation des données
  • Contre-argument
  • Cas d'utilisation de la couche sémantique - PropTech Industry
  • Conclusion

Qu'est-ce qu'une Couche sémantique ?

Une couche sémantique est un modèle de données conçu pour l'analyse qui se situe entre vos données SQL sous-jacentes et les utilisateurs finaux de vos analyses, ce qui permet un accès cohérent et fiable à vos données.

En 2018 déjà, Gartner avait souligné l'importance d'une couche sémantique dans son rapport  Comment utiliser la sémantique pour augmenter la valeur commerciale de vos données :

En raison des niveaux sans précédent d'échelle et de distribution des données, il est quasiment impossible pour les entreprises d'exploiter efficacement leurs actifs de données. Les responsables des données et de l'analyse doivent adopter une approche sémantique de leurs actifs de données d'entreprise, faute de quoi ils risquent de perdre la bataille pour obtenir un avantage concurrentiel.

Chez icCube, nous pensons que les couches sémantiques sont le chaînon manquant entre les utilisateurs professionnels et la valeur bloquée dans les bases de données sous-jacentes. Nous pensons que l'utilisation de couches sémantiques offre plusieurs avantages par rapport à la connexion directe aux bases de données de production et aidera les entreprises à relever les défis actuels.

Tirer parti des avantages des Couches Sémantiques dans la Visualisation des données

Adapté aux Entreprises

Une couche sémantique permet de rationaliser l'accès aux données en fournissant une représentation abstraite, « assimilable » et normalisée des données familières aux utilisateurs finaux. Contrairement aux requêtes directes aux bases de données, qui obligent les développeurs à naviguer dans la complexité des structures de données sous-jacentes, les couches sémantiques présentent les données dans un format structuré en utilisant des concepts commerciaux familiers, simplifiant ainsi la récupération et la manipulation des données.

Cette structure de modèle de données est particulièrement utile lorsque, par exemple, il est souvent nécessaire de disposer de structures hiérarchiques utilisées pour diverses analyses détaillées des tableaux de bord.

Cohérence

Il est essentiel de maintenir la cohérence de l'interprétation des données entre les différents outils de visualisation et tableaux de bord pour une prise de décision efficace. Les couches sémantiques appliquent des définitions de données et des termes commerciaux normalisés, garantissant ainsi la cohérence de l'interprétation et de l'analyse des données. En revanche, les requêtes directes vers les bases de données peuvent entraîner des divergences en raison des variations dans les implémentations des requêtes. Par exemple, si les données de différentes bases de données indiquent des régions mais que les noms des colonnes sont différents, par exemple « Continent » dans l'une et « Région » dans l'autre, cela peut semer la confusion chez les utilisateurs et les empêcher de comprendre et de faire confiance aux données et au tableau de bord. Un autre exemple concerne des calculs ou des mesures qui peuvent ne pas être immédiatement clairs à partir du seul nom de colonne de la base de données, comme « montant » ; vous pouvez donc attribuer à vos données des libellés explicites qui s'adressent à l'utilisateur final.

Les couches sémantiques servent donc à réduire les erreurs et les divergences entre les visualisations de données et les tableaux de bord, favorisant ainsi des processus de prise de décision fiables.

 

Analyses Avancées

Un modèle de données analytique est mieux adapté à l'analyse avancée car il est spécialement conçu pour gérer des calculs complexes de manière efficace et précise. Que vous deviez effectuer des évaluations de parts de marché, des régressions multidimensionnelles, des calculs sur des données comportant des relations plusieurs-à-plusieurs, des opérations vectorielles/matricielles ou d'autres types de calculs complexes, un serveur analytique offre une exécution fiable qui surpasse la complexité du traitement analytique des données que les requêtes directes aux bases de données peuvent généralement gérer efficacement.

Performances Améliorées

Les bases de données de production sont conçues et optimisées pour exécuter des transactions rapides. Par conséquent, les requêtes analytiques directes adressées aux bases de données de production entraînent souvent des goulots d'étranglement en termes de performances, en particulier lors de la gestion de grands ensembles de données ou de requêtes complexes.

Les couches sémantiques, quant à elles, sont conçues et optimisées pour des requêtes analytiques rapides. Ils sont généralement hébergés dans un environnement distinct, ce qui permet d'améliorer les performances des requêtes et la réactivité globale du système, par exemple dans le cadre d'un OLAP, MOLAP ou ROLAP produit comme l'élément multidimensionnel d'ICCube.

Sécurité Renforcée

Les couches sémantiques constituent la base de votre configuration de sécurité, permettant un contrôle précis de l'accès. Par exemple, dans une hiérarchie géographique telle que les continents, les pays et les villes, les utilisateurs peuvent accéder à des données au niveau des pays mais pas à des informations spécifiques à une ville. Combiné à d'autres dimensions selon une approche multiproduit, cela crée une structure de sécurité détaillée qui peut aller jusqu'au niveau de détail des cellules. En centralisant l'accès aux données, les entreprises peuvent appliquer des politiques strictes de manière efficace, ce qui permet aux développeurs de mettre en œuvre une définition de sécurité solide, atténuant ainsi le risque d'accès non autorisé aux données ou de violations.

Maintenance

Le fait d'avoir des requêtes SQL ad hoc réparties sur des graphiques de 10 à 100 et peut-être bien plus encore est la source d'un cauchemar de maintenance et est assez similaire au problème des feuilles de calcul Excel. Toute modification des données de production sous-jacentes peut entraîner la suppression d'une ou de plusieurs de ces requêtes. Malheureusement, il n'existe aucune possibilité réelle de savoir quelle requête (déployée qui sait où) utilise quelles données.

Une couche sémantique permet de minimiser ce risque. L'implémentation de la couche peut être adaptée (si nécessaire) lors de la modification des données sous-jacentes sans modifier son interface exposée, ce qui signifie qu'aucun tableau de bord ne sera jamais cassé.

Intégration et Interrogation de Sources de Données Croisées

Les données proviennent souvent de sources diverses. Un modèle de données analytique sert d'intermédiaire entre des sources de données disparates, permettant ainsi l'harmonisation des données en un seul endroit central. Cette fonctionnalité de collecte simplifie le processus de combinaison de données provenant de sources multiples pour une analyse et une visualisation complètes.

Economies

Les requêtes directes vers les bases de données peuvent entraîner des coûts supplémentaires, car certaines bases de données sont soumises à des frais par volume de requête ou par résultat. Les serveurs analytiques constituent une solution stratégique et rentable car ils chargent les données dans un stockage intermédiaire, ce qui élimine le besoin de requêtes répétitives dans les bases de données, réduisant ainsi les dépenses opérationnelles globales.

Dépendance Réduite à l'égard des Equipes Techniques

Permettre aux équipes en contact avec les clients de créer des tableaux de bord de manière indépendante sans avoir besoin d'expertise technique ou de base de données favorise une plus grande autonomie et une plus grande agilité.

AnalyticSOPS/Gouvernance des Données

En 2021, David Menninger de Ventana Research, dans son article Analytics Ops : le dernier kilomètre des opérations liées aux données a prédit que :

D'ici 2024, un tiers des organisations adopteront une approche des opérations analytiques similaire à leurs processus d'exploitation des données et intégrée à ceux-ci afin d'améliorer la réactivité et l'agilité.

Les couches sémantiques constituent certainement un élément central des AnalyticSOPS et de la gouvernance des données. Par exemple, cela permet d'ajuster plus facilement les structures de données sous-jacentes sans endommager les tableaux de bord existants, ce qui réduit le temps et les efforts nécessaires à la maintenance et à la gestion de ces tableaux de bord. AnalyticSops dépasse le cadre de cet article, mais les lecteurs intéressés peuvent s'y référer. ou à ce poste pour plus de détails.

Tests

Les tests sont essentiels à la réussite de tout projet de développement logiciel, y compris les projets d'analyse et de tableaux de bord. Le fait de disposer d'un système/environnement dédié à la solution d'analyse basé sur une couche sémantique universelle permet de tests qui sont essentiels pour atteindre agilité. Une fois implémenté, il permet la validation automatique des tableaux de bord, des rapports et d'autres contenus de Business Intelligence (BI) en termes de précision, d'expérience utilisateur, de sécurité/d'autorisation, de performances et de régressions. Cela permet de réduire le nombre d'erreurs et de renforcer la confiance dans l'infrastructure analytique, essentielle pour les décideurs qui en dépendent pour leurs opérations quotidiennes.

Contre-argument

Dans les scénarios où l'affichage de données transactionnelles brutes, plates et en temps réel est nécessaire, comme le suivi des activités opérationnelles ou le suivi des transactions en direct, les requêtes directes vers la base de données peuvent être privilégiées, car un puissant moteur d'analyse n'est pas strictement nécessaire.

Dans icCube, vous pouvez faire les deux, remplir un graphique avec des données provenant d'une couche sémantique ou d'un requête directe de base de données SQL :)

Cas d'utilisation de la Couche Sémantique - PropTech Industry

STREETS, une plateforme suisse de gestion de portefeuille immobilier entièrement SaaS de premier plan, a a tiré parti d'une couche sémantique en apportant des informations modernes, sans précédent et donc compétitives basées sur les données à leur solution PropTech.

Plus précisément, STREETS a développé une couche sémantique pour fournir des capacités d'analyse et de modélisation avancées répondant aux exigences sophistiquées de ses modèles de données sous-jacents et à la sécurité complexe des données définie par l'utilisateur.

Conclusion

L'adoption de couches sémantiques dans les flux de visualisation des données offre de nombreux avantages lorsqu'il s'agit d'effectuer des analyses avancées par rapport aux requêtes directes vers les bases de données. Qu'il s'agisse d'un modèle de données convivial pour les entreprises, de performances améliorées ou d'une cohérence et d'une sécurité accrues des données, les couches sémantiques constituent une base solide pour créer des visualisations pertinentes et efficaces.

En tirant parti des serveurs analytiques, les entreprises peuvent exploiter tout le potentiel de leurs actifs de données tout en réduisant la complexité des données et les coûts opérationnels.

Cela permet en fin de compte de prendre des décisions plus éclairées et de mieux comprendre les données grâce à des tableaux de bord numériques alimentés par une plateforme d'analyse fiable.

Vous voulez savoir comment une couche sémantique peut améliorer vos analyses et vos tableaux de bord ? Communiquez avec nous — nous serions ravis de discuter !

_