LLM : Ayez une Discussion Métier Intelligente avec vos Données !

Walter Wartenweiler
Walter Wartenweiler
June 19, 2024

Les récents développements dans le domaine de l'IA apportent une valeur incroyable. Les grands modèles linguistiques combinent la maîtrise des mots écrits avec une compression des informations d'Internet. Cela leur permet d'interagir au même niveau de compréhension entre l'IA et l'humain. Cette interaction permet à l'utilisateur non seulement d'obtenir une recherche Google sous forme de réponse statique, mais aussi d'engager une discussion plus claire. Cet article explique comment cela peut et sera reflété dans l'espace Data Analytics, Dashboarding et Actionable Insights.

TABLE DES MATIÈRES
Les humains et les machines discutent des données
IA / LLM
Analyses
Technologie
Tout

Ces dernières années dans le domaine de l'IA

Les grands modèles linguistiques(LLM) changent le monde plus rapidement que presque toutes les innovations récentes. Ils s'appuient sur des algorithmes très simples inspirés des réseaux de neurones biologiques. Le résultat a surpris le monde entier. C'était efficace pour parler avec un interlocuteur. C'est la puissance de calcul qui permet de simuler l'équivalent de milliards de neurones. Le test de Turing, considéré comme le moyen d'évaluer si un système est devenu intelligent depuis les débuts des logiciels théoriques, serait réussi et devient un objectif évolutif.

La diffusion stable, quant à elle, modifie également la génération d'images et de vidéos. Il promet de donner vie à un agent intelligent qui ressemblera ou même battra les humains dans leurs tâches.

Bien entendu, nous essayons d'appliquer l'IA partout où des humains sont actifs. Cela inclut l'art, la musique, le marketing, etc. (même la photo en haut de cet article de blog est créée par l'IA) et bien plus encore.

Entre-temps, Stable Diffusion change le monde de la génération d'images et de vidéos en promettant de donner vie à un agent intelligent multimodal qui deviendra similaire ou surpassera même les humains dans presque toutes les tâches.

Bien entendu, nous essayons de trouver comment appliquer l'IA à tous les domaines de la société où les humains sont actuellement actifs, de l'art à la musique en passant par le marketing (même la photo en haut de cet article de blog est créée par l'IA) et... eh bien... tout le reste.

IA et analyse des données : une combinaison puissante et risquée

Les sociétés d'analyse existantes intègrent l'IA à leurs systèmes existants, tandis que de nouveaux apparaissent, fusionnant l'IA et l'analyse des données. Voyons donc ce que cela signifie.

Ce qu'un LLM prêt à l'emploi fait très bien, c'est parler en langage naturel (PNL) et apporter une compréhension assez raisonnable, voire parfaite, du monde. Cela signifie qu'il utilise le contexte des instructions de l'utilisateur final. Il peut donner de bonnes réponses aux utilisateurs. L'utilisateur peut juger, affiner et obtenir des réponses supplémentaires. Cette discussion est essentielle pour s'assurer que les informations issues de l'interaction sont correctes, complètes et utiles. Sans personne au courant, qui saisirait le hallucinations et des malentendus dans le réseau neuronal ?

Dans un monde parfait, avec des LLM parfaits, le LLM et l'humain connaîtraient tous les concepts de données. Chaque requête aboutirait à des résultats raisonnables. Nous rêverions de parler directement à l'IA comme s'il s'agissait d'une incarnation factuelle de l'entreprise. Un peu similaire à l'initiative de Jordan Peterson, qui souhaite que nous puissions converser avec la Bible après avoir formé le LLM sur cette question. Cela vaut la peine de prendre en compte, cependant, l'impact d'un LLM hallucinant sur le contenu de la Bible. C'est différent d'une hallucination à propos de votre entreprise. Ici, nous devons tous faire attention. Nous devons maintenir un niveau de contrôle élevé au niveau humain et assurer la transparence de la traçabilité des réponses du système. Cela est particulièrement vrai si nous prenons des mesures immédiates à partir des informations générées par le système d'IA et de données.

Où pourrions-nous alors utilement brancher une IA ?

Un système d'intelligence artificielle est pré-entraîné sur un très grand échantillon d'informations sur Internet. Ensuite, il est peaufiné par les humains pour qu'il puisse répondre correctement aux questions. Le système qui en résulte est donc extrêmement impressionnant car il permet de tenir presque tous les types de conversations sur n'importe quel sujet et de satisfaire l'utilisateur final.

Il est donc prêt à l'emploi avec les connaissances d'un responsable, d'un data scientist, d'un analyste, d'un ingénieur logiciel et d'un spécialiste de l'IA, ainsi que la plupart des connaissances spécifiques de votre organisation dans des domaines spécifiques.

Cela signifie que même sans rien faire d'autre sur le plan technique ou d'intégration, elle peut déjà apporter de la valeur à quelqu'un qui a besoin de donner un sens à ses données. Nous pouvons simplement lui poser des questions sur la meilleure façon de présenter les données, sur les analyses qui ont du sens dans une situation commerciale donnée ou plus encore. C'est comme travailler avec un coach de données externe (IA).

Cas d'utilisation de l'IA dans l'analyse de données (intégrée)

  • Si nous allons encore plus loin, nous pouvons lui présenter les détails de notre propre modèle de données et lui demander de nous aider à concevoir ces analyses dans des technologies cibles qui ont du sens dans notre pile de données. Avec une intégration adéquate, cela peut même signifier qu'un analyste de données (IA) conçoit des analyses avec une connaissance de votre activité et de vos données et soit directement en mesure d'exécuter ces analyses sur votre ensemble de données.
  • Encore une fois, nous pouvons présenter les données avec les questions et faire en sorte que l'IA trouve des modèles que nous n'aurions pas découverts autrement. Cela signifie que votre analyste de données (IA) prendrait conscience, dans le cadre de la conversation, non seulement de la sémantique de votre entreprise, mais également de son STATUT exact. Ce serait comme inviter un expert en données d'IA à travailler sur vos données.
  • Enfin, nous pourrions imaginer ajouter un niveau de mise au point suivant, qui formerait et adapterait davantage le LLM à une IA qui connaît le monde, comprend les conversations et comprend nativement votre modèle commercial et de données. Ce serait comme former un employé expert artificiel qui rejoint votre équipe pour apporter de la valeur.

Chacune de ces étapes s'accompagne d'une intégration croissante entre le LLM de départ et le système existant et doit donc être soigneusement évaluée, par exemple en termes de destination de vos données en dehors de votre organisation. Méfiez-vous des risques de conformité ici !

Les niveaux de conversation

Coach de données IA

Lorsque vous demandez Chat GPT ou d'autres LLM avec des questions liées à des indicateurs pertinents pour votre entreprise, vous obtenez généralement de très bonnes réponses et pouvez poursuivre la conversation si vous avez besoin de plus d'informations.

Un exemple tiré de ChatGPT :

« Je travaille dans une société de logiciels orientés vers les données et j'aimerais évaluer l'efficacité de nos initiatives marketing en fonction des taux de conversion de notre entonnoir marketing. Que recommanderait un data scientist pour atteindre cet objectif ? Faites un résumé de haut niveau »

Pour évaluer l'efficacité de vos initiatives marketing en fonction des taux de conversion de l'entonnoir marketing, un data scientist recommanderait :

1. Définissez les mesures : identifiez les indicateurs de performance clés (IPC) pour chaque étape de l'entonnoir.

2. Collecte de données : mettez en place des méthodes de collecte de données robustes pour suivre les interactions et les conversions des utilisateurs.

3. Analyse : effectuez des analyses statistiques et des tests A/B pour comparer différentes stratégies marketing.

4. Modélisation de l'attribution : utilisez des modèles pour déterminer l'impact des différents points de contact marketing.

5. Analyse prédictive : prévoyez les tendances futures et identifiez les domaines à optimiser.

6. Surveillance continue : passez régulièrement en revue les indicateurs et ajustez les stratégies en fonction des informations fournies par les données.

Analyste de données IA

Lorsque vous décrivez votre modèle de données et ce que vous souhaitez évaluer, le LLM, ChatGPT dans son cas, peut vous renvoyer des requêtes et des algorithmes dans les formats de votre système. Ceux-ci vous permettront à leur tour d'obtenir les résultats directement à partir de vos données.

Voici un exemple tiré de notre prototype :

# Indiquez le prénom et le nom de famille de chaque client ainsi que la date de sa dernière location et le nom du film qui a été loué à la dernière date de location et organisez le résultat par prénom et nom de famille du client.

SÉLECTIONNER

c.first_name AS customer_first_name,

c.last_name AS customer_last_name,

MAX (r.rental_date) COMME last_rental_date,

f.title AS film_title

À PARTIR DE

client c

REJOIGNEZ la location ou NON c.customer_id = r.customer_id

REJOIGNEZ L'INVENTAIRE EN UN. r.inventory_id = i.inventory_id

REJOIGNEZ un film sur i.film_id = f.film_id

r.date_de location = (

SÉLECTIONNEZ MAX (rental_date)

À PARTIR DE la location r2

OÙ r2.customer_id = r.customer_id

)

GROUPER PAR

c.identifiant du client

COMMANDER PAR

c.prenom_prénom, c.nom_famille ;

Expert en données d'IA

Lorsque vous demandez au LLM une description formelle de votre modèle de données AINSI que les données et ce que vous souhaitez évaluer, il peut vous donner un aperçu direct de vos données. Maintenant, cela devient difficile car vous obtenez essentiellement une réponse, mais il est très difficile d'avoir une évaluation formelle de la qualité de cette réponse en termes d'erreurs potentielles cachées dans le raisonnement du LLM. ChatGPT 4o expose actuellement le code Python qu'il a produit pour répondre à votre question, qui pourrait être revu par un humain avant d'y donner suite. Néanmoins, s'il est traité avec soin, il apportera des réponses qui vous surprendront parfois et il aurait fallu un très long projet de Data Science pour vous parvenir par vous-même, en particulier sur de grands ensembles de données.

Voici un exemple tiré de notre prototype :

# Sur quel pays notre entreprise devrait-elle se concentrer pour maximiser ses ventes en 2025 ?

Sur la base des informations fournies, il n'est pas possible de déterminer avec certitude dans quel pays une entreprise devrait se concentrer pour maximiser ses ventes en 2025. Cependant, nous pouvons examiner les tendances et les facteurs potentiels susceptibles d'influencer les performances commerciales :

1. Japon: Les ventes ont toujours été élevées, avec des montants de 100 000 dollars et 90 000 dollars enregistrés dans ce pays. Cela suggère des performances stables.

2. France: Bien que les ventes aient été relativement faibles en 2023 (4 000 dollars), le montant pour le Japon était tout aussi inférieur à la normale (50 000 dollars). Le potentiel d'augmentation est significatif si les efforts sont axés sur l'amélioration des stratégies de vente ou la pénétration du marché en France.

3. USA: Les ventes se sont élevées à 2 000$ en 2024 et à 5 000$ en 2023. Ce pays présente une certaine variabilité mais peut encore s'améliorer.

4. Chine: Des performances constantes avec 70 000 dollars et 50 000 dollars de ventes suggèrent une stabilité et un potentiel de croissance grâce à un marketing ciblé ou à une augmentation de la part de marché.

5. Espagne et Italie: Les deux ont enregistré des chiffres de vente relativement faibles (5 000$ chacun) mais des montants constants d'une année à l'autre. Il existe une possibilité de croissance si des initiatives stratégiques sont mises en place pour stimuler les ventes.

6. Tendance générale: Le Japon semble toujours solide en termes de volume des ventes par rapport aux autres pays sur la base des données fournies.

Processus de prise de décision :

- Potentiel commercial: Analysez la taille des marchés et la demande potentielle de produits/services dans chaque pays.

- Taux de croissance: Tenez compte des taux de croissance historiques et des tendances de croissance futures prévues.

- Alignement stratégique: Déterminez si les objectifs stratégiques de votre entreprise correspondent mieux à ceux d'un marché ou d'un pays en particulier en fonction de leur adéquation avec les stratégies générales de l'entreprise (par exemple, orientation technologique, plans d'expansion géographique).

- Analyse concurrentielle: Comprenez les performances des concurrents dans ces régions afin d'identifier les lacunes et opportunités potentielles sur le marché.

- Facteurs économiques et politiques: Tenez compte de la stabilité économique, des politiques gouvernementales et des réglementations susceptibles d'affecter les opérations commerciales.

Conclusion :

Sur la seule base des données de ventes de 2023 et 2024, le Japon se distingue par ses chiffres de vente constamment élevés. Toutefois, pour la prise de décisions en 2025 :

- Si vous maximisez les profits à court terme: Il peut être prudent de tenir compte de la performance constante du Japon.

- Si vous envisagez une croissance à long terme: Les pays dont la taille de marché potentielle est plus élevée ou dont les taux de croissance projetés sont plus rapides (comme la Chine) pourraient offrir davantage d'opportunités.

- Si vous cherchez à diversifier les risques: Se concentrer sur des pays comme la France ou l'Espagne pourrait contribuer à répartir les risques sur les différents marchés.

Pour prendre une décision éclairée, une analyse plus approfondie de ces facteurs et éventuellement la collecte de données plus récentes seraient bénéfiques.

Employé expert en IA

Si vous affinez le LLM de vos ensembles de données et de votre historique d'analyse, vous pouvez obtenir des informations encore plus pertinentes à partir du système, mais le faire en temps réel ou quasi en temps réel sera coûteux en termes de coûts matériels, de compétences et de main-d'œuvre investie. Je ne doute pas que dans les années à venir, de nombreuses nouvelles innovations scientifiques et techniques à la base des LLM et de la manière de s'approvisionner en puissance de calcul réduiront ce coût, mais à ce stade. Ce niveau d'investissement en termes de charge de travail et de temps de calcul n'en vaudra la peine que pour les très grandes entreprises aux besoins très complexes.

Nos prototypes d'IA

Nous sommes en train de prototyper des variantes autour des options AI Data Analyst et AI Data Expert et des vidéos seront disponibles pour voir comment cela s'intègre dans icCube dans quelques semaines. En attendant, si vous souhaitez savoir ce que nous avons en action, veuillez Planifier une discussion avec notre équipe et indiquez que vous souhaitez parler de l'IA — nous serions ravis d'en parler !

Et enfin une vidéo de démonstration qui pourrait vous intéresser !