Un dirigeant de PME à Orléans me dit souvent la même chose : "L'IA m'intéresse, mais pas question d'envoyer mes données clients à une boîte américaine." Compréhensible. Raisonnable, même. Mais cette crainte repose sur une confusion : l'idée qu'utiliser l'IA oblige à passer par ChatGPT en mode grand public, sans contrat, sans garantie.
C'est faux. Et cette confusion freine des dizaines de PME du Loiret (45), de Tours, de Blois qui pourraient automatiser des tâches répétitives, sans sacrifier leur conformité ni leur sécurité. Voici les cinq piliers que j'applique systématiquement sur mes missions.
Pilier 1 : choisir la bonne architecture, selon la sensibilité des données
Le premier arbitrage, c'est l'hébergement du modèle de langage. Il n'y a pas une seule réponse. Il y en a trois, selon le niveau de sensibilité de vos données.
Données très sensibles (données clients nominatives, données RH, données médicales). On utilise un modèle local. Ollama est un outil qui permet de faire tourner un LLM directement sur un serveur ou un poste de travail, sans aucune connexion externe. LM Studio fait la même chose avec une interface graphique. Rien ne sort du réseau de l'entreprise.
Données sensibles mais tolérables avec garanties contractuelles. Mistral La Plateforme est l'option française. Mistral est une startup parisienne dont les modèles sont hébergés sur Scaleway, datacenter français. Les données traitées restent en France, le contrat Data Processing Addendum (DPA) est conforme au RGPD. Le modèle Mistral Large 3 est au niveau de GPT-4 pour la grande majorité des usages professionnels.
Données peu ou pas sensibles. Claude API d'Anthropic ou l'API OpenAI peuvent convenir, à condition de signer leur DPA, de vérifier l'option de traitement en zone EU, et de ne pas transmettre de données personnelles brutes dans les prompts.
Pour l'automatisation des flux autour du modèle, j'utilise n8n self-hosted sur un VPS OVH France plutôt que Make.com (plateforme SaaS américaine). n8n est un outil d'automatisation open source qui tourne sur votre propre serveur. Vos flux de données ne transitent pas par un tiers.
| Cas d'usage | Architecture recommandée |
|---|---|
| Données RH, médicales, contrats confidentiels | Ollama local + n8n self-hosted OVH |
| SAV clients, relances, devis | Mistral La Plateforme (Scaleway FR) + n8n OVH |
| Rédaction interne, résumés, classification | Claude API ou OpenAI API + DPA + pseudonymisation |
Pilier 2 : privacy by design, minimiser ce qu'on envoie au modèle
L'architecture souveraine ne suffit pas. Ce qui compte autant, c'est ce qu'on envoie réellement au LLM.
La règle de base : le modèle ne reçoit que ce dont il a strictement besoin pour faire son travail. Pas plus. C'est le principe de minimisation du RGPD, appliqué aux appels LLM.
Concrètement, cela se traduit par une étape de pseudonymisation avant chaque appel. Prenons un agent de relance clients. Au lieu d'envoyer au modèle "Jean Dupont, 12 rue de la Paix à Orléans, doit 1 500 EUR depuis le 15 mars", on envoie "[CLIENT_42] doit 1 500 EUR depuis J+47". L'agent traite le message de relance. On réinjecte le nom et l'adresse au moment d'envoyer le mail, dans notre propre système, après l'appel.
Trois règles supplémentaires qui font la différence :
- Les emails entrants ne sont jamais injectés en clair dans un prompt. On en extrait les informations structurées (motif, montant, date) avant de les transmettre.
- Les logs des appels API ne contiennent pas de données personnelles. On loggue les identifiants pseudonymisés, pas les noms réels.
- Le dé-référencement se fait dans le système source. Le LLM ne stocke rien. La correspondance identifiant/personne reste dans votre base.
Pilier 3 : conformité RGPD, les cinq obligations qui comptent vraiment
Le RGPD n'interdit pas l'IA. Il l'encadre. Pour une PME, cela se traduit par cinq actions concrètes, pas par un audit à 50 000 euros.
1. L'analyse d'impact (DPIA). Tout traitement IA touchant des données personnelles à risque (profilage, décisions automatisées, données sensibles) doit faire l'objet d'une analyse d'impact sur la protection des données. Ce document décrit le traitement, les risques identifiés, les mesures prises. C'est un livrable que je fournis systématiquement avec chaque mission.
2. Le registre des traitements. Votre registre doit mentionner le nouveau traitement IA, sa finalité, les données concernées, la durée de conservation, les sous-traitants (dont le fournisseur LLM). La CNIL propose un modèle téléchargeable.
3. Les contrats sous-traitants. Mistral, OpenAI, Anthropic proposent tous un DPA. Ce document contractualise leurs obligations en tant que sous-traitant au sens RGPD. Signer ce DPA est une obligation légale dès que vous leur transmettez des données personnelles, même pseudonymisées.
4. L'information des personnes concernées. Si votre agent IA traite des données de clients (réponses SAV automatisées, relances), vos clients doivent en être informés. Une mention dans les CGV ou dans la politique de confidentialité suffit dans la plupart des cas.
5. Le droit à l'oubli. Si une personne demande la suppression de ses données, le mécanisme doit fonctionner y compris pour les données traitées par l'agent. On prévoit ce mécanisme dès la conception, pas après coup.
La CNIL a publié un guide pratique sur l'IA générative en 2025. Il est lisible, gratuit, et très utile pour cadrer un projet sans sur-interpréter les obligations.
30 minutes au téléphone. On regarde ensemble votre architecture actuelle, les données concernées, et ce qu'il faut mettre en place. Sans baratin sécurité-marketing.
Parlons-en WhatsAppPilier 4 : cybersécurité opérationnelle
L'IA en entreprise introduit de nouvelles surfaces d'attaque. Voici les quatre mesures que j'applique sur chaque déploiement, quelle que soit la taille de la PME.
Moindre privilège. L'agent IA n'accède qu'aux données strictement nécessaires à sa tâche. L'agent de relance clients accède en lecture à la table des factures impayées. Pas à la base clients complète, pas aux données RH, pas aux contrats. On crée un compte technique avec des droits restreints et nommés.
Gestion des secrets. Pas de clé API dans le code source. Jamais. Les clés Mistral, OpenAI ou Anthropic sont stockées dans des variables d'environnement chiffrées sur le serveur. Sur un projet plus sensible, on utilise un vault (coffre-fort de secrets). Le dépôt git ne contient aucun secret.
Audit trail complet. Chaque appel de l'agent est tracé : qui a déclenché quoi, à quelle heure, avec quels paramètres d'entrée (pseudonymisés). Si quelque chose déraille, on sait exactement ce qui s'est passé. C'est aussi ce qui vous permet de répondre à une demande RGPD : "quand avez-vous traité ces données ?"
Rate limiting et alertes. Un agent IA qui appelle le modèle 500 fois en une heure, c'est soit un bug, soit une attaque. On configure des limites d'appels et des alertes par email ou SMS dès qu'un seuil anormal est dépassé. Les mises à jour de sécurité des dépendances de la stack sont planifiées, pas laissées au hasard.
Pilier 5 : l'approche Emakesolution
Ces cinq piliers ne sont pas une checklist abstraite. Ils forment le cadre de travail que j'applique sur chaque mission, du Diagnostic IA jusqu'à la mise en production.
La stack par défaut sur mes projets :
- Mistral La Plateforme (Scaleway, hébergement France) pour le modèle de langage
- n8n self-hosted sur OVH France pour les flux d'automatisation
- Supabase EU (serveurs Frankfurt) pour la base de données si nécessaire
- Variables d'environnement chiffrées pour tous les secrets
Avant chaque mise en production, je réalise un test RGPD : vérification que les données personnelles ne transitent pas en clair, que le DPA est signé, que le registre est à jour, que la DPIA couvre les traitements. Ce n'est pas une formalité. C'est ce qui vous évite un incident ou une mise en demeure CNIL.
La documentation livrée au client couvre l'architecture complète, les flux de données, le registre des traitements mis à jour, et la DPIA. Vous repartez avec les clés, pas juste un outil.
Avec 12 ans d'expérience IT et une certification RGPD, je ne fais pas de la sécurité en option. C'est intégré dès le départ, pas ajouté à la fin.
Les trois idées reçues qu'on entend chaque semaine
"L'IA, c'est forcément OpenAI." Non. Le marché des LLM a explosé. Mistral (France), Mistral (Europe), Llama 3 (Meta, exécutable localement), Gemini, Claude. Selon votre usage et votre niveau de sensibilité, des alternatives existent. La souveraineté n'est plus un luxe réservé aux grands comptes.
"Si je veux du performant, je dois envoyer mes données aux États-Unis." Non. Mistral Large 3 tient la comparaison avec GPT-4 sur la très grande majorité des usages professionnels en français : rédaction, classification, résumé, extraction d'informations, relances. Vous n'avez pas à sacrifier la performance pour la conformité.
"Le RGPD m'empêche d'utiliser l'IA." Non. Le RGPD encadre l'usage des données personnelles. Il ne dit rien contre le fait de faire tourner un LLM. Il dit que si ce LLM traite des données personnelles, vous devez avoir une base légale, informer les personnes concernées, et protéger les données. Ce sont des obligations gérables. Des PME de Tours, Blois et Orléans le font aujourd'hui, sans DPO à plein temps.
Questions fréquentes
Non. Le RGPD encadre l'usage de données personnelles, il ne l'interdit pas. Il exige une base légale, une information des personnes concernées, un registre à jour et, pour les traitements à risque, une DPIA. Ces obligations sont gérables pour une PME dès qu'elles sont prévues dès le départ.
Non. Mistral La Plateforme (hébergement Scaleway France), Ollama en local, LM Studio en local : les options européennes et locales sont nombreuses. Pour OpenAI ou Anthropic, leurs contrats DPA précisent que les données via API ne servent pas à l'entraînement des modèles. La pseudonymisation avant appel réduit encore davantage le risque résiduel.
Oui. Les PME de 10 à 50 personnes à Orléans, Tours ou Blois sont le profil idéal. L'investissement est proportionnel à l'usage. Le Diagnostic IA permet de partir d'un état des lieux concret : cas d'usage, données concernées, niveau de sensibilité, architecture adaptée.
Vérifier d'abord votre contrat. OpenAI propose un DPA qui précise que les données via API ne servent pas à entraîner les modèles. Vérifier ensuite que vos appels API ne transmettent pas de données personnelles brutes. Si c'est le cas, une couche de pseudonymisation suffit dans la grande majorité des cas. Rien d'irréversible.
L'IA conforme, c'est possible. Et c'est maintenant.
Un audit de conformité inclus dans chaque Diagnostic IA. Architecture souveraine, DPIA, registre mis à jour. Pour les PME du Centre-Val de Loire qui veulent avancer sans improviser.