Pédagogie

Comment ça marche,
une IA sans Internet.

La plupart des gens pensent qu'une IA va « chercher » la réponse en ligne, comme un moteur de recherche. C'est faux. Un modèle de langage répond de mémoire, sans connexion. Voici pourquoi, et ce que ça change pour votre cabinet.

Bibliothèque dense, métaphore du savoir intégré au modèle

L'idée en une image

Imaginez un confrère qui aurait tout lu.

Un assistant qui a passé sa vie à lire : dix millions de pages de droit, de médecine, de comptabilité, de recherche. Tout est rangé dans sa tête.

Vous l'installez dans une pièce de votre cabinet. Pas de téléphone. Pas d'Internet. Pas de fenêtre vers l'extérieur. Quand vous lui posez une question, il vous répond depuis ce qu'il a appris.

C'est exactement cela, un grand modèle de langage installé chez vous.

Le trajet de votre question

Tout reste dans vos murs.

Vos documents et vos questions arrivent au modèle qui tourne dans le serveur que nous installons chez vous. La réponse est générée localement et vous est rendue. Aucun élément ne sort.

Votre question

PDF, audio, requête écrite

Entre
Vos murs

Le modèle de langage

Dans le serveur installé chez vous

Pas d'Internet
Sort

La réponse

Texte, résumé, transcription

Aucun appel sortant vers OpenAI, Microsoft, Google ou un quelconque tiers. Le serveur peut même être débranché du réseau extérieur : l'IA continue de fonctionner.

Ce qu'il sait faire

Les usages concrets dans votre cabinet.

Rédiger

Lettres, conclusions, comptes-rendus, contrats, courriers patients. Style adapté à votre profession, en français professionnel.

Résumer

Synthétiser un dossier de 100 pages en une note de deux pages. Extraire les éléments-clés d'un jugement, d'une expertise, d'un bilan.

Dicter et transcrire

Dictée vocale en français, transcription d'une réunion ou d'une audience, génération du compte-rendu signé en quelques minutes.

Chercher dans vos dossiers

Retrouver instantanément une clause, un précédent, un courrier dans l'ensemble de votre cabinet. La recherche ne sort jamais du serveur.

Soyons honnêtes

Ce qu'il ne sait pas faire.

Un assistant, pas un oracle. Voici les trois limites à connaître avant d'acheter.

Pas d'actualité du jour

Le modèle est entraîné sur des connaissances arrêtées à une date donnée. Il ne sait pas qui a gagné le match d'hier ni quelle est la dernière décision du Conseil d'État. La mise à jour des modèles se fait à intervalles réguliers.

Pas de calculs financiers complexes

Un modèle de langage écrit du texte. Pour les calculs précis (comptabilité, fiscalité, paie), il appelle des outils dédiés que nous interconnectons à la demande.

Pas un remplacement du jugement professionnel

L'IA produit un brouillon, propose une formulation, fait gagner du temps. La décision finale, la signature, la responsabilité restent vôtres. Aucune IA ne se substitue au secret professionnel.

Et Internet, alors ?

Deux modes au choix, vous gardez le contrôle.

Une nuance importante : l'IA tourne toujours dans votre serveur, quelle que soit la configuration réseau. Selon votre profession et votre tolérance au risque, deux modes de déploiement sont possibles.

Par défaut

Air-gap strict

Le serveur est complètement isolé d'Internet. Aucune connexion sortante, aucune mise à jour automatique. C'est le mode le plus exigeant, livré activé par défaut.

  • Inférence 100 % locale
  • Zéro sortie réseau, ni amont ni aval
  • Mises à jour modèles déposées par clé USB ou réseau interne contrôlé
  • Conformité maximale RGPD et secret professionnel

Avocats pénalistes, dossiers défense, secret médical en zone protégée, recherche sensible.

Sur demande

Whitelist contrôlée

Le serveur peut sortir uniquement vers une liste de domaines que vous validez vous-même (Legifrance, Ameli, vos outils métier). Tout le reste est bloqué par le pare-feu de l'appliance.

  • Inférence 100 % locale
  • Sortie uniquement vers des domaines que vous choisissez
  • Vos dossiers clients ne sortent jamais — seules les sous-requêtes utiles
  • Liste modifiable depuis l'admin à tout moment

Cabinets qui veulent enrichir l'IA avec des sources publiques sans céder le contrôle.

Dans les deux modes, l'inférence reste locale et les données de vos dossiers ne sont jamais transmises à un cloud IA tiers. Le mode peut être changé à tout moment depuis l'administration de l'appliance.

Modèle vs données

Modèle français, américain ou chinois : quel impact sur votre confidentialité ?

L'origine d'un modèle déclenche souvent une crainte intuitive : « si mon IA est entraînée en Chine ou aux États-Unis, est-ce que mes données partent là-bas ? ». La réponse est non. L'origine du modèle et la circulation des données sont deux questions complètement distinctes. Voici pourquoi.

Ce que l'origine du modèle décide

  • Qui a financé l'entraînement et publié les poids (Mistral en France, Meta aux États-Unis, DeepSeek en Chine, etc.)
  • Sur quelles données il a appris (corpus public, propriétaire, multilingue, mono-langue…)
  • Ses biais culturels et linguistiques (un modèle français parlera mieux le droit français qu'un modèle américain)
  • La roadmap : versions futures, durée de support, licence d'utilisation

Ce que l'origine du modèle ne décide pas

  • Où vos données sont traitées (toujours dans votre serveur)
  • Si une connexion sort vers l'extérieur (réponse : aucune, par construction)
  • Si vos requêtes alimentent l'entraînement d'un autre modèle (réponse : non, jamais)
  • Si une « porte dérobée » peut renvoyer vos dossiers (réponse : non, les poids sont publics et auditables)

Notre choix par défaut

Mistral en première intention, autres modèles à la demande.

Nous installons par défaut un modèle Mistral (français, Apache 2.0) sur chaque appliance. C'est cohérent avec votre besoin de souveraineté et c'est le modèle qui maîtrise le mieux le français professionnel. Mais nous savons aussi déployer Llama (Meta), DeepSeek ou Qwen si votre usage le justifie — recherche scientifique, multilingue avancé, raisonnement de niche. Dans tous les cas, vos données ne sortent pas du serveur. Le choix du modèle est une question de qualité, pas de confidentialité.

La différence

Comparé à ChatGPT, Copilot et consorts.

Cloud IA classique (ChatGPT, Copilot…)

  • Votre question part sur Internet
  • Connexion permanente requise
  • Traitée dans un datacenter étranger (souvent US)
  • Réponse renvoyée par Internet
  • Vos données alimentent potentiellement l'entraînement du modèle

Assistant Privé (IA locale)

  • Votre question reste dans votre serveur
  • Fonctionne sans connexion Internet
  • Traitée dans vos murs, sur votre matériel
  • Réponse générée localement, jamais transmise
  • Vos données ne servent à entraîner aucun modèle, jamais

Prêt à voir l'Assistant Privé tourner pour de vrai ?

Configurez votre appliance en quelques minutes, ou demandez une démonstration en visio pour voir le système répondre à vos vraies questions.