Intelligence Artificielle

🧠 Introduction complète à l’Intelligence Artificielle

Découvrez comment fonctionne l’intelligence artificielle moderne : LLM, GPT, modèles open source et exécution locale avec Ollama. Un guide complet, clair et documenté pour comprendre et utiliser l’IA dès aujourd’hui.

Tom

13 oct. 2025 • 4 min read

De la théorie aux modèles open source comme Ollama et GPT-OSS

📘 Introduction

L’intelligence artificielle (IA) s’impose aujourd’hui comme la technologie la plus influente de notre époque.
Des assistants conversationnels (comme ChatGPT) aux outils de génération d’images, de musique ou de code, l’IA s’est infiltrée dans presque tous les secteurs.

Mais qu’est-ce que l’IA au juste ?
Comment fonctionnent ces fameux LLM (Large Language Models) comme GPT-4 ou LLaMA ?
Et surtout, comment peut-on en exécuter un localement, avec des outils comme Ollama ?

Cet article propose une exploration claire, documentée et vulgarisée de l’IA moderne, de ses bases théoriques à ses applications pratiques, tout en citant les sources les plus fiables.

🧩 1. Comprendre les fondations de l’IA

⚙️ IA, Machine Learning et Deep Learning

IA (Intelligence Artificielle) : discipline visant à créer des systèmes capables d’imiter certaines fonctions humaines (raisonner, apprendre, comprendre le langage…).
Machine Learning (Apprentissage automatique) : sous-domaine de l’IA qui consiste à entraîner des algorithmes sur des données pour qu’ils “apprennent” des modèles ou des comportements.
Deep Learning (Apprentissage profond) : branche du machine learning utilisant des réseaux de neurones artificiels profonds, très performants pour le texte, les images et l’audio.

📊 Le principe d’apprentissage

Phase d’entraînement : le modèle “voit” des millions de données et apprend à prédire des relations statistiques.
Phase d’inférence : le modèle utilise ce qu’il a appris pour produire des résultats (textes, images, décisions).
Fine-tuning : ajustement sur un domaine spécifique (juridique, médical, etc.) pour spécialiser le modèle.

🧱 2. Les modèles de langage (LLM)

Les LLM (Large Language Models) sont au cœur de la révolution actuelle.
Ils sont capables de comprendre, résumer, traduire, raisonner ou générer du texte à partir d’une simple instruction.

🔬 Origine : l’architecture Transformer

Introduite en 2017 par Google (“Attention is All You Need”), cette architecture repose sur le mécanisme d’attention : chaque mot “pèse” les autres mots du contexte pour en comprendre la signification.

Elle permet d’analyser de très longues séquences de texte.
Elle est massivement parallèle (plus rapide à entraîner).
Elle a remplacé les anciens RNN et LSTM.

🤖 3. GPT et les modèles de la famille OpenAI

📈 L’évolution de GPT

Version	Année	Caractéristiques clés
GPT-1	2018	Premier modèle basé sur le Transformer.
GPT-2	2019	Capacité à générer du texte cohérent ; controversé à l’époque.
GPT-3	2020	175 milliards de paramètres ; base de ChatGPT.
GPT-3.5 / 4	2023-2024	Multimodal, plus cohérent, meilleur raisonnement.
GPT-5	2025	Introduit un routage dynamique et un apprentissage continu. (openai.com)

🧩 GPT-OSS — L’ouverture d’OpenAI

En 2025, OpenAI a lancé GPT-OSS, deux modèles open-weight :

gpt-oss-20b (20 milliards de paramètres) — optimisé pour tourner sur GPU 16 Go.
gpt-oss-120b — architecture Mixture of Experts (MoE) : seuls certains “experts” s’activent selon la requête.

Ces modèles sont publiés sous licence Apache 2.0, une première pour OpenAI.
(source : OpenAI)

🌍 4. Autres modèles de LLM open source

Nom	Origine	Points forts	Limites
LLaMA 3 / 4	Meta	Excellente performance, documentation riche.	Licence restreinte pour usage commercial.
Gemma (Google)	Google DeepMind	Légèreté, efficacité sur petit matériel.	Moins performant sur raisonnement complexe.
Mistral / Mixtral	France 🇫🇷	Modèle efficace (Mixture-of-Experts), très apprécié pour l’inférence locale.	Support encore en développement.
Phi-3 (Microsoft)	Microsoft Research	Petit modèle optimisé pour PC / mobile.	Contexte plus limité.
GPT4All	Nomic AI	Facile à installer, fonctionne sans connexion.	Performances inférieures aux grands modèles.
Claude (Anthropic)	USA	Connaissances avancées et raisonnement robuste.	Non open source.

🔗 Sources : Netguru, Datacamp

🧠 5. Comment fonctionne un LLM (vue vulgarisée)

1. Tokenisation

Le texte est découpé en tokens (morceaux de mots).
Exemple : “Bonjour le monde” → ["Bon", "jour", "le", "monde"].

2. Embedding

Chaque token est transformé en vecteur numérique.
Cela permet au modèle de “comprendre” les relations sémantiques entre mots.

3. Attention & prédiction

Les couches Transformer analysent les relations entre tous les tokens et prédisent le mot suivant avec une probabilité.

4. Génération

Le modèle écrit un mot, puis recommence en boucle, mot après mot, jusqu’à obtenir une phrase complète.

5. Inférence & sampling

Le modèle choisit parfois un mot non optimal pour rendre le texte plus naturel (température, top-p sampling).

🧰 6. Exécuter un modèle d’IA localement avec Ollama

⚙️ Qu’est-ce qu’Ollama ?

Ollama est un outil open-source qui permet d’exécuter facilement des modèles d’IA sur votre propre ordinateur, sans dépendre d’un service cloud.

C’est un peu le “Docker des LLM” : vous tirez un modèle (pull) et le lancez (run).

📚 Documentation : Ollama Docs

🚀 Installation rapide

Sous macOS / Linux

curl -fsSL https://ollama.com/install.sh | sh

Sous Windows

Téléchargez le binaire depuis ollama.com/download

🧠 Utiliser un modèle

ollama pull llama3.2
ollama run llama3.2

💡 Astuce : vous pouvez aussi lancer Phi-3, Gemma, Mistral ou GPT-OSS directement depuis la bibliothèque officielle
👉 ollama.com/library

📊 Avantages et limites

Avantages	Limites
Exécution locale → confidentialité totale.	Matériel requis (GPU ou CPU puissant).
Coût nul à l’usage.	Modèles volumineux à télécharger.
Contrôle total du modèle et des prompts.	Pas de “mise à jour automatique” comme les API cloud.

🧮 7. Techniques d’optimisation des modèles

Quantification : réduire la taille du modèle (float32 → int8 / 4-bit).
Pruning : supprimer les neurones inutiles.
Distillation : compresser un grand modèle en un plus petit sans trop perdre en précision.
MoE (Mixture of Experts) : n’activer que certaines parties du modèle à chaque requête, pour gagner en rapidité.

⚠️ 8. Limites, défis et éthique

🎭 Hallucinations

Un LLM peut générer du contenu faux mais plausible.
D’où l’importance de vérifier les sources et d’ajouter des garde-fous (post-vérification, citations automatiques…).

⚖️ Biais et responsabilité

Les modèles apprennent à partir de données humaines, donc imparfaites.
Les biais culturels ou sociaux peuvent se refléter dans les résultats.

🔒 Confidentialité et régulation

L’Union Européenne a lancé en 2024 l’AI Act, cadre légal pour l’usage de l’IA selon le niveau de risque.
(source : European Commission)

🚀 9. Tendances et avenir de l’IA

IA multimodale : texte + image + son + vidéo.
IA embarquée (Edge AI) : exécution sur mobile, Raspberry Pi, etc.
Agents autonomes : IA capables d’enchaîner des actions (AutoGPT, LangChain).
Open-source généralisé : la démocratisation des poids de modèles (comme GPT-OSS).
Rationalité & raisonnement explicite : recherche vers des modèles plus transparents et interprétables.

🧭 Conclusion

L’intelligence artificielle n’est plus une technologie de niche réservée aux géants du numérique.
Grâce à des outils comme Ollama, GPT-OSS, ou LLaMA 3, chacun peut aujourd’hui expérimenter, comprendre et même contribuer à l’évolution des LLM.

Mais il est essentiel d’accompagner cette puissance d’un usage responsable, éthique et transparent.

L’IA ne remplace pas l’humain — elle amplifie son potentiel.
L’avenir appartient à ceux qui sauront collaborer intelligemment avec elle.