Quel outil choisir pour illustrer les personnages d'une campagne — et surtout comment s'y prendre pour qu'ils restent cohérents d'une image à l'autre. Le tour de la question, sans jargon.
🥇 ChatGPT (moteur « GPT Image 2 ») — le plus doué pour garder un perso identique à partir d'une image de référence, et il « réfléchit » à ton idée avant de dessiner. Gratuit en petit volume (~3 images/jour), confortable en payant (~20 $/mois).
🥇 Google Gemini (« Nano Banana Pro ») — quasi ex æquo, et gratuit très généreux (~200 images/jour). Le meilleur pour tout un groupe d'aventuriers cohérent (jusqu'à 5 persos dans une scène).
🎨 Midjourney (~10 $/mois) — si tu veux LE look peint « manuel de jeu ». Le plus beau, mais il faut lui écrire de bons prompts (voir plus bas).
Honnêtement, ChatGPT et Gemini se tiennent dans un mouchoir. Si tu débutes et veux zéro prise de tête : essaie Gemini d'abord (c'est gratuit et sans limite gênante), et ChatGPT si tu veux pousser la fidélité d'un héros précis.
Le réflexe du débutant : ouvrir l'outil et taper « un guerrier nain avec une hache ». Ça marche pour une image isolée. Mais pour une campagne — le même héros dans dix scènes, ou toute une party — ça part dans tous les sens : le nain change de tête, d'armure et de couleurs à chaque essai.
La clé, c'est de te servir du « cerveau » de l'IA (sa partie qui comprend et rédige) pour transformer ton idée en une fiche réutilisable, avant de lancer le « pinceau » (la partie qui dessine). Bonne nouvelle : dans ChatGPT et Gemini, le cerveau et le pinceau sont au même endroit — tu discutes ton perso puis tu le génères dans la même fenêtre. (Midjourney, lui, n'a pas de cerveau : c'est le seul où tu écris le perso dans ChatGPT/Claude, puis tu copies le résultat dans Midjourney.)
⚠️ Et surtout : c'est TOI qui apportes le personnage, pas l'IA. Si tu lui dis juste « invente-moi un nain », elle inventera n'importe quoi. Si tu lui donnes ta vision, elle la met en forme fidèlement. La section suivante te montre exactement comment.
Il y en a des dizaines. Voici ceux qui comptent vraiment pour du perso D&D. La colonne tout-en-un = tu discutes ET tu dessines au même endroit (le plus simple pour débuter).
| Outil | Sa force | Cohérence | Prix d'entrée |
|---|---|---|---|
| ChatGPT · GPT Image 2 tout-en-un |
Le plus fidèle pour un perso à partir d'une réf. « Réfléchit » à ton brief. Texte dans l'image quasi parfait (bannières, noms). | ⭐⭐⭐⭐⭐ | Gratuit ~3/j Plus 20 $/mois |
| Gemini · Nano Banana Pro tout-en-un |
Le plus polyvalent, gratuit très généreux. Tient jusqu'à 5 persos cohérents dans une scène → idéal groupe. | ⭐⭐⭐⭐⭐ | Gratuit ~200/j |
| Midjourney V8.1 le look D&D |
Le rendu peint « manuel de jeu » (style Tyler Jacobson / Wayne Reynolds). Le plus beau. Pas de cerveau intégré. | ⭐⭐⭐⭐ | ~10 $/mois |
| CharGen spécial D&D |
Pensé pour le JDR : lit une fiche de perso / lien D&D Beyond → portrait. NPC, monstres, tavernes, cartes. | ⭐⭐⭐ | Freemium |
| Ideogram | Verrouille un perso depuis une seule photo, très bon sur le texte dans l'image. Gratuit. | ⭐⭐⭐⭐ | Gratuit |
| Leonardo.ai | Modèles taillés « fantasy / concept art ». Bon bac à sable gratuit pour se faire la main. | ⭐⭐⭐ | Tier gratuit |
| Flux.2 / Flux Kontext avancé |
Cohérence record en benchmark et édition fine, mais plus technique. À garder pour plus tard. | ⭐⭐⭐⭐⭐ | API / expert |
Prix et versions vérifiés début juillet 2026 — ça bouge très vite dans ce domaine, considère-les comme des ordres de grandeur.
Gemini en gratuit (~200/jour, largement de quoi illustrer une campagne entière), ou Ideogram / Leonardo. ChatGPT gratuit se limite à ~3/jour.
ChatGPT (GPT Image 2) à partir d'une image de référence : c'est lui qui garde le mieux le même visage d'une scène à l'autre.
Gemini : il garde plusieurs persos identiques dans une même image. Parfait pour la photo de groupe de la party.
Midjourney, 10 $/mois. Rien ne rend l'ambiance « planche de manuel » aussi bien. Pilote-le avec des prompts écrits par ChatGPT/Claude.
C'est la partie la plus importante. Le principe tient en une phrase :
Toi, tu apportes la vision. L'IA, elle la met en forme — elle n'invente pas ton perso.
Voilà le déroulé complet, étape par étape. À chaque étape je te dis qui fait quoi.
Tu déballes ta vision, en vrac. Dans ChatGPT ou Gemini (une simple fenêtre de discussion), tu écris tout ce que tu as en tête sur ton perso — même en désordre. Plus tu donnes de matière, moins l'IA improvise. Donne au minimum : race, classe, âge, caractère, détails signature (cicatrice, tatouage…), couleurs, et le style d'image que tu veux.
Tu demandes à l'IA de structurer, pas de créer. Tu colles cette petite consigne juste après ta description (copie-la telle quelle) :
Elle te renvoie une « fiche » propre + des questions. Elle n'a rien inventé : elle a rangé ta vision et, s'il manque un détail, elle te le demande (« de quel bleu son tabard ? quel nom pour son dieu ? »). Tu réponds, elle affine. Concrètement, elle te rend deux blocs figés…
…puis chaque scène, c'est juste ces deux blocs + une ligne qui change :
Tu passes à l'image. Deux cas selon l'outil :
ChatGPT / Gemini Tu restes dans la même fenêtre et tu dis simplement « génère l'image 1 », puis « l'image 2 », etc. Le cerveau et le pinceau sont ensemble : rien à copier-coller.
Midjourney Tu copies le prompt (les deux blocs + la scène) dans Midjourney. Dès que tu obtiens un rendu qui te plaît, tu le réutilises comme image de référence pour figer le visage sur les suivantes.
Tu corriges en décrivant l'écart. Pas « refais tout » — tu dis ce qui cloche par rapport à ta vision : « il fait trop jeune, vieillis-le », « l'armure est trop dorée, plus acier ». L'IA ajuste sans repartir de zéro. Et tu gardes la même conversation pour toute la campagne : elle se souvient de tes persos et reste cohérente.
Le résultat de tout ça : le même nain, reconnaissable, dans toutes tes scènes — et si tu répètes l'opération pour chaque membre de la party en gardant le même bloc STYLE, l'ensemble de ta campagne a une vraie unité visuelle. C'est ça, la différence entre une galerie qui se tient et 20 images qui n'ont rien à voir.
Si tu creuses le sujet, tu vas tomber sur le mot « LoRA » — l'idée d'entraîner un modèle sur 15-30 images de ton perso pour le figer. Oublie ça. C'était nécessaire avant ; en 2026 les bons outils verrouillent un perso à partir d'une seule image de référence, sans rien entraîner. Plus simple et plus efficace pour ton besoin.
Le workflow complet se prend en main en une petite dizaine de minutes. Le plus dur, c'est de résister à l'envie de tout taper à la main. 🐉