DeliverableDeliverable
Taxonomie + exemples + top failure modes + recommandations.Taxonomy + examples + top failure modes + recommendations.
Identifier, nommer, et prioriser les erreurs : pour corriger vite et éviter les “patchs” aléatoires. Identify, name, and prioritize errors — so you fix fast and avoid random patching.
Taxonomie + exemples + top failure modes + recommandations.Taxonomy + examples + top failure modes + recommendations.
Fausses prémisses, confusion d’intention, sur‑abstraction, tool misuse.False premises, intent confusion, over-abstraction, tool misuse.
Scénarios ciblés + analyse qualitative + scoring simple.Targeted scenarios + qualitative analysis + simple scoring.
le modèle accepte une hypothèse fausse.model accepts a wrong assumption.
la réponse n’attaque pas le vrai besoin.answer misses the actual need.
ton assuré sans preuve.confident without evidence.
outil choisi/séquencé sans vérification.wrong tool/sequence without verification.
LLM failure mode analysisLLM failure mode analysis
LLM reliability diagnosticsLLM reliability diagnostics
error taxonomy LLMerror taxonomy LLM
intent misclassificationintent misclassification
Questions fréquentes — formulées comme des requêtes Google. Common questions — phrased like Google queries.