Chaleur cognitive — expertise incarnée
Human cognition behind reliable thinking AI
J'interviens là où les systèmes d'IA se trompent subtilement : ambiguïté, contexte, refus, tool-use, ton, sécurité. Mon rôle : appliquer un jugement humain structuré pour rendre le comportement plus fiable, mesurable et utile.
Une partie du travail vit dans des espaces privés (workspace). Accès uniquement par URL directe.
Human-in-the-loop, concrètement
Je ne “tune” pas au hasard : je rends visible le raisonnement, les critères, puis je mesure l'effet des corrections. On passe du ressenti au diagnostic, puis à l’itération.
Ce que j’observe
Les points de friction : incompréhension, sur‑confiance, refus trop strict, hallucinations, erreurs de tool-use, ton inadéquat.
Ce que je rends mesurable
Une grille d’évaluation (rubric) + pondérations, pour comparer, suivre une progression, et décider.
Ce que je corrige
Guidelines, prompts, exemples, garde-fous, scénarios : corrections orientées produit et usage réel.
Ce que je sécurise
Refus utiles, limites explicites, comportements en cas d’ambiguïté, et cohérence globale sur les cas limites.
Le métier (déroulé)
- Cadre : objectifs, contraintes, profils utilisateurs, risques.
- Rubric : critères, pondérations, définitions (ce qui compte vraiment).
- Évaluation : scoring + notes qualitatives (le “pourquoi”).
- Patterns d’échec : familles d’erreurs, causes probables, récurrence.
- Corrections : prompt / produit / guidelines / exemples / outils.
- Retest : vérification par scénarios et comparaison avant/après.
- Transmission : recommandations actionnables + priorisation.
Résultats
Clarté
Moins de comportements “bizarres”. Plus de décisions compréhensibles pour l’utilisateur.
Fiabilité
Moins d’erreurs récurrentes. Meilleure cohérence en multi‑tour et en tool-use.
Mesure
Des critères partagés pour itérer sans tourner en rond (scoring + cas limites).
Humain
Refus plus utiles, ton mieux ajusté, et une meilleure sécurité perçue.
Pas de faux témoignages. Références disponibles sur demande.
Contact
Me laisser un message
Newsletter projet (discrète)
Des updates de milestones (pas de spam).
Pour comprendre le format d’intervention : voir le CIA.