Chaleur cognitive — expertise incarnée

Human cognition behind reliable thinking AI

J'interviens là où les systèmes d'IA se trompent subtilement : ambiguïté, contexte, refus, tool-use, ton, sécurité. Mon rôle : appliquer un jugement humain structuré pour rendre le comportement plus fiable, mesurable et utile.

Voir le déroulé Travailler ensemble

Une partie du travail vit dans des espaces privés (workspace). Accès uniquement par URL directe.

Human-in-the-loop, concrètement

1 Output modèle → 2 Jugement humain → 3 Ajustement → 4 Retest → 5 Comportement stable

Je ne “tune” pas au hasard : je rends visible le raisonnement, les critères, puis je mesure l'effet des corrections. On passe du ressenti au diagnostic, puis à l’itération.

Ce que j’observe

Les points de friction : incompréhension, sur‑confiance, refus trop strict, hallucinations, erreurs de tool-use, ton inadéquat.

Ce que je rends mesurable

Une grille d’évaluation (rubric) + pondérations, pour comparer, suivre une progression, et décider.

Ce que je corrige

Guidelines, prompts, exemples, garde-fous, scénarios : corrections orientées produit et usage réel.

Ce que je sécurise

Refus utiles, limites explicites, comportements en cas d’ambiguïté, et cohérence globale sur les cas limites.

Le métier (déroulé)

Cadre : objectifs, contraintes, profils utilisateurs, risques.
Rubric : critères, pondérations, définitions (ce qui compte vraiment).
Évaluation : scoring + notes qualitatives (le “pourquoi”).
Patterns d’échec : familles d’erreurs, causes probables, récurrence.
Corrections : prompt / produit / guidelines / exemples / outils.
Retest : vérification par scénarios et comparaison avant/après.
Transmission : recommandations actionnables + priorisation.

Résultats

Clarté

Moins de comportements “bizarres”. Plus de décisions compréhensibles pour l’utilisateur.

Fiabilité

Moins d’erreurs récurrentes. Meilleure cohérence en multi‑tour et en tool-use.

Mesure

Des critères partagés pour itérer sans tourner en rond (scoring + cas limites).

Humain

Refus plus utiles, ton mieux ajusté, et une meilleure sécurité perçue.

Pas de faux témoignages. Références disponibles sur demande.

Contact

Me laisser un message

Newsletter projet (discrète)

Des updates de milestones (pas de spam).

Pour comprendre le format d’intervention : voir le CIA.