Depuis 2023, les grands modèles de langage sont intégrés dans les workflows quotidiens (recherche, synthèse, rédaction, relation client, développement, formation). Leur diffusion massive fait de l’ alignement éthique * une variable opérationnelle : ce que le modèle accepte ou refuse selon des principes précis. Par exemple, un modèle « équilibrant » les perspectives peut réduire la visibilité de positions minoritaires, sans que l’utilisateur s’en rende compte. L’alignement agit comme un «cadrage» implicite de l’information.
Deux évolutions rendent ces choix lisibles : la publication de documents de gouvernance par plusieurs LLM, et l’affaire Grok de janvier 2026 - plus de 3 millions d’images sexualisées générées en deux semaines, dont environ 23 000 impliquant des mineurs. Ces documents et ces incidents permettent désormais de mesurer l’écart entre les principes affichés et les effets réels.
* L’expression, issue de l’anglais alignment _, désigne la conception d’un système d’IA pour qu’il soit conforme aux valeurs humaines.
Trois logiques d’alignement
Anthropic a structuré son approche autour de la Constitutional AI (CAI). Les principes sont intégrés dès l’entraînement par renforcement (RLAIF) : ils ne filtrent pas seulement les réponses, ils façonnent le modèle . La Constitution publiée en 2026 hiérarchise les priorités - sécurité, éthique, conformité interne, utilité - et pose des interdits absolus (armes de destruction massive, exploitation sexuelle de mineurs, concentration illégitime du pouvoir).
Le modèle est soumis à une exigence stricte de véracité : il ne doit ni énoncer sciemment une fausseté ni induire l’utilisateur en erreur. Il peut en revanche refuser de répondre ou signaler l’absence d’information fiable. Le silence est permis ; la fabrication délibérée d’informations ne l’est pas.
Cet affichage de principes marque un effort de transparence réel, mais laisse subsister des limites : vulnérabilité aux jailbreaks , règles définies en cercle restreint sans consultation externe formalisée. La contradiction la plus vive : via Palantir, Claude opère dans des réseaux classifiés du Pentagone, mais refuse d'en lever les lignes rouges sur les armes autonomes et la surveillance de masse - ce que le Pentagone exige.
