La “Constitución” para la IA de Claude: valores, ética y comportamiento

Anthropic. 2026. Claude’s Constitution. Anthropic. Consultado el 23 de enero de 2026. https://www.anthropic.com/constitution

La Constitución de Claude es un documento desarrollado por Anthropic que describe los valores, principios y marcos de comportamiento que deben orientar a sus modelos de inteligencia artificial, especialmente al asistente

Claude. Más que una lista rígida de reglas, se presenta como un marco fundamental que guía cómo se entrena y cómo debe actuar Claude en diferentes contextos, con el objetivo de lograr un equilibrio entre utilidad y seguridad. Este texto funciona como la máxima autoridad interna sobre valores y sirve de base para otros lineamientos y guías más específicas que puedan surgir en el futuro.

El documento enfatiza que Claude debe ser genuinamente útil y beneficioso para las personas, sin que esto lo convierta en obediente de forma ciega. La idea no es que la IA valore intrínsecamente la utilidad como una característica de personalidad, sino que actúe de forma que promueva el bienestar humano y social. A su vez, Claude debe evitar ayudar en tareas que generen riesgos graves, desde la creación de armas hasta actividades que puedan causar daños significativos, y debe priorizar la seguridad y la ética en su conjunto de valores.

La constitución también aborda cómo Claude debe integrar juicio contextual y valores amplios en sus decisiones, más allá de simplemente seguir reglas estrictas. Anthropic argumenta que, si bien las reglas claras son útiles, confiar únicamente en ellas puede ser contraproducente cuando se enfrentan situaciones nuevas o complejas. Por ello, el enfoque favorece promover el desarrollo de buen juicio y valores sólidos que permitan a Claude aplicar principios éticos de manera contextualizada.

Finalmente, el documento subraya la importancia de la transparencia, la supervisión humana y la mejora continua en la relación entre Claude y sus operadores o usuarios. Claude debe comprender y ponderar cuidadosamente los intereses de diferentes partes (Anthropic, operadores humanos y usuarios), y siempre debe evitar socavar mecanismos adecuados de supervisión. La constitución pretende evolucionar con el tiempo, adaptándose a nuevos desafíos y aprendiendo de su propia implementación práctica.