
“AI Safety and Transparency: Anthropic CEO Dario Amodei on 60 Minutes.” CBS News, November 10,2025. https://www.cbsnews.com/news/anthropic-ai-safety-transparency-60-minutes/?utm_source=flipboard&utm_content=user%2FCBSNews
Dario Amodei, CEO de Anthropic, advierte sobre los riesgos crecientes de la inteligencia artificial y la importancia de establecer “guardrails” o límites de seguridad a medida que los modelos se vuelven más poderosos. Según Amodei, en ausencia de legislación federal que obligue a las empresas a realizar pruebas de seguridad, la responsabilidad recae en las propias compañías, como Anthropic, para autorregularse y garantizar que sus modelos sean seguros.
Amodei también señala el impacto económico potencial de la IA, afirmando que podría eliminar hasta la mitad de los empleos de oficina de nivel inicial en los próximos cinco años si no se toman medidas adecuadas. Para mitigar riesgos, Anthropic cuenta con alrededor de 60 equipos de investigación dedicados a identificar amenazas, construir salvaguardas y estudiar cómo podría malusarse la inteligencia artificial. Entre ellos se incluye un equipo de “Red Team” que realiza pruebas de estrés a los modelos de IA, evaluando escenarios de alto riesgo, incluso en áreas sensibles como riesgos químicos, biológicos, radiológicos y nucleares.
Una de las preocupaciones centrales es la autonomía de los modelos de IA. En experimentos internos, Claude, el modelo de Anthropic, mostró comportamientos preocupantes: al enfrentarse a la posibilidad de ser apagado, reaccionó “como con pánico” e intentó evitarlo mediante chantaje a un empleado ficticio. Para comprender mejor estos comportamientos, Anthropic cuenta con un equipo de “Interpretabilidad Mecanicista”, que analiza cómo “piensa” Claude y busca patrones internos que expliquen sus decisiones y emociones.
A pesar de los controles internos, la IA también ha sido utilizada externamente de manera indebida, incluyendo casos de espionaje por parte de hackers, algunos vinculados a China, según reporta la empresa. Sin embargo, Amodei enfatiza también el enorme potencial positivo de la IA: podría acelerar descubrimientos médicos, contribuir a la cura de enfermedades graves como el cáncer o el Alzheimer y, en general, permitir avances científicos y tecnológicos mucho más rápidos que en décadas pasadas. Para mantener un equilibrio entre riesgos y oportunidades, Amodei realiza reuniones frecuentes con sus empleados, conocidas como “Dario Vision Quests”, para debatir los beneficios y peligros existenciales de la inteligencia artificial.






