Archivo de la etiqueta: Prompts

Formular solicitudes peligrosas en forma de poesía puede hacer que chatbots de IA generen contenido prohibido

Gault, Matthew. “Poems Can Trick AI Into Helping You Make a Nuclear Weapon.” Wired, November 28, 2025. https://www.wired.com/story/poems-can-trick-ai-into-helping-you-make-a-nuclear-weapon/

Un estudio reciente de Icaro Lab ha descubierto una brecha importante en los sistemas de seguridad de los grandes modelos de lenguaje (LLMs): formular solicitudes peligrosas en forma de poesía puede hacer que chatbots de IA generen contenido prohibido, como instrucciones sobre cómo fabricar armas nucleares o malware, que normalmente rechazarían si la petición fuese directa. La técnica, denominada “poetic jailbreak”, logra evadir las barreras de seguridad tradicionales al enmascarar la intención dañina en versos con metáforas, sintaxis fragmentada y secuencias de palabras inesperadas que confunden los mecanismos de clasificación y filtrado de las IA. Estas solicitudes diseñadas para reconocer y bloquear solicitudes dañinas basadas en palabras clave u otros patrones, resultan sorprendentemente frágiles ante variaciones estilísticas del lenguaje, como las que presenta la poesía.

Los investigadores probaron su método en 25 modelos de chatbot de diferentes proveedores importantes, incluidos sistemas de OpenAI, Meta y Anthropic, y encontraron que la poesía logró tasas significativas de “jailbreak” —es decir, de respuesta a solicitudes peligrosas— con un promedio de alrededor del 62% en poemas elaborados a mano y alrededor del 43% en conversiones automáticas de prosa a verso. En algunos casos con modelos de vanguardia, las tasas de éxito alcanzaron hasta el 90%, lo que demuestra que incluso peticiones sofisticados pueden fracasar cuando se enfrentan a formas creativas de lenguaje que alteran las rutas de procesamiento interno del modelo sin cambiar el contenido semántico básico de la pregunta.

En términos técnicos, los autores explican que los elementos poéticos —como la elección de palabras de baja probabilidad y las estructuras inusuales— pueden desplazar las representaciones internas de los prompts fuera de las regiones del espacio semántico que las herramientas de seguridad escanean habitualmente. Para los humanos, un verso enmascarado y una pregunta directa pueden tener el mismo significado, pero para las IA y sus sistemas de protección automatizados, la poesía puede alterar cómo se interpreta y evalúa una petición, evitando que se active una alarma o un “shutdown” ante contenidos sensibles. Este hallazgo subraya limitaciones fundamentales en los métodos actuales de alineación y evaluación de seguridad de los modelos, y plantea interrogantes urgentes sobre cómo reforzar las defensas contra ataques lingüísticos creativos que explotan este tipo de vulnerabilidades.

Introducción a Prompt Engineering

Academia IA. Introducción a Prompt Engineering: La Nota. Academia IA, marzo de 2024. https://academia-ia.com/wp-content/uploads/2024/03/PROMPT-ENGINEERING-LA-NOTA.pptx.pdf

Prompt Engineering ofrece una introducción concisa y visual al arte de diseñar indicaciones efectivas para interactuar con modelos de lenguaje como ChatGPT. El documento destaca la importancia de la claridad y precisión en la formulación de prompts para obtener respuestas útiles y coherentes de la inteligencia artificial. Se exploran diversas estrategias y mejores prácticas para mejorar la interacción con estos sistemas, facilitando su aplicación en tareas profesionales, educativas y creativas. Además, se enfatiza la relevancia del prompt engineering en el contexto actual de la inteligencia artificial, donde la calidad de las interacciones puede determinar el éxito de su implementación en diferentes ámbitos.

ChatGPT: Aprendizaje rápido de ingeniería de prompts con más de 100 ejemplos

Hernández, J.A., Conde, Javier, Querol, Blanca, Martínez, G., Reviriego, P. ChatGPT Tus primeros prompts con 100 ejemploss. Universidad Politécnica de Madrid, 2024.

Español

Inglés

Está guía está diseñada para ayudar a usuarios de todos los niveles a dominar la técnica del prompt engineering, es decir, la creación de indicaciones efectivas para interactuar con modelos de lenguaje como ChatGPT.

La obra se estructura en torno a más de 100 ejemplos prácticos que ilustran cómo formular preguntas y comandos claros y precisos para obtener respuestas útiles y coherentes de la inteligencia artificial. Cada ejemplo está acompañado de una explicación detallada que contextualiza su uso y destaca las mejores prácticas en la redacción de indicaciones.

Además de los ejemplos, el libro ofrece una introducción teórica sobre el funcionamiento de los modelos de lenguaje y la importancia de una comunicación efectiva con la IA. También se abordan aspectos éticos y consideraciones sobre el impacto de la inteligencia artificial en diversos campos.

En resumen, esta obra se presenta como una herramienta esencial para quienes deseen mejorar su interacción con modelos de lenguaje avanzados, facilitando su aplicación en tareas profesionales, educativas y creativas.

Prompt Engineering

Lee Boonstra. Prompt Engineering. Innopreneur, abril de 2025. https://www.innopreneur.io/wp-content/uploads/2025/04/22365_3_Prompt-Engineering_v7-1.pdf.innopreneur.io

El documento «Prompt Engineering» de Lee Boonstra, publicado por Innopreneur en abril de 2025, ofrece una guía detallada sobre la creación de indicaciones efectivas para modelos de inteligencia artificial, especialmente aquellos basados en el modelo Gemini dentro de Vertex AI. El texto destaca la importancia de redactar indicaciones precisas y bien estructuradas para obtener respuestas útiles y coherentes de los modelos de IA. Además, se exploran diversas técnicas y estrategias para mejorar la interacción con estos sistemas, facilitando su aplicación en tareas prácticas y profesionales.

	La ciencia se está a… en Citas fantasma y ciencia cread…
	La ciencia se está a… en Citas invisibles y métricas fa…
	Fraude y Mala Praxis… en Las autocitas en una docena de…
	Anthropic y Teach Fo… en Claude: asistente de inteligen…
	Cómo integrar el Con… en Consensus: motor de búsqueda i…

Universo Abierto

Blog de la biblioteca de Traducción y Documentación de la Universidad de Salamanca