Un estudio cuestiona el impacto del marcado en las citas y visibilidad de las páginas en la IA generativa

Diagram showing schema markup flow leading to AI citation and attribution with terms like JSON-LD, knowledge transfer, and algorithms.
Visual diagram illustrating schema markup and AI citation integration processes.

Schwartz, Barry. “Study: Adding Schema Did Not Improve AI Citations On Google, ChatGPT & More.” Search Engine Roundtable. Publicado el 13 de mayo de 2026. Consultado el 19 de mayo de 2026.

El artículo recoge los resultados de un estudio realizado por Ahrefs que cuestiona una de las creencias más extendidas dentro del SEO y del emergente ámbito del GEO (Generative Engine Optimization): la idea de que añadir marcado Schema o datos estructurados mejora la probabilidad de que una página web sea citada por sistemas de inteligencia artificial como Google AI Overviews, Google AI Mode o ChatGPT.

La investigación analizó 1.885 páginas web que incorporaron marcado JSON-LD Schema entre agosto de 2025 y marzo de 2026 y las comparó con un grupo de control formado por unas 4.000 páginas similares que no añadieron este tipo de marcado. El objetivo era determinar si existía una relación causal entre el uso de Schema y la frecuencia con la que las plataformas de IA citaban esos contenidos en sus respuestas generadas automáticamente. Según el estudio, los resultados no mostraron mejoras estadísticamente significativas en ninguna de las plataformas analizadas.

Los datos obtenidos fueron especialmente llamativos porque contradicen gran parte del discurso dominante en el sector SEO. En Google AI Overviews, las páginas que añadieron Schema incluso mostraron una ligera disminución del 4,6 % en las citas respecto al grupo de control. En Google AI Mode se registró un aumento del 2,4 %, mientras que en ChatGPT el incremento fue del 2,2 %, aunque ambos valores fueron considerados estadísticamente irrelevantes y posiblemente atribuibles al azar. Los investigadores concluyeron que no puede afirmarse que el Schema produzca un aumento real de visibilidad en sistemas de IA generativa.

El estudio también introduce una distinción importante entre correlación y causalidad. Ahrefs observó inicialmente que las páginas citadas por sistemas de IA tenían casi tres veces más probabilidades de incluir marcado Schema que las páginas no citadas. Sin embargo, los autores sostienen que esto probablemente se debe a que los sitios web técnicamente mejor mantenidos suelen aplicar simultáneamente buenas prácticas SEO, contenido de calidad, autoridad de dominio y estrategias de enlazado más sólidas. En otras palabras, el Schema sería un indicador indirecto de calidad técnica general, pero no el factor que impulsa directamente las citas de la IA.

Otro aspecto relevante es que algunos experimentos citados dentro del informe mostraron que varios sistemas de IA no utilizan directamente el marcado JSON-LD durante la extracción inmediata de información, sino que priorizan el contenido HTML visible de la página. Esto cuestiona la idea de que los modelos generativos “lean” o dependan necesariamente del Schema para interpretar el contenido web.

La noticia tuvo una fuerte repercusión dentro de la comunidad SEO y GEO. En diversos debates en Reddit y redes profesionales, numerosos especialistas interpretaron el estudio como un golpe a ciertas estrategias de “optimización para IA” que se habían popularizado rápidamente durante 2025 y 2026. Algunos comentarios destacan que muchas recomendaciones sobre Schema y visibilidad en IA se habían difundido más como hipótesis comerciales que como conclusiones respaldadas por evidencia empírica sólida.

No obstante, el estudio no concluye que el Schema carezca completamente de utilidad. Los autores recuerdan que los datos estructurados siguen siendo importantes para otros contextos: resultados enriquecidos en buscadores, interoperabilidad semántica, organización de contenidos, accesibilidad de datos y construcción de knowledge graphs. Además, reconocen que la investigación se centró únicamente en páginas ya visibles para los sistemas de IA y no pudo determinar si el Schema podría ayudar a páginas nuevas o menos visibles a ser descubiertas inicialmente.

En conjunto, el informe refleja una transformación profunda del SEO tradicional hacia un entorno dominado por motores generativos y asistentes conversacionales. La principal conclusión es que las estrategias centradas exclusivamente en optimizaciones técnicas aisladas parecen perder peso frente a factores más amplios como la autoridad temática, la calidad del contenido, la claridad informativa y la confianza del dominio. El debate abierto por este estudio muestra que el ecosistema GEO todavía se encuentra en una fase experimental, donde muchas prácticas consideradas “buenas estrategias” aún carecen de validación científica robusta.