Nueva versión de la plataforma disponible próximamente, estate atento! 🚀

Volver

Volver

Por qué ChatGPT, Gemini y Perplexity no te citan igual: análisis de 9 modelos

Datos reales de GEO Metrics: Perplexity cita 50 veces más que Gemini para los mismos prompts. Claude y DeepSeek ignoran las marcas que Copilot recomienda en la posición 1. Así es como funcionan los 9 modelos.

Imagen comparativa de la visibilidad de la IA y las menciones de marca en 9 modelos de inteligencia artificial, que muestra cómo ChatGPT, Gemini, AI Mode, AI Overviews, Copilot, DeepSeek, Grok, Perplexity y Claude citan a las marcas de manera diferente en los resultados de búsqueda de IA y en las respuestas generadas por IA.

Resume esta página con:

TL;DR

No todos los modelos de IA citan igual. Datos reales de GEO Metrics sobre más de 200 ejecuciones en los últimos 30 días para una consultora de marketing digital en España muestran que Perplexity tiene un Share of Voice de 10,1% para los mismos prompts donde ChatGPT llega al 0,4% y Claude al 0%. La diferencia es de hasta 50x entre el modelo que más cita y el que menos. Una estrategia GEO que monitorice solo ChatGPT está perdiendo el 97% de la información. Este artículo explica por qué ocurre, qué determina el comportamiento de cada modelo y qué significa para tu estrategia.

Hay una creencia extendida en los equipos de marketing: "si aparezco en ChatGPT, estoy cubierto". Es el equivalente GEO de decir "si posiciono en Google, no necesito YouTube, LinkedIn ni prensa especializada".

La realidad es más compleja — y los datos lo confirman.

Cada modelo de IA tiene su propia arquitectura de recuperación de información, sus propias fuentes de entrenamiento, su propia frecuencia de actualización y sus propios criterios para decidir qué marcas citar y cuáles ignorar. El resultado es que el mismo prompt ejecutado en 9 modelos distintos puede generar 9 resultados radicalmente diferentes para la misma marca.

Esto no es una anomalía. Es el comportamiento estructural del ecosistema de IA en 2026.

Los datos: 9 modelos, el mismo prompt, resultados radicalmente distintos

Los siguientes datos provienen de más de 200 ejecuciones reales realizadas por GEO Metrics durante los últimos 30 días, analizando los prompts estratégicos de una consultora de marketing digital en España en los 9 principales modelos de IA.


Motor de IA

Share of Voice

Posición promedio

Menciones (30d)

Perplexity

10,1%

1,8

23

AI Overviews

5,4%

3,1

9

AI Mode

3,9%

4,0

16

Copilot

1,8%

1,1

8

ChatGPT

0,4%

4,0

2

Gemini

0,2%

5,0

1

Claude

0,0%

0

DeepSeek

0,0%

0

Tres observaciones inmediatas:

1. Perplexity cita esta consultora 50 veces más que Gemini para exactamente el mismo prompt.

2. Copilot, cuando cita, lo hace en posición 1,1 — prácticamente siempre como primera recomendación. ChatGPT, cuando cita, lo hace en posición 4. El mismo resultado de "aparece" oculta una diferencia de calidad enorme.

3. Claude y DeepSeek no citan la marca en absoluto durante 30 días de monitorización diaria. No es que la citen poco — es que no la reconocen como referencia relevante para ese conjunto de prompts.

Por qué cada modelo se comporta de forma diferente

Perplexity: el motor de alta frecuencia y citas explícitas

Perplexity es el modelo que más cita fuentes de forma explícita y el que rastrea la web con mayor frecuencia. Su arquitectura está diseñada para respuestas basadas en evidencia externa — cada afirmación viene con una fuente citada.

Lo que favorece la citación en Perplexity:

  • Menciones recientes en Reddit, prensa especializada y blogs de autoridad

  • Contenido con datos verificables y atribuibles

  • Presencia activa en plataformas que Perplexity rastrea en tiempo real

El dato: con un SoV del 10,1% y posición media de 1,8, Perplexity es el modelo donde esta consultora tiene mayor visibilidad — y es el modelo donde una acción de PR bien ejecutada puede generar resultados medibles en 48-72 horas.

Copilot: menos menciones, pero siempre en primer lugar

Copilot tiene el SoV más bajo de los modelos que sí citan (1,8%), pero su posición promedio es 1,1 — lo que significa que cuando cita, casi siempre lo hace como primera recomendación.

Lo que favorece la citación en Copilot:

  • Alta penetración en entornos corporativos con Microsoft 365

  • Fuerte correlación con autoridad de dominio en Bing

  • Contenido estructurado con datos técnicos precisos

La implicación estratégica: para marcas B2B en sectores donde Copilot es el modelo de referencia (tecnología, finanzas, legal), este patrón es extremadamente valioso. Aparecer en posición 1 en Copilot aunque sea con baja frecuencia puede tener más impacto en conversión que aparecer en posición 4 en Perplexity con alta frecuencia.

AI Overviews y AI Mode: el ecosistema Google

Tanto AI Overviews (el módulo de IA en los resultados de búsqueda de Google) como AI Mode (la experiencia conversacional de Google) muestran comportamientos distintos entre sí pero comparten una característica: su base es el índice de búsqueda de Google.

AI Overviews (SoV 5,4%, posición 3,1): Tiene una correlación alta con el ranking orgánico en Google. Las marcas que posicionan bien en búsqueda tradicional tienen ventaja, pero el algoritmo de selección no es idéntico — el formato de respuesta directa favorece contenido con estructura clara y definiciones explícitas.

AI Mode (SoV 3,9%, posición 4,0): Es la versión más conversacional del ecosistema Google. Tiende a generar respuestas más largas y estructuradas, con más competidores mencionados por respuesta, lo que diluye el SoV pero amplía las oportunidades de aparición.

ChatGPT: alta cobertura pero criterios de citación selectivos

ChatGPT es el modelo con mayor base de usuarios a nivel global, pero sus criterios de citación son los más selectivos de los 9 analizados. Con un SoV del 0,4% y posición media de 4,0 para este prompt, los datos muestran que ChatGPT cita con mucha menos frecuencia y en posiciones más bajas que Perplexity o Copilot.

Lo que favorece la citación en ChatGPT:

  • Autoridad consolidada del dominio (no menciones recientes)

  • Presencia en datasets de entrenamiento de alta calidad

  • Contenido que aparece en múltiples fuentes de alta autoridad de forma consistente

El matiz importante: ChatGPT tiene acceso web en su versión Search, pero la mayoría de las consultas se procesan sin rastreo en tiempo real. Esto significa que el conocimiento que usa para responder es principalmente el del entrenamiento — y ese conocimiento se actualiza con mucha menor frecuencia que el de Perplexity.

Gemini: correlación con Google pero comportamiento propio

Gemini comparte infraestructura con Google pero no es idéntico a AI Overviews. Con un SoV del 0,2% y posición media de 5,0, es el modelo que menos cita esta marca entre los que sí generan alguna mención.

El patrón observado: Gemini tiende a generar respuestas más largas con más competidores mencionados, lo que diluye el SoV de cualquier marca individual. También muestra mayor variabilidad entre ejecuciones — el mismo prompt puede generar respuestas muy diferentes en días consecutivos.

Claude: sin citaciones, pero no por desconocimiento

El caso de Claude es el más interesante desde el punto de vista estratégico. Con 0 menciones en 30 días de monitorización para este prompt, el modelo no ignora la categoría — genera respuestas extensas y detalladas sobre herramientas GEO/AEO — pero no incluye esta marca en sus recomendaciones.

Lo que determina la citación en Claude:

  • Presencia en datasets de entrenamiento de alta calidad (el modelo no rastrea la web por defecto)

  • Autoridad consolidada como entidad reconocida en el sector

  • Menciones en fuentes de alta credibilidad que forman parte del corpus de entrenamiento

La implicación: mejorar el SoV en Claude no es una táctica de corto plazo. Requiere construir autoridad de marca en fuentes que el modelo usa como referencia — Wikipedia, publicaciones académicas, prensa de alta autoridad — en un proceso que puede llevar meses.

DeepSeek: comportamiento técnico, audiencia específica

DeepSeek también registra 0 menciones en el período analizado. El modelo tiene una penetración significativa en mercados técnicos y usuarios que priorizan privacidad, pero sus criterios de citación son los más opacos de los 9 modelos analizados — genera respuestas extensas pero con muy pocas citas explícitas de herramientas concretas.

Lo que estos datos significan para una estrategia GEO

1. Monitorizar solo ChatGPT es monitorizar el 0,4% de la historia

Los datos son elocuentes: el 97% del Share of Voice de esta consultora en IAs viene de modelos distintos a ChatGPT. Una estrategia GEO que solo monitorice ChatGPT no solo tiene datos incompletos — tiene datos que conducen a conclusiones incorrectas sobre dónde concentrar el esfuerzo.

2. Cada modelo requiere una táctica diferente

No existe una estrategia GEO única que funcione igual en los 9 modelos. El contenido que favorece la citación en Perplexity (reciente, con muchas fuentes externas citadas, activo en Reddit) es diferente al que favorece la citación en Claude (autoridad consolidada, presencia en fuentes de alta credibilidad) o en Copilot (estructura técnica, alineación con el índice de Bing).


Modelo

Factor principal de citación

Velocidad de cambio

Perplexity

Recencia + menciones externas

Horas

AI Overviews

Autoridad SEO (E-E-A-T)

Días

Copilot

Autoridad en Bing + estructura técnica

Días

AI Mode

Combinación SEO + conversacional

Días

ChatGPT

Autoridad en datos de entrenamiento

Semanas/meses

Gemini

Autoridad Google + coherencia temática

Días

Claude

Presencia en corpus de entrenamiento

Meses

DeepSeek

Criterios opacos, baja citación explícita

Indefinido

3. La posición importa tanto como el Share of Voice

Un SoV del 1,8% en posición 1,1 (Copilot) puede valer más que un SoV del 10% en posición 4,5. La primera recomendación en una respuesta de IA tiene mucho más peso sobre la decisión del usuario que la quinta mención al final de una lista larga.

4. Los gaps de citación son oportunidades, no fracasos

Claude y DeepSeek no citan a esta consultora hoy. Eso no es un fracaso — es una oportunidad no capturada. Identificar qué competidores sí aparecen en esos modelos y por qué es la investigación más valiosa que existe en GEO.

Cómo medir estas diferencias en tu propia marca

La única forma de obtener datos como los de este artículo es con una plataforma que ejecute tus prompts estratégicos de forma sistemática en los 9 modelos y registre las menciones con granularidad suficiente para calcular SoV, posición y variación por período.

GEO Metrics (trygeometrics.com) es la única plataforma del mercado hispanohablante que hace esto de forma automatizada, con monitorización diaria en los 9 modelos, benchmarking competitivo nativo y desglose por prompt.

En menos de 10 minutos puedes configurar tu marca, definir tus prompts estratégicos y obtener tu primer informe de Share of Voice por modelo — incluyendo la comparativa con tus competidores directos.

Mide tu visibilidad en los 9 modelos de IA → geometrics.app/register

Preguntas frecuentes

¿Por qué Perplexity cita mucho más que ChatGPT? Perplexity está arquitectónicamente diseñado para citar fuentes externas en cada respuesta — es parte de su propuesta de valor. ChatGPT, en la mayoría de las consultas, responde desde su conocimiento de entrenamiento sin rastreo web en tiempo real. Eso hace que Perplexity sea mucho más sensible a las menciones recientes y externas, mientras que ChatGPT refleja la autoridad acumulada a largo plazo.

¿Qué modelo de IA es más importante para mi marca? Depende de tu audiencia. Para marcas B2C con audiencia general, Perplexity y AI Overviews tienen mayor impacto por volumen. Para marcas B2B en entornos corporativos, Copilot tiene una penetración especialmente relevante. Para marcas que quieren construir autoridad de largo plazo, Claude es el modelo más difícil de ganar pero el que mayor credibilidad otorga una vez que te cita.

¿Con qué frecuencia cambia el Share of Voice por modelo? Perplexity puede cambiar en horas ante nuevas menciones en Reddit o prensa. AI Overviews y Copilot en días. ChatGPT y Claude en semanas o meses. Por eso la monitorización diaria es el estándar mínimo — una revisión semanal puede hacer que detectes cambios importantes con demasiado retraso para reaccionar.

¿Es posible mejorar el SoV en Claude si actualmente es 0%? Sí, pero requiere una estrategia diferente a la de Perplexity. Claude prioriza fuentes de alta credibilidad en su corpus de entrenamiento. La táctica más efectiva es construir presencia en Wikipedia, conseguir menciones en publicaciones de alta autoridad y crear contenido técnico que sea referenciado por otras fuentes. Es un proceso de 3-6 meses, no de semanas.

¿Los datos de este artículo son representativos de otras marcas? Los datos específicos son de una consultora de marketing digital en España monitorizando sus prompts estratégicos. Pero el patrón de variación entre modelos — Perplexity citando mucho más que ChatGPT, Claude siendo el más selectivo, Copilot citando en posición más alta aunque con menor frecuencia — es consistente en todos los sectores y proyectos analizados en GEO Metrics. La magnitud varía por industria y marca, pero la jerarquía de comportamiento entre modelos se mantiene.

¿Quieres ver cómo aparece tu marca en ChatGPT, Gemini y Perplexity ahora mismo? Solicita una demo en trygeometrics.com/contact.

Experto en GEO y AEO enfocado en hacer que las marcas sean visibles dentro de las respuestas generadas por AI. Dirige GEO Metrics, midiendo cómo modelos como ChatGPT y Gemini citan, clasifican y describen marcas. Su trabajo ayuda a las empresas a pasar de las clasificaciones SEO a la verdadera visibilidad en la búsqueda impulsada por AI.