Citation graph — como a IA decide entre dois hotéis equivalentes

TL;DR · 4 ideias-chave

Sinal técnico classifica; menção desempata. Quando dois hotéis são tecnicamente equivalentes, a IA recomenda o que mais fontes independentes confirmam.
O grafo de citações é a rede de quem menciona quem. Reviews, guias, imprensa, associações e diretórios oficiais formam os nós que dão (ou negam) confiança ao seu nome.
4 critérios de desempate: consenso entre fontes independentes, autoridade + recência das menções, dados estruturados que confirmam atributos, consistência NAP.
A maioria nem chega ao desempate. No Estudo GEO Hotelaria 2026, só 24% dos 425 sites auditados têm Schema corretamente tipado. Quem resolve a base já compete em outra liga.

O problema do empate técnico

Imagine duas pousadas na mesma praia. As duas têm site próprio, Schema Markup tipado, llms.txt na raiz, FAQ com preço e política de cancelamento. Nos 22 sinais técnicos que audito, as duas pontuam parecido. Um viajante pergunta ao ChatGPT: "pousada boutique com vista pro mar nessa praia, até R$ 900". A resposta cita 3 nomes. Uma das duas entra. A outra não.

Esse cenário deixou de ser hipotético. Segundo a Booking.com (2025), 63% dos viajantes brasileiros já usaram IA pra planejar ou durante a viagem. E o espaço na resposta é curto: a PhocusWire reportou que só cerca de 16% da oferta hoteleira global aparece nas respostas de IA. A lista final tem 3 a 5 nomes — não 10 links azuis com página 2.

Quando a parte técnica empata, o que decide não está no seu site. Está no que o resto da internet diz sobre você. É isso que o conceito de grafo de citações (citation graph) descreve.

O que é um grafo de citações — sem jargão

Pense em como você checaria a referência de um candidato a gerente da sua pousada. O currículo (o site do hotel) diz o que a pessoa afirma sobre si mesma. Mas você liga pra dois ex-empregadores. Se os dois, sem combinar, confirmam as mesmas qualidades, você confia. Se cada um descreve uma pessoa diferente — ou se ninguém atende — você desconfia.

Sistemas de IA que respondem com busca ao vivo (o tal RAG, Retrieval-Augmented Generation) fazem uma versão automatizada disso. Quando alguém pergunta sobre hospedagem numa cidade, o sistema recupera vários documentos ao mesmo tempo: seu site, sua página na OTA, reviews, um guia de viagem, uma matéria de jornal, o diretório da associação de turismo. Cada documento é um nó; cada menção ao seu hotel é uma aresta ligando aquele nó ao seu nome. O conjunto é o grafo.

Seu site é a sua versão da história. O grafo de citações é a versão que as testemunhas contam.

O que o modelo faz com esse grafo, na prática:

Reconhece a entidade. "Pousada Tal" precisa ser identificável como a mesma coisa em todas as fontes — mesmo nome, mesmo endereço, mesmo telefone.
Cruza atributos. Seu site diz "vista pro mar". O review diz "acordei vendo o mar". O guia diz "de frente pra praia". Três fontes independentes convergindo elevam a confiança naquele atributo.
Pondera as fontes. Menção em veículo estabelecido ou diretório oficial pesa mais que menção em página desconhecida. Menção recente pesa mais que menção de 2019.
Gera a resposta. Na hora de escolher os 3-5 nomes que cabem no parágrafo, entra quem tem atributos confirmados por mais fontes com mais peso.

Nenhuma dessas etapas é segredo industrial. É o comportamento documentado de sistemas de recuperação: corroboração entre fontes independentes reduz o risco de o modelo afirmar algo errado — e modelo comercial odeia afirmar algo errado sobre onde você vai dormir com sua família. Na dúvida entre dois hotéis, ele cita o que consegue verificar por mais caminhos.

Os 4 critérios de desempate

1. Consenso entre fontes independentes

A palavra que importa é independentes. Dez páginas do seu próprio domínio repetindo "melhor café da manhã da região" contam como uma fonte só — a sua. Uma menção num guia de viagem, outra num review, outra no diretório de um convention & visitors bureau (em Ilhabela, por exemplo, o IC&VB mantém listagem de associados) são três caminhos distintos até o mesmo fato. Pro grafo, isso vale muito mais.

Reviews têm papel especial aqui: são a fonte independente mais abundante que uma pousada pequena consegue gerar. Não dá pra fabricar (nem deve), mas dá pra colher — pedir no check-out, facilitar o link, responder cada um. Escrevi sobre isso em como o check-out vira motor de GEO.

2. Autoridade e recência das menções

Nem toda aresta do grafo pesa igual. Dois fatores mudam o peso:

Autoridade da fonte. Imprensa estabelecida, guias reconhecidos, órgãos oficiais (Cadastur, secretarias de turismo), associações setoriais. São fontes que o modelo já aprendeu a tratar como confiáveis em milhões de outros contextos.
Recência. Sistemas com busca ao vivo enxergam datas. Uma matéria de 2026 confirmando que você opera, reformou, ganhou prêmio ou lançou algo pesa mais que um artigo parado desde 2019 — que pode descrever um hotel que nem existe mais daquele jeito.

A implicação prática: menção antiga não é patrimônio permanente. O grafo precisa de manutenção — algumas arestas novas por ano.

3. Dados estruturados que confirmam atributos

O Schema Markup (JSON-LD com tipo Hotel ou LodgingBusiness) faz duas coisas no desempate. Primeiro, transforma afirmação solta em atributo legível por máquina: "piscina aquecida" vira amenityFeature, faixa de preço vira priceRange, coordenadas viram geo. Segundo — e é isso que pouca gente percebe — ele dá ao modelo um gabarito pra cruzar com as fontes externas. Quando o que o seu Schema declara bate com o que reviews e guias dizem, a convergência inteira fica mais crível. Quando não bate, tudo fica em dúvida.

O passo a passo técnico está em Schema.org pra hotéis na prática.

4. Consistência NAP

NAP é Name, Address, Phone — nome, endereço e telefone. Parece detalhe burocrático; é fundação do grafo. Se o seu hotel aparece como "Pousada Mar Azul" no site, "Mar Azul Suítes" na OTA e "Pousada MarAzul Ltda" no diretório municipal, com dois telefones diferentes, o sistema pode tratar isso como duas ou três entidades fracas em vez de uma entidade forte. Você mesmo fragmenta suas citações e chega ao desempate com metade do grafo.

Regra simples: escolha a grafia canônica do nome, um endereço formatado de um jeito só, um telefone principal — e replique idêntico em todo lugar onde o hotel aparece.

A maioria nem chega ao desempate

Tudo acima pressupõe que o empate técnico aconteceu. No Brasil de hoje, ele quase nunca acontece — e isso é a melhor notícia deste post.

No Estudo GEO Hotelaria 2026, escaneei 609 sites de hotéis e pousadas em mais de 25 destinos brasileiros entre maio e julho de 2026, e auditei 425 deles com o Protocolo Arsenal (22 sinais). O retrato:

43% não têm Schema algum — nem errado;
33% têm Schema, mas sem tipo Hotel — a IA sabe que existe "algo" ali, não sabe que é hospedagem;
Só 24% têm Schema corretamente tipado — o mínimo pra disputar de igual;
62% não têm llms.txt e 65% não têm página de FAQ;
11% dos sites estavam fora do ar na coleta.

Ou seja: em 3 de cada 4 disputas, um dos lados nem se apresenta legível. O "desempate por citações" é hoje um jogo do quartil de cima. Pra quem está começando, a ordem é uma só — primeiro fique legível, depois construa o grafo.

O ranking de prontidão por destino mostra que a janela está aberta até nos mercados mais maduros (gap médio: quanto menor, melhor):

Destino	Gap médio	n auditados	Destaque
Gramado	15	10	20% sem llms.txt · 70% sem Schema tipado
São Sebastião	22	13	54% sem llms.txt · 92% sem Schema tipado
Búzios	23	9	—
Jericoacoara	25	14	100% sem Schema tipado
Pipa	27	14	—
Ipojuca / Porto de Galinhas	27	21	81% sem llms.txt
Campos do Jordão	28	12	83% sem llms.txt · 100% sem Schema tipado

Repare no dado de Gramado: é o destino mais pronto do ranking e mesmo assim 70% dos sites auditados não têm Schema tipado. No scan de maturidade digital de julho/2026, Gramado lidera com 88% dos hotéis operando profissionalmente ou pagando tráfego (n=18), contra 43% em Bento Gonçalves (n=16). Operação comercial madura e legibilidade pra IA são coisas diferentes — no geral, só 14% dos 541 sites acessíveis tinham mídia paga ativa, e nem esses tratam o grafo de citações como canal. Quem tratar, sai na frente.

Estratégia de menções pra pousada — em ordem de esforço

Construir grafo de citações não exige assessoria de imprensa nem orçamento de rede hoteleira. Exige método e sequência. A ordem abaixo vai do que você controla sozinho (custo zero, efeito imediato) ao que depende de terceiros (custo alto, efeito composto).

Degrau	Ação	Esforço	Efeito no grafo
1	Casa em ordem: Schema tipado + llms.txt + NAP canônico no site	Baixo	Cria a entidade que as citações vão apontar
2	Perfis que você controla fora do site: Google Business Profile, Cadastur, perfis nas OTAs — tudo com NAP idêntico	Baixo	Primeiras arestas, em fontes de alta autoridade
3	Reviews: pedir no check-out + responder todos citando atributos reais	Médio e contínuo	Volume de confirmação independente + recência automática
4	Associações e órgãos: associação local, convention & visitors bureau, secretaria de turismo, ABIH regional	Médio (afiliação)	Menções institucionais de alta autoridade
5	Imprensa e guias regionais: pauta genuína (reforma, evento, dado, história)	Alto	Autoridade editorial + recência
6	Curadorias nacionais e guias especializados ("melhores pousadas de X")	Alto	Arestas de maior peso individual

Três notas de execução:

Degraus 1 e 2 vêm antes de qualquer coisa. Menção nova apontando pra entidade fragmentada é esforço desperdiçado. É como divulgar um telefone que ninguém atende.
No degrau 3, a resposta ao review é sua. O hóspede escreveu "adoramos a piscina"; você responde nomeando: "que bom que curtiram a piscina aquecida com borda pro mar". A resposta do proprietário é texto indexável na mesma página do review — e reforça exatamente os atributos que o Schema declara.
Nos degraus 5 e 6, a moeda é história real, não release. Um dado da sua operação, uma reforma com conceito, um evento no destino. Jornalista regional publica o que tem substância local.

E vale registrar o que a pesquisa acadêmica já mediu: o estudo de Princeton (Aggarwal et al., 2024) testou 3 táticas de conteúdo — entre elas citar fontes e incluir estatísticas — e encontrou ganho de visibilidade em respostas de LLM de até 115% (estudo geral, não específico de hotelaria). E a Seer Interactive (set/2025) mediu, em 3.119 queries, +35% de cliques pra marcas citadas em AI Overviews. Ser citado não é vaidade métrica: muda tráfego e muda reserva direta.

Como saber se o seu grafo está funcionando

Sem ferramenta paga, dois testes mensais resolvem:

Teste de citação. Rode 5 perguntas representativas ("melhor pousada em [cidade]", "pousada romântica [cidade]", "hospedagem pet-friendly [cidade]"...) em ChatGPT, Claude, Perplexity e Gemini. Conte em quantas o seu nome aparece. A metodologia completa está no meu benchmark de 280 queries em 7 cidades.
Teste de atributo. Pergunte "o que você sabe sobre a [nome da pousada] em [cidade]?" no Perplexity, que exibe as fontes. Veja quais atributos a IA afirma com segurança e de onde tirou. O que ela erra ou omite é exatamente a aresta que falta no seu grafo.

Anote os resultados numa planilha simples. Em 3 meses você tem série histórica — e sabe se cada degrau novo moveu o ponteiro.

Perguntas frequentes

Menção sem link vale alguma coisa?

Vale. Diferente do SEO clássico, em que o link era a moeda, pro grafo de citações o que importa é a menção textual da entidade com atributos consistentes. Um guia que escreve "a Pousada Tal, de frente pra praia X" sem linkar ainda é uma aresta. Com link é melhor — ajuda o crawler a conectar — mas a ausência de link não zera o valor.

Reviews negativos destroem o grafo?

Não por si só. Fonte independente com opinião mista ainda confirma que você existe, onde fica e o que oferece. O risco real é padrão consistente de reclamação sobre o mesmo atributo — aí a IA pode repetir a ressalva na resposta. Responda sempre, corrija o que for operacional e siga colhendo reviews novos: recência dilui.

Preciso estar na Wikipedia?

Só se houver notabilidade real — e a maioria das pousadas não tem, o que é normal. Forçar artigo promocional costuma terminar em exclusão. O caminho pra hospedagem independente é o que descrevi nos degraus 4 e 5: associações, órgãos oficiais e imprensa regional. Escrevi sobre o papel da Wikipedia no RAG de viagem em outro post.

Quanto custa construir isso?

Os degraus 1 a 3 custam trabalho, não dinheiro. O degrau 4 custa a anuidade da associação, que muitas pousadas já pagam sem usar o benefício da listagem. Os degraus 5 e 6 custam relacionamento e uma boa história. O gargalo típico não é orçamento — é ninguém na operação ser dono da tarefa.

Seu hotel chega ao desempate?

O Score Arsenal (grátis) mostra em minutos se o seu site passa da fase técnica — Schema, llms.txt, FAQ, NAP. E a Auditoria de Presença em IA (R$ 297) mapeia o que ChatGPT, Gemini e Perplexity já dizem sobre o seu hotel hoje, com as fontes que estão alimentando essas respostas.

Rodar meu score grátis →

Ou conheça a Auditoria de Presença em IA · R$ 297

Citation graph: como a IA decide entre dois hotéis equivalentes