Back to Home
Tempo de vida da palavra-chave
Search Engine Mechanics

Tempo de vida da palavra-chave

Uma análise completa baseada na palestra de Paul Haahr (Google) sobre como o Google processa, classifica e apresenta os resultados de busca.

Overview

Este material tem como base a palestra do Googler Paul Haahr no SMX West 2016 e tem como objetivo explicar como a ferramenta de busca funciona através dos olhos de um “engenheiro de rankings”. Aqui vou mostrar, segundo a ótica do Paul, como funciona o tempo de vida de uma palavra-chave, desde o momento onde o Google “conhece” o termo, até o retorno na busca.

O tempo de vida de uma palavra-chave é dividido em duas partes: pré-busca, que é a parte mais fácil e o processamento de uma palavra-chave, que já é mais complicado.

Pré-busca A etapa pré-busca consiste no rastreamento (crawling) da internet pelo Googlebot e suas variações (mobile, news, image e etc). Após essa etapa, as páginas são analisadas passando por um processo de extração dos links, renderização do conteúdo e interpretação sobre as notações semânticas (conexões do conteúdo com entidades e outros elementos do Knowledge Graph). Com essas informações, o índice de busca é gerado e este funciona como um índice de um livro, sendo que para cada palavra, uma lista de páginas aparece/conecta com ela. O índice é distribuído entre grupos de milhares de páginas, estes grupos são chamados “Shards*” e existem mais de 1.000 “Shards” para o “web index”. Além dessas informações, também temos os meta-dados* dos documentos.

Processamento da palavra-chave O processamento e entendimento da palavra-chave começa com uma análise para saber se ela possui alguma entidade vinculada e/ou um sinônimo. Neste momento, o contexto é muito importante, pois ele segmentar a entender a necessidade do usuário.

Exemplo: Entendimento da Keyword Existem entidades ligadas a esta palavra-chave? Ex: [Estádio do Corinthians], [Zacarias] Existem sinônimos nesta palavra-chave? Ex: [XP] -> [XP Investimentos], [XP php] – > [Instalar php no windows xp] Contexto importa e importa muito nesta etapa. Ex: [Manga] -> Fruta, Mangá, Manga de Roupa Ex: [Cabo] -> Cabo de Cobre, Cabo (Lugar), Cabo Frio (Cidade), Cabo Exército serp da palavra-chave: Cabo

Após essa primeira etapa, entramos na fase de recuperação e score, passando primeiramente pelo envio da palavra-chave para todas as “shards”.

Cada uma das “shards” retorna: - Páginas que combinam com a palavra-chave - Calcula o score para a palavra-chave + página - Retorna as top pages por score As top pages são combinadas em uma listagem, ordenadas por score e em seguida, passam por um ajuste fino, verificando: - Ajustes no título e meta descrição quando necessário - Inclui sitelinks + rich snippets - Verifica se existem muitos resultados similares - Desqualifica páginas spam ou com ações manuais No final dessa fase, temos o resultado de busca em apenas 1/2 de segundo.

Certo, mas afinal, qual a função do “engenheiro de rankings”? As principais são: - Escrever os códigos para os servidores (shards*) - Procurar por novos sinais e os combiná-los com os sinais mais antigos - Otimizar os resultados através da análise sobre as métricas - Entender os sinais e alterar o peso deles ao longo do tempo

Score O score é uma nota para combinar a palavra-chave com a página do site. Os sinais são um pedaço da informação utilizada no score e são separados em dois grupos distintos, um deles independente da palavra-chave e o segundo, dependente dela. Alguns exemplos de sinais independentes: PageRank, linguagem e mobile friendly. Exemplos de sinais dependentes: hits, sinônimos e proximidade (local).

Métricas As métricas são utilizadas como guia para que a otimização dos resultados de busca aconteça. Entre ela, as principais são: - Relevância: a página responde a busca do usuário e métricas de qualidade da página (essa é a mais importante de todas) - Qualidade da Página: quão bom são os resultados para esta busca - Tempo de Carregamento: quanto mais rápido, melhor Ainda dentro das métricas, também são utilizados pesos para os rankings, sendo que neste peso, existe uma escala, chamada “Reciprocidade de Rankings”: 1º lugar: vale 1 2º lugar: vale ½ 3º lugar: vale ⅓ 4º lugar: vale ¼ 5º lugar: vale ⅕ e assim por diante

Todos os indicadores passam por um processo de validação, seja ele através dos “Live Experiments” ou dos “Human Raters”. Os exemplos de Live Experiments são: teste A/B nos usuários ativos (o famoso sandbox), entendimento sobre a mudança no padrão de cliques e análise dos resultados. Um teste bastante conhecido foi a análise entre 42 variações da cor azul dos links nos resultados de busca para entender qual delas performa melhor.

Os Human Raters são pessoas que executam uma série de testes e análises nos resultados de busca, durante o processo de teste, passam por um questionamento sobre quais são os melhores resultados para uma busca e o motivo para isso, se estes estão de acordo com os guidelines definidos pelo Google. O processo de coleta dessas informações é bastante automatizado e os engenheiros gostam de contar com a análise dos Raters para qualificar os resultados, a intuição ainda é um ponto bastante utilizado aqui.

Rating do Resultado de Busca Existem duas escalas que podem ser vistas na imagem acima, a primeira indica se o item atende as necessidades dos usuários e a segunda é sobre rating da qualidade deste item.

Uma variável bastante importante sobre a necessidade do usuário é o Mobile First, ou seja se a página atende a necessidade e modelo de interação para usuários que navegam através de dispositivos móveis. Também são analisadas o dobro de palavras-chave em mobile, além disso, também existe a preocupação com a localização.

A Necessidade encontra o Rating Existem algumas escalas para entender se o item (resultado de site, notícia, imagem, mapa e etc.) atende ou não a necessidade do usuário. Na busca pela palavra-chave “lojas colombo” executada no estado do Rio Grande do Sul, o rating trabalha da seguinte maneira: - Combina perfeitamente: Lojas Colombo - Combina bastante: Colombo - Combina: Camisa Colombo - Combina pouco: Cidade de Colombo - Não combina: Raimundo Colombo Mais exemplos sobre este ponto podem ser encontrados no guideline mencionado anteriormente.

Qualidade da Página Existem três conceitos que descrevem o significado de “Qualidade de Página”: Expertise, Autoridade e Credibilidade (na Cadastra, chamamos este item de Reputação). São três perguntas simples, mas que valem ser feitas: o autor deste conteúdo é um especialista no tema? O site ou página são uma autoridade sobre o tema? Você confia neste conteúdo?

Páginas de baixa qualidade são o oposto do item anterior: a qualidade do conteúdo é baixa? O conteúdo é insatisfatório? O autor não passa confiança ou não é uma autoridade sobre o assunto? Existem muitos anúncios na página ou algo que possa gerar uma distração?

Ufa, finalmente chegamos ao final do post e espero não ter assustado ninguém ou soar mandatário em nada. O conteúdo pode parecer uma teoria sobre Game of Thrones, mas a ideia foi abrir a discussão sobre o entendimento da ferramenta de busca sobre o significado de uma determinada query (palavra-chave) e também da necessidade do usuário quando este executa a busca.

Comentem, discutam, compartilhem e vamos evoluir juntos nesse material!

Legendas* - Meta-dados: também conhecidos como “dados sobre os dados”, são um detalhamento sobre aquela informação em específico. - Shards: são os grupos de servidores onde as mais de 30 trilhões de páginas ficam armazenadas, compondo o índice de busca.

Key Features

  • Arquitetura técnica do Google Search explicada de forma didática
  • Fluxo completo do processamento de uma palavra-chave
  • Avaliação por score, sinais e métricas
  • Função dos engenheiros de ranking
  • Testes com usuários e human raters
  • Conceitos de qualidade de conteúdo: E-A-T

Tags

Google SearchRanking SignalsKnowledge GraphLive ExperimentsSearch Quality RatersMobile-First Indexing

Project Gallery

Tempo de Vida da Palavra-chave

About

Timeline

Publicado em 2017

More

© 2025 Victor Rossini Magalhães. All rights reserved.

0%