blog

Motores de Busca

28/07/2016 Paula Cavalieri
Motores de Busca

O que são motores de busca?

Os motores de busca são indispensáveis na internet. O site mais conhecido da internet é, provavelmente, um motor de busca: o Google. Mas como é que funciona? 

Existem (geralmente) várias etapas:

Coleta
Armazenamento
Extração
Indexação
Classificação
Pesquisa em si

A coleta

Todos os motores de busca tem softwares que percorrem, de forma contínua, todos os sites do planeta. 

Estes softwares se comportam como um simples usuário: eles baixam páginas HTML e seguem os links de hipertextos que elas contem (como quando você clica em um link em uma página). 

Chamamos esses softwares de "robôs". 

O Google, o MSN e outros motores de busca tem, cada um, os seus robôs. 
(Na prática, eles são simples computadores conectados à Internet e equipados com um software especial). 

O armazenamento

Os robôs recuperam páginas e as armazenam no disco. Em centenas de discos rígidos. 
Em geral, eles também armazenam a data da última visita do site, para visitar a página de novo, após algum tempo. 
 

A extração

Uma vez que a página html foi recuperada, um programa extrai todo o seu conteúdo. 

O que interessa os robôs é:

Todo o texto da página.
As meta-informações (autor da página, palavras-chave, URL da página...)
Os links para outras páginas (links de hipertexto)

E os robôs ignoram o resto:

O layout gráfico (cores, fontes de caracteres, tamanho, localização...) é ignorado.
Geralmente, as imagens, vídeos, sons e música são ignorados.


A indexação

Agora que recuperamos o texto de todas essas páginas, vamos criar meios eficazes para pesquisar.

Seu site deve fazer parte da base de dados do Google para poder ser contemplado em buscas por palavras-chave relevantes. Sem estar nesse catálogo, ele não pode ser exibido como um resultado.

Para tanto, é preciso criar seu site seguindo as diretrizes básicas do Google para uma boa indexação. Se você não tiver conhecimento técnico para fazer as páginas de acordo com essas boas práticas, é possível usar algumas ferramentas de criação de sites que facilitam o processo.

A classificação

Bom, nós indexamos as páginas. 
Agora temos um pequeno problema: tem muita página! 

Por exemplo, a palavra "computador" retorna mais de 5 milhões de páginas para o Google. 
Tal motor de busca seria perfeitamente inútil: O infeliz do usuário ainda teria que percorrer esses 5 milhões de páginas para encontrar o mais relevante. 

Portanto, é indispensável classificar essas páginas por relevância, ou seja, colocar em primeiro lugar as páginas com mais probabilidade de dar a resposta correta para a palavra solicitada. 

Isso não é tarefa fácil! 

Existem vários métodos diferentes. 

Veja dois: 
A classificação semântica

O motor de busca vai tentar adivinhar o campo semântico de uma página classificá-la: 
Se uma página contém a palavra "temperatura", mas também "maçã", "fogão", "massa", é bem provável que a página fale de pastelaria. 
Se uma página contém a palavra "temperatura", mas também "lua", "telescópio", "apogeu", é bem provável que a página fale de astronomia. 

Isto permite classificar as páginas e retornar ao usuário as mais prováveis de serem relevantes. 
Por exemplo, se um usuário procurar por "Temperatura do planeta": 
"Temperatura", por si só, é ambíguo mas "planeta" pertence ao campo semântico da astronomia. O motor de busca retornará, com prioridade, as páginas que estiverem classificadas na categoria "astronomia". 

Porém, se ele procurar apenas "temperatura", o motor de busca não terá como adivinhar o que o usuário realmente quer: ele retornará inúmeras páginas com a palavra temperatura. 

É por isso que, às vezes, você tem a impressão que os motores de busca te retornam muitos resultados sem nenhum interesse. 

Para obter resultados mais precisos, adicione palavras à sua consulta. ("temperatura do bolo", "temperatura do fogão", "temperatura da cozinha", etc ...). 

Quanto mais palavras você adicionar à sua pesquisa, mais a pesquisa será precisa e menos páginas serão retornadas. 
 

A classificação por links

Quanto mais links para uma página, mais esta página deve se referir a um domínio. 
Lógico, não? 
É o que faz (entre outros) o Google para classificar as páginas: 
Quanto mais links para uma página, mais esta página "subirá" nos resultados do Google. 

Os motores de busca se disputam muito mais pela classificação de relevância das páginas do que pelo número páginas indexadas. 
 

A pesquisa

O motor de busca vai te apresentar um formulário (mais ou menos evoluído) que te ajudará a encontrar o que quer. 

Eles tem, como opção, critérios de pesquisa adicionais para ajudá-lo a encontrar, com mais precisão, o que você quer. 

Então, estes critérios de pesquisa são enviados para o motor de busca que vai analisá-lo, a seu pedido, remover os "stop-words", selecionar as páginas que atendam a seus critérios (graças aos índices), classificá-las e, em seguida, apresentar os resultados. 

A forma tradicional de apresentar os resultados é a do Google, mas existem outros. 
O kartoo.com tenta apresentar as páginas relacionadas (mais ou menos próximas) com palavras-chave. 

Alguns motores de busca também tentam detectar os erros de digitação, oferecendo páginas com palavras muito semelhantes, ou sugerindo uma ortografia alternativa para a sua palavra. 
Alguns, como o Kartoo, propõem outras palavras ou termos que estão presentes nas páginas de resultados. 
 

Fonte: http://br.ccm.net/

 

Faça seu orçamento para desenvolvimento de site com a Winsite Agência Web!

Compartilhar nas redes sociais

posts relacionados

© Winsite 2012-2018. Todos os direitos reservados.

Logotipo Winsite Agência Web