Entendendo o mecanismo de pesquisa do Google

Introdução

Em 1995, em um curso de graduação na Universidade de Stanford, Larry Page e Sergey Brin se conheceram. Inicialmente, tiveram uma série de discuções por terem pontos de vista diferentes, porém logo encontraram um detalhe em comum: obtenção de relevância sobre grande quantidade de dados, a busca. Com essa união surge a maior empresa de busca conhecida a Google[1].

Relevância de pesquisa

O sistema de pesquisa do google caracteriza-se por um bom algoritmo e uma série de máquinas de baixo custo, formando assim um Sistema Distribuído[2].
Sistema distribuído é um conjunto de computadores que de forma transparente aparecem para o usúario como um único sistema, a nível de hardware ou software.[3]
Figura 1. Sistemas Distribuídos

Embora em constantes evoluções, o princípio que originou o Google, ainda é o alicerce de todo o sistema. Tal princípio consiste em um software desenvolvido por Larry Page e Sergey Brin, denominado PageRank(TM)[2].

PageRank(TM)
é um sistema utilizado para dar notas a páginas da Web. De acordo com os termos digitados na pesquisa, o sistema ordena as principais páginas da sua solicitação de acordo com a votação que cada página obtém. Vale lembrar que os votos dados a determinada página Web por páginas consideradas com maior peso têm uma relevância maior e, de nada vale se a página de maior peso existente não tiver nada relacionado aos termos buscados[2].

Características da pesquisa

Atualmente, o Google contém mais de 1 bilhão de páginas indexadas, tornando a mais completa forma de pesquisa da Web. Ao contrário dos demais mecanismos de pesquisa existentes, o algoritmo do Google apresenta somente as páginas que apresentam os termos pesquisados[2].
Figura 2. Pesquisa Google

O Google traz também em sua relevância a localização dos termos procurados, quando mais próximos eles se encontrarem melhor será sua ordem de aparição. Feita a pesquisa, é apresentado ao usuário uma síntese das páginas onde estão presentes os termos pesquisados[2].

Outro detalhe que o torna ainda mais atraente é o fato de existerem um armazenamento em cache da páginas indexadas, muito importante para caso de falhas nos servidores que hospedam as páginas dos arquivos pesquisados. O único problema deste cenário é que haverá casos em que o cache estará desatualizado em relação a origem[2].

O Google confia tanto em seu algoritmo que acrescentou em sua página de pesquisa um botão Estou com Sorte, que traz a primeira página encontrada para a pesquisa solicitada[2].

Pesquisando no Google

A forma mais simples de pesquisa no Google, praticada na maioria das buscas, baseia-se em informar o termo a ser pesquisado e pressionar ENTER ou o botão Pesquisa Google. A principal característica deste tipo de pesquisa e o fato de serem descartados palavras que em nada acrescentam ao resultado esperado. Para informar tais termos em sua pesquisa, torna-se necessário, acrescentar o caracter '+' com um espaço antes dos termos. Feito isto, as palavras em sua pesquisa são concatenadas[4].
Dica: o Google não trabalha com caracteres coringas e nem é case sensitive, ou seja, não faz distinção entre maiúculas e minúsculas[4].
O Google disponibiliza uma série de formas de pesquisas, ferramentas e serviços. Para maiores informações sobre como realizar pesquisas e utilizar outros serviços, acesse: http://www.google.com.br/intl/pt-BR/options/.

Referências

[1] UNDERGOOGLE, História da Google. Disponível em: <http://www.undergoogle.com/blog/2006/geral/histria-da-google.html>. Acesso em 07 dez. 2008.

[2] GOOGLE. Disponível em: <http://www.google.com.br/why_use.html>. Acesso em 07 dez. 2008.

[3] FATEC-SP, Sistemas Distribuídos. Disponível em: <http://www1.fatecsp.br/aguiar/sistemasdistribuidos.htm>. Acesso em 07 dez. 2008.

[4] GOOGLE. Disponível em: <http://www.google.com.br/intl/pt-BR/help/basics.html>. Acesso em 07 dez. 2008.

José Mauro da Silva Sandy


Leia Também

5 comentários:

  Lopes

8 de dezembro de 2008 às 00:15

Salve, Simpatia!
Você sabe que sou chato, né?! O Google hoje é muito mais que pesquisas. Entendendo o funcionamento do Google como título, parece que você vai explicar como funciona a empresa. Acho que um título mais adequado seria Entendendo o funcionamento do mecanismo de pesquisa do Google... ;)

Sobre o sinal de +, eu o utilizei por muito tempo, mas não lembro onde eu li que ele tem função igual à do espaço em branco. Assim, ele seria descartável...

Outra coisa interessante é que o Google tem uma API aberta, possibilitando que pessoas com o conhecimento adequado criem aplicações com base no serviço da empresa de Mountain View. Um que acho interessante e uso no meu blog é o que exibe o PageRank. :)

[]!

PS: versão Própria com PageRank 4! :D

  José Mauro

8 de dezembro de 2008 às 09:57

Quanto ao título vc tem razão ele está com uma abrangência maior que ele se propoe a explicar, irei corrigi-lo.

Agora quanto ao '+' se vc der uma olhada nas referências abaixo vc verá que não é da maneira que vc pensa.

Abraço brow.

  Lopes

8 de dezembro de 2008 às 13:41

Sim, sim, sim, sa-la-bim!
Então o + tem relevância! :D
Mas pelo que entendi, ele serve apenas para incluir palavras que seriam descartadas, não?
[]!

  José Mauro

8 de dezembro de 2008 às 15:23

Exatamente isto, ele inclui o que por padrão não seria primeiramente relevante para pesquisa.

Dica: faça uma postagem sobre as diversas funcionalidades que o google tem, como define, link, dentre outras.

abraço

  Unknown

24 de janeiro de 2009 às 12:11

Este comentário foi removido pelo autor.