Em 1995, em um curso de graduação na Universidade de Stanford, Larry Page e Sergey Brin se conheceram. Inicialmente, tiveram uma série de discuções por terem pontos de vista diferentes, porém logo encontraram um detalhe em comum: obtenção de relevância sobre grande quantidade de dados, a busca. Com essa união surge a maior empresa de busca conhecida a Google[1].
Relevância de pesquisa
O sistema de pesquisa do google caracteriza-se por um bom algoritmo e uma série de máquinas de baixo custo, formando assim um Sistema Distribuído[2].
Sistema distribuído é um conjunto de computadores que de forma transparente aparecem para o usúario como um único sistema, a nível de hardware ou software.[3]
Embora em constantes evoluções, o princípio que originou o Google, ainda é o alicerce de todo o sistema. Tal princípio consiste em um software desenvolvido por Larry Page e Sergey Brin, denominado PageRank(TM)[2].
PageRank(TM) é um sistema utilizado para dar notas a páginas da Web. De acordo com os termos digitados na pesquisa, o sistema ordena as principais páginas da sua solicitação de acordo com a votação que cada página obtém. Vale lembrar que os votos dados a determinada página Web por páginas consideradas com maior peso têm uma relevância maior e, de nada vale se a página de maior peso existente não tiver nada relacionado aos termos buscados[2].
Características da pesquisa
Atualmente, o Google contém mais de 1 bilhão de páginas indexadas, tornando a mais completa forma de pesquisa da Web. Ao contrário dos demais mecanismos de pesquisa existentes, o algoritmo do Google apresenta somente as páginas que apresentam os termos pesquisados[2].
O Google traz também em sua relevância a localização dos termos procurados, quando mais próximos eles se encontrarem melhor será sua ordem de aparição. Feita a pesquisa, é apresentado ao usuário uma síntese das páginas onde estão presentes os termos pesquisados[2].
Outro detalhe que o torna ainda mais atraente é o fato de existerem um armazenamento em cache da páginas indexadas, muito importante para caso de falhas nos servidores que hospedam as páginas dos arquivos pesquisados. O único problema deste cenário é que haverá casos em que o cache estará desatualizado em relação a origem[2].
O Google confia tanto em seu algoritmo que acrescentou em sua página de pesquisa um botão Estou com Sorte, que traz a primeira página encontrada para a pesquisa solicitada[2].
Pesquisando no Google
A forma mais simples de pesquisa no Google, praticada na maioria das buscas, baseia-se em informar o termo a ser pesquisado e pressionar ENTER ou o botão Pesquisa Google. A principal característica deste tipo de pesquisa e o fato de serem descartados palavras que em nada acrescentam ao resultado esperado. Para informar tais termos em sua pesquisa, torna-se necessário, acrescentar o caracter '+' com um espaço antes dos termos. Feito isto, as palavras em sua pesquisa são concatenadas[4].
Dica: o Google não trabalha com caracteres coringas e nem é case sensitive, ou seja, não faz distinção entre maiúculas e minúsculas[4].
Referências
[1] UNDERGOOGLE, História da Google. Disponível em: <http://www.undergoogle.com/blog/2006/geral/histria-da-google.html>. Acesso em 07 dez. 2008.
[2] GOOGLE. Disponível em: <http://www.google.com.br/why_use.html>. Acesso em 07 dez. 2008.
[3] FATEC-SP, Sistemas Distribuídos. Disponível em: <http://www1.fatecsp.br/aguiar/sistemasdistribuidos.htm>. Acesso em 07 dez. 2008.
[4] GOOGLE. Disponível em: <http://www.google.com.br/intl/pt-BR/help/basics.html>. Acesso em 07 dez. 2008.
José Mauro da Silva Sandy
Leia Também
- Limites Inferiores e NP-Completude - Análise de algoritmo NP e limites
- Fábrica de Software - Detalhes sobre a criação correta de um software
5 comentários:
8 de dezembro de 2008 às 00:15
Salve, Simpatia!
Você sabe que sou chato, né?! O Google hoje é muito mais que pesquisas. Entendendo o funcionamento do Google como título, parece que você vai explicar como funciona a empresa. Acho que um título mais adequado seria Entendendo o funcionamento do mecanismo de pesquisa do Google... ;)
Sobre o sinal de +, eu o utilizei por muito tempo, mas não lembro onde eu li que ele tem função igual à do espaço em branco. Assim, ele seria descartável...
Outra coisa interessante é que o Google tem uma API aberta, possibilitando que pessoas com o conhecimento adequado criem aplicações com base no serviço da empresa de Mountain View. Um que acho interessante e uso no meu blog é o que exibe o PageRank. :)
[]!
PS: versão Própria com PageRank 4! :D
8 de dezembro de 2008 às 09:57
Quanto ao título vc tem razão ele está com uma abrangência maior que ele se propoe a explicar, irei corrigi-lo.
Agora quanto ao '+' se vc der uma olhada nas referências abaixo vc verá que não é da maneira que vc pensa.
Abraço brow.
8 de dezembro de 2008 às 13:41
Sim, sim, sim, sa-la-bim!
Então o + tem relevância! :D
Mas pelo que entendi, ele serve apenas para incluir palavras que seriam descartadas, não?
[]!
8 de dezembro de 2008 às 15:23
Exatamente isto, ele inclui o que por padrão não seria primeiramente relevante para pesquisa.
Dica: faça uma postagem sobre as diversas funcionalidades que o google tem, como define, link, dentre outras.
abraço
24 de janeiro de 2009 às 12:11
Postar um comentário