Documentos internos do Google (vazados) revelam “verdades ocultas”…

… sobre o funcionamento do seu algoritmo de pesquisa! Como muitos já sabem, o Google há tempos deixou de lado o lema “don’t be evil” (“não seja mau”) em seu código de conduta corporativo, em vista de uma série de problemas relacionados a contextos e interpretações, além de receber várias críticas (até mesmo processos legais) em relação as ações da empresa, as quais nem sempre estão alinhadas ao seu antigo lema. No entanto, ela não o abandonou completamente, já que ainda são feitas referências em cartas, manifestos e outras documentações…

“Back in March, an automated bot called yoshi-code-bot posted a number of documents from Google’s internal Content API Warehouse. Those documents were then shared with Rand Fishkin, the co-founder of SparkToro, who has now put together a rather detailed article about the nearly 2,500 pages that describe how Google Search ranks pages and websites on the internet. You might be wondering why this is a big deal and why you should care. These files show us what matters to Google when ranking websites and web pages…”
— by Android Headlines.

O serviço de buscas da empresa é o principal alvo de críticas e reclamações, em vista de privilegiarem determinados sites em detrimentos de outros (inclusive, dos seus próprios serviços), além de promover critérios “parciais” em rankings, para favorecer parceiros comerciais. Por se tratar de um serviço que é utilizado por +90% dos usuários, o Google também já enfrentou algumas ações antitruste por abusos de monopólio. Obviamente, o Google nega todas as acusações e até então, muitas delas eram consideradas como infundadas e/ou não apresentavam provas contundentes em relação ao mecanismo de buscas e algoritmos por trás dele.

Em março, um bot automatizado postou uma série de documentos do “Content API Warehouse” interno do Google, que por sua vez traz detalhes de como é feita a indexação de sites e páginas WEB, através do mecanismo de busca da empresa. Compostos por quase 2.500 páginas, os documentos vazados se tornaram as bases para a publicação de um artigo elaborado por Rand Fishkin (cofundador da SparkToro), o qual traz uma análise minuciosa destas informações. Com base nele, a conclusão de Fishkin é simples e óbvia: o Google mente há anos, sobre como é feita a indexação dos sites reportados pela sua ferramenta de busca!

O navegador WEB Google Chrome (o qual possui uma cota em torno de 65% do mercado) também está envolvido nesta discussão. Embora a empresa afirme que não utiliza os dados gerados por ele, na prática o uso deste software influencia diretamente nos resultados de busca da ferramenta, pois também foi mencionado nas documentações (nas seções sobre como os sites aparecem na pesquisa). Até o momento, a empresa não se manifestou sobre estes vazamentos e segundo o autor da notícia, ele acredita que “Google fará tudo ao seu alcance para retirá-los”, além de “não ficar surpreso se este artigo for removido nos próximos dias”.

Resumindo: teremos que se virar mesmo com o DuckDuckGo… &;-D