Nem tudo na web aparecerá em uma lista de resultados de pesquisa no Google ou Bing; há muitos lugares que seus rastreadores da web não podem acessar.
Para explorar a web invisível, você precisa usar mecanismos de pesquisa especializados. Aqui estão nossos 12 principais serviços para realizar uma pesquisa profunda na Internet.
O que é a Web invisível?
Antes de começarmos, vamos estabelecer a que se refere o termo “web invisível”? Simplesmente, é um termo abrangente para conteúdo online que não aparecerá nos resultados de pesquisa ou diretórios da web.
Não há dados oficiais disponíveis, mas a maioria dos especialistas concorda que a web invisível é várias vezes maior que a web visível. Dado que apenas Google, Amazon, Microsoft e Facebook armazenam mais de 1.200 petabytes entre eles, os números rapidamente se tornam incompreensíveis.
O conteúdo da web invisível pode ser dividido em deep web e dark web.
A Deep Web
A deep web é composta por conteúdo que normalmente precisa de alguma forma de credenciamento para acessar. Por exemplo, bancos de dados de bibliotecas, caixas de entrada de e-mail, registros pessoais (financeiros, acadêmicos, de saúde e jurídicos), unidades de armazenamento em nuvem, intranets de empresas etc.
Se você tiver os detalhes corretos, poderá acessar o conteúdo por meio de um navegador da Web comum.
A Web Sombria
A dark web é uma subseção da deep web. Você precisa usar um navegador da dark web dedicado (como o Tor) para ver o conteúdo. É mais anônimo do que a web comum e, portanto, muitas vezes é o lar de atividades ilegais, como venda de drogas e armas.
Os melhores motores de busca da Web invisíveis
1. Piloto
O Pipl se autodenomina o maior mecanismo de busca de pessoas do mundo. Ao contrário do Google, o Pipl pode interagir com bancos de dados pesquisáveis, diretórios de membros, registros judiciais e outros conteúdos de pesquisa profunda na Internet para oferecer a você um instantâneo detalhado de uma pessoa.
2. A Máquina de Retorno
Os mecanismos de pesquisa regulares fornecem apenas resultados da versão mais recente de um site disponível.
A Wayback Machine é diferente. Possui cópias de mais de 361 bilhões de páginas da web em seus servidores, permitindo que você pesquise conteúdo que não está mais disponível na web visível.
3. A Biblioteca Virtual WWW
A Biblioteca Virtual WWW é o catálogo mais antigo da web. Foi iniciado por Tim Berners-Lee, o criador da World Wide Web, em 1991.
Os voluntários compilam a lista de links manualmente, criando assim um índice de alta qualidade de conteúdo da deep web em dezenas de categorias.
4. DuckDuckGo
O DuckDuckGo é conhecido como um mecanismo de pesquisa privado para a web visível, mas você sabia que a empresa também oferece um site onion que permite explorar a dark web?
Mesmo o mecanismo de pesquisa comum oferece mais conteúdo da deep web do que o Google. Ele reúne resultados de mais de 500 ferramentas de pesquisa independentes para encontrar seus resultados. Se você emparelhar o mecanismo normal do DuckDuckGo com a versão .onion, poderá realizar uma pesquisa na web inteira.
O site da cebola pode ser encontrado em http://3g2upl4pq6kufc4m.onion/.
5. USA.gov
A quantidade de conteúdo do USA.gov é seriamente impressionante. É um portal para todo o material público que você precisa em todas as agências federais e governos estaduais, locais ou tribais.
Você também encontrará informações sobre empregos governamentais, empréstimos, subsídios, impostos e muito mais. A maioria das informações no site não aparecerá no Google.
6. Diretório de Periódicos de Acesso Aberto
O Directory of Open Access Journals é um mecanismo de busca profunda na Internet que fornece acesso a trabalhos acadêmicos. Os papéis estão disponíveis para qualquer pessoa gratuitamente.
O repositório atual tem quase 10.000 periódicos com 2,5 milhões de artigos em todos os assuntos. O Google Acadêmico pode acessar algumas das informações, mas achamos que o DOAJ é uma ferramenta de pesquisa melhor.
7. nãoEvil Dark Web
Se você estiver procurando por um mecanismo de pesquisa na dark web, confira notEvil Dark Web. O site tem um nome de domínio .onion, portanto, não pode ser acessado por meio de um navegador da Web padrão. Para carregá-lo, abra um navegador da dark web como o Tor e cole hss3uro2hsxfogfq.onion na barra de endereços.
Ele tem um banco de dados de mais de 32 milhões de sites da dark web para extrair, o que significa que, se existir, esse mecanismo de pesquisa provavelmente poderá encontrá-lo.
8. Elephind
Elephind visa fornecer um portal único para todos os jornais históricos do mundo. É um recurso fantástico para pesquisadores—especialmente historiadores da família, genealogistas e estudantes.
Muitos dos jornais do site estão exclusivamente na deep web; eles não aparecerão no Google. No momento da redação deste artigo, 3,6 milhões de jornais estão disponíveis.
9. Voz do ônibus espacial
Para qualquer pessoa interessada em humanidades, Voice of the Shuttle é um recurso essencial. O site foi lançado em 1994 e hoje possui uma das coleções mais impressionantes de conteúdo da deep web com curadoria.
São mais de 70 páginas de links comentados cobrindo tudo, desde arquitetura até filosofia.
10. Ahmia
Ahmia é um mecanismo de pesquisa da dark web. Mas há uma reviravolta — é um dos poucos mecanismos de pesquisa da dark web que está disponível na web comum.
Claro, quaisquer links e resultados não poderão ser abertos a menos que você tenha o navegador Tor instalado em seu computador. No entanto, ainda é uma ótima maneira de experimentar o que está disponível na dark web sem se expor aos riscos inerentes ao uso da dark web.
11. WorldCat
Como você sabe quais livros as diferentes bibliotecas locais da sua área têm em estoque? Percorrer o site de cada biblioteca individualmente é demorado e potencialmente propenso a erros.
Em vez disso, confira o WorldCat. Esse mecanismo de pesquisa na Internet profunda possui dois bilhões de itens indexados de bibliotecas de todo o mundo, incluindo muitos links que normalmente só estão disponíveis com uma pesquisa de banco de dados.
12. Projeto Gutenberg
Se você pesquisar e-books obscuros sem direitos autorais no Google, terá que clicar em várias páginas para encontrar um resultado que forneça um link para download.
O Project Gutenberg oferece mais de 58.000 e-books gratuitos para você conferir e baixar.
Saiba mais sobre a Web invisível
Os 12 mecanismos de pesquisa que apresentamos devem fornecer uma base sólida para iniciar sua busca por conteúdo.
Infelizmente, um dos mecanismos de busca profunda mais famosos do passado, o Deeppeep, não existe mais, mas todos os sites do artigo podem ajudar a recriar os recursos perdidos.