The Deep web, het onzichtbare internet
Deep web, deep net, onzichtbare net allemaal namen voor het deel van internet wat niet gevonden wordt door reguliere zoekmachines. Het klinkt misschien wat duister en illegaal maar dat valt reuze mee, voor het grootste deel althans.The Deep web
Het internet kan je ruwweg in 2 lagen indelen, de oppervlakte, en de diepte. Aan het oppervlak vinden we alle sites die we kennen, de direct toegankelijke informatie, meestal in de vorm van HTM pagina’s en afbeeldingen. De oppervlakte is het deel wat te doorzoeken valt met de reguliere zoekmachines zoals Google en Yahoo en bestaat uit vele miljarden pagina’s.Hoewel het reguliere deel van internet al groot genoeg lijkt, is het in werkelijke internet nog veel groter, vele malen groter zelfs, alleen is dit deel van internet wat moeilijker te doorzoeken en daardoor minder bekend. Dit minder zichtbare deel (men schat +/-99%) noemt men het meestal 'The deep web' Het diepe web bestaat uit verschillende soorten pagina’s, die al dan niet bewust onzichtbaar blijven.
Waar het diepe web voornamelijk uit bestaat:
Het diepe web doorzoeken
Zoeken in het diepe web is nog steeds niet makkelijk. Neem als voorbeeld de databases, elke database heeft wel een zoekfunctie, maar er bestaat nog geen zoekmachine die op iedere afzonderlijke database nieuwe zoekopdracht uitgevoerd, en vervolgens alle resultaten gebundeld en overzichtelijk aflevert. Er zijn wel een paar projecten in ontwikkeling die het proberen, maar die beperken zich meestal maar tot een beperkt aantal gespecificeerde databases.Enkele van deze projecten:
De toekomst van het Deepweb
Het toekomstbeeld voor het deepweb is niet echt duidelijk te voorspellen. Aan de ene kant neemt de omvang ervan toe door de enorme populariteit van de zogenaamde social media. Aan de andere kant winnen zoekmachines steeds meer terrein en worden de gebruikte zoektechnieken steeds geavanceerder. Voorbeeld hiervan is het sitemap protocol. Dit door Google ontwikkelde Google bied dit protocol webmasters de mogelijkheid een sitemap te uploaden naar de zoekmachine. Deze sitemap is in feite gewoon een plattegrond van de gehele website en zorgt ervoor dat de site volledig geïndexeerd wordt door de zoekmachines. Zonder dit protocol gebeurde het vaak dat een deel van de content niet kon worden opgenomen in de zoek-indexen omdat deze niet via de menustructuur toegankelijk waren, of bijv. geprogrammeerd in Ajax of Flash of een andere taal waar de zoekrobots niet mee overweg konden. Verder werken de beheerders van grote databases (Bijv. Universiteiten) steeds vaker samen met zoekmachines zodat de inhoud hiervan ook beschikbaar wordt voor het grote publiekHet deepweb zal echter nooit helemaal verdwijnen, het zal ongetwijfeld technisch mogelijk worden dat alles gevonden wordt, maar er zal altijd content zijn waarvan men wil dat het niet gevonden wordt, je mailbox bijvoorbeeld.