Distant reading: 'lezen' met een computer
Distant reading is een term die wordt gebruikt voor een manier van 'lezen' die tegenwoordig veel wordt gebruikt. Namelijk lezen van een afstand met gebruik van de computer, zonder een tekst woord voor woord bijlangs te gaan. Deze manier van lezen maakt het mogelijk meer tekst tegelijkertijd te verwerken, specifiek op een bepaald onderwerp te zoeken en ook relaties in kaart te brengen tussen verschillende onderwerpen in een of meerdere teksten. Distant reading-tools worden gebruikt door onderzoekers in o.a. taal- en geesteswetenschappen.
Distant reading
Distant reading (letterlijk vertaald: afstandslezen) is het lezen van een tekst op afstand met behulp van computerprogramma's. Het is het tegenovergestelde van
close reading: het traditioneel lezen van een boek, door woord voor woord te lezen en zo een tekst te begrijpen.
Distant reading kan op verschillende manieren worden gedaan, het ligt er maar net aan waar de lezer naar op zoek is. Er bestaan programma's die een boek 'lezen' en zo woorden die met elkaar in verband staan weergeven in netwerken. Of bijvoorbeeld programma's die aan de hand van de woorden bepalen welk genre een boek heeft. Het gaat vaak over het lezen van grote hoeveelheden tekst waar een mens eigenlijk geen tijd voor zou hebben. Maar soms doen wij dit lezen van een afstand ook al in kleine vorm.
Voorbeeld: hoe wij zelf doen aan distant reading
Ook wij doen aan
distant reading in kleine mate. Wat we vaak doen, wanneer we internet gebruiken en we op zoek zijn naar bepaalde informatie, lezen we niet een hele lange tekst maar zoeken binnen die tekst naar relevante woorden met behulp van de CTRL+F sneltoetsen. Zo krijgen we in één keer te zien waar de relevante informatie te vinden is in de tekst, en hoeven we daarvoor niet de gehele tekst te lezen.
Het ontstaan van computerlezen
Hugo Brandt Corstius was in de jaren 60 en 70 de pionier van de 'computertaalkunde', en al in de jaren 80 was 'computationele taalkunde' bij de meeste universiteiten een bekend begrip. In deze beginjaren werd geprobeerd de computer te leren taal te spreken en begrijpen. Er waren onderzoekers mee bezig die een technische achtergrond hadden, vaak in combinatie met een taalkundige opleiding. Maar in deze tijd was er lang niet zoveel tekst digitaal beschikbaar.
Tegenwoordig is er veel tekst digitaal beschikbaar, zowel tekst geschreven voor het internet als gedigitaliseerde bestanden. Denk aan het project
Google Books, waarmee in 2016 zo ongeveer 10% van de beschikbare boeken is gedigitaliseerd. Het lezen van alle digitale boeken en teksten door een mens is onmogelijk, en zou daarmee alleen kunnen worden 'gelezen' door een computer. De programma's gebruikt voor computerlezen zijn daarom steeds belangrijker geworden. Een term voor het gebruik van computers in geesteswetenschappen tegenwoordig is
e-Humanities.
Meningen over distant reading
Franco Moretti is een literatuurwetenschapper die
distant reading promoot. Hij stelt dat het voor hem als literatuurwetenschappers onmogelijk is om wereldliteratuur te bestuderen, omdat alle wereldliteratuur nooit door één persoon kan worden gelezen. Hij constateert dat zijn kennis is gebaseerd op maar een klein deel van alle literatuur die bestaat. Daarom raadt hij literatuurwetenschappers aan geen boeken meer 'van dichtbij' te lezen, maar te doen aan
distant reading. Moretti heeft het programma
The Lab ontwikkeld, waarmee hij genres van boeken kan detecteren en netwerken kan maken van kenmerken van dat bepaalde genre.
Sommige onderzoekers in de geesteswetenschappen zoals Moretti denken dat de digitale technologie voor een wetenschappelijke revolutie zal zorgen. Anderen zien de computer enkel als een handig hulpmiddel. Weer anderen zijn fel tegen de nieuwe ontwikkelingen en protesteren tegen het gebruik van computers voor bijvoorbeeld lezen. Ze stellen dat literatuur niet als 'data' moet worden gezien, en dat een computer een tekst niet zo kan begrijpen als een mens dat doet. Ze zien de komst van
e-Humanities als een grote bedreiging.
Zelf eens een distant reading-tool uitproberen? Het kan op de website voyant-tools.org.