Over Nannini’s boekenmolen

Deze tekst is voor het webinar al klaar gezet in mijn kunstmatig intelligente website. Dat bleek een terechte keuze.

Er is wat ophef in het boekenwereldje ontstaan rond de acties van NBD Biblion, de organisatie die opgericht is door de bibliotheken en die als kerntaak heeft die bibliotheken te voorzien van ‘plankrijpe’ gekafte boeken en de bijbehorende aankoopinformatie. Vanmiddag was er een uitleg webinar waarin ex-recensenten, uitgevers en anderen uitleg kregen over de oplossing die NBD Biblion bedacht heeft om de doorlooptijd voor het leveren van aankoopinformatie (AI, niet te verwarren met ook als AI afgekorte Artificiële Intelligentie) te bekorten. Er volgde aan het begin een excuus naar de afgedankte recensenten en aan het eind een schop naar de overtollige redacteuren. Over dat verder weinig informatieve webinar van vanmiddag, waar wij domme mensen even uitgelegd kregen wat niet uit te leggen viel omdat de AI-output bagger is, kan ik hier maar beter zwijgen. Op de opmerking na dat de bezuiniging dus inderdaad een bezuiniging is, in tegenstelling tot eerdere berichten. Mijn mening daarover zou als een aanval opgevat kunnen worden. Ik ga het ook maar niet hebben over de onterechte verwarring van (meta)data met informatie, iets dat iedere informatiekundige bij het eerste college ingeprent krijgt maar dat nog niet tot de burelen van NBD Biblion blijkt te zijn doorgedrongen.

Bij Frits Spits in de Taalstraat kwam het er niet van om Fritsafschuw over Nanninis boeken-lees-en-recenseer machine weg te nemen. Mevrouw is, zoals ze zelf zegt, geen data-expert. Ook geen literair expert, maar goed. Dus zal ik in Jip en Janneketaal – sorry dat ik je hier in meesleep Annie – uitleggen hoe die machine werkt. Daar gaat ie.

Men neme een boek en digitaliseert dat of men neme het al digitaal aangeleverde bestand van dat boek. Die digitale zak met bits en bytes voer je aan een programma, ook wel bekend als Nannini’s boekenmolen. Deze pseudo-intelligente maalmachine gaat dan aan de hand van het in JSON geprogrammeerde algoritme een vrij willekeurige selectie van frasen uit het boek samenvatten. Dat kan door aspecten als grammaticale regels, woordenschat en data als woordfrequentie en woordspreiding en nog zo wat parameters. Uit die eerste maling volgen kleine samenvattingen van die geselecteerde tekstblokken. Op dat punt kan het dan twee kanten op. In de gunstige variant laat je mensen (‘annotatoren’ in Nanninitaal) die samenvattinkjes annoteren. Zeg maar dat er een soort labeltjes aan komen te hangen. In het ongunstige geval doe je dat niet. Hoe dan ook, die samenvattinkjes gaan weer opnieuw door de Nannini boekenmolen, die vervolgens, hondstrouw als ie is, daar weer een samenvatting van knutselt. En deze kleine cyclus kan je dan nog een paar keer herhalen. Voor wie hier meer over wil lezen of deze uitleg niet begrijpt of wil begrijpen, dit schrijft het bedrijf OpenAI er bijvoorbeeld over: https://openai.com/blog/summarizing-books/.

Dus in het kort: je grabbelt tekstblokken uit een boek, vat die samen en vat die samenvattingen op hun beurt opnieuw samen en herhaalt dat desnoods nog een keer. Het resultaat laat je langs een mens gaan die dat resultaat bekijkt en wanneer die een klotedag heeft het zonder nadenken doorzet voor publicatie. Aangevuld met wat boektechnische metadata. En – ook daar wringt het – voorzien van de inmiddels beruchte Nannini boekenschuifjes. Die boekenschuifjes, met aansprekende onderwerpen als seks, geweld, activiteit en concentratie, worden gevoed door tijdens het maalproces gescoorde woordjes en zinnetjes. Die scoring (ook metadata) die dus onder de schuifjes zit is overigens, na alle commotie van vorige week en de geflunkte (en door alle auteurs van die werken afgewezen) voorbeelden van NBD Biblion, bijgesteld voor wat betreft het bereik naar maar liefst zeven in plaats van de oorspronkelijke vijf niveau’s. Waarmee Giphart’s nieuwe boek waarin over misbruik van een jongen wordt gesproken dus gewoon nog steeds automatisch de ‘conclusie’ aan zich krijgt te hangen dat er veel seks in zit. Sorry Ronald, je zult toch echt in de Veluwse bibliotheken onvindbaar blijven. Het spijt me jongen.

Natuurlijk is het in de details allemaal nog iets ingewikkelder en je kunt armpje worstelen over hoe goed de code is of de parametrisering, maar dit is in grote lijnen dus wel de manier waarop NBD Biblion vanaf heden boeken en literatuur vermaalt tot brokjes ongeïnspireerde data die middels de schuifjes eigenlijk alleen geschikt zijn voor het organiseren van censuur. Zodat de tere kinder- en volwassen zieltjes beschermd kunnen worden tegen seks, geweld, teveel activiteit en teveel inspanning. Je kunt dat kunstmatig intelligent noemen. Je kunt het ook kolder noemen. Want in dit hele boekenvermaalproces van mevrouw Nannini zit niets ingebouwd dat rekening houdt met de premisse van een boek, de bedoelingen van de auteur, eventuele gelaagdheid en persoonsontwikkelingen in het verhaal, noch met geschiedkundige -, astronomische -, geologische – of wat voor wetenschap dan ook. Laat staan maatschappelijke -, culturele – of literaire relevantie. Laat staan de subjectieve maar wel relevante waardering van een mens met verstand van zalen. Het zal dus ook een boek van een willekeurige gek als Thierry Baudet voor waarheid aannemen. Een nep-nieuws filter of een zeef voor alternatieve waarheden is immers niet ingebouwd. Het zou zo’n gedrocht zelfs naar de bibliotheken kunnen brengen zodat we onze scholieren wat gemakkelijker tot mini-Hitlertjes, mini-Poetintjes of volleerde wappies kunnen opvoeden. En vergeet daarbij niet dat als het bruin is, ontiegelijk stinkt en niet te vreten is zal het wel degelijk stront zijn, maar dàt ziet Nannini’s boekenmolen helemaal niet. Die vat het gewoon, met bedenkelijke kwaliteit, samen. Eat that, bibliotheken! Sorry lezers. De beweringen van sommigen van de, voor wat automatisering betreft, ondeskundigen aan tafel dat de software in de toekomst vast wel literatuur en poëzie op waarde kan duiden, verwijs ik naar de wereld van wensdromen. Je kunt net zo gemakkelijk beweren dat de mensheid ooit een keer stopt met oorlogen voeren.

Je kunt de promotie van haar boekenmolen door Nannini op Radio 1 met afschuw aanhoren, zoals Frits Spits dat deed. Je net als hem afvragen waarom in hemelsnaam boeken door een computer gelezen zouden moeten worden. Je kunt, omdat je naast lezen ook kunt rekenen, beseffen dat het ontslaan van wat redacteuren en 700 recensenten een lekkere besparing op jaarbasis oplevert, ook al zegt mevrouw dat het niet om een bezuiniging gaat. En je kunt beseffen dat een IT-projectje van het eigen Bookarang bedrijfje binnen NBD Biblion na drieënhalf jaar zo langzamerhand eindelijk eens van de grond moet komen, wil het bestuur niet uitermate kribbig worden naar haar directeur en dat initiatief vervolgens als een boomerang terug laten komen. Want ze zijn daar immers BOL.com als klantje al kwijt omdat die gewoon verkoopt zonder kennis van zaken en de klanten niet echt geïnteresseerd bleken te zijn in recensies om tot koop over te gaan. Best slecht voor de ambities van die Bookarang toko. Je kunt ook Bookarang op haar woord geloven als ze dit op de site schrijven: “Waar het aanbod groot is en de keuze overweldigend, maken goede recommendations het verschil.” Niet voor BOL dus, wel voor de bibliotheken en zeker voor mensen die graag een goed boek lezen. Je kunt zelfs vaststellen dat ze daar bij Bookarang dus geen Nederlandse taal beheersen omdat hun woordenschat blijkbaar het woord aanbeveling ontbeert en ze als IT-winkeltje automatisch in het Engels vervallen. Je kunt, als je echt somber ingesteld bent, zelfs nog geloven dat bibliotheken niet meer gericht zijn op een kwalitatief goede collectie, hoewel ik dàt gewoon weiger te geloven.

Of je kunt dus net als Frits Spits het allemaal met afschuw aanhoren omdat je van boeken en literatuur houdt. En rillingen krijgen bij de gedachte dat goede boeken in Nannini’s machine vermalen worden tot betekenisloze digitale pulp. Er misselijk van worden omdat je – zeker in deze tijd – tegen digitale boekverbrandingen bent. Je kunt ook tegenwerpen dat als de gemiddelde doorlooptijd van recensieproductie te lang is je toch echt eerst die productieketen van uitgever tot aankoopinformatie moet herinrichten en optimaliseren voordat je overgaat tot automatisering en inhoudelijke en kwalitatieve beperking. Je kunt er zelfs geconditioneerd boos over worden en ik doe dat ook. Geconditioneerd omdat ik ook wel weet dat blazende ondeskundige managers het in deze maatschappij toch winnen van de rede en het verstand. Persoonlijk vind ik Frits Spits een ontzettend lieve en wijze man. Dus je mag één keer raden aan wiens kant ik – ook als informatiedeskundige – in dezen sta en er dus net als zoveel anderen behoorlijk misselijk van ben. Het wachten is nu op de uiteindelijk onontkoombare opvolger van mevrouw Nannini, die met een flinke bezem de stofnesten van de automatisering mag opruimen, Bookarang verkopen, het verlies nemen en een nieuwe dienst bedenken waar echte mensen boeken recenseren en aanbevelen aan de bibliotheken. Om zo die organisatie terug te brengen naar waar die thuishoort: in het om deskundigheid gewaarde domein van boekenliefhebbers. Mocht een slimmerik niet inmiddels een concurrerende dienst opgezet hebben.

Mic stuiter.

Anna A. Ros – auteur en voormalig NBD Biblion recensent

13