NFI ontwikkelt dataset om internationaal AI-modellen te trainen op herkennen verborgen berichten criminelen: een vooruitblik op IAFS 2023 - deel 2
De nieuwste snufjes en trends in de forensische opsporing uitwisselen en ervaringen en kennis delen. Dat is waarvoor forensisch onderzoekers van over de hele wereld bijeenkomen op de driejaarlijkse bijeenkomt van de Internationale Association of Forensic Science (IAFS) in Sydney. De bijeenkomst vindt plaats van 20 tot en met 24 november. Ook forensisch onderzoekers van het Nederlands Forensisch Instituut (NFI) reizen naar Australië om over hun werk te vertellen en om er nieuwe kennis op te doen. Eén van hen is promovenda Meike Kombrink. Zij deelt op de IAFS een door het NFI ontwikkelde database met foto’s waarin in sommige foto’s verborgen berichten zijn verstopt. De database kan straks wereldwijd worden gebruikt om AI-modellen te trainen om verborgen berichten van criminelen te herkennen in ogenschijnlijk onschuldige afbeeldingen.
Het verbergen van boodschappen in foto’s, video’s, audio of tekst heet ‘steganografie’. "Een geheim bewaren in het volle zicht, dat is de essentie van steganografie”, zegt Meike Kombrink. Steganografie werd al gebruikt in de oudheid. Toen schoren ze slaven kaal, tatoeëerden boodschappen op hun hoofd en daarna lieten ze het haar weer aangroeien. Zo konden ze vijandig gebied veilig oversteken. Uit een wetenschappelijke publicatie blijkt dat Al-Qaida steganografie heeft gebruikt om de aanslag van 9/11 te plannen. Ook in Nederland zijn enkele voorbeelden van strafzaken waarin stego gebruikt werd. Zo kwam het voor in een afpersingszaak uit 2003. Een verdachte gebruikte stego om bankgegevens in een afbeelding te verstoppen.
Elkaar internationaal helpen
Internationale wetenschappers waarschuwen dat steganografie steeds populairder wordt sinds de opsporingsinstanties hebben laten zien dat ze steeds vaker cryptotelefoons kunnen openbreken. Kombrink houdt daarom samen met een internationale collega van het Duitse Bundeskriminalambt een workshop over steganografie op de IAFS. “Digitale steganografie is een relatief nieuw fenomeen. Het is goed om internationaal te delen waar we mee bezig zijn, zodat we van elkaar kunnen leren en elkaar kunnen helpen.”
Database
Verborgen berichten in foto’s en video’s zijn tegenwoordig met het blote oog amper meer te herkennen. Dat is waarom Kombrink bezig is met het ontwikkelen van slimme AI-modellen, om de verborgen berichten in foto’s of video’s te herkennen en ontsleutelen. Om die AI-modellen te trainen, heeft ze een betrouwbare en goede dataset nodig met foto’s waarin steganografie is gebruikt. Die heeft het NFI nu ontwikkeld. “Het gaat om een gigantische database van 2,3 terrabyte.” Ze ontwierp de database met Stijn van Lierop, die bezig is met een master AI aan de Radboud Universiteit en een master Forensic Science aan de Universiteit van Amsterdam, en met Dionne Stolwijk van de Hogeschool van Amsterdam. “Het was een enorme klus. Het is zonde om de database voor onszelf te houden. Ook internationale forensische collega’s kunnen er hun voordeel mee doen”, vertelt Van Lierop.
Knoeien met pixels
Hoe werkt steganografie ook al weer? Een object waarin een boodschap verborgen zit, heet een cover. Er zijn verschillende methoden om boodschappen te verbergen. Een makkelijk uit te leggen voorbeeld van een toegepaste methode is het aanpassen van de binaire waardes van de kleuren in afbeeldingen. Je past dan de kleurintensiteit van een pixel in de foto aan. “Je voegt als het ware een klein druppeltje rood toe aan de code van de kleur. Dat zie je niet wanneer je naar de foto kijkt. Je kan het soms herkennen wanneer je naar de binaire waardes kijkt. De aangepaste waarden kunnen weer een verborgen tekst weergeven”, zegt Kombrink. Van Lierop maakte onderstaand voorbeeld, waarin hij het woord kat in een afbeelding van zijn hond Bickel verstopt heeft.
Handige tools
Zelf knoeien met pixels is vrij ingewikkeld, maar er zijn tegenwoordig - bijvoorbeeld in de appstore - meerdere gebruiksvriendelijke tools om boodschappen in foto’s te verbergen. Zoals ‘Steganography studio’ of ‘Quickstego’ of ‘Stegosuite’. “Deze tools zijn al tienduizenden keren gedownload, dus ze worden gebruikt”, zegt Van Lierop. Kombrink liep ertegenaan dat bij het trainen van de AI-modellen zij gebruik kon maken van twee achterhaalde forensische databases met foto’s waarin stego verstopt zat. Sommige databases waren zelfs nog met zwart-wit foto’s en het ging om relatief kleine bestanden. Niet te vergelijken met de foto’s die onze telefoons nu maken. “In die databases waren ook nog eens ingewikkelde wetenschappelijke stego-methodes gebruikt. Mijn aanname is dat criminelen die niet gebruiken, die gebruiken eerder apps die wel gebruiksvriendelijk zijn.”
Database
In de nieuwe database zitten afbeeldingen met stego volgens wetenschappelijke methodes, maar ook een mix van stego methodes uit de gebruiksvriendelijke apps. De database bevat meer dan 100.000 foto’s. Die zijn allemaal met de hand gemaakt, zegt Van Lierop: “We konden geen foto’s van internet halen, want dan weet je niet of er steganografie is gebruikt. Soms zit er een watermerk in dat niet zichtbaar is.” Er mochten geen merken gefotografeerd worden, geen gezichten en geen kentekens. De foto’s moesten met meerdere camera’s zijn gemaakt. Het was, kortom, een hele klus. Van Lierop gebruikte vervolgens vele tientallen stego tools om boodschappen te verstoppen in een deel van de foto’s. Ze gebruikte moeilijke en eenvoudige foto’s, verstopte heel veel tekst en soms ook juist weinig. Van Lierop: “We wilden een gelijke verdeling van alle varianten. Die hebben we door een computer laten generen want met de hand is dat niet te doen.”
Benchmark
Kombrink hoopt dat de internationale collega’s ook gebruik gaan maken van de databank met foto’s. Het is nog wel een klus om de gigantische databank van 2,3 terrabyte voor de forensische collega’s beschikbaar te maken. “We hopen dat deze databank de internationale benchmark wordt waarmee je bestaande modellen met elkaar kunt vergelijken. Het is belangrijk om dat steeds met dezelfde databank te testen, anders ga je appels met peren vergelijken.” Ze hoopt dus dat haar presentatie op de IAFS goed ontvangen wordt.
Europees project
Het NFI neemt deel aan het Europese project UNCOVER waarin opsporingsdiensten met universiteiten en bedrijven tools ontwikkelen om verborgen berichten in video’s en afbeeldingen te ontdekken en uit te lezen. Het promotieproject van Kombrink is onderdeel van ICAI AI4forensics lab in oprichting met de Universiteit van Amsterdam en het NFI onder supervisie van prof. Marcel Worring en prof. Zeno Geradts.