“Bewijsuitsluiting
In de nacht van 11 op 12 september 2012 is OVC-apparatuur geplaatst in de Renault Megane met kenteken [kenteken] . Met die apparatuur zijn gesprekken opgenomen die door de inzittenden van de auto zijn gevoerd. Aanvankelijk bleek niet dat mijn cliënt aan die gesprekken had deelgenomen. Op de pro-forma zitting van 10 januari 2013 stelde de toenmalige raadsman van [verdachte] :
De OVC-gesprekken uit de auto duiden er niet op dat verdachte in die auto heeft gezeten.
Op 6 februari 2013 is mijn cliënt vervolgens door de politie gehoord. Zoals in het proces-verbaal van dat verhoor staat te lezen, heeft hij zich toen op zijn zwijgrecht beroepen. Na het verhoor heeft de teamleider aan de verbalisant [verbalisant 1] gevraagd of hij de stem van [verdachte] zou kunnen herkennen. [verbalisant 1] verklaart hierover bij de rechter-commissaris:
Mij is door de teamleider gevraagd of het na het verhoor van [verdachte] mogelijk zou zijn om zijn stem te herkennen, in de OVC gesprekken. Dit is mij na het verhoor gevraagd. Mijn collega [verbalisant 2] en ik hebben het samen gedaan. De bestanden stonden op de computer, die hebben we uitgeluisterd. We zaten naast elkaar. Op dat moment hebben we alleen de OVC’s uitgeluisterd.
(...)
U vraagt of ik kan vertellen hoe de stemherkenning ging.
(...)
We hebben een aantal stukjes beluisterd. Soms was er een gelijktijdige herkenning, soms zei één van ons twee: dit is volgens mij [verdachte] . Dan zei ik of mijn collega: nee, dat is niet zo, of ja, dat klopt. Als we het samen eens waren dat het [verdachte] was, schreven we dat op.
Deze werkwijze heeft uiteindelijk geresulteerd in een proces-verbaal van 7 februari 2013. In dit proces-verbaal wordt geconcludeerd dat de stem van [verdachte] op de OVC is te herkennen in de zaken [1] , [2] , [3] , [4] en [5] . Vijf van de acht zaken dus. En dat terwijl dit proces-verbaal begint met de mededeling:
Door meerdere verbalisanten werden de gesprekken reeds uitgeluisterd en in een proces-verbaal van bevindingen verwerkt. Uit statische en dynamische observatie was reeds gebleken dat de verdachte [verdachte] bijna dagelijks in het voertuig had gezeten. Tot op heden kon zijn stem echter niet met zekerheid worden herkend. Dit kwam vooral door het feit dat hij elke keer in het gezelschap van zijn broer [betrokkene 1] was, waarvan de stem gedeeltelijk overeenkomt.
Oftewel: een heel team is maandenlang bezig met een onderzoek, waarin maandenlang geluisterd wordt naar tapgesprekken en OVC- gesprekken en op geen enkel moment lukt het om de stem van mijn cliënt te herkennen, totdat ontdekt wordt dat dat weleens voor bewijsproblemen zou kunnen gaan zorgen. Dan lukt het opeens wel. In bijna alle gevallen.
De verdediging is van oordeel dat dit proces-verbaal van stemherkenning van 7 februari 2013 niet tot het bewijs kan worden gebezigd. De belangrijkste reden daarvoor is dat de zogenaamde herkenningen onvoldoende betrouwbaar zijn. Ook als de verbalisanten te goeder trouw zijn, betekent dat niet dat op hun zogenaamde herkenningen kan worden vertrouwd. En ze hoeven zich maar één keer vergist te hebben en mijn cliënt wordt ten onrechte veroordeeld voor een feit dat hij niet heeft gepleegd. De mogelijkheid dat ze zich een keer hebben vergist is bepaald niet denkbeeldig en die onzekerheid kleeft aan ieder afzonderlijk feit. Bij geen van de tenlastegelegde feiten kan die onzekerheid worden geaccepteerd.
Dat de herkenningen onbetrouwbaar zijn, volgt eigenlijk al uit het feit dat herkenning zo lang – onder precies dezelfde omstandigheden – onmogelijk was. Daar komt echter het volgende bij.
Sprekerherkenning is moeilijk. In een vakbijlage Sprekerherkenning wees het NFI er jaren geleden al op dat spraakonderzoekers beschikken over een uitgebreide kennis van de fonetiek, de dialectologie, de sociolinguïstiek en de algemene taalwetenschap en gebruik maken van methoden, technieken en inzichten die binnen die wetenschapsgebieden zijn ontwikkeld. Er worden auditieve en akoestische technieken gebruikt, waarbij een groot aantal variabelen wordt onderzocht. De conclusie die de spraakonderzoeker uiteindelijk formuleert heeft het karakter van een persoonlijk oordeel, waar geen statistisch oordeel aan worden gegeven.
(…)
In het Batman-onderzoek is eveneens de hulp van het NFI ingeroepen bij de beoordeling van de zogenaamde stemherkenningen. Op 17 mei 2013 heeft het NFI een eerste brief gestuurd aan de rechter-commissaris naar aanleiding van een vooronderzoek aan de OVC-gesprekken (meer in het bijzonder een selectie in de zaak van [betrokkene 2] ). Er is genoeg materiaal voorhanden voor vergelijking, aldus het NFI, maar overigens is een stemvergelijking eigenlijk niet mogelijk. Het NFI stelt in de brief:
Wegens omgevingslawaai (motor van de auto, muziek staat aan en een of meerdere ramen staan open) is het materiaal van matige tot slechte kwaliteit. Dit beperkt de mogelijkheden van een vergelijkend spraakonderzoek.
Een tweede beperking van het onderzoek ligt in het gegeven dat er geen vergelijkingsmateriaal beschikbaar is dat in dezelfde omstandigheden tot stand is gekomen aks het betwiste materiaal.
(...)
Gegeven de hiervoor genoemde beperkingen, is geen sterke conclusie van een vergelijkend spraakonderzoek te verwachten.
De vraag of een verbalisant aan de hand van een bepaalde uiting een hem bekende verdachte kan herkennen, kan ik niet beantwoorden. Op uw verzoek zou ik wel een rapport kunnen schrijven over de betrouwbaarheid van stemherkenning en over de factoren die daarbij een rol spelen. Voor dit moment beperk ik mij tot de opmerking dat herhaaldelijk uit onderzoek is gebleken dat de mate van zekerheid van degene die de herkenning doet, geen betrouwbare maat is voor de juistheid van die herkenning.
Deze tekst laat al weinig aan duidelijkheid te wensen over. En waarom zou die laatste zin zijn toegevoegd? Zou het soms zo zijn dat het NFI herhaaldelijk is geconfronteerd met verbalisanten die met stelligheid beweren dat zij een stem hebben herkend, terwijl dit achteraf ten onrechte blijkt? Het later inderdaad opgemaakte rapport ‘Beantwoording vragen over sprekerherkenning’ van 12 juli 2013 licht een tipje van de sluier op:
In de ervaring van het NFI komen in de aan het NFI aangeboden zaken verkeerde toekenningen of verwisselingen van sprekers in de uitgewerkte tapverslagen wel degelijk voor maar niet op grote schaal.
In dit rapport worden de beweerdelijke herkenningen door meerdere verbalisanten van medeverdachte [betrokkene 2] als gespreksdeelnemer aan de OVC-gesprekken tegen het licht gehouden. Het NFI merkt wederom op dat de door de verbalisanten gestelde zekerheid (100%, wij kunnen ons niet vergissen) niets zegt over de betrouwbaarheid, terwijl leken hun vaardigheid in het herkennen van stemmen systematisch te hoog inschatten. Het belang van de eerder door Broeders noodzakelijk geachte blinde vergelijking blijkt duidelijk uit het rapport. Juist de sturing door contextinformatie kan erg groot zijn. Met betrekking tot de zogenaamde herkenning van [betrokkene 2] merkt het NFI op dat de geluidskwaliteit slecht is, de spreker zich qua stem en taalgebruik niet erg duidelijk onderscheid en dat het NFI niet kan zeggen dat de betwiste uitlating terecht is toegeschreven aan [betrokkene 2] .
Het NFI wijst op een aantal elementen die van belang kunnen zijn bij de beoordeling van de herkenning door meerdere verbalisanten. Onder meer is volgens het rapport (pagina 8) van belang:
1. of de herkenningen onafhankelijk van elkaar tot stand zijn gekomen:
2. of de verbalisanten er van tevoren vanuit gingen dat er een vast aantal (in casu drie) mensen in de auto zat;
3. of de personen in de auto reeds waren geïdentificeerd;
4. of de verbalisanten bekend waren met specifieke kenmerken van de te herkennen stem;
5. of de verbalisanten bekend waren met de specifieke kenmerken van de andere stemmen;
6. of de sprekers op elkaar lijken;
7. of de verbalisanten bekend zijn met de gesproken taalvariant.
Als we dit nu eens afzetten tegen de in casu door [verbalisant 2] en [verbalisant 1] gehanteerde ‘methodiek’.
Ad 1.
De herkenningen zijn niet onafhankelijk van elkaar tot stand gekomen. Zoals eerder aangehaald verklaarde verbalisant [verbalisant 1] :
U vraagt of ik kan vertellen hoe de stemherkenning ging.
We hebben een aantal stukjes beluisterd. Soms was er een gelijktijdige herkenning, soms zei één van ons twee: dit is volgens mij [verdachte] . Dan zei ik of mijn collega: nee, dat is niet zo, of ja, dat klopt. Als we het samen eens waren dat het [verdachte] was, schreven we dat op.
Een duidelijker manier van onderlinge beïnvloeding is bijna niet denkbaar.
Ad 2.
De verbalisanten gingen inderdaad uit van een gesloten setting. Van enige blinde of zelfs maar objectieve stemherkenning was geen sprake. De verbalisanten hoefden alleen maar even op te schrijven dat het inderdaad [verdachte] was die in de auto zat. [verbalisant 1] verklaart bij de rechter-commissaris:
De conclusies op grond van de overige bevindingen over wie er vermoedelijk in de auto zaten, waren mij bekend, in ieder geval, dat [verdachte] in de auto zat.
En [verbalisant 2] heeft verklaard:
U zegt dat er in de meeste van de zaaksdossiers wordt beschreven wie er in de auto zaten op de verschillende avonden. Deze informatie was mij bekend. Dit weet ik eigenlijk wel zeker.
Oftewel: de verbalisanten hebben samen geluisterd naar een hele slechte geluidsopname, waarvan hen vantevoren bekend was dat [verdachte] daarop te horen moest zijn.
Ad 3.
De personen in de auto waren inderdaad al geïdentificeerd, althans in de opvatting van de verbalisanten.
Ad 4.
Het valt te betwijfelen of de verbalisanten bekend waren met de specifieke kenmerken van de stem van [verdachte] . [verbalisant 2] verklaart bij de rechter-commissaris:
U vraagt mij of ik kan aangeven of er specifieke stemkenmerken zijn waaraan ik [verdachte] heb herkend, bijvoorbeeld accent, intonatie, woordgebruik. Nee. Hij praatte wel wat rustiger. Hij had natuurlijk wel een accent, maar dat had [betrokkene 1] ook, dus het was lastig hen uit elkaar te halen. Je hoort wel verschil, maar dan moet je goed luisteren. U vraagt hoe we [betrokkene 1] en [verdachte] uit elkaar konden halen. Er werden op een gegeven moment ook namen genoemd. [betrokkene 1] heeft een iets zwaardere stem.
Wat zegt deze verbalisant nu? In feite zegt hij dat hij [verdachte] helemaal niet kan herkennen, maar dat als hij twee stemmen van mensen in de auto heel nauwkeurig beluisterd, hij een verschil meent te horen. Als objectieve sprekerherkenning is dat niets waard. Dat er ook namen zouden zijn genoemd, is in elk geval in het geval van [verdachte] gewoon niet waar. Eén keer zou volgens het transcript het woord ' [verdachte] ' zijn gezegd. Of dat een naam was, of dat op [verdachte] sloeg, weten we helemaal niet.
Geen van beide verbalisanten heeft overigens enige opleiding of training in stemherkenning gehad.
Ad 5.
Of de verbalisanten de stemmen van de andere sprekers kenden is niet helemaal duidelijk. In elk geval verklaart [verbalisant 1] dat hij [betrokkene 1] nooit heeft verhoord. [verbalisant 2] weet niet meer of hij [betrokkene 1] heeft verhoord, maar hij heeft hem naar eigen zeggen weleens gesproken, bijvoorbeeld in het kader van het uitdelen van stukken. Niet echt een gelegenheid, waar veel bij wordt gesproken als je het mij vraagt.
Ad 6.
Het NFI vindt verder relevant of de stemmen van de sprekers op elkaar lijken. Dat is inderdaad het geval en wel -volgens de politie- zozeer dat een herkenning aanvankelijk onmogelijk was. Kennelijk - zo begrijp ik het rapport in de zaak [betrokkene 2] - gold dat ook voor andere verdachten in dit onderzoek.
Ad 7.
Of de verbalisanten het Haags goed beheersen, weet ik niet.
Resumerend scoren de verbalisanten negatief op ieder punt dat volgens het NFI van belang is bij een deugdelijke sprekerherkenning. Van een ook maar enigszins betrouwbare herkenning is geen sprake. [verbalisant 2] en [verbalisant 1] hebben naast elkaar zitten luisteren naar een hele slechte opname, waarvan zij al hadden besloten dat [verdachte] daaraan deelnam en vervolgens hebben zij voor ieder zaaksdossier opgeschreven dat dat inderdaad het geval was.
Raadselachtig blijft daarbij waarom stemherkenning eerst niet mogelijk was en toen plotseling wel. De verhoren geven hier geen bevredigend antwoord op. [verbalisant 2] verklaart in dat verband bijvoorbeeld:
U vraagt waarom het later wel mogelijk was om de stem van [verdachte] te herkennen. We hebben regelmatig taps teruggeluisterd omdat het lastig te horen was wie wie was. Op een gegeven moment kwam [verdachte] in beeld. Het komt ook door de verhoren dat het later wel ging om onderscheid te maken tussen de stem van [betrokkene 1] en [verdachte] . Het klopt dat er een gesprek met [verdachte] heeft plaatsgevonden dat ongeveer een uur duurde. U vraagt mij of dat gesprek doorslaggevend was voor de stemherkenning van [verdachte] . Nee. U vraagt mij waarom ik dan niet eerder de stem van [verdachte] heb herkend. Dat weet ik niet.
In hoger beroep is in de zaak [verdachte] nog een poging gedaan om een meer objectieve beoordeling van de stemmen op de OVC te krijgen. Het NFI heeft blijkens de brief van de heer Vermeulen van 23 juni 2016 geluidsfragmenten ontvangen afkomstig uit 9 verschillende OVC's. Het NFI heeft vervolgens alle spraakuitingen die door de politie zijn toegeschreven aan [verdachte] achter elkaar gemonteerd. Dit noemt men het netto-onderzoeksmateriaal.
Vervolgens stelt het NFI:
Het betwiste materiaal is niet bruikbaar voor vergelijkend spraakonderzoek. Het betwiste materiaal is opgenomen in een auto. De kwaliteit van de opnamen is slecht. Er is veel achtergrondgeluid, de te onderzoeken spreker klinkt ver van de microfoon af. De verschillende sprekers in de opname zijn zeer moeilijk van elkaar te onderscheiden en ook niet altijd goed te verstaan. Daarnaast bevat het onderzoeksmateriaal voornamelijk korte, losse uitingen. De gespreksomstandigheden zorgen voor een beperking in een vergelijkend spraakonderzoek, waardoor de vergelijkingsbasis met ander materiaal zeer beperk is.
Nogal verbazingwekkend is hoe deze vaststellingen zich verhouden tot de beoordeling van het verweer door de rechtbank. De rechtbank meent dat de verbalisanten tot de herkenningen hebben kunnen komen, onder meer omdat de stemmen van de verschillende verdachten zeer goed hoorbaar zijn en de stemmen ook in voldoende mate te onderscheiden zijn.
Hoe is het precies mogelijk dat de rechtbank spreekt over stemmen die voldoende te onderscheiden zijn en die zeer goed hoorbaar zijn, terwijl geschoolde spraakonderzoekers zeggen dat de verschillende sprekers in de opname zeer moeilijk van elkaar zijn te onderscheiden en ook niet altijd goed zijn te verstaan. Deze discrepantie is dermate groot dat zonder nadere motivering van een deugdelijke verwerping van het verweer geen sprake is.
Resumerend moet mijns inziens gezegd worden dat waar de verbalisanten [verbalisant 2] en [verbalisant 1] in het proces-verbaal van 7 februari 2013 relateren dat zij ‘zonder enige vorm van twijfel’ kunnen stellen dat zij [verdachte] herkennen als een van de personen die te horen zijn op de OVC, dit niets zegt over de betrouwbaarheid van die conclusie. Bij gebrek aan betrouwbaarheid van de gehanteerde methode en gelet op de bevindingen van het NFI over onder meer de slechte geluidskwaliteit, de vooroordelen en de op elkaar lijkende stemmen, behoort het proces-verbaal van 7 februari 2013 te worden uitgesloten van het bewijs.
Uw hof kan dit proces-verbaal niet met een gerust hart aan een veroordeling ten grondslag leggen. Ik zei het eerder al: de verbalisanten hoeven zich maar één keer te vergissen, en mijn cliënt krijgt straf voor een feit dat hij niet heeft begaan. Bij de beoordeling van ieder afzonderlijk tenlastegelegd feit (waarbij de stemherkenning een rol speelt) moet uw hof zeker weten dat de ten aanzien van dat feit gedane stemherkenning (waar [verbalisant 2] en [verbalisant 1] het dus soms aanvankelijk niet eens over eens waren) juist is. Bij twijfel moet een vrijspraak volgen.
Wij verzoeken uw hof het proces-verbaal van stemherkenning uit te sluiten van het bewijs met een integrale vrijspraak voor de zaken [1] , [2] , [3] , [4] en [5] als gevolg.”