Foutmelding

Deprecated function: The each() function is deprecated. This message will be suppressed on further calls in _menu_load_objects() (regel 579 van /var/www/vhosts/taaluniebericht.org/2014.archief.taaluniebericht.org/includes/menu.inc).

Editie september 2015

Dit is een oude versie van Taalunie:Bericht en wordt niet meer bijgewerkt. Ga voor nieuwe artikelen naar taaluniebericht.org.

Rubriek: 
Auteur: 
Nick Kivits

De zoektocht naar de perfecte kandidaat

Wie een vacature heeft, wil die invullen met de beste kandidaat. Maar het vinden van die perfecte persoon is vaak zoeken naar een speld in een hooiberg. Is taaltechnologie de oplossing?

Het is de droom van menig recruiter: software die met één druk op de knop de perfecte nieuwe werknemer uit de hoge hoed tovert. Niet alleen iemand met de juiste ervaring en opleiding, maar ook iemand die toe is aan een nieuwe stap én die in de buurt woont. 'We zijn hard op weg die richting op te gaan', vertelt Remko Bonnema. 'Taaltechnologie is nu al in staat om op basis van een vacaturetekst een eerste selectie te maken van kandidaten die bij de functieomschrijving passen. We staan pas aan het begin van wat mogelijk is.'

Bonnema is technisch directeur van het Amsterdamse Textkernel, een bedrijf dat al zo'n vijftien jaar taaltechnologietoepassingen voor de recruitmentmarkt ontwikkelt. Dat heeft geleid tot diverse tools die niet alleen tekst in vacatures, cv's en begeleidende brieven doorlicht, maar ook automatisch analyseert. Dat analyseren begint met het ontleden van een cv of brief. Want waar staat de werkervaring vermeld? En waar rept de sollicitant over zijn opleidingen? 'Iedereen maakt zijn cv's, brieven en vacatures anders op', aldus Bonnema. 'Software moet eerst zorgen dat hij weet welke informatie hij precies voor handen heeft, voordat hij kan beginnen met het vinden van de juiste kandidaat bij een vacature.'

Mismatches oplossen

De eerste stap bij het automatisch verwerken van sollicitaties is het op één lijn brengen van de ingezonden informatie. Maar dat is nog maar het begin van het hele proces. De technologie van Textkernel kijkt ook naar de inhoud van de tekst. Anders dan bij de zoekmogelijkheden van de talloze online vacaturebanken, gaat het daarbij niet om het vergelijken van sleutelwoorden. In plaats daarvan kijkt de software naar de betekenis van woorden.

'Leg je een vacaturetekst en een cv naast elkaar, dan zie je dat er tussen die twee vaak een mismatch is in taalgebruik', aldus Bonnema. Hij verduidelijkt: 'In een vacature wordt bijvoorbeeld gevraagd naar affiniteit met bepaalde software of andere belangrijke zaken voor de functie. Er zijn een hoop kandidaten die die affiniteit hebben, maar weinigen zullen woord voor woord in hun cv zetten wat er in de vacature wordt gevraagd.'

Taaltechnologie lost dat probleem op door naar de semantiek van woorden te kijken. Dat wordt natuurlijke taalverwerking genoemd. Volgens Bonnema lijkt de manier waarop de tools van Textkernel dat doen op de manier waarop zoekmachine Google werkt. Wie een zoekopdracht invoert in de meest gebruikte search engine ter wereld krijgt namelijk ook niet alleen letterlijke antwoorden terug. Per zoekopdracht probeert Google te achterhalen wat de gebruiker bedoelt en waar hij eigenlijk naar op zoek is. 'Taaltechnologiesoftware voor recruitment kan dat ook. Dat levert veel betere en betrouwbaardere resultaten op dan de standaard zoekfuncties in vacaturebanken en recruitmentsystemen.'

Taalbegrip ontwikkelen

Wat een gebruiker bedoelt met bepaalde zoektermen, dat weet taaltechnologie niet van zichzelf. Net als een mens moet de software dat eerst leren. De medewerkers van Textkernel trainen hun programma's aan de hand van voorbeelden. Ze voeden de programmatuur met succesvolle matches van cv's en vacatureteksten, zodat de software ziet welke mensen zijn aangenomen op wat voor soort functies. Als de software genoeg van die voorbeelden voorbij ziet komen, gaat hij verbanden ontdekken. Zo leert de programmatuur vaardigheden en beroepen aan elkaar te koppelen en woorden te begrijpen.

Dat taalbegrip is onmisbaar om de juiste kandidaten te vinden. 'Er zijn functies die een mens doorgaans niet vaker dan één keer doet', weet Bonnema. 'Iemand die al is gepromoveerd zal niet snel nog een promotieonderzoek doen. Wanneer taaltechnologie in een cv-databank op zoek gaat naar een kandidaat voor een promotieonderzoek, kan hij de cv's van mensen die zo'n onderzoek al gedaan hebben dus uit zijn resultaten filteren.' De afwegingen die de software maakt, zijn volgens Bonnema per type baan verschillend. 'Wanneer je op zoek bent naar een accountant, dan wil je juist iemand die al eerder zo'n functie heeft bekleed.'

Dankzij de juiste training kan taaltechnologie zelf interpreteren wie wel en wie niet bij een functie past. Daarbij wordt niet alleen gekeken naar iemands ervaring, maar ook naar het opleidingsniveau en of iemand logischerwijs toe is aan een volgende stap. Software-engineers stromen bijvoorbeeld na een paar jaar vaak door naar een functie als projectleider. Een programma dat in een cv-databank op zoek gaat naar een nieuwe projectleider zal dus ook software-engineers die een aantal jaar ervaring op hun cv hebben geschreven, meenemen in zijn afweging.

Zelflerende software

De taaltechnologie die op dit moment gebruikt wordt om geschikte medewerkers te vinden, doet dat op basis van statistische algoritmes. Maar de volgende stap in die ontwikkeling dient zich inmiddels al aan. De nieuwe tak van sport heet deep learning. Software die daar gebruik van maakt, moet leren denken als het menselijk brein.

Op het gebied van beeldherkenning worden grote stappen gemaakt. Zo ontwikkelde Google een systeem dat een kat kon herkennen, zonder hiervoor specifiek te zijn getraind. De software – Google Brain – deed dat door miljoenen documenten door te nemen en verbanden te leggen. Googles brein leert dus zelf, zonder hulp van mensen.

Deep learning wordt gezien als de volgende stap op het gebied van kunstmatige intelligentie. En ook binnen de taaltechnologie heeft deep learning toekomst, omdat het software in staat stelt zelf de betekenis van nieuwe woorden te leren. Aan elkaar verwante woorden komen namelijk vaak in een soortgelijke context voor.

'Een voorbeeld: het woord “Amsterdam” zal in een cv vaak voorkomen in de context van een plaatsnaam', aldus Bonnema. 'Als de software die combinatie vaak genoeg ziet, zal hij hem als dusdanig herkennen. Ontdekt de programmatuur een voor de software nog onbekend woord in een soortgelijke context, dan concludeert hij dat het nieuwe woord de naam van een stad moet betreffen.'

Hoewel dat nu nog klinkt als sciencefiction, zou de droom van de computer die met één druk op de knop de perfecte sollicitant tevoorschijn haalt in de toekomst realiteit kunnen worden.