Sinds 2017 stijgt de vraag naar hoogwaardige trainingsdata voor zelfrijdende auto’s exponentieel. Enorme hoeveelheden data zijn namelijk nodig om het einddoel van de AV te behalen. Maar om uit zelflerende algoritmes zelfsturende auto’s te krijgen is er eerst heel veel handenarbeid nodig. Arbeid die wereldwijd door goedkope flexwerkers wordt geleverd. Zij brengen de zelflerende technologie het waarnemingsvermogen bij door miljoenen beelden van verkeerssituaties zo te verrijken dat ze door de AI verwerkt kunnen worden.

Venezuela

Alexander Schmidt van de Hochschule für Technik und Wirtschaft in Dresden heeft zich in een studie beziggehouden met de clickworkplatforms die deze thuiswerkers faciliteren. Alhoewel de kwaliteitseisen hoog zijn, is een van de conclusies, en gespecialiseerde platforms hogere vergoedingen betalen, staan deze vergoedingen door de harde concurrentie tussen thuiswerkers onder druk. Dit wordt nog versterkt door het feit dat zo’n 200.000 hooggekwalificeerde maar noodlijdende mensen uit Venezuela hun diensten voor zeer lage prijzen aanbieden. Op veel platforms vormt deze groep inmiddels 75 procent van het aanbod aan arbeidskrachten. Volgens berichten verdienen zij omgerekend een tot twee euro per uur.

Goed gefinancierd

Afnemers van de door hen geproduceerde trainingsdata zijn volgens Alexander Schmidt tientallen goed gefinancierde bedrijven die een plek proberen te veroveren in de zich ontvouwende markt van de autonome auto. Dit zijn niet alleen de grote, gevestigde autofabrikanten maar ook hardware en software leveranciers zoals Intel, Nvidia, Google en Apple. Daarbij komen nog talrijke met risicokapitaal gefinancierde startups. In 2018 beschikten 55 bedrijven over een licentie om alleen al in Californië te testen met autonome voertuigen.

Pixels

Allemaal zijn ze voor het functioneren van hun algoritmes aangewezen op exact omschreven en toegekende – geannoteerde – trainingsdata. Ze hebben miljoenen foto’s nodig van verkeerssituaties, waarbij elke pixel aan een object wordt toegekend. Wegmarkeringen, voertuigen en voetgangers moeten haarscherp van elkaar worden onderscheiden en worden voorzien van aanvullende informatie zodat er via machine learning spelregels afgeleid kunnen worden en softwaremodellen kunnen worden ontwikkeld.

Markt is veranderd

Door de hogere kwaliteitseisen van deze klanten is de markt waarin crowdsourcingbedrijven acteren deels veranderd, merkt de onderzoeker op. De productie van AI-trainingsdata verloopt nog altijd via bekende platforms als Amazon Mechanical Turk, maar er zijn ook nieuwkomers bijgekomen of traditionele aanbieders hebben hun businessmodel aangepast en zich volledig gespecialiseerd in de specifieke eisen van de autobranche. De grote namen zijn nu Mighty AI, understand.ai, Playment, Hive en Clickworker.

Voor thuiswerkers in het algemeen en voor veel Venezolanen in het bijzonder zijn deze platforms een financiële levensader geworden concludeert Schmidt. “Ze maken deel uit van een groep digitale werknomaden die als seizoensarbeiders tussen de verschillende platforms heen en weer bewegen.”