Een nieuwe taal voor data die iedereen begrijpt

Uit een reportage van Marjolein van Trigt voor Vrij Nederland ‘Neem een kijkje in de Black Box’ waarin ze beschrijft hoe we weer grip kunnen krijgen op onze data. Ze citeert o.a. Jonathon Morgan die pleit voor een Data Science Exchange Protocol waarmee iedere leek data kan begrijpen.

Hoe krijgen gewone mensen meer macht over data? Op de meest recente editie van technologiefestival Border Sessions in Den Haag pleitte Jonathon Morgan voor een nieuwe taal voor data, een zogenaamd Data Science Exchange Protocol. Zoals alle webpagina’s in HTML zijn opgemaakt, zo zou er één taal moeten zijn die alle data beschrijft. Dat zou niet-technici beter in staat stellen om te snappen welke informatie machines verwerken en om zelf kennis te halen uit data.

‘Zonder de menselijke context hebben we niets aan data,’ zegt Morgan. ‘Maar het is fundamenteel verkeerd om op technici te vertrouwen om die context aan de data toe te voegen. Dus wil ik gewone mensen een manier geven om grote datasets te doorzoeken.’

In zijn presentatie maakt Morgan de vergelijking met videogames. ‘De gamingindustrie is erin geslaagd om hele werelden te creëren die in feite vrij gelimiteerd zijn, maar niet zo aanvoelen voor de speler. Datawetenschappers doen alsof we experts nodig hebben om ons door de wereld van big data te leiden. Maar ik denk dat we heel goed in staat zijn om systemen te ontwerpen waaruit gewone mensen kennis kunnen destilleren.’

Nog steeds zie je als gebruiker van een dergelijk systeem alleen de uitkomst, niet de gegevens die het systeem buiten beschouwing laat. Morgan: ‘Klopt. Ik zou willen beargumenteren dat het voor de meeste mensen niet uitmaakt. Evenmin weet je hoe de gamedesigner je spel manipuleert en of je GPS je werkelijk de snelste route voorschotelt. In de meeste gevallen is het desondanks oké om het systeem beslissingen voor je te laten nemen.’

Google, met wie moet ik trouwen?

Vertrouw op je gevoel, luister naar je hart, doe wat goed voelt. Hoe vaak heb je dat advies niet gekregen bij het nemen van een beslissing? Sinds humanistisch gedachtegoed, met Rousseau als posterboy, post heeft gevat, staan onze gevoelens en verlangens centraal als ultieme bron van betekenis en dus ook meetlat.
dataism
Want nu meetsystemen van onze gedragingen steeds geavanceerder en veelomvattender worden, kent onze technologie ons beter dan onszelf.
Hoe kiest een humanist een boek? Door naar een boekwinkel te gaan, lekker rond te dolen tussen de schappen, wat te bladeren, wat zinnen te lezen en dan z’n keuze te maken op basis van z’n intuïtie.
Hoe kiest een dataïst een boek? Door naar een webwinkel te gaan, die hem aanbevelingen doet op basis van keuzes in het verleden.
En in de toekomst wellicht: doordat z’n e-reader bijhoudt welke delen van z’n boek hij snel of langzaam leest, waar hij pauzes nam en waar hij stopte met het boek. Of zelfs: door te meten hoe elke zin z’n hartslag en bloeddruk beïnvloedde. Wat hem aan het lachen maakte, of bedroefd. Kortom:
“Soon, books will read you while you are reading them. And whereas you quickly forget most of what you read, computer programs need never forget. Such data should eventually enable Amazon to choose books for you with uncanny precision. It will also allow Amazon to know exactly who you are, and how to press your emotional buttons.”
Zo komt in maart 2017 Zenta in productie, een fitbit voor je emoties. Niet alleen meet het, zoals een normale fitbit je hartslag, huidtemperatuur en bloeddruk, maar het probeert het ook te duiden in de context van de persoon waarmee je praat of de situatie waarin je je bevindt:
“Word je bijvoorbeeld altijd opgewonden als je een afspraak hebt met een collega (zoals in je agenda af te lezen is), dan kan het apparaat je daarvoor waarschuwen.”
Waar je je in een middeleeuwse samenleving tot de autoriteiten of kerk richtte voor belangrijke levensbeslissingen en je in de humanistische samenleving vertrouwde op je gevoelens, wend je je in de dataïstische samenleving tot Google:
“Google, ik heb zowel een tinderdate deze week met Pietje als Puk: Welke date heeft de meeste kans op basis van alles wat je over hen én mij weet?”
Dit bericht komt uit m’n wekelijkse nieuwsbrief ‘Curated Culture’ waar ik elke week de laatste berichten rondom ‘future affairs’ naar je opstuur: wat zijn dé technologische ontwikkelingen die jouw toekomst gaan bepalen? Elke zaterdagochtend de nieuwsbrief ontvangen? Schrijf je hier in. 

Stel je voor…dat je twittergeschiedenis je politieke carrière bepaalt

Je ziet het al gebeuren bij deze verkiezingen: Trump wordt op basis van eerder gedane uitspraken in het verleden aangepakt op draaikonterij. Niet dat het heel veel helpt. The Notorius Draaikont deed zijn uitspraken veelal in talkshows op tv, maar vraag je nu het volgende af:
Hoe lang gebruik jij nu al Twitter? Of Facebook? Of misschien heb/had je wel een persoonlijke blog? Of verzamelde je plaatjes van je favoriete popicoon op een tumblr? Of had je daarover ellenlange chatsessies met vriendinnen op een openbaar forum?
Pakweg 1/3de van mijn leven breng ik nu online door en laat ik sporen na. En in die tien jaar ben ik veranderd. Gekke projectjes uit het verleden hoef ik nu niet persé meer te zien en ik denk heel anders over bepaalde zaken waar ik in het verleden blogs over heb geschreven.
But it’s out there.
Trump twitter robot
De generatie onder ons laat al sinds zijn puberteit digitale sporen na. En denk maar even terug aan je eigen puberteit – hoe je toen dacht en deed – om daar de volle implicaties van te begrijpen.
De podcast ‘Flashforward’ die ik hierboven al noemde – en echt, ik ben groot fan – heeft hier ook weer een prachtige aflevering over gemaakt ’The revenge of the retweet’:
“What happens, when today’s teens start running for office? When their entire internet history is there, searchable, for us to read? What if these teens Tweet something at 15 that they might regret at 45? Do we learn to accept that their opinions have changed?”
En om nog even terug te komen op Trumps twitter: Niet alleen is door big data inmiddels een robot gebouwd die op verbazingwekkend gelijke manier als Trump tweet de ’Deep Drumpf Twitter Bot’, maar ook is door een data-analyse onlangs bewezen, dat hoogstwaarschijnlijk maar 50% van alle tweets van Trump zelf afkomstig is. Namelijk de agressieve, boze uitspraken
Dit bericht komt uit m’n wekelijkse nieuwsbrief ‘Curated Culture’ waar ik elke week de laatste berichten rondom ‘future affairs’ naar je opstuur: wat zijn dé technologische ontwikkelingen die jouw toekomst gaan bepalen? Elke zaterdagochtend de nieuwsbrief ontvangen? Schrijf je hier in. 

iOverheid on steroids: waar gaat het mis? (tjsa, waar eigenlijk niet..?)

Twee van de beste tech-journalisten van Nederland – Dimitri Tokmetzis en Maurits Martijn – publiceerden deze week in de Correspondent een interview met Dennis Broeders en Corien Prins, de auteurs van iOverheid, een rapport uit 2011 dat onthulde dat de Nederlandse overheid grote steken laat vallen bij het verwerken van burgergegevens
X-road
Vijf jaar na het uitkomen van het rapport maken Broeders en Prins zich nog grotere zorgen. De problemen? Allereerst werkt Nederland met databases die direct aan elkaar worden gelinkt, waardoor informatie uit het ene systeem vrijelijk doorstroomt naar het andere. Niet alleen is niemand verantwoordelijk voor deze grote datastroom, alleen voor individuele databases, maar ook zorgt dit ervoor dat er foutieve koppelingen met grote gevolgen kunnen worden gelegd.
“Juist in Big Data-sets zitten bijvoorbeeld veel vuile en incomplete data – ‘ruis’. […] Daar kun je voor compenseren als je iets wilt zeggen over groepen mensen, maar die conclusies zijn niet zomaar door te trekken naar individuen.[…]Een terrorist opsporen met datamining? Nee dus. ‘Er zijn te weinig data om een betrouwbaar profiel te maken, een terrorist is een té grote uitzondering. Maar die kennis hindert een hele hoop mensen niet.”
(Kijk trouwens voor hoe het óók kan eens naar Estland, waar databases alleen aan elkaar gelinkt zijn door de Xroad (zie afbeelding), een systeem dat burgers makkelijk kunnen inzien en waar op individuele basis toestemming moet worden gegeven welke database inzicht heeft in welke persoonsgegevens).

Data zijn de nieuwe ‘weapons of math destruction’

“We live in the age of the algorithm. Increasingly, the decisions that affect our lives—where we go to school, whether we get a car loan, how much we pay for health insurance—are being made not by humans, but by mathematical models. In theory, this should lead to greater fairness: Everyone is judged according to the same rules, and bias is eliminated. But the opposite is true.”
De Amerikaanse wiskundige Cathy O’Neil is nogal stellig in haar TED-talk (later dit jaar komt het boek uit waarin ze dit verder uitwerkt): onze omgang met data is net zo gevaarlijk als een atoombom. Waarom?
Omdat een data algoritme een schijn van neutraliteit, logica en eerlijkheid ophoudt, terwijl het niet transparant genoeg is hoe dat algoritme werkt. En aangezien algoritmes worden gebruikt om steeds meer vergaande beslissingen te nemen over de levens van veel mensen gebruikt O’Neil de steengoede metafoor ‘weapon of math destruction’.
Mass destruction

Waarom bedrijven binnenkort je data niet meer willen bezitten

Persoonlijke data als het nieuwe goud van deze tijd. De grondstof waar iedereen naarstig naar het graven is, oftewel in officiële termen: dataminen. Maar dit is wel een stukje goud, waar bedrijven in de toekomst snel vanaf willen, zo voorspelt Ryan Gardner in dit stuk.
Want nu, pakweg drie jaar sinds de onthullingen van Edward Snowden, gaan burgers veel bewuster om met hun persoonlijke data. Mid-2015 zijn er 198 miljoen advertentieblockers geïnstalleerd en 75% van de consumenten wantrouwt bedrijven op datagebied. Ook de regelgeving is in deze periode aangescherpt.
Datamining
En dus gaan we nu naar een tijd toe waarin burgers steeds meer eigenaar worden van hun eigen data en bedrijven op z’n minst transparant moeten worden over hoe ze bepaalde data van je gebruiken. In maart vertelde Marten Kaevats tijdens de HEYU! Urbans talkshow, waar ik programmamaker van ben, over Estland dat tijdens het komende EU-voorzitterschap in 2018 eigenaarschap over je data als het vijfde basisrecht wil gaan bepleiten.
En dus worden data een blok aan het been en zelfs een groot risico om in bezit te hebben voor bedrijven. Gardner voorspelt dan ook een toekomst waarin het eigenaarschap van data inderdaad bij het individu ligt, en databedrijven steeds meer als managers optreden die ervoor zorgen dat de data terecht komen bij de bedrijven die deze willen hebben. Hij noemt dit het Uber/AirBnb model voor databedrijven:
“Through the network, they connect people that have something with people that want that thing. They don’t care about the actual thing itself. Owning a fleet of cars or a chain of hotels is not scalable, and it’s not where the value is. In fact, it’s a liability. [..]
Data companies that leverage the power of the network will dis-intermediate traditional data aggregators. Instead of aggregating data at an organizational level, data will be integrated around the individual. People will just authorize permission-based access to businesses when the need arises. Businesses benefit too. They get access to richer data in a timely way that avoids major compliance issues.”
Dit bericht komt uit m’n wekelijkse nieuwsbrief ‘Curated Culture’ waar ik elke week de laatste berichten rondom ‘future affairs’ naar je opstuur: wat zijn dé technologiche ontwikkelingen die jouw toekomst gaan bepalen? Elke zaterdagochtend de nieuwsbrief ontvangen? Schrijf je hier in. 

Chinese datahonger om modelburgers te creëren

Ik kreeg veel reacties toen ik in deze nieuwsbrief berichtte over hoe de Chinese overheid werkt aan een systeem van ‘sociale kredietverstrekking’ dat in 2020 live moet gaan. Kort door de bocht: de data die je bewust of onbewust deelt gaan bepalen welke (overheids)diensten je kunt krijgen en hoe duur die voor je zijn. Marije Vlaskamp geeft in haar stuk over Chinese datahonger in de Volkskrant een goed voorbeeld van hoe dit kan werken:
“Hoe die score in de praktijk kan worden gebruikt blijkt al in Sjanghai, waar ouderen die vinden dat hun kinderen niet vaak genoeg op bezoek komen, naar de rechter kunnen stappen. Vindt die inderdaad dat er sprake is van verwaarlozing, dan kost dat zo’n kind straks punten op zijn kredietscore. Dat betekent niet alleen minder kans op een lening; omdat je kredietwaarde openbaar is, sta je de rest van je leven te kijk als harteloos”.
china-big-data
Het stuk belicht een enorm dataverzamelingsproject van de Chinese overheid die 5,4 miljoen heeft uitgetrokken om data te verzamelen van scholieren en studenten. Zoals Vlaskamp schrijft:
“’Datacrunchers’ beperken zich in opdracht van scholen en universiteiten niet tot studieresultaten, maar analyseren ook het dagelijks leven van studenten: het tijdstip waarop ze douchen, wat hun lievelingssnacks zijn en welke meningen ze op sociale media uiten.”
Het doel? “Modelstudenten die beter leren, een onberispelijke moraal hebben en precies denken zoals de Chinese eenpartijstaat wil.”
Dit bericht komt uit m’n wekelijkse nieuwsbrief ‘Curated Culture’ waar ik elke week de laatste berichten rondom ‘future affairs’ naar je opstuur: wat zijn dé technologiche ontwikkelingen die jouw toekomst gaan bepalen? Elke zaterdagochtend de nieuwsbrief ontvangen? Schrijf je hier in

James Bridle schrijft over het einde van big data

Eén van mijn favoriete kunstenaars, James Bridle, waarover ik al eerder berichtte in deze nieuwsbrief, schreef ‘The end of big data. Hij verhaalt over een toekomst waarin een grote privacy crash is geweest waarbij iedereens data op straat zijn komen te liggen.

“But the currency crash just prefigured the privacy crash, a lurking, existential horror that tore into everyday relationships. It was like having the Stasi back, but the Stasi was everyone. The papers couldn’t keep up with the scandals: political, financial, domestic, deranged. [..] We’d been losing gays, trans kids, freethinkers and unaccredited journalists for years, but when senators turned out to be just as vulnerable, the legislature finally took action.”

Dus nu is er een tijdperk van ‘undata’ aangebroken waarin geen enkele persoonlijke data meer gebruikt mogen worden. De dood natuurlijk voor allerlei branches zoals de marketing- en advertentiesector, waardoor er al snel een uitgebreid datasmokkelcircuit ontstaat, maar Silicon Valley maakt er uiteraard wel weer fijn winst op.

Personal Data

 

Dit bericht komt uit m’n wekelijkse nieuwsbrief ‘Curated Culture’ waar ik elke week de laatste berichten rondom ‘future affairs’ naar je opstuur: wat zijn dé technologiche ontwikkelingen die jouw toekomst gaan bepalen? Elke zaterdagochtend de nieuwsbrief ontvangen? Schrijf je hier in

Creep-alert! Een 7,8 burger

Ja, ik heb het hier over vlees. Nee, ik heb het hier niet over waar je de beste hamburger kunt eten. Ik heb het hier over Sesame Credit, een spel dat burgers een score geeft op burgerschap.

Sesam Credit

Het is de nieuwste ontwikkeling uit China waarin gehoorzaamheid aan de staat tot game wordt gemaakt. Sesame Credit meet hoe gewillig Chinese burgers het beleid volgen door data van sociale netwerken en online aankopen te vertalen in een score. Zo kan je score omhoog gaan als je positieve tweets rondstuurt over de Partij, maar omlaag als je mangastrips uit Japan koopt (en dus niet lokale producten steunt). Klinkt al ongelofelijk creepy niet waar? Maar het wordt nog erger..Je score kan ook omlaag gaan als je vrienden hebt die verslaafd zijn aan Japanse manga en potentiële gevolgen in de toekomst zouden kunnen zijn dat minder goede burgers minder makkelijk een lening kunnen krijgen, lagere internetsnelheid of de benodigde papieren om een bedrijf te starten of te reizen. Sesame Credit is nu nog vrijwillig, maar tegen 2020 wordt het realiteit: creepy!

Dit bericht komt uit m’n wekelijkse nieuwsbrief ‘Curated Culture’ waar ik elke week de laatste berichten rondom ‘future affairs’ naar je opstuur: wat zijn dé technologiche ontwikkelingen die jouw toekomst gaan bepalen? Elke zaterdagochtend de nieuwsbrief ontvangen? Schrijf je hier in.