Analyse av Big Data – et middel for maktutøvelse?

av aresj

Dette blogginnlegget er utarbeidet i felleskap med Eva Ankjell Helgesen og Tore Knudsen og er innledningen på en prosjektoppgave vi skal jobbe med utover høsten i faget Teknologiendring og samfunnsutvikling ved NTNU:

Harper Reed omtales som Obamas orakel i Dagen næringsliv 6. oktober 2012. Reed er teknogeniet som har funnet formelen for hvordan Barak Obama skal vinne valget. Reed uttaler: «Jeg er her for å sikre at teknologi er en suksessfull kraftmulitplikator i denne valgkampen». I 2008 hadde Obama-kampanjen 4 dataingeniører. I denne valgkampen har de 45 dataingeniører. I tillegg kommer statistikere, matematikere, sannsynlighetsberegnere, datagravere og markedsføringseksperter – som tilsammen utgjør et team på rundt 120 mennesker som under hele valgkampen jobber utelukkende med å skape verktøy som samler inn, systematiserer og foredler data om velgerne.
Businessweek skriver følgende: Under Reed har Obama-teamet bygget systemer for velgerregistrering, organisering av frivillige og generell støvsuging og analysering av hver eneste bit av tilgjengelig data – ikke bare stemmemønster, politiske donasjoner og forbrukerpreferanser, men også hva folk leser og deler, og hvordan de reagerer på eposter, annonser, tweets og andre henvendelser.
I tillegg til alle ansatte, er det en mengde frivillige som jobber i valgkampen. Reed har utviklet verktøyet «Dashboard» for å lette deres arbeid. De frivillige skal vite akkurat hvem det er viktig å ringe. De skal vite akkurat hvilken dør de skal banke på. Unge mennesker skal ringe de unge velgerne, eldre mennesker skal oppsøke eldre. De frivillige skal identifisere Obama-tilhengerne, og få dem til stemmeurnene. De skal overbevise tvilerne, og få dem til å stemme på Obama. De skal ikke kaste bort tiden på å ringe til eller besøke Mitt Romneys tilhengere.
Artikkelen er fascinerende, men også skremmende. Det ligger en enorm makt i å kunne systematisere store datamengder slik at nyttig og håndterbar informasjon kan hentes ut med kirurgisk presisjon.

Hvor henter Reed sin informasjon fra? Artikkelen i DN går ikke grundig inn på dette, men vi vil gjette at en vesentlig del av informasjonen kommer fra den enkelte. Vi deler villig informasjon om oss selv via Facebook, Twitter, blogger og andre nettsteder. Facebooks grunnlegger, Mark Zuckerberg har proklamert en lov som sier at for hvert år framover, i all overskuelig fremtid, vil mengden av informasjon som deles på nett dobles. Denne økte delingen skjer dels ved at vi blir vant til å dele mer med hverandre, dels gjennom lansering av nye tjenester som gjør det lettere for oss å dele informasjon. Erfaringsmessig er vi i starten forsiktig med hvilken informasjon vi deler, og tenker oss om for hver nye applikasjon vi benytter, men etter hvert blir disse barrierene brutt, og vi blir mer åpen for deling. Det er rett og slett «slik vi gjør det».
Facebook endret i 2007 sin strategi og åpnet kildekoden til Facebook-plattformen, og tillot dermed alle å utvikle programmer som kunne kobles til deres tjeneste, såkalte app’er. Åpningen synes å ha vært en suksess, og stadig nye app’er utvikles. Enkelte tjenester gjør at informasjonen kan deles sømløst, for eksempel når vi lytter til en sang på Spotify blir denne automatisk publisert under nyhetsfeeden på Facebook-siden vår. Gjennom å installere programmet tillater vi en tredjepart å publisere informasjon om vår bruk av tjenesten. På Facebook er det mulig å uttrykke at man ”liker” et innlegg, en hendelse eller en applikasjon. En rekke bedrifter legger også ut linker der vi kan trykke «liker» på deres sider hvor de presenterer et produkt eller en tjeneste. Når vi «liker» noe, kommer dette opp på nyhetsoppdateringen vår, og samtidig som nyhetsoppdatering på alle våre venners nyhetsoppdatering. Trykker de også «liker» sprer annonsen seg ytterligere. Dette er nettverkseffekter i praksis, og er utrolig effektivt for ikke å snakke om at dette er en gratistjeneste.
For å illustrere effektene av nettverk: Om en har et budskap og formidler dette til 2 personer. Og de formidler dette videre til 2 nye, og de igjen til 2 nye – har vi etter bare 33 ledd fått ut dette budskapet til hele verdens befolkning på godt over 7 milliarder mennesker. Vi ser her at nettverkseffekten ved hjelp av “Liker” knappen i Facebook kan være formidabel. En ting er informasjon vi deler, og vet at vi deler, men hva med all den informasjonen vi deler uten å være det bevisst? Hva med alle de gangene vi eksempelvis trykker på “Accept” -knappen idet vi laster opp en App, eller entrer en side på internett og godtar vilkårene for nettopp denne siden? Hvor mye informasjon samles inn? Og hvem bruker denne informasjonen? Og til hva?

Hver enkelt opplysning i seg selv er kanskje ikke så interessant, men når dataene sammenstilles kan en finne mønstre – eller avvik på mønstre som er langt mer interessant.
Ved å sammenstille store mengder data kan man få ut mye informasjon, som igjen kan benyttes til en rekke forskjellige formål. En slik sammenstilling av data går under betegnelsen «Big data». Big data er datasett med en størrelse som overgår det normale database verktøy kan lagre, håndtere og analysere (Big data: The next frontier for innovation, competition and productivity, McKinsey Global Institute, 2011). Definisjonen inneholder ikke en bestemt størrelse i form av terrabyte eller petabyte, den er forventet å endre seg med tiden ettersom mer effektive dataverktøy og datavare vil utvikles.
Mengden av digitalt produserte data har økt enormt over de siste 30 årene. Mens det i 1986 kun var 3 exabytes med data lagret globalt, var det i 2007 til sammenligning 295 exabytes, og i 2011 ble det generert ufattelige 1.8 zettabytes (10^21 bytes) med informasjon. Også regnekapasiteten har gjennomgått en betydelig utvikling. Eksempelvis ble 41% av regnekapasiteten i 1986 dekket av lommekalkulatoren, mens det i 2007 hovedsaklig var personlige datamaskiner og videospill som utførte de fleste regneoperasjonene.

I denne oppgaven ønsker vi å se på de ulike bruksområder for Big data. Videre vil vi analysere temaet i forhold til samspillet mellom elementene teknologi, organisasjon og samfunn. Hvilken nytte kan organisasjoner og samfunn ha av denne teknologien, og hvilke utfordringer finnes? Kan vi ane en forrykning i maktbalansen ved bruk av denne typen data?

Vi vet at tilgangen til informasjon er enorm, og vi vet at de som har midler og den riktige teknologien kan utnytte informasjonen til egen fordel – eller til å vinne et valg!