Stručnjaci tvrde da su društvene mreže poput Facebooka i Twittera previše pristrane da bi njihovi podaci bili korišteni u znanstvene svrhe.
Juergen Pfeffer i Derek Ruths u časopisu Science upozoravaju kako znanstvenici slijepo koriste gomile podataka s društvenih mreža, odnosno koriste ih kao zlatne rudnike podataka, pri čemu ne uzimaju u obzir inicijalno ugrađenih pristranosti.
O korištenju podataka s društvenih mreža kao lako dostupnih izvora podataka počelo se pričati nakon što je Facebook znanstvenicima dopustio da u svrhu istraživanja manipuliraju news feedovima korisnika s ciljem manipuliranja njihovim emocijama.
Loše provedeno istraživanje rezultiralo je vrištećim naslovima o ‘tajnim eksperimentima‘. Skandal je nastao zato što je Facebook dopustio provođenje eksperimenta bez pristanka korisnika, odnosno subjekata istraživanja, a stvar je dodatno pogoršala činjenica da je Facebook odgađao ispriku sve dok nije bio prisiljen ispričati se.
Pfeffer objašnjava kako je velik problem i u onima koji su proveli istraživanje, a ne samo u Facebookovim skrupulima. Naglasio je da su moralna pitanja i privatnost bitne stavke te da su se etički odbori matičnih sveučilišta znanstvenika trebali pozabaviti tom tematikom.
Pfeffer i Ruths također upozoravaju i da je broj istraživanja baziranih na podacima s Twittera golem. Primjerice, ako u Google Scholar upišete ‘Twitter‘ kao ključ pretrage, dobit ćete 4,9 milijuna rezultata, što je više od bilo koje ključne riječi. Usporedbe radi, pretraga po ključnoj riječi ‘sociologija‘ generira 2,5 milijuna rezultata.
Iako se društvene mreže čine kao nepresušan izvor podataka, često sadrže populacijske pristranosti koje onemogućuju generaliziranje na opću populaciju.
- Instagram, primjerice, posebno privlači korisnike u rasponu godina od 18 do 29, crnačku populaciju, Latinoamerikance, žene i urbano stanovništvo. Na Pinterestu dominiraju žene u dobi između 25 i 34 godine, s godišnjim prihodom kućanstava od 100 tisuća dolara. – objašnjavaju.
Još gore, društvene mreže koriste vlastite algoritme za određivanje protoka podataka – algoritme koji se mogu promijeniti u bilo kojem trenutku bez znanja znanstvenika.
- Kako itko može evaluirati rezultate istraživanja kada niti podaci niti točne metode ne smiju biti objavljene? – pitaju se Pfeffer i Ruths. Oni koji su privilegirani na način da imaju pristup podacima stvaraju vlastitu istraživačku zajednicu koja se bavi društvenim mrežama, što otežava objektivnu analizu radova koji proizlaze iz podataka prikupljenih s društvenih mreža.
Na koncu, mnogi od ‘korisnika‘ na društvenim mrežama nisu stvarne osobe – ima lažnih profila, PR profila i sličnih pojava, što je posebno slučaj kada govorimo o Twitteru.
- Twitter je u centru javnog interesa, a uspješnost političara i kompanija se često mjeri brojem ‘pratitelja‘ ili brojem re-tweetova, stoga postoji cijela mašinerija zadužena za web optimizaciju čiji je cilj poboljšati njihov imidž u javnosti. –
Mnogi su znanstvenici svjesni ovih ograničenja i koriste različite metode kako bi ispravili pristranosti svojstvene podacima s društvenih mreža. Međutim, ako namjeravaju i u budućnosti koristiti društvene mreže kao izvore podataka (što je više nego izgledno), morat će smisliti neke nove načine za rješavanje problema pristranosti podataka.