Algoritmeista

Morozov käsittelee kirjassaan runsaasti automaattiseen päättelyyn käytettyjä algoritmeja ja nostaa esiin ongelmatilanteita, joissa algoritmi tekee pohja-aineistostaan vääriä päätelmiä.

Yhtenä esimerkkinä on Googlen ja Guernica-nimisen julkaisun nokkapokka. Guernica-verkkojulkaisu käsittelee politiikkaa, kirjallisuutta ja taidetta. Guernicaan ovat kirjoittaneet muun muassa Noam Chomsky, Amartya Sen, Arundhati Roy ja Zadie Smith. Julkaisun tulonlähteitä ovat esimerkiksi lukijoilta saadut lahjoitukset ja Googlen AdSense-ohjelman kautta saadut mainostulot.

Googlen kanssa sukset menivät ristiin, kun Guernica julkaisi Clancy Martinin kirjoituksen ”Early Sexual Experiences”. Martinin kirjoitus käsittelee juuri sitä aihetta, johon otsikko viittaa. Ongelma syntyi siitä, että Googlen käyttämä verkkosivujen sisältöjä analysoiva algoritmi tulkitsi Martinin kirjoituksen sopimattomaksi. Tämä johti siihen, että Google poisti mainokset Guernican sivuilta. Samalla katkesi myös Guernican mainostulovirta. Valitukset eivät tuottaneet tulosta. Tapauksesta on kirjoittanut myös Joel Whitney (Censored by Google, Boston Review).

Morozov kritisoi Googlen luomaa kuvaa itsestään todellisuuden peilinä. Esimerkkinä hänellä on muun muassa Googlella tuotesuunnittelua johtaneen Marissa Mayerin haastattelulausunto Googlen tavoitteista:

”We’re trying to build a virtual mirror of the world at all times.”

Hakukonetta ei saisi ajatella muusta maailmasta irrallaan olevana, maailmaa objektiivisesti tarkkailevana järjestelmänä. Google on Morozovin mukaan samantapainen todellisuutta muokkaava järjestelmä kuin sanomalehdet, radioasemat ja televisiokanavat. Nämä järjestelmät muokkaavat todellisuutta esimerkiksi nostamalla esiin tiettyjä asioita tai näkökulmia asioihin. Objektiivisuus ei synny siirtämällä erilaisia tehtäviä koneiden ja tietojärjestelmien hoidettavaksi.

Morozov havainnollistaa algoritmien todellisuutta muokkaava vaikutusta Twitterin Trends-toiminnolla. Trends-toiminto perustuu algoritmiin, joka erilaisin säännöin päättelee twiiteistä, mitkä aiheet ovat nousemassa trendeiksi. Tyypillinen kuvio Twitterissä on se, että kun aihe nousee trendiksi, se saa yhä enemmän huomiota ja sen trendikkyys kasvaa. Morozov määritteleekin Twitterin pikemminkin todellisuutta luovaksi koneeksi, kuin todellisuutta vain havainnoivaksi kameraksi.

Helmikuussa 2014 Pirkanmaa pakeni trendikartan analyysia.
Helmikuussa 2014 Pirkanmaa pakeni trendikartan analyysia.

Algoritmit ja sisällöntuotanto

Tekstintuottaminen koneellisesti ei ole ihan uusi asia. Aihetta on käsitellyt myös Steven Levy (Can an Algorithm Write a Better News Story Than a Human Reporter?, Wired, 2012). Uutistuotannossa tekstintuottamista on jo automatisoitu. Yksi tällaista palvelua tarjoava yritys on Narrative Science.

Helsingin Sanomien mukaan Amazon on yrittänyt automatisointia teosten kääntämisessä. Tulokset ovat jääneet heikonlaisiksi. Voidaanko sanataidetta automatisoida isossa mittakaavassa kaupallisesti? Morozov arvioi tällaisen olevan mahdollista tulevaisuudessa vaikkapa niin, että Amazon ryhtyy tuottamaan sisältöjä, jotka se laatii lukijoiden lukutottumusten pohjalta.

Morozovin ajatuskuvio menee näin: Amazon kykenee tallentamaan Kindle-lukulaitteidensa avulla informaatiota siitä, millaisia lukutottumuksia Kindlen käyttäjillä on. Mikäli informaatio pitää sisällään tiedon esimerkiksi siitä, mitä sanoja haetaan lukulaitteen sanakirjasta, mitä tekstinkohtia sähkökirjoista alleviivataan useimmin, kauanko sähkökirjan lukeminen kestää jne, voi Amazon tällaiseen informaatioon pohjaten rakentaa palvelun, jossa tekstintuottaminen on automatisoitu:

Nothing prevents Jeff Bezos from taking such knowledge and churning out books automatically, bypassing the authors completely and offering such a personalized offering – pushing all the right emmotional and intellectual buttons for each reader – so that no bought book goes unread. A growing number of newspapers and magazines already turn to companies like Narrative Science to supply them with articles – mostly about sports and finance – produced by algorithms. (172)

Tällainen tekstiautomaatti tuottaisi käyttödatan pohjalta sellaisia tekstejä, jotka täyttävät suositun tekstin kriteerit.

Algoritmien ongelma

Morozov tiivistää ongelmat kahteen kohtaan. Ensimmäinen on algoritmien oletettu objektiivisuus. Algoritmit ovat jonkun rakentamia, emmekä voi tietää algoritmin tekijän mahdollisista ennakkoasenteista ja oletuksista esimerkiksi rikollisuuden yleisyydestä tietyillä asuinalueilla tai tietyissä ihmisryhmissä. Toinen ongelma on algoritmien läpinäkymättömyys: emme esimerkiksi voi tutkia hakukoneiden algoritmeja. Tätä perustellaan – ymmärrettävästikin – liikesalaisuuksilla.

Mikäli sensorointi ja rikosten ehkäisy valvontajärjestelmien avulla yleistyvät, voivatko näiden sovellusalueiden tuotteet olla läpinäkymättömiä, Morozov kysyy. Mikäli ennakoivan kontrolloinnin (predictive-policing) työvälineet rakentaa yksityinen yritys, tämä voinee olla mahdollista. Morozov kertoo algoritmien olevan yhä enemmän käytössä yhdysvaltalaisessa oikeusjärjestelmässä:

And algorithms increasingly dominate many other parts of our legal system; for example, they are also used to predict how likely a certain criminal, once on parole or probation, is to kill or be killed. Developed by a University of Pennsylvania professor, this algorithm has been tested in Baltimore, Philadelphia, and Washington DC. Such probabilistic information can then influence sentencing recommendations and bail amounts, so it’s hardly trivial. (184)

Meillä yleisissä kirjastoissa tällaista algoritmiikkaa edustavat verkkokirjastojen lisää samankaltaisia teoksia -tapaiset listat. Näiden kanssa ei tällä hetkellä osaa olla huolissaan siitä, että algoritmien kätköissä muhisi puolueellisuuksia. Ennemminkin miettii missä määrin automatisoidut listat tai relevanssin mukainen lajittelu osoittavat oikeaan suuntaan.

Esimerkkinä läpinäkymättömyysongelman ratkaisusta Morozov esittää rahoitusalalle kehitetyn mekanismin, jolla valvotaan algoritmista kaupankäyntiä. Kuvio on rakennettu niin, että ulkopuolinen taho tekee säännöllisiä auditointeja, joilla arvioidaan algoritmiseen kaupankäyntiin valmistettuja tietokonejärjestelmiä. Oma kysymyksensä on se, millä elämän osa-alueilla tarvitaan vastaavaa varmistusjärjestelmää. Hakukoneiden algoritmit? Verkkokauppojen algoritmit? Morozov alistaisi tälle tarkastelulle erilaiset ennakoivan kontrolloinnin järjestelmät. Sosiaalisen median palvelujen pitäisi määritellä standardit sille, kuinka paljon ne käyttävät ennakoivaa kontrollointia, kuinka pitkälle ne profiloivat käyttäjiään ja mitä dataa jakavat ulkopuolelle, esimerkiksi viranomaisille.

[schema type=”review” url=”http://clickherethebook.com/” rev_name=”To Save Everything, Click Here” author=”Jevgeni Morozov” ]