Kirjan Mikä internetiä vaivaa? jälkisanat.
Syksyllä 2017 istuin tietojenkäsittelytieteen luennolla Columbian yliopistolla New Yorkissa. Kurssin aihe oli luonnollisten kielten käsittely, englanniksi “Natural Language Processing” (NLP), ja luento käsitteli sanojen edustamista matematiikan keinoin. Luokan edessä tieteenalan vanhoihin kettuihin lukeutuva Kathleen McKeown esitteli luentokalvoa, jonka otsikko oli “Sanaupotukset ovat magiaa”1. “Ne toimivat, mutta emme ihan ymmärrä miten”, McKeown selitti.
Sanojen matemaattisessa representaatiossa nykykäytäntö perustuu juuri tähän toimivaan mutta hämärään menetelmään: sanaupotuksiin. Sanaupotukset ovat moniulotteisia vektoreita, jotka edustavat sanojen merkityksiä GPT-mallien kaltaisissa neuroverkoissa. Muistan elävästi, miten pääni alkoi pyöriä McKeownin luennolla. Ei siksi, että aihe oli minulle vaikea (mitä se toki oli), vaan siksi, että kielellisten merkitysrakenteiden edustaminen matemaattisena numerosarjana tuntui minusta niin täydellisen vieraalta. Luentokalvoilla McKeown näytti, miten sanaupotukset mahdollistivat sanoilla laskemisen2: kuningas – mies + nainen = kuningatar. Seurasin tätä merkillistä performanssia lumoutuneena. Olinhan itse tottunut ajattelemaan kieltä, diskurssia ja merkitystä melkein täysin laadullisena ja usein varsin intiiminä tutkimuskohteena, jonka syövereihin päästiin pikemminkin Foucault’n ja Derridan opastamana kuin tietojenkäsittelytieteen professorin ohjaamana3. McKeownin luento täytti minut pelonsekaisella ihmetyksellä ja uteliaisuudella. Jos merkitysrakenteet voitiin näin tehokkaasti määrällistää, niin luvassa olisi pian täysin uudenlaisia tieteen, runouden, kirjallisuuden sekä myös hallinnan ja vallan muotoja.
Kuusi vuotta McKeownin luennon jälkeen sanaupotukset ovat ilmestyneet monen ihmisen arkeen joko suoraan ChatGPT:n ja Bardin kaltaisten palveluiden kautta tai välillisesti hakukoneiden, kartta-applikaatioiden ja vastaavien sovellusten myötä. Upotukset ovat nyt kaikkialla, eivät vain kielessä: Spotify-kuunteluja, klikkauksia verkossa, tykkäyksiä deittisovelluksessa ja kaikkia muita sarjoina esiintyviä digitaalisia tapahtumia voi edustaa upotuksin. Näiden palveluiden taustalta löytyvät mallit ovat yleensä moninkertaisesti monimutkaisempia kuin McKeownin luennolla esittelemät vastaavat, mutta moni periaate on sama: tekoäly pohjautuu upotuksiin ja vastaaviin digitaalisiin rakenteisiin, siis magiaan, joka toimii mutta jota emme aivan ymmärrä. Samalla tämän taikuuden aiheuttama äimistys on sen kuin kasvanut.
“Meidän piti vapautua internetin avulla”, Lahtinen ja Purokuru kirjoittavat tämän kirjan johdannossa. Tänään, viimeisimmän kryptokuplan puhjettua, teknologisen vapautuksen evankeliumia julistavat tekoälyn airueet. Lahtisen ja Purokurun kirjaa voi yhtäältä lukea eräänlaisena jälkikirjoituksena avoimelle ja vapaalle internetille ja toisaalta esipuheena tekoälyn tarjoamalle tulevaisuudelle. Nykyisenkaltainen, yksityisvetoinen, palvelinkeskeinen ja suljettuihin malleihin pohjautuva tekoälyn räjähdysmäinen kehitys ei olisi ollut mahdollista ilman viime vuosikymmenen halvan rahan ajamaa oligopolikehitystä digitaalitaloudessa. Alphabetin (Google) ja Metan (Facebook) kaltaisten yritysten omistamat datakeskukset ja grafiikkasuoritinkeskittymät mahdollistivat ensin internetin keskittymisen kouralliseen palveluita ja sitten datan ja laskentatehon keskittymisen muutamaan hallitsevaan ja yksityisomisteiseen tekoälymalliin.
“Ihmisen anatomia on avain apinan anatomiaan”, kuten Marxia on usein lainattu4. Tässä viitekehikossa tekoälyn anatomia on avain internetin anatomiaan. Vasta tänään voimme alkaa hahmottaa 2000-luvulla alkaneen netin palveluiden keskittymisen todellisen merkityksen. Kun Lahtinen ja Purokuru kysyvät, “mikä internetiä vaivaa?”, he johdattavat lukijan usein juuri kohti kysymystä tekoälystä ja sen kouluttamista varten vaadittavasta datasta. Muutaman vuoden päästä kysymys internetistä saattaa olla täysin alisteinen kysymykselle tekoälystä. Kysykäämme siis jo nyt: “Mikä tekoälyä vaivaa?”
Tekoälyä käsittelevässä historiankirjoituksessa erotellaan usein kaksi eri vaihetta: symbolinen tekoäly ja nykyisten mallien “konnektionismi”. Jälkimmäisen esihistoria löydetään yleensä 1940- ja 50-lukujen kybernetiikasta5. Tässä tulkinnassa konnektionismin ensimmäinen aalto sattui kuta kuinkin yksi yhteen kybernetiikan nousun kanssa, kun taas toinen aalto alkoi 1980-luvun lopussa, kun tietokoneiden lisääntynyt laskentateho sekä liuta innovaatioita neuroverkkojen ja tehokkaan differentiaalilaskennan saralla mahdollisti ensimmäisen aallon ideoiden uuden tulemisen.
Kybernetiikan keskeiset innovaatiot tekoälyn kannalta olivat kolmenlaiset. Ensinnäkin, Claude Shannonin informaatioteoria osoitti, että mikä tahansa yksittäinen “tapahtuma” voidaan esittää joukkona “kyllä” tai “ei” -valintoja, eli “bitteinä”, ykkösinä ja nollina6. Toiseksi, ja hieman samaan malliin, Walter Pittsin ja Warren McCullochin yksinkertainen mallinnus aivoista esitti, että monimutkaisetkin matemaattiset funktiot voidaan pelkistää joukoksi yksinkertaisia funktioita7. Kolmanneksi Norbert Wienerin ja hänen kollegoidensa teoria takaisinkytkennästä ja teleologiasta esitti, että ilmiöitä ei tarvinnut ymmärtää syvällisesti, ainoastaan pinnallisesti niiden “inputin” ja “outputin” kautta8,9. Jos järjestelmälle asetetaan tavoite (teleologia) ja sen annetaan yrittää saavuttaa tavoitteensa ja sitten oppia virheistään (takaisinkytkentä), järjestelmä kehittää vähitellen tavoitteen saavuttamiseksi vaadittavat tietorakenteet ja kaaviot10,11.
Kybernetiikan filosofia levisi kulovalkean tavoin. Se vaikutti kirjallisuuteen, yhteiskuntatieteisiin, teolliseen ajatteluun, taloustieteeseen, psykologiaan ja niin edelleen. Tekoälyn osalta kybernetiikan vaikutusvalta jäi aluksi kuitenkin lyhyeksi. Vaikka Shannonin kehittämä bitti mullisti tietojenkäsittelytieteen, kybernetiikan muut perusperiaatteet olivat liian vaativia sen ajan tietokoneille. Uskottavaa tekoälyä niistä ei saanut mitenkään. Usean vuosikymmenen ajan tekoälytutkimus keskittyi takaisinkytkennän ja neuronien sijaan symbolisiin järjestelmiin, joita ohjasivat ennalta-annetut tarkat ohjeet ja loogiset periaatteet.
Konnektionistisen tekoälyn toinen aalto alkoi 1980-luvun lopussa, samaan aikaan kun internet ja kotitietokoneet alkoivat levitä kuluttajamarkkinoille. Tekoälytutkijat 1980-luvun lopussa osoittivat lopulta sen, mitä jo kyberneetikot olivat vihjailleet: yksinkertaisia matemaattisia funktioita monimutkaisesti yhdistelevät neuroverkot pystyvät estimoimaan minkä tahansa monimutkaisen matemaattisen funktion12. Suomeksi sanottuna: yhdistelemällä yksinkertaista matematiikkaa useisiin “kerroksiin” neuroverkot saattavat mallintaa monimutkaista matematiikkaa. Siksi englanniksi neuroverkoista puhutaan termillä “deep learning”, syväoppiminen. Tarpeeksi “syvä” ja leveä neuroverkko pystyisi konnektionismin peruspilareiden mukaan ilmaisemaan minkä tahansa matemaattisen funktion.
Koska kybernetiikka oli jo opettanut läntisen mielen ajattelemaan kaikkia yhteiskunnallisia ilmiöitä juuri funktioina, neuroverkot antoivat lupauksen maailmasta, jossa kaikki oli mallinnettavissa. Kahden vuosikymmenen ajan tämä lupaus oli unelma, jota julistettiin lähinnä tietojenkäsittelytieteen ja matematiikan laitoksilla, mutta viimeistään ChatGPT:n myötä siitä on tullut valtavirtaista ideologiaa. Eliezer Yudkowskyn kaltaiset alarmistit varoittavat kaikkivoipaisen tekoälyn tuhoavan maailman, kun taas loputon liuta hurmoshenkisiä toimitusjohtajia ja tutkijoita alan johtavista yrityksistä lupaa tekoälyn tuovan kaikille paremman maailman.
Sekä hurmosmiehet että alarmistit tuntuvat hahmottavan tekoälyn tavalla, joka muistuttaa ranskalaisen matemaatikon Pierre-Simon Laplacen ajatusleikkiä kaikkitietävästä demonista. Laplacen demoni tunsi maailman kaikkien atomien tarkat paikat ja nopeudet ja osasi siksi ennakoida tulevaisuuden täydellisellä tarkkuudella13. Tekoälystä ennakoidaan nyt kaikkitietävää olentoa, “jumalkatsetta”, joka ei ole missään mutta silti näkee kaiken14. Laplacen ajatuskoetta noudattaen tarpeeksi suurten mallien ajatellaan lähentyvän täydellistä tietämystä ilmiöistä. Maailma näyttäytyy näin gon tai šakin kaltaisena pelinä, joka voidaan lopulta “voittaa” (kuten tekoäly onkin näiden pelien tapauksessa jo tehnyt). Jos 1990-luvun sosiologit vakuuttivat meidät siitä, että elämme “riskiyhteiskunnassa”15, jossa kaikki toimijat yrittävät minimoida riskinsä, niin tekoäly tarjoaa lopullisen ratkaisun tähän ongelmaan. Tekoälyn ohjaamat tietojärjestelmät voivat älypuhelimien ja muiden laitteiden kautta luovuttamamme datan avulla ennakoida kaiken ja minimoida kaikki riskit. Tähän valtavaan vasikointiverkostoon osallistuvat enenevissä määrin myös jääkaapit, autot, lamput ja muut arkiset koneet, jotka ovat nyt “älykkäitä”. Ihmisen anatomia selittää tosiaankin apinan anatomian.
Tämä horisontti tuntuisi masentavalta, jos se olisi uskottava. Mutta missä määrin se on? On tietenkin jo nyt selvää, että tekoäly luo uudenlaisia kauhistuttavia valtaepätasapainoja: Konenäön avustamat droonit pudottavat jo nyt pommeja Lähi-idässä16 ja valvovat mielenosoittajia ympäri maailman17. Kielimallien avustamat botit siivoavat nettiä sopimattomasta ja kielletystä puheesta, mitä ikinä se tarkoittaakaan kussakin yhteiskunnassa18. Neuroverkkoihin pohjautuvat tilastomallit seuraavat työntekijöitä ja mittaavat heidän tehokkuuttaan (Pitääkö työntekijä liikaa taukoja? Käykö hän vessassa epäilyttävän usein?)19. Samalla ajatus Laplacen demonin kaltaisesta tekoälystä on vähintäänkin kyseenalainen.
Yksi kybernetiikan keskeisistä oivalluksista on erottelu järjestelmän ja maailman välillä20. Kybernetiikan viitekehyksessä kullakin järjestelmällä on oma “maailmansa”, joka koostuu kaikista mahdollisuuksista ja olioista, jotka järjestelmä saattaa hahmottaa. Esimerkiksi säätä ennakoivan yksinkertaisen mallin “maailma” voisi olla “pilvistä”, “poutaa” ja “sadetta”. GPT-mallien maailma on moninkertaisesti suurempi mutta silti rajattu. Yksi raja koostuu kaikista kirjaimista ja sanoista, jotka sisältyvät mallin näkemään dataan. Kuvia ja sanoja yhdistelevä “multimodaalinen” malli tunnistaa myös kaikki kolme RGB-väritilaa (punainen, vihreä, sininen) ja kunkin 256:lla eri kirkkaustasolla. Esimerkiksi sateliittien ja lentokoneiden avulla kaukokartoitukseen dataa keräävät kamerat saattavat tuottaa dataa malleille, jotka käyttävät RGB:n lisäksi satoja ihmiskatseen ulottumattomissa olevia väritiloja. Nykypäivän tilastollisten tekoälymallien maailma koostuu siis datasta. Mallin järjestelmä tunnistaa vain sen maailman, joka sisältyy sen näkemään dataan21.
Kuten Purokuru ja Lahtinen korostavat kirjassaan, data ei synny itsestään, vaan se on aina tuotettava. Tieteensosiologiaa lainaten voisimme sanoa, että data vaatii “kääntämistä”22. Aivan kuten englanninkielinen lause voidaan kirjoittaa suomeksi vain käännöstyötä tekemällä, myös datan tuottaminen vaatii oman käännöstyönsä. Kääntäminen taas vaatii tietyn tulkinnan ja tietyn vaivan. Se tapahtuu energian voimin, tietystä näkökulmasta käsin23. Jotta voimme tulkita uusia merkitysrakenteita, meidän on turvauduttava jo olemassa oleviin merkitysrakenteisiimme. Tulkitseminen tapahtuu aina ajassa, menneisyyden valossa ja varjossa. Se on aina väkivaltaista: tietyt asiat korostuvat, toiset hiipuvat ja katoavat24. Joskus kääntäminen on jopa määrätietoista tukahduttamista, kuten silloin kun siirtomaaisäntä kirjoittaa siirtomaan historiaa.
Tekoälytutkimuksen kentällä moni ymmärtää jo näkökulmien moninaisuuden päälle. ChatGPT:n lanseerannut OpenAI julkaisi jo vuonna 2023 monikkomuotoisen “GPTs” palvelun, joka sallii käyttäjien luoda yhteen keskeiseen GPT-malliin pohjautuvia erikoistuneita GPT-malleja. Koneoppimisen saralla suuren mallin “hienosäätäminen” tiettyyn tarkoitukseen, kuten sähköpostien luokitteluun roskaksi tai aidoksi, on jo pitkään ollut vallitseva käytäntö. Nämä näkökulmat ovat kuitenkin aina palautettavissa yhden keskeisen katseen näkökulmaan. Yhden mallin bittien kääntäminen toisen mallin biteiksi on suhteellisen yksinkertaista OpenAI:n tai Googlen kaltaiselle suurelle toimijalle.
Silti tekoälymallien monistuminen tarjoaa jalustan, jolta hahmottaa tulevaisuus muuten kuin Laplacen demonin tyranniana. Mihin siis astuisimme tältä jalustalta? Jotain suuntaviivoja voi hakea 2000-luvun piraattiliikkeestä.
Ennen Spotifyn suoratoistomallia tiedostonjako vertaisverkkojen kautta vaikutti vääjäämättömältä tulevaisuudelta. Kun tekijänoikeusteollisuus onnistui vuonna 2001 tuhoamaan ensimmäisen tiedostonjakopalvelun Napsterin, joukko uusia palveluita korvasi sen heti. Näistä keskeisin, The Pirate Bay, haastettiin oikeuteen tuloksetta. Perustajat tuomittiin sakkoihin tai lyhyisiin vankeusrangaistuksiin, mutta palvelu pysyi silti pystyssä25. Vasta Spotify onnistui haastamaan tiedostonjaon toden teolla26. Suoratoistopalvelu oli helpompi ja kuluttajaystävällisempi. Se tarjosi yksinkertaisen rajapinnan, joka ei vaatinut juuri mitään teknistä ymmärrystä. Toki samalla tiukentunut lainsäädäntö mahdollisti hupenevan tiedostonjakajien joukon kovemman valvonnan. Kuten Lahtinen ja Purokurukin kirjoittavat, kapitalismi toimi kuten kapitalismi aina toimii: kybernetiikan varsinaisena perikuvana, eli valtavana koneena, joka lopulta palauttaa kaikki pakoviivat itseensä, sekä kepillä että porkkanalla.
Tämän kriisin keskellä piraattiliikkeen piirissä alettiin hahmotella vaihtoehtoa silmittömälle tiedostonjaolle. Alkuperäinen tekijänoikeusteollisuudelle keskisormea heilutteleva The Pirate Bay edusti akselerationismia tai “kiihdytysoppia”, joka julisti bittien rajatonta ja yhä kiihtyvää jakamista, vailla huolta laeista tai muista seuraamuksista. Se kaappasi kapitalismin synnyttämän kiinnostuksen ja halun viihteeseen ja kiihdytti sen kympistä sataan. Spotifyin ja muiden suoratoistopalveluiden esiinmarssi aiheutti tiedostonjaon suhteellisen marginalisaation, samalla kuin repression määrä lisääntyi verkossa paitsi “piraatteja” myös uusia poliittisia liikkeitä vastaan. Vaadittiin uusi taktiikka. Kerskailevasta nopeudesta oli siirryttävä varovaiseen hitauteen, salattujen yhteyksien “tunnelipolitiikkaan”. Tunnelipolitiikkaan kuuluu tiedonsiirron salaaminen TOR-verkossa, VPN:llä tai vielä esoteerisimmin keinoin27. Tunnelipolitiikka toki mahdollistaa laittoman tiedonsiirron vertaisverkkoja pitkin, mutta ennen kaikkea se korostaa yksittäisten pienten maailmojen merkitystä. Jos kaiken jakaa avoimesti ja suoraan, tunnelien yhdistämät maailmat romahtavat. Tunnelit on kaivettava huolellisesti ja valikoiden yksittäisten maailmojen välille. Esimerkiksi nykyään kaatuneet What.Cd ja Waffles olivat suljettuja tiedostonjakamispalveluita. Maailmoja, joihin johtavia tunneleita vartioitiin tarkasti.
Kiihdytysopin ja tunnelipolitiikan keskeinen ero kulkee siis paitsi nopeuden myös näkyvyyden akselia pitkin. Kun tiedostonjako vertaisverkkoja pitkin alkoi, valtaosa käyttäjistä julisti IP-osoitettaan eli “identiteettiään” ja sijaintiaan avoimesti. Tunnelipolitiikan aikakaudella jokainen pyrkii olemaan anonyymi ja jakamaan vain valikoidusti tietoja itsestään. Tunnelipolitiikka on nyt jossain määrin valtavirtaa. Edward Snowdenin tietovuoto Yhdysvaltain tiedustelupalvelu NSA:sta loi yksityisyydelle uudenlaista kysyntää, ja nykyään Signalin kaltaisia suojattuja viestipalveluja käyttävät paitsi aktivistit, toimittajat, sotilaat ja valtion virkamiehet, myös monet tavalliset kaduntallaajat. WhatsAppiin on rakennettu jonkinasteinen päästä päähän -salaus, ja jopa oma äitini alkoi ilman vaikutustani käyttää VPN:ää.
Tekoälyn saralla ChatGPT on jossain määrin omaksunut saman roolin kuin Spotify, vaikka vertaus on tehtävä monin varauksin. Ennen viimeisimpiä GPT-malleja kaikki keskeiset mallit, kuten Word2Vec, BERT ja ELMo, olivat avoimia ja niiden upotukset vapaasti ladattavissa. ChatGPT otti tiedeyhteisön (ja toki myös yritysmaailman) oivallukset ja paketoi ne kätevään rajapintaan, jonka parhaat versiot pian muutettiin maksullisiksi. Toisin kuin vielä 2010-luvun lopussa, emme nyt tiedä, millä datalla uusimmat GPT-mallit ja niiden kilpailijat on koulittu, emmekä voi ladata omaan käyttöömme mallien upotuksia ja muita “painoja”. Kun haluamme hienosäätää malleja, se tapahtuu OpenAI:n maksullisilla alustoilla. Jos Spotify otti musiikillisen yhteisvarallisuutemme ja paketoi sen maksulliseen palveluun, ChatGPT menee vielä paljon pidemmälle. Se paketoi jaetun yhteisälymme ja myy sen meille takaisin kätevänä palveluna.
Tekoälyn anatomia asettaakin sekä kiihdytysopin että tunnelipolitiikan uuteen valoon. 2000-luvun kiihdytystä edustivat myös sellaiset sivustot kuten Wikipedia ja vuonna 2008 (pääosin) lähdekoodin avoimeen jakamiseen perustettu GitHub28. Molempien sisältämä data on ollut keskeisessä asemassa GPT:n kaltaisten suurten kielimallien koulimisessa. Kun internet 2000-luvun lopussa alkoi sulkeutua Facebookin ja vähitellen muiden suurten sosiaalisen median alustojen ympärille, myös nämä säilyttivät vielä pitkään avoimia ohjelmointirajapintoja (API), joiden kautta palvelujen dataa saattoi ladata (näin syntyi muun muassa Cambridge Analytica -skandaali, kuten Lahtinen ja Purokuru kertovat luvussa “Hämärä tietokanta”). Myös tämä data on keskeisesti pohjustanut usean GPT-sukupolven ja vastaavien mallien kehittämistä. Vaikka laiton tiedostonjako ajautui jossain määrin marginaaliin 2010-luvulla ja netti keskittyi muutaman suureen some-alustaan, tekoälytutkimus jatkoi kaikessa hiljaisuudessa kiihdyttämistä. Vuonna 2023 sekä Twitter että Reddit sulkivat ohjelmointirajapintansa maksumuurien taakse, mikä saattoi Spotifyn ja suurten some-alustojen aloittaman avoimen verkon vastaisen kumouksen uuteen lakipisteeseen. Alunperin avoimien mallien kehittämiseen perustettu OpenAI on, ironista kyllä, johtanut tätä kehitystä sekä sulkemalla mallien kehityksen että provosoimalla muita isoja alustoja varjelemaan tarkemmin omaa dataansa, joka yhtäkkiä näyttäytyy mallien kouluttamiseen kelpaavana tarkoin varjeltavana resurssina. 2000-luvun internetapinan anatomia esiintyy näin uudessa valossa.
Kun historiaa tarkastelee näin, uudeksi vedenjakajaksi nousevat juurikin neuroverkkojen painot ja upotukset. Niissä informaatio tiivistyy “hämäriin” vektorirakenteisiin, jotka näyttäytyvät ihmisille maagisina riimuina vailla selvää merkitystä mutta jotka voivat siivittää älykkään algoritmin kirjoittamaan proosaa tai ennustamaan pörssikehityksiä29. Marxin kapitalismianalyysia noudattaen kiihdyttäminen on myös kaiken konkreettisen muuttamista abstraktiksi30. Upotukset ovat merkitysrakenteiden korkeinta abstrahointitasoa, tiivistetty osatotuus kielestä, kuvista ja kaikista muista ilmiöistä, joiden mallintamiseen niitä käytetään. 2020-luvun kiihdytysoppi ja tunnelipolitiikka käydään tällä abstrahointitasolla31.
Upotusten sulkeminen yksityiseen omistukseen todennäköisesti hidastaa tekoälyn kehitystä pitkällä aikajänteellä. Esimerkiksi OpenAI pyrkii (pääosin varsin hyvin perusteluin) puhdistamaan malleistaan rasistista tai muuten epäsopivaa kieltä. Nämä rajoitteet ovat joidenkin tutkimusten mukaan kuitenkin menneet niin pitkälle, että mallien suorituskyky eri osa-alueilla on jo heikentynyt32. Vielä olennaisempaa on, että mallien kehittelyn rajaaminen yhden yrityksen sisään vähentää niihin käytettyä työaikaa sekä heikentää innovaatioita muiden mallien parissa, kun OpenAI:n sisällä saatuja oivalluksia ei voida jakaa laajemmalle tieteelliselle yhteisölle. Siksi tämän päivän kiihdytysoppia edustavat pikemminkin pyrkimykset kehittää avointa ja estotonta tekoälyä. Näiden pyrkimysten priimusmoottorina on toiminut, kenties hieman yllättäen, Facebookin omistavan Metan johtava tekoälytutkija Yann LeCun sekä Hugging Facen33 kaltaiset avoimia malleja kehittävät ja alustavat yritykset. Metan Llama-malli ja sen eri kokoiset johdannaismallit sekä liuta muita avoimia malleja kilpailevat tehokkuudessa jo OpenAI:n ja Googlen parhaimpien mallien kanssa34.
Avoimen tekoälyn kiihdytysoppi myös puoltaa näkökulmien moninaisuutta. Kun malleja on moneen lähtöön ja kuka tahansa voi jatkokehitellä ja hienosäätää niitä, yksikään malli ei edusta lopullista totuutta. Avoimeen kehittelyyn myös kuuluu mallien tuottaminen eri kokoluokissa, joista yhä useampi toimii kannettavalla tietokoneella tai älypuhelimella paikallisesti. Tässä kohtaa kiihdytysoppi yhtyy tunnelipolitiikkaan. Kun tekoälyä voi hyödyntää paikallisella laitteella vailla verkkoyhteyttä isolla palvelimella pyörivään malliin, Laplacen demonilta katkotaan siivet. Maailma monistuu ja hajoaa useaan fragmenttiin. Dataa voi kerätä ja tulkita täysin paikallisesti, jos niin haluaa. Pian saatamme syöksyä huimaavaa vauhtia eteenpäin, kukin omissa tunneleissamme.
Tämä tulevaisuus ei kuitenkaan ole todennäköinen, saatikka välttämättä kovin toivottava – ainakaan varauksettomasti. OpenAI ja Google toivovat taatusti osaltaan maailmaa, jossa paikalliset mallit ovat jatkuvassa vuorovaikutuksessa keskitettyjen mallien kautta. Vain näin paikalliset opetukset jakautuvat yleiseen tietoisuuteen. Jos esimerkiksi Google Maps ennakoisi liikennettä täysin paikallisesti, emme saisi mitään dataa ruuhkista ja vastaavista yhteisen liikkeen tuottamista ilmiöistä. Kuka sellaista palvelua käyttäisi? Jos uutiset ja kaikki informaatio olisi räätälöity sopimaan täysin meidän yksilölliseen dataprofiiliimme, maailma todella hajoaisi täysin sellaisiin yksilöllisiin “filtterikupliin”, joista on jo pitkään varoitettu35. Kuka sitä aidosti toivoisi? Keskustan ja periferian yhteys tulee siis jatkossakin olemaan tiivis, mikäli nykyiset markkinajohtajat saavat asiasta päättää. Samoin valtaosa kuluttajista valitsisi varmasti palvelut, jotka lyövät laudalta periferiaan eristäytyvän näpertelyn.
Miten siis vältymme Laplacen demonilta, jos emme halua sulkeutua täysin yksilölliseen todellisuuteen? Marxilaisen poliittisen talouden termein voisimme sanoa, että palvelimella pyörivä ylivoimainen tekoäly edustaa keskustan täydellistä tyranniaa yli periferian, kun taas täysin yksilöllinen tekoäly edustaa periferian totaalista irtautumista keskustasta36. Kuten monessa siirtomaassa aikoinaan, keskusta saattaa saada täyden ylivallan. Koska vektorirakenteiden tuottaminen vaatii äärettömän määrän dataa ja niiden tulkitseminen älyttömän määrän grafiikkasuorittimia, älyllinen yhteisvarallisuutemme muuttuu käytännössä suljetuksi. Elon Muskin Starlinkin tarjoama sateliitti-internet keskittää netin ja samalla palvelinpohjaisen tekoälyn infrastruktuuria entisestään. Se viitoittaa tietä kohti tulevaisuutta, jossa pilvipalveluihin kuljetaan tähtien kautta.
Kybernetiikkaa käsittelevissä kirjoituksissaan ranskalainen Tiqqun-kollektiivi peräänkuulutti 2000-luvun alussa “offensiivisen läpinäkymättömyyden alueita”37. Täydellisen irtaantumisen sijaan tällaiselle alueelle informaatio kyllä virtaisi sisään mutta pysyisi piilossa keskitetyltä katseelta. Kuten mustan tietyt sävyt, offensiivinen läpinäkymättömyys nielee runsaasti valoa mutta heijastaa sitä hyvin vähän. Kysymys kuuluu siis: miten voimme ottaa tekoälyltä luovuttamatta sille kuitenkaan itseämme? Miten voimme oppia tekoälyltä luovuttamatta sen maailmalle omia, moninaisia maailmojamme?
Salausteknologian piirissä on viime aikoina tapahtunut paljon edistysaskelia, joiden myötä keskitettyjä palveluita voi käyttää paljastamatta niille kuitenkaan itsestään olennaisesti (differentiaalinen yksityisyys38) tai yhtään (homomorfinen salaus39) mitään. Näillä työkaluilla voimme siis pyytää tietoja palvelimelta paljastamatta palvelimelle, mitä pyydämme, tai edes, mitä sen pitäisi meille palauttaa. Vaikka poliittisten ratkaisujen etsiminen teknologiasta on aina riskialtista, nämä uudet tekniikat tuntuvat avaavan myös uuden poliittisen horisontin. Se kutsuu meitä kehittelemään “etäisyyksien taitoa”, valjastamaan tekoälyn ja sen luomat tietorakenteet antamatta sen kuitenkaan täysin valjastaa meitä.
Offensiivisen läpinäkymättömyyden alueet eivät ole yksilöllisiä kuplia vaan yhteisiä salaisuuksia ja kollektiivisia yksityisyyksiä. Ne voivat perustua tekniseen salaukseen (eli kryptografiaan) tai jaettuihin totuuksiin, jotka eivät mitenkään käänny keskitetyn vallan kielelle40. Offensiivisen läpinäkymättömyyden alueet käyttävät keskustaa, mutta ne eivät ole keskustan käytettävissä. Tietyt alakulttuurit, rikolliset, valtakulttuurin varjossa elävät etniset yhteisöt, hakkerit ja muut vastaavat ryhmät ymmärtävät läpinäkymättömyyttä paremmin kuin muut vaikkeivät aina mieltäisi sitä offensiivisena. Silti tavoite ei voi olla läpinäkymättömyys marginaalisena ilmiönä vaan yleisenä normina. Läpinäkymättömyys on toden teolla “offensiivista” vain, jos se kuuluu kaikille.
Mikä tekoälyä siis vaivaa? Ei suinkaan maailman määrällistäminen biteiksi, sen ymmärtäminen kybernetiikan kaltoin funktioina tai edes vastauksien etsiminen tilastorakenteista ja takaisinsyötteistä. Tekoälyä vaivaa taipumus selittää kaikki ei-mistään käsin, taipumus kaapata kaikki käännösvalta yhdelle tai harvalle mallille. Tekoälyä vaivaa taipumus kääntää kaikki kielet yhdelle ainoalle kielelle, joka tulee vääjäämättä olemaan vallan kieli41. Maaginen musta laatikko, joka määrää meitä antamatta meille muuta kuin nimellistä määräysvaltaa omaan elämäämme. Kun yhä kasvava osa internetin sisällöstä ilmaistaan tällä kielellä, maailma muuttuu kirjaimellisesti pienemmäksi42.
Haastaaksemme tämän kehityksen meidän ei tule sulkea korviamme tekoälyn kieleltä vaan oppia se ja hyödyntää sitä luovuttamatta sille kuitenkaan itseämme. Meidän tulee kaivaa uudenlaisia tunneleita, joihin tekoälyn valo kyllä kajastaa mutta joissa itse pysymme piilossa. Offensiivinen läpinäkymättömyys kääntää tekoälyn itseään vastaan ja valjastaa sen avoimuuden sijaan salaukseen. Se tulee vaatimaan uudenlaista teknologista lukutaitoa, uudenlaisia innovaatioita ja avoimuutta sekä salaukselle että datalle. Panoptisen ja panspektrisen katseen levitessä arjen joka sopukkaan muistakaamme, ettei se koskaan tule tavoittamaan todellisuuden kaikkia sävyjä, niin kauan kuin emme suostu luovuttamaan todellisuutta sille. Kysykäämme siis: Miten läpinäkymättömyys voi kuulua kaikille? Miten tekoäly voisi palvella monia maailmoja, yhden keskitetyn maailman sijaan? Kenties tarjoamalla läpinäkymättömyyttä uutena universaalina oikeutena ja kykynä maailma voisi, paradoksaalista kyllä, jälleen kadota sirpaleisiin, joita kukaan ei väitä tuntevansa yhdestä universaalista näkökulmasta käsin.
Kirjoittajasta
Mikael Brunila on Montrealissa asuva tutkija, joka viimeistelee tekoälyä ja tilallisuutta käsittelevää väitöskirjaansa. Hän on aikaisemmin ollut mukana kirjoittamassa kirjoja Muutaman töhryn tähden (Into 2011), Äärioikeisto Suomessa (Into 2012), Verkko suljettu (Into 2014) ja Kuulumme toisillemme (Khaos 2023). Hänen akateemista tutkimustaan on julkaistu kieliteknologian (EMNLP, NAACL) ja maantieteen (JAPA, GIScience, Transactions in GIS) kärkijulkaisuissa. Akateemisen työnsä ohella Brunila on ollut perustamassa yhteisöllistä teknologialeiriä sekä suojattuja karttapalveluja tarjoavaa Drift-applikaatiota. 2000-luvulla Brunila oli Helsingin talonvaltausliikkeen kautta mukana organisoimassa tiedostonjaon vastaisiin oikeudenkäynteihin liittyvää solidaarisuustoimintaa.
Viitteet
- Alkuperäinen englanninkielinen otsikko oli “Embeddings are magic”. McKeown, K. (2017). Distributional Semantics and Word Embeddings. CS 4705: Introduction to Natural Language Processing. Columbia University. http://www.cs.columbia.edu/~kathy/NLP/2017/ClassSlides/Class15-WordEmbeddings/WordEmbeddings_class.pdf
- Esimerkki on alunperin seuraavasta artikkelista: Pennington, J., Socher, R., & Manning, C. (2014). Glove: Global Vectors for Word Representation. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 1532–1543. https://doi.org/10.3115/v1/D14-1162
- Tosin myös Foucault’n ja Derridan edustama ranskalainen teoria on ammentanut valtavasti siitä kyberneettisestä perinteestä, josta myös nykyinen tekoälytutkimus kumpuaa. Ks. Geoghegan, B. D. (2023). Code: From Information Theory to French Theory. Duke University Press.
- Marx, K. (1986 [1858]). Vuosien 1857–1858 taloudelliset käsikirjoitukset (»Grundrisse»). Suomentanut Antero Tiusanen. Kustannusliike Edistys. https://www.marxists.org/suomi/marx-engels/1858/grundrisse
- Ks. esim Russell, S. J., & Norvig, P. (2020). Artificial Intelligence: A Modern Approach (4th edition). Pearson. http://aima.cs.berkeley.edu
- Shannonin kaksi keskeistä artikkelia aiheesta on koottu kirjaan, johon sisältyy myös Warren Weaverin varsin helppotajuinen johdanto: Shannon, C. E., & Weaver, W. (1963). The Mathematical Theory of Communication (First paperback edition). University of Illinois Press.
- “[F]or any logical expression satisfying certain conditions, one can find a net behaving in the fashion it describes”. McCulloch, W. S., & Pitts, W. (1943). “A logical calculus of the ideas immanent in nervous activity”. The Bulletin of Mathematical Biophysics, 5(4), 115–133. https://doi.org/10.1007/BF02478259
- Wiener, N. (1948). Cybernetics or Control and Communication in the Animal and the Machine. MIT Press.
- Rosenblueth, A., Wiener, N., & Bigelow, J. (1943). “Behavior, Purpose and Teleology”. Philosophy of Science, 10(1), 18–24. https://doi.org/10.1086/286788
- Yksi oivallinen johdanto kybernetiikan historiaan löytyy kirjasta Kline, R. (2015). The Cybernetics Moment. Johns Hopkins University Press. https://doi.org/10.1353/book.40478
- Matteo Pasquinellin mukaan kybernetiikan aikaan sattunut mullistus voidaan ymmärtää sekä numeroinnin että laskennan algoritmisoitumisena. Pasquinelli, M. (2023). The Eye of the Master. A Social History of Artificial Intelligence. Verso.
- Tarkkaan ottaen väitettiin: “[S]tandard multilayer feedforward networks with as few as one hidden layer using arbitrary squashing functions ure capable of approximating any Borel measurable function from one finite dimensional space to another to any desired degree of accuracy, provided sufficiently many hidden units are available.” Hornik, K., Stinchcombe, M., & White, H. (1989). “Multilayer feedforward networks are universal approximators”. Neural Networks, 2(5), 359–366. https://doi.org/10.1016/0893-6080(89)90020-8
- Luen tässä Laplacea Henri Bergsonin kriittisen tulkinnan kautta. Bergson, H. (1998). Creative Evolution. Dover.
- Se toimii siis kuten Donna Haraway on kuvaillut. Haraway, D. (1988). “Situated Knowledges: The Science Question in Feminism and the Privilege of Partial Perspective”. Feminist Studies, 14(3), 575. https://doi.org/10.2307/3178066
- Beck, U. (1992). Risk society. Towards a new modernity. Sage Publications.
- Ks. esim. Davies, H., McKernan, B. & D. Sabbagh (2023). ‘The Gospel’: how Israel uses AI to select bombing targets in Gaza” The Guardian. 1.12.2023. https://www.theguardian.com/world/2023/dec/01/the-gospel-how-israel-uses-ai-to-select-bombing-targets
- Ks. esim. Lyons, K. (2021). “Use of Clearview AI facial recognition tech spiked as law enforcement seeks to identify Capitol mob”. The Verge, 10.1.2021.
https://www.theverge.com/2021/1/10/22223349/clearview-ai-facial-recognition-law-enforcement-capitol-rioters - Ks. esim. Funk, A., Shahbaz, A. & K. Vesteinsson (2023). AI Chatbots Are Learning to Spout Authoritarian Propaganda. Wired, 4.10.2023.
- Ks. esim. Cater, L. & M. Heikkilä (2021). “Your boss is watching: How AI-powered surveillance rules the workplace. Politico, 21.5.2021. https://www.politico.eu/article/ai-workplace-surveillance-facial-recognition-software-gdpr-privacy/
- Ks. esim Luhmann, N. (1995). Social Systems (D. Baecker & J. Bednarz, Trans.). Stanford University Press.
- Kriittisen tekoälytutkimuksen piirissä moderni klassikko aiheesta on Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). “On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜” Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, 610–623. https://doi.org/10.1145/3442188.3445922
- Callon, M. (1984). Some elements of a sociology of translation: Domestication of the scallops and the fishermen of St Brieuc Bay. The Sociological Review, 32(S1), 196–233. https://doi.org/10.1111/j.1467-954X.1984.tb00113.x
- Reddy, M. (1993). The conduit metaphor. In Metaphor and thought (2nd ed., pp. 164–201). Cambridge University Press.
- Tsing, A. L. (2015). The Mushroom at the End of the World—On the Possibility of Life in Capitalist Ruins. Princeton University Press.
- Tosin The Pirate Bayn luonne muuttui oikeudenkäynnin seurauksena huomattavasti, ja monet tekevän siksi eron “alkuperäisen” ja oikeudenkäynnin jälkeisen sivuston välille.
- Suomeksi tämä historia on kerrattu hyvin tekstissä Fleicher, R. (2014). Vastavallankumous. Teoksessa Brunila, M. & K. Kallio (toim.) Verkko suljettu. Internet ja avoimuuden rajat. Into Kustannus.
- Tarkemman selonteon kiihdytysopin ja tunnelipolitiikan suhteesta voi lukea seuraavasta tekstistä: Brunila, M. (2014). Runsauden räjähdys – internet hakutalouden jälkeen. Teoksessa Brunila, M. & K. Kallio (toim.) Verkko suljettu. Internet ja avoimuuden rajat. Into Kustannus.
- Palvelut edustavat kiihdytysoppia siinä mielessä, että ne pyrkivät vapauttamaan ja nopeuttamaan tiedon kiertoa. Ne eivät kuitenkaan edusta kiihdytysoppia siinä huimapäisessä ja varomattomassa mielessä kuin alkuperäinen The Pirate Bay.
- Gilles Deleuzeä seuraten voisimme sanoa, että kielestä tulee sisältöä upotusten ilmaisulle. Noam Chomskyn väitöskirjaohjaajaa, kielitieteilijä Zellig Harrisia mukaillen voisimme sen lisäksi sanoa, että upotukset ilmenevät näin metakielenä, jonka kohteena on luonnollinen kieli ja muut ihmisten tuottamat merkitysrakenteet. Ks. esim. Deleuze, G. (1999). Foucault. Continuum. Harris, Z. S. (1988). Language and information. Columbia University Press. Brunila, M., & LaViolette, J. (2022). “What company do words keep? Revisiting the distributional semantics of J.R. Firth & Zellig Harris”. Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 4403–4417. https://aclanthology.org/2022.naacl-main.327
- Marx, K. (1974). Pääoma, 1. osa. Suomennos O. W. Louhivuori. Kustannusliike Edistys. https://www.marxists.org/suomi/marx-engels/1867/paaoma1/index.htm
- Googlen DeepMindin ja Metan tutkijat totesivatkin vastikään, että “kielimallit ovat kompressiota”. Ks. Delétang, G., Ruoss, A., Duquenne, P.-A., Catt, E., Genewein, T., Mattern, C., Grau-Moya, J., Wenliang, L. K., Aitchison, M., Orseau, L., Hutter, M., & Veness, J. (2023). “Language Modeling Is Compression” (arXiv:2309.10668). arXiv. https://doi.org/10.48550/arXiv.2309.10668
- Chen, L., Zaharia, M., & Zou, J. (2023). How is ChatGPT’s behavior changing over time? (arXiv:2307.09009). arXiv. https://doi.org/10.48550/arXiv.2307.09009
- https://huggingface.co
- Ks. esim Touvron, H., Martin, L., Stone, K., Albert, P., Almahairi, A., Babaei, Y., Bashlykov, N., Batra, S., Bhargava, P., Bhosale, S., Bikel, D., Blecher, L., Ferrer, C. C., Chen, M., Cucurull, G., Esiobu, D., Fernandes, J., Fu, J., Fu, W., … Scialom, T. (2023). “Llama 2: Open Foundation and Fine-Tuned Chat Models” (arXiv:2307.09288). arXiv. https://doi.org/10.48550/arXiv.2307.09288
- Pariser, E. (2011). The Filter Bubble: How the new personalized web is changing what we read and how we think. Penguin.
- Ks. esim. Smith, N. (2008). Uneven development: Nature, capital, and the production of space. University of Georgia Press.
- Ks. esim. Tiqqun. (2020). The Cybernetic Hypothesis. Semiotext(e). MIT Press.
- Yksi monesta katsauksesta aiheeseen löytyy artikkelista Yang, M., Guo, T., Zhu, T., Tjuawinata, I., Zhao, J., & Lam, K.-Y. (2024). Local differential privacy and its applications: A comprehensive survey. Computer Standards & Interfaces, 89, 103827. https://doi.org/10.1016/j.csi.2023.103827
- Yksi lupaava protokolla löytyy artikkelista Menon, S. J., & Wu, D. J. (2022). Spiral: Fast, High-Rate Single-Server PIR via FHE Composition (2022/368). Cryptology ePrint Archive. https://eprint.iacr.org/2022/368
- Pohdin tätä kysymystä runouden näkökulmasta tekoälyä käsittelevässä esseemuotoisessa kirjeessäni “16.2.2020–19.2.2023, Montreal”. Teoksessa Brunila, M., Saarinen, V. & V. Sandell (2023). Kuulumme toisillemme. Kirjeitä ja kirjoituksia ystävyyden politiikasta. Khaos Publishing.
- Pasquinelli lähestyy asiaa hieman samoin kirjoittaessaan tekoälystä “vallan katseena”. Ks. Pasquinelli (2023).
- Kesällä 2023 julkaistussa tutkimuksessa todettiin, että tekoälyn tuottamalla sisällöllä koulittu tekoälymalli tuottaa yhä suppeampaa sisältöä. Jos tulevaisuuden GPT-10 esimerkiksi koulittaisiin viiden sukupolven tekoälysisällöllä, mallin ulosanti olisi hyvin kapeaa ja “normatiivista”. Shumailov, I., Shumaylov, Z., Zhao, Y., Gal, Y., Papernot, N., & Anderson, R. (2023). The Curse of Recursion: Training on Generated Data Makes Models Forget (arXiv:2305.17493). arXiv. https://doi.org/10.48550/arXiv.2305.17493