Linkkari-linkki, sori, mutta tämä julkaisu on kiinnostava.
-
Linkkari-linkki, sori, mutta tämä julkaisu on kiinnostava. Harri Sipola kirjoittaa siitä, miksi yleensä tunnistamme tekoälyn kirjoittaman suomen tekoälyn kirjoittamaksi, vaikka teksti sinänsä olisi teknisesti oikein.
"Englanninkieliset AI-työkalut on koulutettu englanninkielisellä datalla. Kun ne tuottavat suomea, ne soveltavat englannin kirjoituslogiikkaa suomen kielioppiin. Tulos on teknisesti oikeaa, mutta kulttuurisesti vierasta.
Konkreettinen esimerkki: synonyymikierto.
Englannissa samaa sanaa toistetaan harvoin. "Use", "utilize" ja "leverage" kiertävät kehää, koska se on englanniksi tyylikästä. Suomessa tilanne on päinvastainen. Kielitoimiston ohjepankki on tästä suora: toisto on suomen kirjakielessä normaalia. Kielikello täydentää, että synonyymikierto kuulostaa usein keinotekoiselta, koska täydellisiä synonyymejä ei ole olemassa. Kun sanaa vaihtaa väkisin, merkitys liukuu. Suomalainen kirjoittaja toistaa mieluummin saman täsmällisen sanan kuin käyttää epätarkkaa korvaajaa.
Tekoäly ei tätä tiedä. Se kiertää, koska se on opetettu siihen.
Kolme rakennetta, jotka paljastavat koneen
Synonyymikierto on näkyvin ongelma, muttei suinkaan ainoa.
1. Sanajärjestys. Kielikello toteaa suomen sanajärjestyksen olevan melko vapaa. Me käytämme tätä vapautta painottamiseen – siirrämme asioita lauseessa rytmin mukaan. Tekoäly taas nojaa englannin vakiojärjestykseen, koska se on turvallisinta. Teksti toimii, mutta pulssi puuttuu.
2. Partikkelit. Sanat kuten hän, pa, kyllä ja vaan tekevät tekstistä elävää. Vaikka ne kuuluvat normatiiviseen suomeen, tekoäly karsii ne "epämuodollisina". Lopputulos on oikeaoppinen mutta umpipuiseva.
3. Tasapaksu sävy. Tekoäly on yleensä tasaisen innostunut alusta loppuun. Jokainen kappale tulee samalla energialla. Ihminen taas varioi: isot asiat ovat isoja, pienet pieniä. Tämä vaihtelu tekee tekstistä uskottavan."Kiinnostavaa on myös, että Sipola on koonnut havainnoistaan avoimen lähdekoodin työkalun niille, jotka tekoälyä käyttävät kirjoittamisessaan apuna: Finnish Humanizer (miksi nimi englanniksi? :D) "tunnistaa 26 AI-tekstille tyypillistä rakennetta – aina passiivin ylikäytöstä genetiiviketjuihin. Se ei vain korjaa, vaan opastaa purkamaan nämä rakenteet."
-
R ActivityRelay shared this topic