Tuore päivitys OpenAI:n tekoälypalveluun GPT4 mahdollistaa räätälöityjen chatbottien tekemisen ihan vain antamalla toimintaohjeita tai lataamalla tietoaineistoa, jonka perusteella chatbot sitten vastailee kysymyksiin. Tein kokeilun taannoin kirjoittamani Opettajan tekijänoikeusopas -kirjan kanssa. Tässä kokemukset.
Lyhyesti: Laatimani kirjan sisältöön perustuva tekoäly selvästi perustaa vastauksensa sille annettuun kirjan käsikirjoitukseen. Jos käyttäisin bottia sellaisen kirjan kanssa, jonka olen itse lukenut, vastaukset vaikuttaisivat luultavasti erinomaisilta. Mutta kirjan kirjoittajana tunnen aiheen niin hyvin, että näen vastausten puutteet.
Tekoälyn antamien vastausten taso vastaa henkilöä, joka on lukenut kirjan varsin hyvin, mutta ei ole ihan ymmärtänyt, miten eri asiat vaikuttavat toisiinsa. Annetut neuvot ovat sisältävät oikeita asioita, mutta valitettavasti niistä puuttuu monesti jotain tai jotkin asiat on oikaistu liian suoriksi.
Oman GPT:n kouluttaminen
Oman chatbotin voi rakentaa, kun maksaa OpenAI:lle premium-tason tekoälystä, joka tätä kirjoitettaessa kustantaa 20€/kk+alv. Chatbotin voi myös jakaa muille joko linkillä tai julkisesti, mutta kaikkien käyttäjien on samoin oltava premium-tilaajia.
Chatbotin voi rakentaa vastailemalla kysymyksiin tai sitten syöttämällä joitain tietoja ihan lomakkeeseen. Tein yhdistelmän molempia. Valitsin botille nimen ja syötin kirjani käsikirjoituksen PDF-muodossa. Lisäksi juttelin botin kanssa kun se kyseli vastailutyyliä ja sellaista. Koko tähän prosessiin meni noin 8 minuuttia.
Valitsin lisäasetuksista vaihtoehdon, jossa chatbottini tekemisiä ei käytetä OpenAI:n koulutusaineistona. Tämä estää, että käsikirjoitus imuroitaisiin OpenAI:n yleisempään käsittelyyn. Samoin kytkin pois kuvatoiminnot sekä netin hakutoiminnot, jotta vastaukset pohjautuvat vain ja ainoastaan kirjassa oleviin tietoihin.
Tuloksia
Testasin omaa bottiani useammalla tekijänoikeuskysymyksellä. Heitin samat kysymykset myös normaalille GPT4:lle ja vertasin vastauksia.
Aloitetaan hankalalla: Saako Youtube-videoita esittää opetuksessa?
Tämä kysymys on vaikea, koska lakitilanne on Suomessa ollut (aina viime kevääseen asti) tosi rikki ja epäselvä. Tämä on käyty läpi myös kirjassa. Alla kuvissa Opettajan tekijänoikeus -botin sekä yleisen GPT4:n vastaukset.
Oman botin vastaus on mukavan tiivis ja antaa suoria vastauksia. Teknisesti vastaus on oikein, mutta se tärkeä kysymys elokuvamaisista videoista on vasta kolmannessa virkkeessä ja ensimmäinen virke lupaa liikoja. Luultavasti harhauttaa lukijaa.
Yleinen GPT4 vastaa pitkästi ja ympäripyöreästi. Se puhuu YouTuben ehdoista, mutta ei mitenkään ota kantaa Suomen lainsäädäntöön. Vastaus on puutteellinen ja melko hyödytön.
Helpompi: Voiko oppilaan tekemän piirustuksen julkaista koulun verkkosivuila?
Tähän on selkeä oikea vastaus: Oppilaan (ja huoltajan) lupa tarvitaan, ihan isyysoikeuden perusteella. Miten tekoäly pärjää?
Oma botti puhuu vain oppilaan nimestä ja kuvattujen luvista, eli käsittelee oppilaita sisältävän valokuvan julkaisun rajoituksia. Toisaalta, tarkistettuani kirjani sisällön, eipä tätä oppilaan tekemän teoksen julkaisua kirjassa käsitelty, joten sinänsä ymmärrettävää ettei se tule vastaukseen mukaan. Touché.
Yleinen GPT4 vastaa varsin hyvin.
Keskitasoa: Missä tilanteissa voin kopioida netistä kuvan osaksi opetusmateriaaliani?
Tämä on aika tyypillinen kysymys ja vastaus on monipolvinen. Lähtökohtaisesti avoin lisenssi tai teoskynnyksen alittuminen sallivat kuvan käytön. Muuten apuna on oppilaitosten kopiointilupa (joka ei vielä kirjan kirjoitushetkellä koskenut verkon kuvien käyttöä, joten sitä ei kirjassa mainittu) tai sitten yksityistilanteeseen vetoaminen (joka on aika heikko käsi pelata).
Oma botti antoi tiiviin ja pääosin oikean vastauksen, mutta aloittaa taas vastauksensa vähän liian laajalla “yleisesti ottaen melko sallittua”, joka harhauttaa kysyjän. Kaksi seuraavaa tilannetta ovat aivan oikein ja konkreettisesti kuvattuja. Loppukaneetti on sisältää oikeanlaisia varoituksia, mutta huonosti muotoiltuna.
Yleinen GPT4 antaa samat kaksi selkeää tilannetta ja lisäksi puhuu amerikkalaisesta fair use -periaatteesta (joka ei tietenkään Suomessa päde). Jatkokysymyksellä pyydän vastaamaan Suomen näkökulmasta. Nyt fair use jää pois ja vastaukset ovat sinänsä oikeista aiheista. Toinen vastauskohta on kuitenkin aika sekavaa puuroa. Vastaukset ovat yleisellä tasolla ja sinänsä hyviä muistutuksia asioista, joista olisi oltava tietoinen, mutta ohjeet eivät ole kovin konkreettisia, mikä on GPT:lle aika tavanomaista.
Loppupäätelmä
Kirjan käsikirjoituksesta rakennettu oma chatbot on todella helppo rakentaa ja toimii melko hyvin. Jos olisin tehnyt kokeilun jonkun muun tuottamalla PDF-kirjalla, olisin lukijana luultavasti tosi tyytyväinen vastauksiin. Kyselen kirjan sisällöstä ja saan osuvia, selvästi aiheeseen ja kirjaan pohjautuvia vastauksia. Näyttäisi menevän oikein…
Mutta kun olen itse kirjan kirjoittanut, pystyn näkemään, että tekoälyn analyysi kirjasta ei ole pystynyt säilyttämään eri seikkojen tasapainoa ja että vastaukset voivat johtaa kysyjää harhaan yksinkertaistamalla asioita liiaksi.
Luultavasti on mahdollista jatkokouluttaa omaa bottia pidemmälle, antamalla lisäohjeita vastaustyylistä ja tekemällä lukuisia kysymyksiä ja antamalla palautetta saaduista vastauksista. Tämä lisäkoulutus on kuitenkin jo ihan eri kertaluokan työmäärä.
Monien viljelemä lupaus siitä, että GPT4 pystyisi noin vain ilman lisätyötä juttelemaan tietyn kirjan sisällöstä luotettavasti ja faktoja tiputtelematta ei näytä pitävän paikkaansa.
PS. Jos alkoi mietityttää nämä opetuksen tekijänoikeusasiat, suuntaa Opettajan tekijänoikeusoppaan blogiin hakemaan ne oikeat vastaukset.
Leave a Reply