Kalervo Järvelinille arvostettu tiedonhauntutkimuksen palkinto

Julkaistu 25.10.2018 - 11:22
Kalervo Järvelin/ Kuva: Jonne Renvall
Emeritusprofessori Kalervo Järvelin on uransa aikana ollut mukana tiedonhaun tutkimuksen ja tekniikan mullistuksissa. Nyt hänet on palkittu arvostetulla kansainvälisellä Gerard Salton -palkinnolla.

 

Teksti: Jaakko Kinnunen
Kuva: Jonne Renvall

Emeritusprofessori Kalervo Järvelinille on myönnetty kansainvälinen Gerard Salton -palkinto hänen merkittävistä ansioistaan tiedonhaun tutkimuksessa. Palkinnon myöntää kansainvälinen tiedonhaun tutkimuksen järjestö SIGIR, joka on edistänyt alan koulutusta ja kehitystyötä vuodesta 1963 lähtien.

Gerard Salton -palkinto jaetaan joka kolmas vuosi. Palkinto myönnetään tutkijalle, joka on antanut merkittäviä ja jatkuvia kontribuutioita tiedonhaun tutkimuksen alalla. Kyseessä on tieteenalan merkittävin kansainvälinen palkinto.

Palkinnon perusteissa todetaan, että Järvelin on tehnyt useita olennaisia kontribuutioita tiedonhaun ja hankinnan tutkimuksen aloilla, erityisesti vuorovaikutteisen ja tehtäväperustaisen tiedonhaun sekä evaluointimetriikoiden ja –mallien aloilla. Professori Järvelinin kontribuutiot sisältävät yhden kaikkein laajimmin tiedonhaun evaluoinnissa käytetyistä mittareista.

Entistä tarkempia
hakutuloksia

Järvelinin tutkimustyön merkittävin panostus liittyy hakutulosten evaluointimenetelmien kehittämiseen.

– Jos lähetät kyselyn hakukoneelle, kuinka hyvä saamasi vastaus on? Hyvä vastaus on sellainen, että haluamasi tieto löytyisi mahdollisimman läheltä hakutulosten kärkeä, Järvelin toteaa.

Yksinkertaisissa kysymyksissä hakukoneen tarjoaman vastauksen tarkkuuden arviointi on helppoa. Jos hakukonetta käyttävä ihminen tiedustelee Mount Everestin korkeutta, hyvä hakukone tarjoaa ensimmäisenä vastausvaihtoehtona oikean metriluvun. Mutta jos henkilö haluaakin tietää ahtaajien lakon vaikutuksesta Suomen talouteen, tilanne muuttuu haastavammaksi. Monimutkaiseen kysymykseen ei ole yhtä selkeää vastausta vaan useita eri näkökulmia ja faktoja: hakukoneen täytyisi osata kerätä kaikki olennainen tieto hakutulosten kärkeen.

– Kysymys on siitä, kuinka voimme mitata, onko hakukoneen tarjoama vastaus hyvä vai ei. Osa vastauksista voi olla täysin vääriä, osa marginaalisia ja osa olennaisia, Järvelin sanoo.

Järvelinin tutkimusryhmä Tampereen yliopistolla on kehittänyt tämän kysymyksen arviointiin algoritmin, joka kykenee pisteyttämään hakukoneen tarjoamat vastausvaihtoehdot. Algoritmin avulla hakukoneita voidaan kehittää tarjoamaan entistä parempia hakutuloksia.

– Algoritmia käyttävät kaikki maailman suuret hakukoneyritykset. Menetelmään on viitattu yli 3 000 kertaa Google Scholarissa. Ensimmäinen versio menetelmästä julkaistiin vuonna 2000 ja se palkittiin viime vuonna SIGIR:n Test of Time -palkinnolla, Järvelin kertoo.

Tiedonhakujärjestelmiä käytetään
hyvin erilaisin tavoin

Toinen Tampereella tehtävä tiedonhaun tutkimuksen painopiste on tehtäväperusteinen tiedonhaku.

– Perinteisesti tiedonhakujärjestelmän suunnittelijat näkevät tehtäväkseen mahdollisimman hyvän, mutta muusta elämästä eristetyn, tietojärjestelmän suunnittelun annetun tyyppistä dokumenttiaineistoa ja hakemista varten. Työelämässä (ja vapaallakin) pitäisi kuitenkin saada usein monia tietojärjestelmiä toimimaan yhdessä. Tukea tarvitaan hakemisen lisäksi tiedon valikointiin, työstämiseen, yhteenvetoon ja loppupäätelmien dokumentointiin ja talletukseen myöhempää käyttöä varten. Järjestelmien kehittäjien olisi hyvä tietää, miten tietojärjestelmiä todellisuudessa käytetään yhdessä, Järvelin toteaa.

Etnografinen tutkimus tarjoaa ensi käden tietoa siitä, miten ihmiset todellisuudessa käyttävät hakukoneita ja tietokantoja ja niistä hankkimiaan tietoja.

– Tutkija menee työpaikalle tutkimaan, kuinka ihmiset hakevat tietoa. Tavoite on selvittää, millaisia tehtäviä työntekijät suorittavat, millaista tiedonhakua tehtäviin liittyy, mitä vaikeuksia tiedonhaussa voi olla ja miten prosessia voitaisiin tiedonhaun osalta kehittää, Järvelin sanoo.

Etnografinen tieto on arvokasta, sillä siinä tulee esiin se, kuinka ihmiset käyttävät tiedonhakujärjestelmiä yhdessä ja mitä ongelmia tässä esiintyy. Hakujärjestelmän kehittäjälle tieto siitä, kuinka järjestelmiä käytetään käytännössä, on erittäin arvokasta.

Netti mullisti
tiedonhaun

Professori Järvelin tuli Tampereen yliopistolle opiskelijaksi vuonna 1972. Oppiaineen nimi oli tuolloin kirjastotiede ja informatiikka.  Hänen toinen pääaineensa oli tietojenkäsittelyoppi.

Vuosien mittaan tiedonhaku käytännössä on kokenut valtavia muutoksia. Suurimpina tekijöinä Järvelin mainitsee tietokoneiden kehityksen ja internetin.

– 1970-luvulla tulivat käyttöön sähköiset kirjallisuusviitetietokannat, jotka toimivat tietoverkkojen kautta. Silloin ei ollut nettiä siinä mielessä kuin nykyisin. Mutta päästiin esimerkiksi Tampereen yliopistolta USA:ssa sijaitsevaan kirjaston tietokantaan satelliittiyhteyden kautta. Kyse oli lähes yksinomaan tieteellisen tiedon välityksestä, Järvelin kertoo.

1980-luvulla yleistyivät kokotekstitietokannat, jotka tarjosivat pelkän viitetiedon lisäksi esimerkiksi tutkimusartikkelin tai uutisen koko tekstin. Tekniikkaa hyödynnettiin edelleen lähinnä tieteellis-ammatillisen tiedon haussa.

1990-luvun puolivälissä World Wide Web oli valtava muutos. Vuosituhannen lopussa netin hakukoneet alkoivat yleistyä. Netti muuttui varsin nopeasti ammattilaisten tiedonhakuvälineestä kaikenlaisen tiedon ja kulttuurin jakelukanavaksi, sitten jokamiehen keskustelufoorumiksi ja kaiken kansan markkinapaikaksi.

– Viimeisin kehitysvaihe on kiinnittää huomio käyttäjien mielenkiinnon ja verkkokäyttäytymisen profilointiin. Sen sijaan, että vain löydettäisiin yleisesti parhaat vastauksen esitettyihin hakukysymyksiin, pyritään vastausten personointiin ja mielenkiinnon kohteiden - tulevien kysymysten - ennakointiin. Tätä varten verkon käyttäjien liikkumisesta ja toiminnasta verkossa, muun muassa sosiaalisessa mediassa ja sähköpostissa, kerätään valtavasti dataa, jota analysoidaan koneoppimisen menetelmin, Järvelin kertoo.

Google, Facebook, Amazon ja muut suuret verkkoyritykset panostavat valtavasti käyttäjien profilointiin. Mainostajat ovat valmiita maksamaan suuria summia palveluille, jotka pystyvät kohdentamaan oikeat mainokset juuri oikealle kohderyhmälle ja osoittamaan, että mainos on nähty.

– Tai kohdistamaan sopivat valeuutiset tai muut syötit otolliselle kohderyhmälle poliittista mielenmuokkausta varten. Tietomurrot ja käyttäjien tietosuoja ovat merkittäviä ongelmia, Järvelin sanoo.

Simulointia ja
keskusteluanalyysiä

Eläkkeelle siirtynyt Järvelin on edelleen mukana tutkimustyössä. Parhaillaan hän osallistuu tutkimusprojekteihin, joissa kehitetään menetelmiä tiedonhaun eri alueille.

Yksi projekteista kohdistuu vuorovaikutteisen tiedonhaun simulointiin. Onnistuessaan tämä tarjoaisi mahdollisuuden korvata osittain työläitä käyttäjäkokeita automaattisin menetelmin hakujärjestelmien evaluoinnissa.

Toisessa projektissa kehitetään menetelmiä luonnollisella kielellä esitettyihin kysymyksiin vastaamiseksi. Jos hakujärjestelmältä kysytään ammattiliittojen puheenjohtajien nimiä, niin vastaukseksi annetaan luettelo puheenjohtajista sen sijaan, että annettaisiin perinteiseen tapaan lista linkkejä, joista tiedontarvitsija voi etsiä puheenjohtajien nimet, Järvelin kertoo.

Kolmannessa projektissa tutkimus- ja kehitystyötä tehdään sosiaalisen median ja muiden tekstikokoelmien keskusteluanalyysin parissa.

– Millaisia kuvailevia sanavalintoja liittyy eri keskustelun kohteisiin - kuten brändeihin, yrityksiin, politiikan tai kulttuurin toimijoihin - ja missä yhteyksissä niistä puhutaan. Kuinka ja milloin keskustelut alkavat, kehittyvät, ja päättyvät, Järvelin kertoo.

Informaatiotutkimuksen oppiaine Tampereen yliopistossa on ollut perinteisesti vahva suunnannäyttäjä kansainvälisessä tiedonhankinnan ja tiedonhaun tutkimuksessa. Emeritusprofessorin mukaan oppiaine on nyt taitekohdassa: neljä professoria on eläköitynyt vuosina 2015-2018, ja kahta oppituolia ollaan täyttämässä loppuvuoden aikana.

– Uusien tiedekuntaratkaisujen myötä yliopistolla ja oppiaineella on tilaisuus valita, millaisin eväin ja millaisten tutkimusongelmien kimpussa se ponnistaa huipulla eteenpäin, Järvelin sanoo.