Valtion taidemuseo, vuoden 2014 alusta alkaen Kansallisgalleria, julkaisi lokakuun alussa kokoelmiensa metatiedot avoimena datana. Sen lisäksi, että CC0-lisensoitua kokoelmadataa voi käsitellä erittäin hyvin dokumentoidun rajapinnan kautta, metatiedot voi ladata pakettina datan paikallista käsittelyä varten. Nyt joulun jouteliaina välipäivinä latailin datapaketin koneelleni ja päätin katsoa, miltä data näyttää BaseX XML-tietokantaohjelman kautta tarkasteltuna.

Kuten kirjastoaineistoja, myös taideteoksia kuvaillaan kontrolloitujen asianasastojen avulla -- onpa tämä oma tutkimusalansakin, ikonografia. Pintapuolisen datasetin läpikäynnin perusteella näytti, ettei lähellekkään kaikkia kokoelmien teoksia ole kuvailtu asiasanoin. Kuvailtuja teoksia on datasetissä kuitenkin niin paljon, että kokoelmista voisi saada luotua suht. paikkansapitävän yleiskuvan visualisoimalla käytetyt asiasanat verkostona, kuten olen tehnyt aikaisemmin kirjastoaineistojen tapauksessa.

Mielenkiintoisen eron kirjastoaineistojen kuvailutietoihin tekee taideteosten kuvailussa käytetty Iconclass-luokitusjärjestelmä. Iconclassin asiananat muodostuvat kirjain- ja numerosarjoista sekä selväkielisestä määritteestä, joka täsmentää numero-kirjainsarjan koodaamaa kuvailutermiä. Koska teokset kuvaillaan kieliriippumattomilla koodeilla, kuvailut ovat ymmärrettävissä vaikka kuvailutyötä tehnyt henkilö ja taideteosten metatietojen selailija eivät jakaisikaan yhteistä kieltä. Käytännössä siis, sen sijaan että jouluista aihetta kuvaava teos kuvailtaisiin suomalaisessa taidemuseossa asiasanalla 'joulu', kuvailuterminä voidaan käyttää Iconclass-koodia 11Q7612. Voidaan siis ajatella, että Iconclass-koodit ovat eräänlaisia linkkejä taideteoksista luokitusjärjestelmään -- ihanteellinen linkitetyn datan sovelluskohde siis.

Tähän ilmiselvään sovelluskohteeseen on myös tartuttu ja Iconclass on julkaistu koneluettavassa muodossa. Edellinen 11Q7612-kuvailutermi voidaan ilmaista linkkinä http://iconclass.org/11Q7612.json, jonka kautta selviää Iconclass-koodin selväkielinen merkitys useilla eri kielillä -- suomi mukaanlukien --sekä koodin sijainti kuvailutermien hierarkiassa. Koska koodien selväkielisiin ilmauksiin pääsee käsiksi helposti muodostettavien URL-osoitteiden kautta, on suhteellisen helppoa kirjoittaa XQuery-skripti, joka käy läpi kunkin taideteoksen kuvailutiedot, lataa verkosta kuvailukoodien selväkieliset ilmaukset ja muotoilee tiedot siten, että ne voidaan esittää verkostona Gephi-visualisointiohjelman avulla.

Iconclass-kuvaillut teokset Kiasman kokoelmissa.

(Lataa tarkkaresoluutioinen kuva.)

Omistaja lkm
Kiasma 1934
Sinebrychoffin taidemuseo 645
Ateneum 61
Teostyyppi lkm
maalaus 1120
grafiikka 464
valokuva 356
piirustus 202
veistos 154
mediataide 80
installaatio 73
esineteos 51
mustavalkoinen valokuva 31
muut ~ 90

Pääasiassa Kiasman kokoelmiin kuuluvien Iconclass-kuvailtujen teosten lisäksi päätin ottaa käsittelyyn selväkielisillä asiasanoilla kuvailtujen teosten metatiedot. Suurin osa näistä teoksista kuuluu Ateneumin kokoelmiin.

(Lataa tarkkaresoluutioinen kuva.)

Omistaja lkm
Ateneum 5310
Kiasma 1950
Sinebrychoffin taidemuseo 744
Teostyyppi lkm
maalaus 3709
piirustus 2699
grafiikka 1046
veistos 378
valokuva 28
reliefi 22
esineteos 19
miniatyyri 16
installaatio 12