Kartta kirjastosta
Macen tammikuisen postauksen innoittamana sain viimeinkin piirreltyä ensimmäiset Helmet-kirjastojen kokoelmaa kuvaavat tilastografiikat. Aloitin grafiikkojen takana olevan aineiston pyörittelyn jo kesäkuun helteiden aikaan, Helmet-kirjastojen julkaistua kokoelmatietokantansa avoimena datana. Proggis kuitenkin jäi telakalle, josta sen nyt viikonloppuna herätin henkiin virkistääkseni R-taitoja gradutaistoa varten.
Grafiikat ovat syntyneet Helmet MARCXML-aineistodumpista, joka on ajettu aluksi MODS-muotoon XSLT-muunnostiedostolla. Sen jälkeen tiedot muutettiin CSV-taulukkomuotoon toisella XSLT-muunnoksella. Ensimmäisen muunnosvaiheen olisi voinut hyvin jättää väliin, ja ajaa tiedot taulukoksi suoraan MARCXML-muodossa. Koin kuitenkin selväkielisen MODS-tiedostomuodon käsittelyn helpommaksi, siihen nähden että olisin MARCXML:ää pyöritellessäni joutunut miettimään, mikä kenttäkoodi vastaa mitäkin metatietoa.
Siivoilin muunnostiedostojen avulla syntynyttä CSV-taulukkotiedostoa pienillä Python-koodinpätkillä ja latasin tämän jälkeen tiedoston R-tilasto-ohjelmaan. Ärrässä mankeloin tiedot tarvitsemaani muotoon ja lopulta tuotin grafiikat R:n treemap-kirjaston avulla. Kaikki edellä mainitut ohjelmat ja työkalut ovat vapaata koodia.
Pidemmittä puheitta — kokoelmagrafiikoita, olkaa hyvä. Pikkukuvaa klikkaamalla grafiiikan saa suurennettua. Mikäli grafiikkojen muoto on outo, Wikipedia-selvittää mistä on kyse (Treemapping-artikkeli).
- Kokoelman tekstiaineiston kielijakauma
- Aineiston ikä kustantajittain
- Kokoelman kustantajat
- Kokoelman kielijakauma kun tarkastellaan alle 500 teoksen ryhmiä
- Kokoelman kielijakauma kun tarkastellaan alle 2000 teoksen ryhmiä.
- Kokoelman kaiken aineiston kielijakauma
- Kokoelman ikä aineistolajeittain







Huippua!!
[...] Matti Lassila on leiponut kirjastojen Open Data -julkaisujen perusteella erilaisia karttoja kirjastoaineistoon Kaukomieli -blogissaan. Lähdemateriaalina on tässä HelMetin avoin data, joka avattiin Kirjastot.fi:n Labsin voimin; [...]
Hienoa! Mielenkiintoista!
Kiehtovaa!
فكرة فعلا ممتاز.
Datan visualisointi – kevään alku, niin hienoa! Seuraavaksi kuvat data/info-linkeistä, data/informaatioverkostojen 3D-mallit…
Hienoja kuvia! Kauniita. Ihania. Voisi tulostaa isona, kehystää ja panna seinälle. Noista sitä paitsi on kouriintuntuvaa hyötyä käytännön kokoelmanhallintatyössä.
Macen innoittamana tein minäkin yhden kuvion kirjastot.fi’hin:
http://www.kirjastot.fi/fi-fi/foorumit/thread.aspx?threadId=185d18d9-74cb-4960-99ec-347454dfcef5&so=0&se=0&p=1
Tai suoraan kuvaan:
http://i205.photobucket.com/albums/bb194/Ksantippa/Kuvaruutukopioita/Eraankirjastontietokirjojenkiertojakokoelmat2009.jpg
Henkilökohtaisesti minusta tuollaisesta sijalukuvertailusta oli suurta hyötyä kokoelmanhoidossa. Siitä pitäisi tehdä vähän avanseeratumpi työkalu. Innostuisitko?
Kiitos kaikille kannustavista kommenteista
Anna-Liisa: Enpä tiennytkään, että Hkistä on saatavissa julkisesti noin tarkkoja tilastoja! Niiden pohjalta voisi kyllä kehitellä jotain. Aluksi voisin ottaa asiaksi luoda tilastojen pohjalta R:n ymmärtämän datasetin.
Kuvien kehittely R:ssä ei ole kovin monimutkaista. Jos tuon prosessin dokumentoisi, siinä olisi valmis työnkulku kokoelmatyötä varten. Web-selaimessa toimiva, varta vasten tätä tarkoitusta varten rakennettu työkalu olisi tietty vielä parempi. Hmmhmm.
Olen vähän kaavaillut kokoelmanhallinta+evidenssipohjainen kirjastotyö+bibliografinen data+käyttödata+visualisointi+webimetriikka+infoporno -workshoppeja voisi pitää, vaikka jonkun sarjan. Ei mitään powerpoint-shittiä semiaarisalissa pomojen kanssa, vaan datat, läppärit, R, Excel mukaan ja kunnon kotityöt.
Mitäs teette syksyllä?