Kartta kirjastosta

Kirjastot — Avainsanat: , , — Matti @ 14:13

Macen tammikuisen postauksen innoittamana sain viimeinkin piirreltyä ensimmäiset Helmet-kirjastojen kokoelmaa kuvaavat tilastografiikat. Aloitin grafiikkojen takana olevan aineiston pyörittelyn jo kesäkuun helteiden aikaan, Helmet-kirjastojen julkaistua kokoelmatietokantansa avoimena datana. Proggis kuitenkin jäi telakalle, josta sen nyt viikonloppuna herätin henkiin virkistääkseni R-taitoja gradutaistoa varten.

Grafiikat ovat syntyneet Helmet MARCXML-aineistodumpista, joka on ajettu aluksi MODS-muotoon XSLT-muunnostiedostolla. Sen jälkeen tiedot muutettiin CSV-taulukkomuotoon toisella XSLT-muunnoksella. Ensimmäisen muunnosvaiheen olisi voinut hyvin jättää väliin, ja ajaa tiedot taulukoksi suoraan MARCXML-muodossa. Koin kuitenkin selväkielisen MODS-tiedostomuodon käsittelyn helpommaksi, siihen nähden että olisin MARCXML:ää pyöritellessäni joutunut miettimään, mikä kenttäkoodi vastaa mitäkin metatietoa.

Siivoilin muunnostiedostojen avulla syntynyttä CSV-taulukkotiedostoa pienillä Python-koodinpätkillä ja latasin tämän jälkeen tiedoston R-tilasto-ohjelmaan. Ärrässä mankeloin tiedot tarvitsemaani muotoon ja lopulta tuotin grafiikat R:n treemap-kirjaston avulla. Kaikki edellä mainitut ohjelmat ja työkalut ovat vapaata koodia.

Pidemmittä puheitta — kokoelmagrafiikoita, olkaa hyvä. Pikkukuvaa klikkaamalla grafiiikan saa suurennettua. Mikäli grafiikkojen muoto on outo, Wikipedia-selvittää mistä on kyse (Treemapping-artikkeli).

9 kommenttia

  1. Huippua!!

    Comment by mace — 28.2.11 @ 22:55
  2. [...] Matti Lassila on leiponut kirjastojen Open Data -julkaisujen perusteella erilaisia karttoja kirjastoaineistoon Kaukomieli -blogissaan. Lähdemateriaalina on tässä HelMetin avoin data, joka avattiin Kirjastot.fi:n Labsin voimin; [...]

  3. Hienoa! Mielenkiintoista!

    Comment by Petri — 1.3.11 @ 9:32
  4. Kiehtovaa!

    Comment by Mikko — 1.3.11 @ 10:16
  5. فكرة فعلا ممتاز.

    Comment by Mikko — 1.3.11 @ 11:03
  6. Datan visualisointi – kevään alku, niin hienoa! Seuraavaksi kuvat data/info-linkeistä, data/informaatioverkostojen 3D-mallit…

    Comment by Naranja — 1.3.11 @ 13:16
  7. Hienoja kuvia! Kauniita. Ihania. Voisi tulostaa isona, kehystää ja panna seinälle. Noista sitä paitsi on kouriintuntuvaa hyötyä käytännön kokoelmanhallintatyössä.

    Macen innoittamana tein minäkin yhden kuvion kirjastot.fi’hin:
    http://www.kirjastot.fi/fi-fi/foorumit/thread.aspx?threadId=185d18d9-74cb-4960-99ec-347454dfcef5&so=0&se=0&p=1

    Tai suoraan kuvaan:
    http://i205.photobucket.com/albums/bb194/Ksantippa/Kuvaruutukopioita/Eraankirjastontietokirjojenkiertojakokoelmat2009.jpg

    Henkilökohtaisesti minusta tuollaisesta sijalukuvertailusta oli suurta hyötyä kokoelmanhoidossa. Siitä pitäisi tehdä vähän avanseeratumpi työkalu. Innostuisitko?

    Comment by Anna-Liisa — 1.3.11 @ 13:41
  8. Kiitos kaikille kannustavista kommenteista :)

    Anna-Liisa: Enpä tiennytkään, että Hkistä on saatavissa julkisesti noin tarkkoja tilastoja! Niiden pohjalta voisi kyllä kehitellä jotain. Aluksi voisin ottaa asiaksi luoda tilastojen pohjalta R:n ymmärtämän datasetin.

    Kuvien kehittely R:ssä ei ole kovin monimutkaista. Jos tuon prosessin dokumentoisi, siinä olisi valmis työnkulku kokoelmatyötä varten. Web-selaimessa toimiva, varta vasten tätä tarkoitusta varten rakennettu työkalu olisi tietty vielä parempi. Hmmhmm.

    Comment by Matti — 1.3.11 @ 16:34
  9. Olen vähän kaavaillut kokoelmanhallinta+evidenssipohjainen kirjastotyö+bibliografinen data+käyttödata+visualisointi+webimetriikka+infoporno -workshoppeja voisi pitää, vaikka jonkun sarjan. Ei mitään powerpoint-shittiä semiaarisalissa pomojen kanssa, vaan datat, läppärit, R, Excel mukaan ja kunnon kotityöt.

    Mitäs teette syksyllä?

    Comment by mace — 19.3.11 @ 14:32

RSS-syöte tämän artikkelin kommenteille.

Pahoittelut, kommentointi on nyt suljettu.

This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.
(c) 2013 Kaukomieli | powered by WordPress with Barecity