Sehän on vain semantiikkaa 5

Posted by Matti on February 04, 2008

Istuskelin viikko sitten perjantaina Teknillisellä korkeakoululla kuuntelemassa FinnONTO -mahtihankkeen päätösseminaarin esityksiä. Suomalaisen semanttisen webin perusinfraa kehittäneessä hankkeessa on kehitetty mm. Yleisen suomalaisen asiasanaston isoveli, n. 20 000 käsitteen Yleinen suomalainen ontologia (YSO) sekä tätä käsiteviidakkoa laajentavat Museoalan ontologia MAO, valokuvausalan VALO sekä paikkaontologia SUO, vain muutamia hankkeessa kehitettyjä ontologioita mainitakseni. Rakennetut ontologiat ovat vapaasti käytettävissä TKK:n ontologiapalvelimen kautta. Nyt suomalaisten semanttisen webin sovellusten kehittäminen ei ole ainakaan käsitemalleista kiinni.

Päätösseminaarissa ontologioiden voimaa havainnollistettiin demosovellusten avulla. Protot toimivat varsin mukavasti ja erityisesti paikkaontologia SUO vakuutti hyödyllisyydestään, nyt kun kuntarajat ovat vapaaehtoisessa(kin) liikkeessä. SUO-ontologian avulla hakusovellus saadaan ymmärtämään esimerkiksi se, että Rovaniemi-niminen paikka on koostunut vuodesta 2006 alkaen kahdesta aiemmin erillisestä alueesta (Rovaniemi ja Rovaniemen maalaiskunta), jotka sijaitsevat Lapin läänin sisällä, joka on ollut vuoteen 1938 asti osa Oulun lääniä.

Demoja ihmetellessäni mietin, millä edellytyksin esitellyt teknologiat - ontologiat etunenässä - leviäisivät aluksi edes web-harrastajien käyttöön. FinnONTO-hankkeen puolelta käyttöönottokynnystä on koitettu madaltaa ONKI Widget-palvelulla, jonka tarkoituksena on integroida halutut ontologiat olemassaoleviin tietojärjestelmiin.

Idea on vähän sama kuin Technorati Tags -palvelussa, jonka avulla voidaan yhdistää eri bloggaajien kirjoitukset käytettyjen avainsanojen perusteella, mutta nyt käytössä ovat ontologioiden käsitteet. Technorati Tags-palvelun käyttöä helpottaa eri julkaisualustoille kehitetyt moduulit, joiden ansioista loppukäyttäjän ei tarvitse huolehtia Technoratiin linkittämisen yksityiskohdista. Nähtäväksi jää, kuinka moni semanttisesta webistä kiinostunut web-harrastaja onnistuu yhdistämään Onki Widgetin julkaisutyökaluunsa - itselläni se jäi toistaiseksi yritykseksi.

Olisi hienoa, jos Semantic Web 2.0 (FinnONTO 2.0)-hankkeessa, joka jatkaa päättyneen FinnONTO-hankkeen viitoittamalla tiellä, kehitettäisiin jotain tämäntapaista. Käyttövalmiit moduulit suosituimpiin vapaisiin julkaisujärjestelmiin, esimerkiksi Drupaliin ja Wordpressiin, olisivat reipas harppaus eteenpäin verkon semantisoinnissa - samaan tapaan kuin julkaisujärjestelmiin integroidut mikroformaatit (esimerkiksi XFN) ovat semantisoineet verkkoa loppukäyttäjän kannalta läpinäkyvästi jo muutaman vuoden ajan.

Drupal-puolella joitain semanttisen webin rakennuspalikoita on jo kehitteillä, esimerkiksi Semantic Search-moduuli ja kuluvan vuoden maaliskuun DrupalCon-tapahtumassa semanttiselle webille on tiedossa oma sessio.

VuFind - kasvojenkohotusta Voyagerille 3

Posted by Matti on July 22, 2007

Philadelphialaisen Villanova Universityn kirjasto on rakentanut mielenkiintoisen Voyager-kirjastojärjestelmän asiakaskäyttöliittymän korvaajan.VuFind-nimellä kutsuttua järjestelmää on kehitetty vajaan vuoden verran ja viime viikon perjantaina julkaistiin ensimmäinen yleiseen käyttöön valmis testiversio. Mikä parasta, koodi julkaistiin GPL-lisensoituna! Myöhemmin VuFind tulee tukemaan myös muita kirjastojärjestelmiä (ml. avoimen koodin Evergreen ja Koha), joten projektin etenemistä on syytä pitää visusti silmällä.

VuFind toimii kokonaisuudessaan avointen ohjelmistojen varassa. Vaatimuksina ovat:

  • Apache 2.2 (web-palvelin)
  • PHP 5.1.0 (yleinen web-sovelluksissa käytetty ohjelmointikieli)
  • MySQL 4.1 (tietokanta)
  • Java J2SE JDK 1.4 (yksi yleisimmistä ohjelmointikielistä)
  • YAZ 3.0 (mm. MARC-tietueiden käsittelyssä käytettävä avoin Z39.50 -ohjelmistokirjasto)

Järjestelmän varsinaisina aivoina toimii Solr-hakumoottori (myös avointa koodia), mutta asennuspakettiin sisällytettynä sitä ei mainita erikseen vaatimusluettelossa. VuFind toimii samalla periaatteella kuin NCSU:n näyttöluettelo, joka on rakennettu kaupallisen Endeca-hakumoottorin päälle. NCSU:n näyttöluettelosta bloggisin puolisentoista vuotta sitten.

NCSU:n näyttöluettelon tapaan järjestelmä ei käsittele alkuperäisiä MARC-tietueita, vaan tietueet muutetaan helpommin käsiteltävään muotoon ja tuodaan VuFindin omaan tietokantaan järjestelmän käyttöönottovaiheessa. Vielä nykyisessä 0.5- versiossa varsinaisen tietokannan ja näyttöluettelotietokannan synkronointi ei suju automaattisesti, mutta jo seuraavassa kehitysversiossa toiminnallisuuden on jo tarkoitus olla. Tällöin synkronointi voidaan tehdä eräajona esimerkiksi öisin.

Hajahuomioita ja pari vertailevaa ruudunkaappausta (klikkaa kuvia suuremmaksi).

Perus-Voyager

Teoksen tiedot Voyagerin perus-OPACissa

VuFind

Teoksen tiedot VuFindissä

Käyttöliittymä on toteutettu viisaasti. Kaikki HTML-koodi on sijoitettu erillisiin sivupohjatiedostoihin, jotka nopean tutkailun perusteella näyttäisivät olevan jokseenkin puhtaita varsinaisesta ohjelmakoodista. Käyttöliittymän asettelussa on hyödynnetty Yahoon BSD-lisenssillä tarjoamaa Grids CSS -koodia. Grids CSS on osa Yahoon UI-kirjastoa, joka koostuu lukuisista web-kehittäjän elämää helpottavista käyttöliittymäkomponenteista ja -kirjastoista. Valmiita komponentteja käyttämällä VuFindin kehittäjät ovat välttäneet painimasta selainkohtaisten CSS-yhteensopivuusongelmien kanssa, kun Yahoon väki on hoitanut asian heidän puolestaan.

Asennusohjeet näyttävät selkeiltä ja ilmeisesti myös ovat sitä, sillä esimerkiksi Miami Universityn kirjastossa työskentelevä Rob Casson toteaa asennuksen sujuneen puolessa tunnissa. Löytyisiköhän suomalaisilta Voyager-käyttäjiltä, joita ovat mm. kaikki yliopisto- ja ammattikorkeakoulukirjastot, hieman pioneerihenkeä ja puolta tuntia löysää aikaa?

Edit:

Google-haun perusteella näyttäisi siltä, että VuFind -nimellä kehitetään myös videohakujärjestelmää. Voi olla, että näyttöluetteloprojekti joutuu vielä vaihtamaan nimeä, sillä mitä todennäköisemmin videohakujärjestelmää kehittelevä VuFind Inc. ei sitä tule tekemään.

Kirjallisuutta kartalla - Google Lit Trips

Posted by Matti on March 10, 2007

Google LitTrip
John Steinbeck: Vihan hedelmät

Kalifornialainen opettaja Jerome Burg on keksinyt kiehtovan tavan elävöittää kirjallisuuden opetusta. Google Lit Trips antaa mahdollisuuden kulkea klassikkokirjojen henkilöiden jalanjäljissä Google Earth-virtuaalikarttapallon pinnalla. Vielä syvemmälle kertomuksen maailmaan vievät kartalle merkittyihin paikkoihin linkitetyt videot, kuvat ja muut dokumentit - myös toiset kirjat. Tämä on aivan ehdoton verkkokirjavinkkaamisen väline - kuvitelkaapa jokin Waltarin tai Paavolaisen matkaromaaneista plotattuna kartalle!

Linkkejä:

Google Earth (ilmaisohjelma) Steinbeckin Vihan hedelmät kartalla

Näyttöluettelovideo!

Posted by Matti on December 05, 2006

the OPAC sucks, people are confused
it runs amok, committing its abuse
years and years and years ago, computers replaced cards
how come finding what i want is still so goddamn hard?

Videon tehneen Brian Smithin kommentti tiivistää olennaisen:

Keep in mind that your library isn’t spending thousands of dollars on the song and video

Suomen biblioblogosfääri herää 87

Posted by Matti on September 01, 2006

Kirjastoseuran puheenjohtaja Tarja Cronberg kommentoi bloginsa ensimmäisessä merkinnässä Hesarin Sunnuntaidebatti-palstalla julkaistun kirjoituksensa synnyttämää keskustelua. Ennen Cronbergin blogiin törmäämistä en ollut lukenut Cronbergin kirjastojen rahoitusta koskevaa puheenvuoroa aiemmin, vaikka Kirjastoseuran nettikeskusteluissa aihetta on puitu parin kirjoituksen verran, samoin Kirjastot.fi:n keskusteluissa. Lukaisin alkuperäisen kirjoituksen ja sen alle kertyneet kommentit. Kommenttien joukossa on joitain helmiä, joiden mielellään soisi kulkeutuvan kirjastojen päätäntävaltaisen väen käsiin:

Se voisi luoda “kantaasiakas-systeemin” jossa saisi jäsenmaksulla(10-30 euroa/vuosi) erillaisia jäsenetuja ja kaikkein kovimmat lainaajat, joilla on vuodessa lainoja useita kymmeniä saisi siitä bonusetuja, esmes: alennusta Helsingin ja Turun Kirjamessuille, alennuksia kirjoista ja ennakkoilmoituksia ja posteja tulevista kirjoista ja kirjallisuustapahtumista niin kirjailijavierailuista kuin runoilloistakin kautta Helsingin - Vantaan - Espoon. Voisi myös ajatella sellaistakin järjestelmää, jossa klubilainen saisi ja pääsisi nopeammin uutuuksiin kiinni varauksilla ja voisi *ohittaa* ei maksavat asiakkaat sekä heille kuuluisi myös lainakaton rajan siirtäminen 50 lainaan/ asiakas! nimim. Martin Eden

Miksi ei?

Jos Amazon toimisi kuin näyttöluettelo… 4

Posted by Matti on June 21, 2006

Ruudunkaappaus OPAC Amazonista

Olisikohan Amazon nykyään markkina-arvoltaan 15 miljardin dollarin verkkokauppa, mikäli sen käyttöliittymä olisi yrityksen aloittaessa kymmenkunta vuotta sitten muistuttanut nykyisiä näyttöluetteloita? If Amazon sucked like our old OPAC antaa mahdollisuuden nauttia verkkokaupasta innovatiivisen hakukäyttöliittymän kautta.

Kirjastot ja Web (n)

Posted by Matti on April 17, 2006

Hivenen alle pari vuotta vellonutta Web 2.0 -keskustelua on ollut mielenkiintoista seurata. Suomessakin Web 2.0-termiä on ehditty pyöritellä jo useamman kirjoittajan voimin, joten siitä ei sen enempää. Todettakoon vain, että olen jokseenkin samaa mieltä gstepin, Zeldmanin ja Joelin kanssa - termisoppa on jo kohta liedellä. Toisaalta, eihän asiasta voi puhua, jollei sitä nimetä.

Technorati Chart

Itse olen koittanut tarkkailla Web 2.0 -huumaa kirjastojen näkökulmasta. Syksyllä yritin herättää keskustelua ( huonolla menestyksellä tosin) Koha-kehittäjien postituslistalla käyttäjälähtöisen luokittelun tarpeellisuudesta Koha-kirjastojärjestelmässä syistä, joita käsittelin aiemmassa merkinnässäni. Käyttäjälähtöisen luokittelun ohella myös moni muu “Web 2.0″-leimaa kantava teknologia ja ajattelutapa voisivat parantaa kirjastojen palvelutasoa - tai käyttäjäkokemusta, näin trendikkäästi ilmaistuna. Yhteisöllisyys, avoimet API:t kirjastojen jättimäisiin metatietovarantoihin, RSS-virrat, suosittelijajärjestelmät, virheenkorjaavat hakutoiminnot ja niin edelleen; pelikenttä on asetettu valmiiksi ja kirjastot voisivat astua mukaan.

Oli vain ajan kysymys milloin “kirjastot+Web 2.0″ -keskustelulle annetaan nimi. Kirjastojärjestelmien ongelmia ja vanhakantaisia palvelukäytäntöjä suominut blogikirjoittelu alkoi kerääntyä Library 2.0 -nimen alle viime vuoden lokakuussa - toki pienemmässä mittakaavassa kuin mitä Web 2.0-kehityksestä on kirjoitettu:

Technorati Chart

Tässä vaiheessa aihetta käsitteleviä merkintöjä on jo niin paljon että asiasta kiinnostuneen suomalaisen kirjastoihmisen ei liene järkevää kahlata läpi kaikkea asiasta kirjoitettua. Walt Crawford tiivistää aina yhtä erinomaisen Cites & Insights: Crawford at Large -verkkolehtensä Library 2.0 and “Library 2.0″ -numerossa (PDF) helmikuuhun 2006 mennessä käydyn Library 2.0-keskustelun olennaisimmilta osin. Myös Chris Zammarellin Library 2.0-lukulista on tutustumisen arvoinen. Ajan myötä uusin tieto suodattunee nyt pitkänäperjantaina Ann Aborissa, Michiganissa järjestetyn Library Camp 2006-epäkonferenssin wikiin. Nyt kun ITK2006-konferenssin myötä suomalainen Web 2.0-keskustelu on kasvanut verkon ulkopuolelle, löytyisikö myös Kirjasto 2.0 -epäkonferenssiin väkeä?

Muokattu: Jostain syystä WordPress hukkaa osan merkinnästä, missähän vika.

Näyttöluettelorintamalta jotain uutta 1

Posted by Matti on February 24, 2006

Näyttöluettelorintamalla tapahtuu jotain uutta. NCSU (North Carolina State University) julkaisi vajaa kuukausi sitten uuden näyttöluettelonsa, joka on kehitetty yhteistyössä paremmin verkkokauppojen hakukäyttöliittymistä (mm. Barnes and Noble, Wal-Mart ja Indigo Books) tunnetun Endecan kanssa. Näyttöluettelo mahdollistaa LCSH-asiasanoja selaamalla tapahtuvan haun - aineistoa voi siis hakea syöttämättä ainuttakaan hakusanaa. Haun tulosjoukkoa voidaan kaventaa edelleen selaamalla joko asiasanoja tai kahdeksaa tulosjoukkoa kaventavaa fasettia (aihe, genre, aineistolaji, sijainti, maantieteellinen alue, aikakausi, kieli ja tekijä).

Esimerkki paljastanee paremmin, kuinka mainio ominaisuus onkaan käytännössä. Olen lähiaikoina lueskellut teollisen muotoilun klassikoita käsitteleviä kirjoja - katsotaampa mitä NCSU:n kirjastolla olisi tarjota aiheesta. Haku sanalla ‘industrial design‘ palauttaa 3213 teosta. Jätän mielelläni teollisuuden tuotekehitysprosessit ja käytännön muotoilutyön muille - sen sijaan käyttödesign ja muotoilun historia kiinnostavat. Aiherajaus (Topic: Design) lienee siis paikallaan. Nyt ehdot täyttävään joukkoon kuuluu 165 teosta. Mitähän aineistoa kirjasto on valinnut kokoelmiinsa saksalaisesta muotoilusta? (Subject Region: Germany) Tulosjoukkoon haarukoituu seitsemän teosta - helposti silmäiltävissä oleva määrä.

NCSU OPAC

Tavanomaisin keinoin - kuten vaikkapa Boolen-hakuehtoja ketjuttaen - tapahtuvaan haun tarkentamiseen nähden selaushaulla on monia etuja puolellaan. Tiedonhakija näkee jatkuvasti käytettävissä olevat rajausvaihtoehdot ja säästyy monimutkaisten hakulausekkeiden kirjoittamiselta. Voimassa oleva rajaus on myös jatkuvasti näkyvissa ja muokattavissa tuloslistauksen yläreunassa olevasta sivupolusta.

Selaushaun lisäksi näyttöluetteloon on Endecan avustuksella rakennettuu muitakin hyödylliseltä vaikuttavia ominaisuuksia, muun muassa:

  • tulosten lajittelu lainauskertojen mukaan - suosituimmuusjärjestys
  • kirjoitusvirheiden korjaus
  • karkeiden kirjoitusvirheiden automaattinen oikaisu Googlen Tarkoititko: -toiminnon tapaan

NCSU:n uusi näyttöluettelo toiminee suunnannäyttäjänä alan kehitykselle. Muista järjestelmätoimittajista Innovative (mm. HelMet-aineistohaun taustalla hyrräävän Millenium-järjestelmän kehittäjä) on tuomassa markkinoille uutta versiota tuotteestaan. Tulevassa WebPac Pro:n versiossa tulee olemaan mm. RSS-tuki - saapa nähdä otetaanko ominaisuus käyttöön joskus HelMet-luettelossa. Toinen alan jättiläinen - Ex Libris - vastaa verkkohakukoneiden asettamaan haasteeseen Primo-projektillaan. NCSU:n esimerkki osoittaa, että perinteiset kirjastojärjestelmätoimittajat saattavat joutua ahtaalle kun Endecan tapaiset, yleiseen hakukoneteknologiaan erikoistuneet yritykset astuvat samoille markkinoille.

Kirjastoihmisen Google

Posted by Matti on December 28, 2005

Vuoden loppupuoli on tuonut tullessaan kaksi hyödylliseltä vaikuttavaa Googleen liittyvää sivustoa. Hakukoneyhtiö itse on perustanut [Google Librarian Center->http://www.google.com/services/librarian_center.html] -palvelun, joka ei tätä kirjoitettaessa vielä sisällä liiemmälti aineistoa. Kirjastonhoitajia ja muita tiedonhaun opettajia olevia pyydetään jakamaan tietämystään hakukoneiden käytön opettamisesta - liekö lopullisena tarkoituksena syrjäyttää kirjastoihmiset, kuten [Jill Hurt-Wahl->http://hurstassociates.blogspot.com/2005/11/googles-librarian-center.html] puolivakavissaan arvelee.

Tällä hetkellä palvelun suurin anti on uutiskirje, jonka [ensimmäinen numero->http://www.google.com/newsletter/librarian/librarian_2005_12/newsletter.html] avaa Googlen hakurobotin toimintaa. Kirje on erittäin mielenkiintoista luettavaa, vaikka aihepiiri olisi jo ennestään tuttu. Ensimmäinen uutiskirje asettaa riman varsin korkealle - teksti on miellyttävää lukea ja indeksoinnin tekniset periaateet on selitetty havainnollisella tavalla. Uutiskirje sisältää myös tehtäviä, jotka sopinevat hieman edistyneemmän tiedonhaun opettamiseen. Odotan mielenkiinnolla seuraavia julkaisuja.

Toinen tuore tuttavuus, [Google Librarian->http://www.googlelibrarian.com], on edellisestä poiketen syntynyt hakukoneyhtiön ulkopuolella. Sivuston äiti on [Cleveland Public Library->http://www.cpl.org]:ssä työskentelevä kirjastonhoitaja ‘Julie’, joka kertoo motiivikseen:

The reason I made the website is because I have seen a need for something like this. Internet search engines are becoming a huge part of our jobs, and not everyone understands the finer details of them yet. There are ways to fine-tune your results, and methods to employ that can help you find what you need faster. Plus there are also alot of really cool tools that Google offers that I think librarians would find interesting. My goal is to share my knowledge and expertise with fellow librarians and information professionals.

Tietysti voihan olla että kyseessä on vain ovela [guerrilla marketing->http://en.wikipedia.org/wiki/Guerrilla_marketing]-kampanja, mutta väliäkö sillä. Jo nyt sivusto sisältää yhteen paikkaan koottuna hyödyllisiä neuvoja, kuinka informaatioammattilaiset voivat hyödyntää Googlen palveluja entistä monipuolisemmin. Jokaisesta palvelusta on lyhyt esittely ja ehdotus siitä, kuinka kyseessä oleva palvelu voisi olla hyödyllinen informaatioammattilaisen työssä:

Google Book Search What is Book Search? Google Book Search allows you to search the full text of books online. With this service you are able to find books that suit your interests that you may be interested in purchasing or checking out from your local library. Books out of copyright are available to view in full, and some newer books that publishers have allowed to be scanned are available in a partial sample view. Other books may only have a few snippets of text and information from the book. Each book record also has a link to places that the book can be purchased, and some entries have a link to local libraries that own the book. How is this relevant to Librarians? You are able to get a better idea of what a book is about before you purchase it for your collection. You can not only get information about the book, but also can view the actual book and read some excerpts.

Ymmärrättävästi jotkut sivustolla esitellyt Googlen palvelut ovat käyttökelpoisia vain Yhdysvalloissa. Sivuston arvoa parantaa entisestään se, että esittelyt eivät rajoitu ainoastaan verkkopalveluihin, vaan sivustolla annetaan vinkkejä Googlen käyttöä helpottavista Firefox-selainlaajennoksista, jotka lienevät MUTU-tuntumani perusteella täysin tuntemattomia suurelle osalle kirjastoväkeä - ainakin Suomessa. Tilanteen soisi muuttuvan, sillä onhan selain yksi informaatioammattilaisen tärkeimmistä työkaluista.

…ja olkoon kaikilla oikeus haluamiinsa kyselyihin

Posted by Matti on November 26, 2005

John Blybergin muotoilema [ILS Customer Bill-of-Rights->http://www.blyberg.net/2005/11/20/ils-customer-bill-of-rights/] tiivistää varsin hyvin [aikaisemmin mainitsemani->http://www.kaukomieli.net/2005/09/24/nayttoluettelomanifesti/] OPAC manifeston ydinsanoman.

  1. Open, read-only, direct access to the database
  2. A full-blown, W3C standards-based API to all read-write functions
  3. The option to run the ILS on hardware of our choosing, on servers that we administer
  4. High security standards

Ehkäpä tulevaisuudessa käytössämme on ‘ei-niin-integroitu kirjastojärjestelmä’: ydintoiminnot toteuttava ohjelmisto, joka avoimien rajapintojensa kautta antaisi järjestelmien käyttäjille (kirjastoille ja mahdollisesti jopa asiakkaille) vapauden luoda juuri sellaisia käyttöliittymiä ja palveluita kuin on tarve. Plug-in -perustaisuus pitäisi varsinaisen ydinjärjestelmän kevyenä ja avoimuus kannustaisi kokeilemaan perinteistä poikkeavia toimintoja, joiden kehittämisessä kirjastot eivät olisi järjestelmätoimittajien armoilla.