26
nov 10

Et teknisk pip om en virtuel databrønd

Toke Eskildsen fra Statsbibliotekets web-udviklingsafdeling har skrevet et indlæg om sammensmeltning af to geografisk adskilte datakilder til én.

As part of our collaborative agreement Serial Solutions has agreed to deliver statistics about their metadata to us on an experimental basis. With this we can hopefully do better merging and issue boosted queries to get the hits that are relevant to us, thus approximating the results we would have gotten if all metadata had been in a single index. (min fremhævning)

Det bliver spændende at se de første resultater med den omtalte teknik. Pt. integreres artikel-dataene fra Serials Solutions på en mere traditionel måde i en betaudgave . Resultaterne fra den eksterne kilde fremtræder i en separat boks. Målet er at skabe ét søgeresultat, så brugeren aldrig opdager, at der er tale om to eller flere datakilder.


23
nov 10

Bibliografiske poster frigives som public domain i England

Nyhed fra Creative Commons: The British Library releases 3 million bibliographic records into the public domain using CC0

Esben Fjord (udviklingschef på Gladsaxe Bibliotek) kommenterer nyheden på sin Facebook-profil med ordene “Mon det også er meningen med Ting?“.


10
nov 10

Tre nye websites om bøger

Tre nye danske bogsites der centerer sig om bøger er dukket op på min radar i denne uge:

  • Riidr – et site der går efter at blive stedet hvor alle danske e-bøger er samlet og er til salg. Opstartsvirksomhed etableret af seks gode venner i IT-væksthuset ved ITU.
  • Bogtube – videoer om bøger, bag om bøger, om forfatterne. Ejet af Mediamovers, et journalistisk produktionsselskab med 11 medarbejdere, der leverer bl.a. web-tv til mediehuse og virksomheder.
  • Bog.nu – “vi læser alle danske boganmeldelser og giver dig et kort referat”. Alle anmeldelser bliver regnet sammen til en samlet karakter. Sat i søen af Forlaget Bindslev, teknisk udarbejdet af Casper Fabricius og Jesper Hvirring.

Og pludselig kom jeg i tanke om mit indlæg Hvem laver det danske site med læseinspiration baseret på brugerdata? fra marts 2007. Hverken bibliotekerne eller andre aktører har rigtigt sat sig på pladsen endnu.


10
nov 10

Fra niche til almindelig

16% af brugerne på Bibliotek.dk er Mac-brugere. Det stemmer godt overens med min observation af Statsbibliotekets brugere (primært studerende). Det er ikke sjældent, at op til 50% af dem sidder med en Mac, når man ser ud over læsesalen og de andre steder, som de studerende ynder at benytte som studieplads på Statsbiblioteket.

Se andre resultater af brugerundersøgelsen af Bibliotek.dk 2010 (pdf).


10
nov 10

Bibliotek.dk er blevet 10 år

Se en tidslinje for Bibliotek.dk, hvor det er tydeligt at se, hvordan der er kommet flere og flere features til med tiden. Der er tale om en trinvis udvikling. Mon Danskernes Digitale Bibliotek bliver en revolution (ny grundfilosofi og ny grundfunktionalitet) eller blot næste trin i evolutionen?


27
okt 10

Faldende biblioteksbrug

Wikipedia har et utraditionelt vinklet opslag, Decline of Library Usage. Relativt interessant læsning, selvom det ikke er mit indtryk, at tendensen kan overføres ukritisk til danske forhold. Eksempelvis har Statsbibliotekets udlån af fysiske materialer været stigende i de tal jeg har fra 2008 til nu.

John Law fra ProQuest citeres for noget, som jeg synes (stadig) gælder for biblioteker på nettet:

However, the complexity of the search methods provided by libraries alienates many potential users. While most academic researchers and students acknowledge that libraries contain much more relevant and high quality materials, the confusing search process makes it difficult to find these resources. With the current premium placed on time, students are not willing to sift through the clutter to find the sources, rather turning to Google because of the accessibility of the content, not its quality. So despite the efforts to digitize, libraries are still losing potential patrons to less complicated mediums.


27
okt 10

Internat om e-bøger og databrønde

Danmarks Forskningsbiblioteksforening afholder internat om e-bøger og databrønde:

Spræng siloerne: e-bøger og integreret søgning i det digitale forskningsbibliotek

Jeg kan forestille mig, at det bliver en god baggrund for og opvarmning til The Well Conference, som afholdes ca. 14 dage senere.


25
okt 10

Debat i Bibliotekspressen om databrønde

Mit “synspunkt” er nu i tidsskriftet Bibliotekspressen, og det kaster ønskværdig debat af sig fra starten. Læs diskussionen under artiklen og kom evt. selv med dit bidrag.

Bibliotekspressen: Hvorfor tanken om en databrønd ikke er realistisk


19
okt 10

Axiell skriver om databrønde

Boris Zetterlund skriver om databrønde i sit indlæg Data well – the kiss of death?:

One possible alternative is to have paid external metadata in one “Well” (or Federated Index) and the local metadata in the libraries fully controlled environment. The idea is to have all possible power of your own data and the possibilities to use the external in any preferred combinations. It kind of distorts the idea of “one search to find them all” but search is not all libraries are about. Libraries wouldn´t want services that drive their users from their webs?  “One platform to rule them all” may be the theme to chant.


14
okt 10

Hvorfor tanken om én databrønd ikke er realistisk

I øjeblikket tales der en hel del om databrønde og særligt én national databrønd, som f.eks. Danmarks Digitale Bibliotek og alle lokale bibliotekers søgesystemer kan basere sig på. Tanken om en databrønd stammer nok fra, at vi for længst har konkluderet, at brugerne grundlæggende foretrækker ét søgefelt og ét søgeresultat til alle de materialer, vi tilbyder. Det gør tanken om én databrønd meget nærliggende.

Dødsstødet

18. marts 2010 var en milepæl, og måske en kedelig en af slagsen. I hvert fald indtil man accepterer konklusionen og begynder at se fremad igen. DEFF var i færd med et udbud om en national databrønd til elektroniske artikler og e-bøger, men udbuddet blev annulleret på grund af de indkomne svar.

Ingen af de store internationale udbydere ville give hverken data eller metadata fra sig. Selvom udbuddet reelt havde været halvandet år i støbeskeen ville nogle måske mene, at man burde gå videre og arbejde endnu hårdere for at få virksomhederne til at afgive data. Men konklusionen er, at det bliver alt for dyrt og videre forsøg og forhandlinger vil være at ignorere forretningsmæssige realiteter.

Ny virkelighed – hvad så?

Tanken om at frigive data, så biblioteker selv kan kontrollere dem fuldt ud, lever selvfølgelig videre og kan give mening i visse sammenhænge. Men bibliotekerne må endegyldigt acceptere, at vi ikke i noget der ligner nær fremtid kan etablere et enkelt sted, som den danske biblioteksverden kan få alle sine data fra.

Når man først har accepteret denne realitet, ser verden pludselig anderledes ud, men målet om at præsentere ét samlet søgeresultat for brugerne har vi sådan set stadig. De tekniske udfordringer er blot anderledes og måske større – i hvert fald nye for mange. Vi skal kunne formulere nye krav til dataleverandører og f.eks. bede om tf-idf-vægte så vi alligevel kan flette data sammen i et søgeresultat og huske at formulere krav til API’er, der lader os vise, men dog ikke indeksere, data i vores egne webomgivelser.

Biblioteker i cloud computings tidsalder

Tænker vi videre, er det (desværre) åbentlyst, at én central database med alt biblioteksmateriale ikke er en mulighed. Slet ikke i en tid, hvor begreber som cloud computing er hverdagssnak. E-bøgerne og e-tidsskrifterne var det første, store søm i kisten, men der er adskillige eksempler, som peger i samme retning.

Vi har før indset, at inkorporation af data fra Bibliotekernes Netmusik kunne give os juridiske problemer, fordi musiktracks skifter ejerforhold. Pludselig er dataene på bibliotekernes sites ikke opdaterede, og det har vist sig at bringe bibliotekerne i fare for sagsanlæg (hård virkelighed, men virkelighed). Her har der altså i praksis vist sig store argumenter for at dataejere kontrollerer de data og metadata, som de har ansvar for.

Samme situation har vi sådan set med visse data, der er bibliotekernes “helt egne”. På Statsbiblioteket optager vi f.eks. al dansk radio og tv og arkiverer det digitalt på baggrund af pligtafleveringsloven. Denne ordning betyder, at dataene ikke må forlade Statsbibliotekets servere. Tv og radio-programoversigterne kan selvfølgelig eksporteres til en central databrønd – men i øjeblikket ser man på, hvordan selve optagelserne i form af billeder og lyd (og altså ikke kun programoversigterne) kan gøres søgbare og give nye og brugbare indgange til materialet – metadata og data smelter altså mere og mere sammen og besværliggør en central databrønd. Ligeledes vil man gerne kunne vise brugerne “snippets” eller “previews” af udsendelserne – atter et eksempel på, at data og metadata efterhånden har en flydende grænse, som skaber ophavsretsproblemer så snart man vil begynde at distribuere data til andre servere.

Mange flere eksempler peger i retning af, at én central databrønd til alle “biblioteksdata” ikke bliver virkelighed nogensinde på grund af jura og forretning. Hertil kommer i øvrigt de ressourcer, det kræver at holde en databrønd velstruktureret og opdateret, hvis den skal give brugbare og relevante resultater.

Målet er stadig det samme

Målet er dog, for mig at se, stadig det samme: Vi skal servicere brugerne på en inspirerende, relevant og effektiv måde – den tekniske løsning og vejen derhen er nu blot en anden.

Da verden i dag på dette punkt ser meget anderledes ud end for et halvt år siden, og da vi mangler mange svar og måske mangler at stille de rigtige spørgsmål, afholdes tirsdag 8. februar 2011 en konference om emnet. Konferencen hedder The Well Conference, og du kan tilmelde dig og læse mere på www.well11.dk.