ESB Forum ESB Forum
ISSN: 2283-303X

I cataloghi elettronici delle biblioteche

Tendenze evolutive degli OPAC


Tesi di laurea in biblioteconomia, Corso di laurea in Conservazione dei Beni Culturali, Facoltà di Lettere e Filosofia dell'Università Ca' Foscari di Venezia, relatore prof. Riccardo Ridi, correlatore prof. Paolo Eleuteri, anno accademico 2006/2007 discussa il 27 febbraio 2008.
di Lucia Tronchin (in linea da marzo 2008) 

5. Evoluzione dei codici catalogazione e opac

Una delle componenti dell’opac è l’insieme dei record bibliografici prodotti dai catalogatori basandosi su una serie di regole e convenzioni relative alla descrizione dei documenti e alla loro indicizzazione. Gli elementi individuati come significativi dai catalogatori diventano indici direttamente interrogabili dagli utenti e liste di termini significativi presentate nelle funzioni di browsing; gli altri elementi presenti nei record catalografici e non indicizzati costituiscono la base sulla quale operano le funzioni di ricerca per parola. Il lavoro di redazione del record catalografico con tutte le sue relazioni, in sostanza la catalogazione descrittiva e semantica del documento e la costruzione delle relazioni tra quelle descrizioni e le altre presenti nel catalogo, è dunque di grandissima importanza nel determinare le possibilità di ricerca nel catalogo. E’ quindi naturale che in un momento in cui i cataloghi delle biblioteche sono sottoposti a grandi cambiamenti sia nel contenuto, con l’inclusione di una grande varietà di risorse anche digitali, sia nelle funzioni di ricerca, trasformandosi da strumenti di mera localizzazione a strumenti di orientamento bibliografico, ci si chieda se le regole catalografiche attuali possano produrre registrazioni in grado di assolvere a questi nuovi compiti, se i principi di catalogazione che erano validi per produrre un catalogo cartaceo coerente siano altrettanto validi in ambiente elettronico, se gli scopi del catalogo siano ancora gli stessi.

Conceptually, the objectives and functions of the catalogue are independent of its physical form and arrangement. Technology can, however, influence the way in which these functions are carried out: the more developments there are in the technology of catalogue construction and in the online environment, the more possibilities there are of achieving those objectives and functions (Fattahi 1997 pag. 25)[1].

E’ anche di pressante attualità verificare se i costi delle attività di catalogazione siano compatibili con le risorse disponibili in un ambiente in cui la massa dei documenti potenzialmente disponibili per essere catalogati è immensa e se esistano possibili alternative alla catalogazione manuale dei documenti che possano essere incluse nell’opac attraverso gli strumenti catalografici e i formati dei dati attualmente in uso o in altre forme.

 

I principi su cui si basano gli attuali codici di catalogazione furono stabiliti nel 1961 nel corso della Conferenza Internazionale sui principi di catalogazione (ICCP) di Parigi. Nonostante fossero gli anni in cui nascevano i primi sistemi di automazione in biblioteca, la formulazione di questi principi non tenne in alcun conto le nuove prospettive tecnologiche e il loro eventuale impatto sul catalogo e si basò sulle funzioni, sulle caratteristiche e modalità di gestione e consultazione proprie dei cataloghi tradizionali su supporto cartaceo (Weston 2002 pag. 69). Durante la conferenza il tema del rapporto tra informatica e catalogazione fu discusso a partire dalla relazione di Gull (Gull 1963) che metteva in discussione il valore dell’intestazione principale in ambiente elettronico e auspicava regole meno legate agli aspetti formali, ma l’impatto dell’automazione nelle biblioteche era ancora troppo limitato, specie riguardo al catalogo, perché queste considerazioni fossero valutate adeguatamente e avessero un qualche riflesso nei principi.

Dal 1963 cominciarono gli studi che avrebbero portato nel 1968 alla prima versione del formato MARC, un formato nato per lo scambio dei dati ma che ha nel tempo influenzato molto la struttura interna dei dati nei cataloghi poiché molti produttori di sistemi hanno cercato di rendere i formati interni simili al formato di scambio per minimizzare il lavoro necessario nelle fasi di trasferimento dei dati. Molti sistemi di automazione prevedono oggi, anche per l’immissione dei dati catalografici, uno schema simile a quello del formato di scambio e usano gli indicatori e le etichette MARC per la creazione degli indici di accesso e per la visualizzazione dei dati (Scolari 2000 pag. 14). Il formato è dunque strettamente correlato alle regole di catalogazione e trasferisce in ambiente elettronico i limitati dispositivi approntati da quelle regole per i cataloghi cartacei per esempio sviluppando solo i collegamenti relativi alle chiavi di ricerca primarie. Molte relazioni importanti tra entità catalografiche, infatti, pur presenti nell’area dell’edizione e specialmente nelle note, così come non sono oggetto di indicizzazione in fase di catalogazione, non hanno tag e indicatori MARC specifici e non vengono quindi espresse nel display dei dati limitando le possibilità di ricerca. Alcuni autori (per esempio Yee 2005) indicano modi in cui le informazioni presenti nel formato potrebbero essere recuperate per consentire di esplicitare meglio le relazioni tra le entità bibliografiche. Altri associano i formati MARC alle AACR2 in una critica molto radicale che fa parlare della necessità di definire “strategie di uscita da MARC” (Tennant 2002). Essendo la base della maggior parte dei cataloghi, di milioni e milioni di record, il loro abbandono, già prospettato nel passato, non è mai stato possibile per l’immenso onere che comporterebbe e questo ha di fatto reso statica la situazione. I formati MARC sarebbero inoltre di ostacolo allo sviluppo di cataloghi di nuova generazione perché non sono usati da nessun’altra comunità di utenti se non quella delle biblioteche e impedirebbero l’integrazione dei dati bibliografici nelle interfacce web (Miller 2000): si discute quindi di come renderli interoperabili con altri linguaggi se non di abbandonarli completamente[2].

Nonostante l’interesse internazionale intorno ai formati di scambio, fino al 1967, anno di pubblicazione delle Anglo-American Cataloguing Rules (AACR), in ambito catalografico, non si tenne conto della realtà dell’automazione che cominciava ad apparire in quegli anni nelle grandi biblioteche. L’ipotesi che l’elettronica potesse cambiare radicalmente la struttura del catalogo e fosse dunque necessario adottare criteri catalografici più flessibili e meno orientati alle procedure tradizionali non venne neanche considerata, forse per una scarsa conoscenza dei meccanismi dell’automazione e l’impossibilità di prevederne le ricadute (Weston 2002 pag. 89). Ancora nel 1979 Michel Gorman, citato da Weston (Weston 2001b), lamentava che il mondo bibliotecario si accontentasse di sfruttare la velocità di esecuzione delle procedure automatizzate rinunciando ad avvalersi in pieno delle caratteristiche relazionali dei sistemi informatici. Serrai, citato da Weston (Weston 2001b), vedeva come estremamente negativo il fatto che si fossero trasferite in ambiente elettronico le funzioni manuali, con l’aggiunta della sola ricerca per parole chiave, come se la scansione veloce dei data base rendesse superati i principi della mediazione catalografica e la necessità di riflettere intorno ad essi alla luce delle nuove tecnologie.

 

5.1  I principi di Parigi

Nel contesto della conferenza di Parigi, e delle regole di catalogazione nazionale che da essa discendono, principi significa essenzialmente obiettivi del catalogo, anche se in una diversa accezione sarebbero principi solo le direttive per la progettazione di un linguaggio bibliografico usate poi per creare un sistema che definisce le funzioni bibliografiche e le regole catalografiche[3]. Secondo i principi di Parigi, che riprendono la teorizzazione di Cutter del 1876, il catalogo deve essere uno strumento efficace per accertare:

1) se la biblioteca possiede un libro particolare identificato

per mezzo del suo autore e titolo, oppure

se l’autore non è nominato nel libro , per mezzo del titolo soltanto, oppure

se autore e titolo sono inadatti o insufficienti all’identificazione, un conveniente sostituto del titolo

2) quali opere di un particolare autore esistono in biblioteca

3) quali edizioni di una particolare opera esistono in biblioteca.

 

Nel 1979 Malinconico e Fasana (Malinconico–Fasana 1979) rielaborano questi obiettivi ed evidenziano le due modalità operative del catalogo: localizzazione e raggruppamento. Secondo questi autori (citati da Guerrini 2007 pag. 190) il catalogo ha il compito di

1) consentire la localizzazione fisica di un particolare documento

2) collegare le singole manifestazioni di un’opera particolare (le sue traduzioni ed edizioni, comprese quelle in formati diversi

3) collegare tutte le opere che sono il prodotto di un singolo agente responsabile della loro creazione, ovvero tutte le opere che hanno un’origine comune

4) collegare tutte le opere che trattano di un soggetto comune.

Il catalogo ha dunque una modalità nella quale individua certi documenti e una modalità in cui raggruppa o collega i documenti in base a caratteristiche prestabilite. I documenti presenti nel catalogo possono essere considerati da due punti di vista: come contenuto intellettuale e come materializzazione di quel contenuto in un oggetto fisico. Da questa duplicità consegue che il catalogo

Deve saper descrivere e al tempo stesso organizzare per rendere accessibili gli oggetti fisici e gli oggetti intellettuali che corrispondono ai documenti. E’ proprio alla duplice natura del documento che sono attribuite le ragioni di almeno due problemi fondamentali nella logica del catalogo: qual è l’oggetto della descrizione (la pubblicazione o l’opera) e a quale delle due funzioni (la localizzazione o il raggruppamento) debba essere assegnata la priorità (Guerrini 2007 pag. 191).

E’ evidente che i criteri che debbono venire applicati nella scelta e nella formulazione dei punti di accesso alla notizia, nonché nell’allestimento dei dispositivi atti a collegare le entità correlate, cambiano a seconda di quale delle due funzioni sia considerata prevalente. Se consentire il recupero di specifici documenti è la funzione principale del catalogo, la catalogazione dovrà basarsi sul documento fisicamente presente in biblioteca, sia per quanto riguarda la descrizione, sia per le intestazioni, che andranno individuate tra quelle presenti sul frontespizio, inteso come la fonte di informazioni bibliografiche con la quale i lettori hanno la maggiore familiarità. […] Qualora sia ritenuta prevalente l’altra funzione, cioè quella bibliografica, sarà invece l’opera, più che il documento fisicamente presente in biblioteca, a costituire l’oggetto della catalogazione. In questo caso, infatti, considerando il frontespizio come la fonte primaria per l’individuazione dei punti di accesso e per la parte più consistente della descrizione dell’entità, il catalogatore rischia di non disporre di tutti gli elementi necessari per individuare e rendere esplicita la rete delle relazioni esistenti (Weston 2001b pag 2-3).

Nel catalogo tradizionale la priorità assegnata alle funzioni di individuazione si traduceva nella scelta operativa di assegnare l’intestazione principale in base al contenuto della pubblicazione lasciando ai titoli uniformi e ai record di autorità il compito di consentire i raggruppamenti quando necessario. Oggi, che il catalogo è diventato multimediale e cooperativo, di notevoli dimensioni, aperto ad utenti locali e remoti, strumento di ricerca bibliografica oltre che di localizzazione, sembrerebbe necessario far prevalere una logica diversa cioè basare la catalogazione sull’opera piuttosto che sulla sua realizzazione fisica e privilegiare le funzioni di raggruppamento. E’ anche vero però che il catalogo attuale è inserito all’interno di un flusso di informazioni bibliografiche che coinvolgono diversi agenti, per esempio i produttori e distributori dei documenti o anche le agenzie che realizzano le bibliografie nazionali, per i quali l’oggetto di interesse resta la singola manifestazione fisica così come è su livelli gerarchicamente inferiori a quello di opera, sulla manifestazione o sul singolo documento, che avvengono molte delle attività svolte dagli utenti come quelle identificare e di scegliere il documento e attivare le funzioni di prestito locale o interbibliotecario.

 

5.2  FRBR

Proprio allo scopo di analizzare la quantità minima, nell’ottica del risparmio delle risorse, di dati bibliografici indispensabili a soddisfare le necessità delle diverse comunità di utenti dei record bibliografici è stato commissionato dall’IFLA uno studio che ha portato alla pubblicazione dei Functional Requirement for Bibliographic Record (FRBR) (IFLA 1998). Lo studio, basato sui concetti di entità e relazione, ha analizzato, in modo indipendente dai codici di catalogazione in uso, quali dati catalografici sono oggi utilizzati in tutta la catena che porta dalla creazione del documento alla sua utilizzazione nei cataloghi delle biblioteche al fine di individuare un set minimo di dati sufficienti a svolgere tutte le funzioni. Ha individuato le entità, cioè gli oggetti di interesse primario per gli utenti del catalogo (opera, espressione, manifestazione, item, persone, enti, concetti, oggetti, eventi, luoghi), gli attributi, cioè le caratteristiche delle entità, e le relazioni, ovvero le associazioni che intercorrono tra le entità individuate alla luce delle funzioni utente, cioè delle attività che l’utente svolge attraverso il catalogo (trovare: cioè reperire i materiali che corrispondano a determinati criteri, per esempio tutto ciò che riguarda un certo soggetto, che è edito in un certo anno, di cui è autore un certo ente, ecc.; identificare: cioè verificare l'identità di un'entità, distinguerla da altre che hanno con essa caratteristiche in comune; selezionare: cioè scegliere, fra le altre, l'entità che ha le caratteristiche desiderate, per esempio una certa lingua del testo; ottenere: cioè accedere all'entità, ad esempio ottenere una copia in prestito) (Spinelli 2002).

Il modello FRBR sta avendo un grande impatto nelle biblioteche anche in relazione agli opac. Si ritiene, infatti, che possa dare un contributo a due dei principali problemi dei cataloghi attuali: l’incapacità di trovare, collegare tra loro e mostrare all’utente tutte le versioni di un’opera che esistono nel catalogo e l’incapacità di tener conto delle varianti dei titoli e dei nomi (Yee 2005). Gli studi si muovono in diverse direzioni: la maggior parte dei lavori focalizza la propria attenzione nel cercare il modo di dedurre le relazioni FRBR dai record catalografici esistenti e nel modificare le interfacce utenti per meglio mostrare quelle relazioni[4]. Da rilevazioni fatte sul catalogo OCLC (Bennett–Lavoie–O’Neill 2003) le opere costituite da una singola manifestazione per opera sono circa l’80%: questo significa che per queste opere il record di autorità, titolo uniforme e autore, potrebbe essere generato automaticamente sulla base della catalogazione già eseguita con le attuali norme. Sul restante 20% sarebbe necessario intervenire per stabilire i necessari collegamenti tra opere, espressioni, manifestazioni e item. Una volta fatto questo il lavoro di mantenimento del catalogo sarebbe meno oneroso, per esempio soggetto e classificazione potrebbero essere dati una sola volta nel record relativo all’opera (Tillet 2004). Il fatto che non tutte le informazioni necessarie siano già presenti nei record e che quelle che ci sono presentino delle ambiguità che non possono essere risolte automaticamente, come abbiamo visto parlando del formato MARC, renderebbe difficile applicare la nuova struttura al catalogo tradizionale. Finora gli algoritmi individuati nelle sperimentazioni hanno lavorato solo sulle relazioni opera-manifestazione trascurando gli altri livelli (Weston 2007 pag. 243). Secondo Weston i cataloghi modellati su FRBR mostrerebbero come il problema della duplice natura del catalogo non possa essere risolto se non pensando a un catalogo di doppio livello:

un primo archivio con le registrazioni catalografiche contraddistinte da un identificatore univoco che potrà fungere da puntatore; questo archivio sarà usato per le funzioni amministrative e di circolazione nonché per le interrogazioni che hanno come scopo la localizzazione del documento; un secondo livello costituito da una sovrastruttura bibliografica, realizzata secondo specifiche esigenze, da singole biblioteche specializzate o da centri di ricerca, nel quale per rappresentare il documento si richiameranno le notizie presenti nell’archivio delle registrazioni catalografiche per mezzo dell’identificatore univoco. Questo catalogo sarebbe destinato alle ricerche di tipo bibliografico ma dovrebbero essere possibili entrambe le ricerche. Questo prevederebbe naturalmente un ripensamento delle norme catalografiche nonché una precisa distribuzione delle competenze dal punto di vista operativo (Weston 2001b pag. 7)[5].

 

Altri studi cercano di creare prototipi di catalogo che siano strutturalmente basati sulle entità gerarchiche FRBR e non utilizzino le registrazioni MARC ma usino schemi di metadati completamente diversi (Mimno-Crane-Jones 2005). Quest’ultimo tipo di catalogo si ottiene frammentando il contenuto di una registazione bibliografica, in MARC costituita da un solo record, in diversi record gerarchici. Questo, se da un lato rende piuttosto complessa dal punto di vista tecnico la ricerca negli indici, dall’altro genera un catalogo in cui i diversi livelli FRBR sono separati e possono essere facilmente mantenuti, manipolati e riusati nonché rispondere alle interrogazioni in modo più potente e nel contempo semplice. Uno dei principali problemi emersi da queste ricerche è la mancanza di identificatori univoci specifici per le diverse entità ai diversi livelli: i principali numeri standard (per esempio l’ISBN) sono emessi solo a livello della manifestazione, mentre identificatori a livello di opera esistono solo entro domini ristretti, per esempio per le opere greche nel TGL (Thesaurus Linguae Graecae). L’utilizzo dei titoli uniformi, espressi in forma di stringa testuale, utile in un ambiente cartaceo, non dà risultati efficienti in ambiente elettronico dove lo scopo non è tanto descrivere il documento quanto identificarlo (Mimno-Crane-Jones 2005). Sarebbe quindi necessario individuare le caratteristiche di questi identificatori e l’agenzia che dovrebbe farsi carico del loro rilascio e mantenimento. Secondo Karen Coyle, nonostante il modello FRBR non sia un modello per il futuro, nel senso che vede e analizza il catalogo così come lo definiamo oggi, il fatto che si cominci a pensare ad un modello relazionale dei dati bibliografici apre la possibilità a sviluppi positivi, che potranno essere anche molto lontani da FRBR. Bisognerebbe intanto approfondire le relazioni tra le entità e considerarle non solo in senso gerarchico come si fa oggi, per esempio includendo la relazione “citato da”, rivedere la lista degli attributi che oggi appare piuttosto casuale e riconsiderare le funzioni utente in senso più ampio includendo attività come condividere, citare, salvare, collegare (Coyle 2007).

 

5.3  IME ICC

Accanto agli studi su FRBR sono state promosse dall’IFLA altre iniziative di standardizzazione a livello internazionale che hanno toccato diversi aspetti della catalogazione, dai record di autorità, con le Guidelines for Authority Records and References (GARR), alla descrizione, con la revisione degli standard ISBD in particolare ISBD(CR) e ISBD(ER), ai formati di visualizzazione, con la pubblicazione delle Guidelines for Online Public Access Catalogue (OPAC) Display. Le rilevanti innovazioni teoriche hanno spinto l’IFLA ad una riflessione sui principi stessi della catalogazione avviata nel 2003 con il primo IFLA Meeting of Expert on an International Cataloguing Code. Scopo del meeting era svolgere un’analisi dei codici nazionali di catalogazione per verificare quanto aderissero ai principi di Parigi. Nel corso dei lavori i partecipanti hanno rilevato la necessità di individuare un insieme di norme comuni, considerato che catalogatori e utenti condividono opac di tutto il mondo, e di elaborare un testo che fosse non solo integrativo dei principi di Parigi ma più ampio e sostitutivo. Si ritiene che queste norme, allo scopo di adeguare i principi di catalogazione alle trasformazioni derivanti dalle nuove tecnologie e alla realizzazione dei cataloghi elettronici, debbano tener conto di queste esigenze fondamentali:

1)      i principi devono essere validi per tutti i tipi di materiale documentario e non solo per le opere testuali

2)      i principi devono essere validi nell’ambito dei cataloghi elettronici

3)       i principi devono riguardare tutti gli aspetti delle registrazioni catalografiche, non solo quelle relative alla scelta e alla forma dell’intestazione del catalogo per autore e titolo

4)      i nuovi principi devono basarsi sulla grande tradizione catalografica ma anche sui documenti dell’IFLA relativi a FRBR, FRAR e alla catalogazione per soggetti (Guerrini 2007 pag. 215).

 

5.4  RDA

Le regole di catalogazione anglo-americane, nella nuova edizione che è in fase di elaborazione e dovrebbe essere pubblicata nel 2009, si chiameranno Resource Description and Access, una variazione nel nome voluta per indicare la profondità dei cambiamenti e la rottura col passato che vogliono attuare.

La prima edizione delle AACR è del 1967. Nella redazione della seconda edizione, preparata dal 1974 al 1978, fu inclusa tra gli obiettivi la volontà di tener conto degli sviluppi nel campo dell’automazione delle biblioteche: nonostante questo l’impianto generale delle regole non rompeva con la tradizione che le voleva concentrate nella scelta e nella forma delle intestazioni, aspetti questi di fondamentale importanza in ambiente cartaceo ma che forse potevano essere ridimensionati in ambiente elettronico a favore dell’individuazione di altre possibili relazioni tra opere e autori da esplicitare attraverso il catalogo. Queste regole sono diventate negli anni le più diffuse al mondo e sono state prese come modello da numerosi codici nazionali anche grazie alla diffusione delle reti informatiche tra biblioteche e alla pratica della catalogazione derivata e cooperativa (Weston 2002 pag. 92). Nella seconda edizione, e in maniera più consistente nella successiva revisione del 1988, per adeguarsi alle nuove tipologie di documenti via via disponibili sul mercato, sono state previste regole per la catalogazione di una grande varietà di materiali, incluse le risorse elettroniche locali e remote. La revisione delle AACR2 iniziata nel 1997 che avrebbe dovuto portare alle AACR3 si è nel tempo trasformata nella volontà di creare codice completamente nuovo. Le RDA nascono con l’intento di incorporare il modello concettuale FRBR e di cambiare volto agli opac (Hider-Huthwaite 2006). In realtà fin dalla prima bozza del 2004 hanno suscitato parecchie critiche per essere troppo legate al passato e incapaci di rispondere alle questioni aperte dalle nuove risorse informative disponibili, dai cambiamenti tecnologici e di finalità del catalogo, dal cambio complessivo dell’ambiente informativo, degli utenti e delle loro necessità[6]. All’interno dell’ALA (American Library Association) è emersa una crescente sfiducia circa la possibilità che il processo di sviluppo delle RDA porti ad uno standard accettabile e nel novembre 2007 la bozza del rapporto del Working Group on the Future of Bibliographic Control organizzato dalla Library of Congress include fra le sue raccomandazioni la sospensione del lavoro sulle RDA finchè non sia accertata la loro validità[7].

 

5.5  RICA

Il codice italiano di catalogazione Regole Italiane di Catalogazione per Autori fu pubblicato nel 1979 tenendo presenti i principi di Parigi e le norme internazionali più importanti tra le quali le AACR, le regole tedesche e le norme ISBD. Dal 1997 è attiva presso l’ICCU una Commissione per l’aggiornamento e le eventuali semplificazioni delle regole per la compilazione del catalogo alfabetico per autori nelle biblioteche italiane i cui compiti sono così descritti:

riesaminare analiticamente il testo delle regole italiane di catalogazione per autori; verificarne, ad oltre vent’anni dalla pubblicazione, l’effettiva rispondenza all’evoluzione delle pratiche catalografiche a livello internazionale, al contesto automatizzato in cui attualmente si opera e alle nuove tipologie di materiali sempre più presenti nelle biblioteche; predisporre nuovi testi; seguire l'eventuale evoluzione delle norme nel tempo chiarendone l'applicazione e adeguandone i contenuti.

La commissione ha seguito il dibattito internazionale in corso, valutando in particolare l’idoneità del modello FRBR a fungere da base per la revisione del codice. Fino al 2006 sono stati prodotti diversi documenti sui vari aspetti catalografici che sono tuttora allo stato di bozza. Secondo Guerrini

L’atteggiamento della commissione è ispirato a cautela, sia nella conservazione di norme non più rispondenti alle mutate esigenze, sia nell’accoglienza acritica, o pedissequa, di nuove terminologie non ancora del tutto assestate (Guerrini 2007 pag. 220).

5.6  La catalogazione semantica

Uno degli obiettivi del catalogo è raggruppare le opere che condividono lo stesso soggetto consentendo agli utenti di individuare opere di cui non conoscono né l’autore né il titolo. La ricerca per soggetto è tra le più difficili per l’utente perché, non avendo alcun riferimento conosciuto, come il titolo o l’autore, da cui iniziare la ricerca, egli deve essere in grado di individuare i termini che il catalogatore ha utilizzato per descrivere il contenuto del documento. Questi termini appartengono ad un vocabolario controllato che non riflette il linguaggio comune, ma sono attinti piuttosto da espressioni precise e specifiche delle diverse discipline cui il soggetto fa riferimento. E’ quindi abbastanza frequente che l’utente immetta un termine che non è stato usato dal catalogatore e ottenga una risposta nulla, che viene interpretata come “non esistono documenti su questo argomento” mentre potrebbe semplicemente significare “non hai usato il termine usato dal catalogatore”. Il lavoro richiesto per la catalogazione semantica di un documento è piuttosto impegnativo perché richiede l’analisi del contenuto intellettuale e la sua successiva formalizzazione: per questo mentre alcuni sostengono la necessità di mettere l’utente nelle condizioni di utilizzare al meglio la ricerca per soggetto con dispositivi che consentano il browsing nelle liste di soggetti organizzando i soggetti per faccette o mostrando le relazioni di tipo tesaurale tra i termini, o suggerendo ricerche alternative con termini simili, altri sostengono che è opportuno cessare questa pratica costosa perché la ricerca per soggetto può essere sostituita dalla ricerca per parole chiave. In particolare nell’ambiente digitale la ricerca per parola chiave sarebbe molto più efficiente realizzandosi su tutto il documento e non solo sui metadati di soggetto.

A favore di questa seconda ipotesi è Karen Calhoun. Il suo rapporto The Changing nature of the catalog and its integration with other discovery tools (Calhoun 2006) riflette la posizione della dirigenza della Library of Congress riguardo alla catalogazione, posizione che va nel senso di ridurre gli investimenti, sia evitando la catalogazione dettagliata dei singoli documenti a favore di un trattamento a blocchi e rapido, fatto di sola catalogazione derivata, sia abbandonando l’indicizzazione semantica fatta da esseri umani. A sostegno di questa posizione Calhoun evidenzia come il catalogo sia un prodotto nella fase declinante del suo ciclo di vita, la cui posizione è erosa tanto da essere considerato marginale da chi effettua delle ricerche, un prodotto ormai sostituito da internet e dai suoi motori di ricerca. Thomas Mann nella sua critica a Calhoun (Mann 2006), contesta diversi aspetti del rapporto tra cui l’applicazione del modello imprenditoriale alle biblioteche e la valutazione complessiva del ruolo delle biblioteche, che secondo lui è contraddetta da recenti studi (OCLC 2005, Friedlander 2002). In particolare egli sottolinea come esista una differenza fondamentale tra chi cerca rapidamente informazioni (quick information seekers) e gli studiosi. Gli studiosi sono un segmento particolare di utenza, una nicchia, verso il quale le biblioteche di ricerca hanno delle responsabilità specifiche riconosciute dai cittadini i quali da molti di anni, attraverso le tasse, le finanziano, ribadendone il valore. Il modo in cui gli studiosi fanno le loro ricerche è sostanzialmente diverso da chi cerca rapidamente informazioni: essi vogliono un quadro complessivo di tutte le fonti, in particolare quelle più significative per il loro campo; non vogliono duplicare ricerche già fatte; vogliono sia i libri recenti sia quelli anteriori che non sono più in commercio e li vogliono in tutte le lingue; sono interessati alle correlazioni tra il loro lavoro e altre discipline; vogliono sistemi che consentano di distinguere le fonti rilevanti che non potrebbero individuare con parole chiave; non vogliono liste lunghissime in cui materiale pertinente è sepolto da materiale inutile trovato dalle parole chiave giuste applicate a concetti sbagliati. La ricerca per parole chiave e l’ordinamento per rilevanza non soddisfano queste necessità. L’organizzazione delle voci, il controllo terminologico che applicano, il superamento della diversità linguistica dei documenti fanno delle liste di soggetto uno strumento di gran lunga superiore alle interrogazioni per parola chiave e pertanto imprescindibile in una biblioteca. Questo non significa che debba essere l’unico strumento: chi ha bisogno di trovare “qualcosa” lo farà attraverso le parole chiave, chi ha necessità di farsi un quadro complessivo della letteratura su un certo argomento userà le funzioni di browsing dei soggetti[8]. Mann sottolinea anche il fatto che le strutture logiche che permettono il recupero sistematico dei documenti devono essere realizzate da catalogatori professionali

Structures that bring about systematic retrieval cannot be created quickly by technicians, by computer algorithms, by “under the hood” programming behind a blank keyword search box, or by “throwing more keywords into the hopper.” They can be created only by professional library catalogers (Mann 2006 pag. 17)[9].

Secondo Marta Yee l’organizzazione dei soggetti, con la loro rete di rinvii e richiami, dà all’utente risposte più efficienti quanto a richiamo e precisione rispetto alla travolgente mole di risultati proposta da Google e questo costituisce per lui una gratificazione immediata. Questo risultato è frutto di un lavoro pagato e costoso che le biblioteche, come gli archivi e i musei, hanno già fatto e che sarebbe vanificato della fusione di questi dati con record contenenti vari tipi di metadati privi di vocabolario controllato e di controlli di autorità su titoli e autori (Yee 2006).


 



[1] Concettualmente, gli obiettivi e le funzioni del catalogo sono indipendenti dalla sua forma e dalla sua organizzazione fisica. La tecnologia può tuttavia influenzare il modo in cui queste funzioni vengono svolte: più è sviluppata la tecnologia di costruzione del catalogo e dell’ambiente on line, maggiori sono le possibilità di conseguire quegli obiettivi e quelle funzioni.

[2] Si veda il progetto Marc in XML della Library of Congress <http://www.loc.gov/marc/marcxml.html> .

[3] Secondo Svenonius (Svenonius 2000), citato da Guerrini, nell’ambito della letteratura professionale sono riconosciuti i seguenti principi:

a) principio dell’interesse dell’utente del catalogo: le decisioni adottate nel creare le descrizioni vanno prese tenendo presente l’utente del catalogo. Un sottoprincipio è: principio dell’uso comune: il lessico normalizzato usato nelle descrizioni deve essere in accordo con quello della maggioranza degli utenti;

b) principio di presentazione: le descrizioni devono essere basate sul modo in cui ciascuna entità descrive se stessa. Un sottoprincipio é: principio di accuratezza: le descrizioni devono rappresentare fedelmente le entità descritte;

c) principio di sufficienza e necessità: le descrizioni devono essere sufficienti a raggiungere gli obittivi fissati e non devono includere elementi non necessari a questo scopo. Un sottoprincipio è: principio di significatività: le descrizioni devono includere solo gli elementi che sono bibliograficamente significativi;

d) principio di standardizzazione: le descrizioni devono essere normalizzate, fin dove possibile, in estensione e livello;

principio di integrazione: le descrizioni per tutti i tipi di materiali devono basarsi, fin dove è possibile, su regole comuni (Guerrini 2007b pag. 188).

[4] Si veda per esempio il progetto di OCLC <http://www.oclc.org/research/projects/frbr/default.htm>, in particolare lo studio per la trasformazione di dati MARC21 in dati utilizzabili secondo il modello FRBR.

[5] Per una realizzazione di questo tipo di catalogo si veda AustLit Australian Literature Gateway <http://ww.austlit.edu.au/>. In questa realizzazione non si tratta effettivamente di due archivi separati ma il raggruppamento delle notizie per espressioni e per formato avviene dinamicamente in risposta alle interrogazioni dell’utente.

[6] Per un esame dei principali motivi per cui le RDA non sarebbero in grado di rispondere alle esigenze di nuovi modelli di opac si vedano Coyle e Hilmann (Coyle-Hilmann 2007).

[7] Il rapporto è consultabile a questo indirizzo <http://www.loc.gov/bibliographic-future/news/lcwg-report-draft-11-30-07-final.pdf>.

[8] Per una esemplificazione dettagliata della ricerca per soggetti rispetto alla ricerca per parole chiave si veda anche Mann 2007.

[9] Strutture che permettono il recupero sistematico non possono essere realizzate rapidamente da tecnici, da algoritmi o da programmi “dietro le quinte” di una finestrella di ricerca con parole chiave, o “mettendo più parole chiave nel calderone”. Possono essere realizzate solo da catalogatori professionali… (traduzione di Alberto Petrucciani).


PRECEDENTE - INDICE - SUCCESSIVO
| © ESB Forum | a cura di Riccardo Ridi |