2007-11-13

Metadata: Γνωστά ή άγνωστα?

Ο όρος μεταδεδομένα, είναι κάτι που για πρώτη φορά άκουσα ως φοιτήτρια όταν βρισκόμουν στο 5ο εξάμηνο της σχολής... και όχι στο πλαίσιο των μαθημάτων. Σαν όρος ακουγόταν ως κάτι πολύ σημαντικό, κάτι που ως τότε δεν ήξερα και ίσως κάτι που για να το κατανοήσω θα έπρεπε να έχω ειδικές γνώσεις. Στη συνέχεια, άκουσα για το περιβόητο DC (Dublin Core 15-element set, Ohio:1995 αν δε με απατά η μνήμη μου) που φαινόταν σαν κάτι απλό και φυσικά δεν ήταν τίποτε περισσότερο από ένα σχήμα για την καταγραφή μεταδεδομένων.


Τι είναι όμως τα μεταδεδομένα; Είναι κάτι τόσο άγνωστο; Εντάξει, ο όρος αποτελεί καινοτομία, σχετικά, αλλά πρακτικά, ως έννοια είναι όντως κάτι τόσο καινοτόμο;

Τα μεταδεδομένα συνήθως ορίζονται ως data about data. Είναι "δομημένη πληροφορία για την περιγραφή και επεξήγηση, τον εντοπισμό ή τη διευκόλυνση της ανάκτησης, χρήσης και διαχείρισης πληροφοριακών πόρων" (Δανείζομαι τον ορισμό από παρουσίαση του κ. Καπιδάκη).
Αν το σκεφτούμε με τη στενή βιβλιοθηκονομική λογική αυτό δεν είναι τίποτε άλλο από την βιβλιογραφική και θεματική επεξεργασία που κάνουμε τόσα χρόνια για τα βιβλία των βιβλιοθηκών μας. Οι κατάλογοί μας, δηλαδή, είναι μεταδεδομένα. Η μόνη διαφορά είναι ότι συνήθως χρησιμοποιούμε τον όρο για να περιγράψουμε τα δεδομένα για ηλεκτρονικούς / ψηφιακούς πόρους.

Τα μεταδεδομένα είναι η ταυτότητα ενός ψηφιακού αντικειμένου, όπως αντίστοιχα ήταν (προ αμνημονεύτων ετών) τα καρτελάκια σε ISBD μορφή ή τώρα πια το MARC για το υλικό παραδοσιακής μορφής.

Ο ρόλος των μεταδεδομένων στον internet και στις ψηφιακές βιβλιοθήκες είναι πρωταρχικός. Και αυτό γίνεται ευκολότερα κατανοητό με μια εφαρμογή αναζήτησης σε μια συλλογή ψηφιακής βιβλιοθήκης με πεπερασμένο και σχετικά μικρό αριθμό ψηφιακών αντικειμένων και της ίδιας αναζήτησης στο περιβάλλον του WWW.
1η περίπτωση: Αναζήτηση στην αρκετά περιορισμένη συλλογή μιας ψηφιακής βιβλιοθήκης

Η έλλειψη μεταδεδομένων σίγουρα θα επιβραδύνει κάπως την αναζήτησή μας ενώ ταυτόχρονα το να δημιουργήσουμε μεταδεδομένα για ένα πεπερασμένο πλήθος ψηφιακών αντικειμένων είναι εύκολο. Αυτό βοηθά στο να διαχειριστούμε τη συλλογή μας πιο εύκολα, να κερδίζουμε χρόνο στις αναζητήσεις και φυσικά να κερδίζουμε και σε ακρίβεια αποτελέσματος καθώς όταν έχει προηγηθεί λογική επεξεργασία του περιεχομένου ενός τεκμηρίου είναι φυσικό τα αποτελέσματα να είναι καλύτερης ποιότητας από αυτά που δίνει η αναζήτηση σε πλήρες κείμενο.

2η περίπτωση: Αναζήτηση στο χάος του internet

Σίγουρα η καταγραφή μεταδεδομένων από κάποιον για όλους τους πόρους του internet είναι αδύνατη. Ίσως να διευκολυνόταν η κατάσταση αν ο κάθε δημιουργός / παραγωγός ψηφιακού αντικειμένου έγραφε τα μεταδεδομένα για τους πόρους που παράγει. Ας σκεφτούμε, όμως, τι θα συνέβαινε στην περίπτωση της αναζήτησης στα ψηφιακά αντικείμενα του WWW αν αυτά δεν είχαν ευρετηριαστεί. Ήδη η ανάκτηση αποτελεσμάτων σε ορισμένα θέματα καθυστερεί λίγο ακόμη και με γρήγορες συνδέσεις. Ας σκεφθούμε τι θα συνέβαινε αν δεν υπήρχαν ευρετήρια αυτών των πόρων! Ο όγκος των πληροφοριών είναι ήδη τεράστιος και η αναζήτηση σε full text δεν θα ολοκληρωνόταν ποτέ!
Το σημαντικότερο πλεονέκτημα όμως στην περίπτωση αναζήτησης στο web είναι πως δεν χρειάζεται να δημιουργούμε μεταδεδομένα για όλα τα αντικείμενα καθώς υπάρχουν και άλλοι τρόποι αναζήτησης εκτός της λεκτικής. Για παράδειγμα, μπορεί να γίνει αναζήτηση ενός γραφήματος, επί παραδείγματι, χωρίς να έχει περιγραφεί με μεταδεδομένα. Απλά, γίνεται ταυτοποίηση του γραφήματος που αναζητούμε προς αυτά της συλλογής και ταιριάζουν με την εικόνα του δικού μας γραφήματος.

Εδώ θα ήθελα να κάνω μια διευκρίνιση: τα ίδια τα μεταδεδομένα ενίοτε είναι δεδομένα. Για παράδειγμα, ο OPAC μιας ψηφιακής βιβλιοθήκης είναι μεταδεδομένο γιατί περιγράφει το περιεχόμενο μιας υπάρχουσας συλλογής. Ένας συλλογικός κατάλογος , όμως, που δεν πρόκειται για κατάλογο μιας συγκεκριμένης συλλογής, δεν είναι data about data. Ουσιαστικά πρόκειται για ένα σύνολο δεδομένων. Συνεπώς, το ίδιο ψηφιακό αντικείμενο ανάλογα με το ποιο είναι το σημείο αναφοράς μπορεί να είναι τόσο δεδομένο όσο και μεταδεδομένο.

Πιστεύω ότι τα μεταδεδομένα είναι ένα θέμα αρκετά σημαντικό καθώς και δυναμικό μιας και σε μεγάλο βαθμό τώρα εξελίσσεται ως αντικείμενο της επιστημονικής έρευνας, οπότε πιθανόν να νιώσω την ανάγκη να επανέλθω... Προς το παρόν όμως, απλά ελπίζω στα σχόλιά σας που θα προάγουν τη συζήτηση.

Υ.Γ. Μην ξεχνάτε τα social tags. Αν εμείς οι βιβλιοθηκονόμοι δεν τα χρησιμοποιούμε για να ευρετηριάσουμε τα blogs μας από ποιον περιμένουμε να το κάνει; Και σε περίπτωση που αμφιβάλλει κάποιος, ναι, τα tags είναι μεταδεδομένα. Προσοχή όμως! Tags είναι οι μεμονωμένες λέξεις. Όταν χρησιμοποιούμε φράσεις πρόκειται για annotations. Αυτό ως σημείωση για την επιλογή του όρου. Σε κάθε περίπτωση πάντως είναι μεταδεδομένα.

Δεν υπάρχουν σχόλια: