CulDiLeγια τη Ψηφιοποίηση Πολιτιστικών Αγαθών
CULtural DImensions of deep LEarning
Ένα ολοκληρωμένο ευφυές σύστημα για τη ψηφιακή καταγραφή, επεξεργασία και κατανόηση πολιτιστικών εγγράφων.
Η ΑΝΑΓΚΗ ΓΙΑ ΚΑΙΝΟΤΟΜΙΑ ΣΤΗΝ ΨΗΦΙΟΠΟΙΗΣΗ ΚΑΙ ΤΕΚΜΗΡΙΩΣΗ ΠΟΛΙΤΙΣΤΙΚΩΝ ΑΓΑΘΩΝ
Παρά τις ενισχύσεις μέσω ΕΣΠΑ και άλλων προγραμμάτων, η πλειοψηφία των αρχείων και των βιβλιοθηκών παραμένει ακόμη σε αναλογική μορφή.
Ένας από τους βασικούς λόγους είναι ότι η ψηφιοποίηση απαιτεί πολύ χρόνο και εξειδικευμένο, υψηλού κόστους εξοπλισμό. Επιπλέον, η επιστημονική τεκμηρίωση —ειδικά σε υλικό όπως ιστορικά έγγραφα, παλαίτυπα και χειρόγραφα— είναι μια χρονοβόρα και απαιτητική διαδικασία, η οποία πολλές φορές ξεπερνά σε διάρκεια και πολυπλοκότητα την ίδια την ψηφιοποίηση.
Η τεκμηρίωση αυτών των τεκμηρίων περιλαμβάνει την καταγραφή κρίσιμων χαρακτηριστικών, όπως η διάταξη, η στοιχειοθεσία και το περιεχόμενο, ώστε να καταστεί δυνατή η αναζήτηση και η πρόσβαση. Για να καταδείξουμε πόσο αναγκαία είναι η τεχνολογική υποστήριξη σε αυτό το πεδίο, παραθέτουμε δύο παραδείγματα έργων που υλοποιήθηκαν με τον παραδοσιακό τρόπο.
Παράδειγμα 1: Ψηφιοποίηση μικροφίλμ
Σε πρόσφατο έργο, μετατράπηκαν 20.000 μικροφίλμ σε εικόνες εγγράφων. Κάθε μικροφίλμ απαιτούσε τουλάχιστον 8 ώρες επεξεργασίας: απομόνωση του εγγράφου από το καρέ, ξάκρισμα περιθωρίων, βελτίωση εικόνας. Μια νέα μέθοδος, βασισμένη σε τεχνικές layout, που εφαρμόστηκε πιλοτικά σε ένα μικρό ποσοστό (10%), απέδειξε ότι θα μπορούσε να μειώσει το χρόνο κατά περίπου 95%, εξοικονομώντας σχεδόν 72 ανθρωποέτη, με ταυτόχρονη παραγωγή ανώτερης ποιότητας εικόνων.
Παράδειγμα 2:
Τεκμηρίωση χειρογράφων του Μουσείου Μπενάκη Η τεκμηρίωση 117 χειρογράφων απαίτησε συνολικά 12 ανθρωποέτη. Αν και η πλήρης αυτοματοποίηση της τεκμηρίωσης δεν είναι εφικτή, μπορεί να επιτευχθεί σημαντική μείωση του χρόνου — ακόμα και κάτω από το 1/10 του συμβατικού — με χρήση ημι-αυτοματοποιημένων μεθοδολογιών, οι οποίες αναγνωρίζουν και προτείνουν βασικά τεκμηριακά στοιχεία.
Η ΚΑΙΝΟΤΟΜΟΣ ΠΡΟΣΕΓΓΙΣΗ ΜΑΣ
Στο πλαίσιο του παρόντος έργου, αναπτύσσουμε ένα πλήρες και καινοτόμο σύστημα λογισμικού, το οποίο συνδυάζει:
- Σύλληψη (capturing) και βελτιστοποίηση εικόνας από σαρωτές χαμηλού κόστους,
- Κατανόηση τεκμηρίων με χρήση τεχνητής νοημοσύνης,
- Και υποβοήθηση της τεκμηρίωσης, βασισμένη σε νευρωνικά δίκτυα.
ΕΞΥΠΝΗ ΑΝΑΛΥΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ
Η έμπειρη υποβοήθηση της τεκμηρίωσης περιλαμβάνει την αυτόματη αναγνώριση και επισήμανση σημαντικών στοιχείων, όπως:
- Αρχίγραμμα
- Τυπογραφικά κοσμήματα
- Τίτλοι, αφιερωματικά σημειώματα
Λέξεις-κλειδιά ανά είδος τεκμηρίου (π.χ. σε Ευαγγέλιο: «Τω καιρώ εκείνω»)
ΜΙΑ ΜΟΝΑΔΙΚΗ ΕΦΑΡΜΟΓΗ ΠΑΓΚΟΣΜΙΑΣ ΕΜΒΕΛΕΙΑΣ
Το αποτέλεσμα θα είναι ένα πρωτοποριακό λογισμικό υποβοήθησης της επιστημονικής τεκμηρίωσης, μοναδικό σε παγκόσμιο επίπεδο, το οποίο:
- Εναρμονίζεται πλήρως με την προτεραιότητα 2.1.8 του σχετικού προγράμματος,
- Εστιάζει στη βελτίωση της ποιότητας ψηφιοποίησης,
- Περιορίζει δραστικά τον χρόνο και το κόστος της τεκμηρίωσης.
Η πλατφόρμα μας βασίζεται στη μετεξέλιξη της υπάρχουσας τεχνολογίας HDOC+ της Honest Partners, και εξασφαλίζει πλήρη συμβατότητα με αποθετήρια ανοικτού λογισμικού, τόσο για τις εικόνες όσο και για τα τεκμηριωμένα δεδομένα.
Στόχος μας είναι να προσφέρουμε σε αρχεία, μουσεία και βιβλιοθήκες ένα προσιτό, αποδοτικό και τεχνολογικά προηγμένο εργαλείο, που θα ενισχύσει ουσιαστικά την πρόσβαση, διαχείριση και διαφύλαξη της πολιτιστικής κληρονομιάς.
CulDiLeΥΨΗΛΗΣ ΠΟΙΟΤΗΤΑΣ ΨΗΦΙΑΚΑ ΑΝΤΙΓΡΑΦΑ
Στόχος μας είναι η παραγωγή υψηλής ποιότητας ψηφιακών αντιγράφων, μέσω προηγμένης προ-επεξεργασίας εικόνας. Αυτή η βελτίωση είναι θεμελιώδης για την επιτυχία των επόμενων σταδίων, όπως κατάτμηση και αναγνώριση.