- Advertisement -

Aρχεία και Τεχνητή Νοημοσύνη

3

- Advertisement -

Τα «αρχεία» διατηρούν την πολύτιμη εμπειρία του παρελθόντος και υποστηρίζουν την ανασύνθεση και μελέτη γεγονότων, καταστάσεων, τάσεων, όπως διαμορφωνόταν στις δεδομένες συνθήκες κάθε εποχής. Το αρχειακό υλικό δεν είναι όμως – τουλάχιστον όχι μόνο – ένα στατικό σύνολο προς μελέτη από έναν στενό κύκλο ειδικών, αλλά πηγή διατήρησης της συλλογικής μνήμης και, ταυτόχρονα, κατανόησης και ερμηνείας των τρεχουσών δραστηριοτήτων και εξελίξεων σε κάθε επίπεδο (πολιτικό, οικονομικό, κοινωνικό, δημογραφικό, γεωχωρικό).

Μέχρι πριν από λίγες δεκαετίες το «απόρρητο» ήταν κυρίαρχος κανόνας και πρακτική στα αρχεία. Η αντίληψη αυτή άλλαξε υπό την επιρροή της εξέλιξης των δημοκρατικών θεσμών και της ανάδειξης του δικαιώματος πρόσβασης στην πληροφορία ως «μήτρα» άσκησης και άλλων δικαιωμάτων, όπως η έρευνα αλλά και τα δικαιώματα συμμετοχής στην κοινωνική, οικονομική και πολιτική ζωή και στην «Κοινωνία της Πληροφορίας». Οι νέες τεχνολογίες εκτόξευσαν τις δυνατότητες διατήρησης, επεξεργασίας και διάδοσης της πληροφορίας. Η επεξεργασία ενός τεράστιου όγκου δεδομένων στον αρχειακό τομέα και η προσβασιμότητα έδωσαν νέα ώθηση στην αξιοποίηση του πληροφοριακού αποθέματος, εκσυγχρονίζοντας τον ρόλο και την επιρροή των αρχείων.

Αρχειονόμοι και ερευνητές προσβλέπουν στην Τεχνητή Νοημοσύνη για να «τιθασεύσουν διαφορετικές γραφές, γλώσσες, είδη, μορφές, μορφότυπα, λεξιλόγια και σημασιολογικά στοιχεία», όπως χαρακτηριστικά ανέφερε η κυρία Δ. Κυριάκη-Μάνεση, συντονίζοντας τη συζήτηση που οργάνωσε το Ιδρυμα Κ. Σημίτη με θέμα «Τεχνητή Νοημοσύνη και Αρχεία». Μπορεί η ΤΝ να υποστηρίξει την αρχειακή εργασία ή – πολύ περισσότερο – να αναδείξει σχέσεις και συσχετίσεις, να διαχειριστεί, να ερμηνεύσει, να προσδώσει επιπλέον νόημα στο μεμονωμένο στοιχείο («μια φωτογραφία, ένα απόκομμα εφημερίδας, μια απλή απόδειξη συναλλαγής»);

Χωρίς αμφιβολία μπορεί να επιταχυνθεί η οργάνωση και η συστηματοποίηση των διάφορων συλλογών και βάσεων δεδομένων. Δραστηριότητες, όπως η ανάλυση του αρχειακού υλικού και η δημιουργία νέων μεθόδων που θα ενισχύσουν την αναλυσιμότητά του, συνιστούν μια βασική προσδοκία από τη χρήση συστημάτων ΤΝ. Η προσδοκία αυτή συνδέεται με την – αναπόφευκτα – αύξουσα παραγωγή πληροφορίας και αντίστοιχα αρχειακού υλικού. Είναι προφανής η ανάγκη για την οργάνωση των δεδομένων, τον εντοπισμό των μεταξύ τους συνδέσεων και συσχετίσεων, τη δημιουργία νέων αιτημάτων-ερωτημάτων (queries).

To ζητούμενο και το στοίχημα σε σχέση με τα αρχεία είναι πως η ΤΝ μπορεί να υποστηρίξει τον ρόλο των αρχείων, προτείνοντας συσχετίσεις και αναλύσεις. H αξία της ΤΝ έγκειται ακριβώς στην ικανότητα να αναδείξει τις συσχετίσεις, τους «μίτους» που θα οδηγήσουν στην ανακάλυψη νέων πληροφοριών, τις oμοιότητες και διαφορές μεταξύ διαφορετικών συνόλων δεδομένων. Στο αρχειακό υλικό μπορούν να εφαρμοστούν αναλυτικές μέθοδοι (όπως η εξόρυξη κειμένου, η ανάλυση συναισθήματος – emotion analysis κ.λπ.) και να καταστεί δυνατή η αναγνώριση και ταυτοποίηση αντικειμένων, προσώπων και ενοτήτων αλλά και ο έλεγχος ακεραιότητας και η επαλήθευση δεδομένων και τεκμηρίων.

Θα πρέπει βέβαια να λάβουμε υπόψη ότι η εισαγωγή συστημάτων ΤΝ σε σχέση με την αξιοποίηση του αρχειακού υλικού προϋποθέτει συχνά σημαντικής έκτασης και έντασης προεργασία ως προς την επεξεργασία του, έτσι ώστε να καθίστανται εφικτά ή πιο ουσιώδη η περιγραφή των περιεχομένων ενός αρχείου, η αλγοριθμική επεξεργασία τους, ο εντοπισμός επιμέρους στοιχείων και η διαλειτουργικότητα της αρχειακής πληροφορίας. Η δυνατότητα απόξεσης δημόσια διαθέσιμων πληροφοριών (scraping) από το δίκτυο, τα κοινωνικά δίκτυα και τα οπτικοακουστικά αποθετήρια συμβάλλουν στον εμπλουτισμό της πληροφοριακής βάσης.

Μια προσέγγιση που εστιάζει και εκκινεί από τη μέγιστη αξιοποίηση του αρχειακού υλικού μέσω της ΤΝ μπορεί να αντανακλά τον πλουραλισμό των αρχείων και την επιδίωξη της δομημένης, λειτουργικής «ανοιχτής πρόσβασης» σε αυτά. Ενα βασικό ερώτημα αφορά ωστόσο τις επιμέρους στοχεύσεις, τις μεθόδους και παραμέτρους με βάση τις οποίες θα σχεδιαστεί μια «αλγοριθμική» επεξεργασία ενός αρχείου. Πώς και με ποια κριτήρια αξιολόγησης θα προτείνει κανείς έναν αλγόριθμο για την «εξυγίανση» ή την «αξιολόγηση» «εγγράφων» που θα μπορούσε να «μιμηθεί» την ανθρώπινη κρίση ως προς την αντίληψη και πρόσληψη του περιεχομένου τους; Μιας κρίσης απαλλαγμένης από – ανθρώπινες και αλγοριθμικές – μεροληψίες;

Η χρήση συστημάτων ΤΝ για την ανάδειξη του πληροφοριακού πλούτου, τη συσχέτιση προσώπων, γεγονότων, επιμέρους ταξινομημένων ή και αταξινόμητων πληροφοριών συμβάλλει αναμφίβολα στην ερμηνεία, στην παραγωγή νέας πληροφορίας, στην ανάδειξη πτυχών που μπορεί να διαφεύγουν της ανθρώπινης προσοχής και αντίληψης. Η ποιότητα της διαδικασίας είναι κρίσιμη, ώστε η υφιστάμενη πληροφορία που αναδεικνύεται ή η νέα που παράγεται να ανταποκρίνεται σε προδιαγραφές: να είναι κατανοητή, εξηγήσιμη, να μην αναπαράγει προκαταλήψεις. Κυρίως να ανταποκρίνεται σε απαιτήσεις ακρίβειας και να μη συντελεί στην παραγωγή «fake historical views/news» που θα φέρουν και την «επισφράγιση» ενός αρχείου που αξιοποιήθηκε. Βέβαια ορισμένα «δομικά», εγγενή χαρακτηριστικά της ΤΝ, όπως η περιορισμένη ή ανύπαρκτη προδιαγνωσιμότητα, η αδιαφάνεια και η έλλειψη επεξηγησιμότητας ως προς τα αποτελέσματα, τα «στοιχεία εξόδου», ενδέχεται να εγείρουν ζητήματα και αμφιβολίες ως προς τις προτεινόμενες «απαντήσεις». Σε κάθε περίπτωση η λεγόμενη «ανθρώπινη παρέμβαση» για τον έλεγχο, αν μη τι άλλο, των αποτελεσμάτων παραμένει κεντρική προϋπόθεση για αξιόπιστη (χρήση της) ΤΝ.

Οταν κάνουμε χρήση εργαλείων ΤΝ πρέπει να έχουμε ως γνώμονα τις απαιτήσεις της «υπεύθυνης» και «αξιόπιστης» ΤΝ αλλά και τον σεβασμό θεμελιωδών δικαιωμάτων, όπως η προστασία των προσωπικών δεδομένων. Ενα δικαίωμα που βρισκόταν πάντα σε σχέση έντασης ή και σύγκρουσης με την πρόσβαση στα αρχεία και την επεξεργασία για ερευνητικούς σκοπούς. Η τήρηση των αρχών που διέπουν την επεξεργασία (αναλογικότητα, διαφάνεια, ενημέρωση) κατά την άντληση προσωπικών δεδομένων, την παραγωγή νέων δεδομένων, την εκπαίδευση των μοντέλων ΤΝ είναι αναγκαία συνθήκη για τη διαφύλαξη της αξίωσης πληροφοριακού αυτοκαθορισμού που εκτίθεται στον αυξημένο κίνδυνο που ενέχει η αλγοριθμική χρήση των προσωπικών πληροφοριών: της άντλησης/δημιουργίας πληροφορίας που ταυτοποιεί πρόσωπα από το «άγνωστο» και της χρήσης της σε παντελώς νέο πλαίσιο. Οπως, όμως, επανειλημμένα επισημαίνεται, οι άνθρωποι είναι πίσω από τους αλγορίθμους και η επιλογή τους μια ανθρώπινη απόφαση.

Η Λίλιαν Μήτρου είναι πρόεδρος του Ινστιτούτου

για την Ιδιωτικότητα, τα Προσωπικά Δεδομένα και την Τεχνολογία

- Post Down -

Comments are closed.