Η σημασία των FAIR δεδομένων στην επιστήμη της γης

Jans Aasman, Ph.D.13 Σεπτεμβρίου 2019

Η αποτίμηση των στοιχείων ως περιουσιακό στοιχείο της επιχείρησης πραγματοποιείται με τον πλέον έντονο τρόπο με την πάροδο του χρόνου. Όταν γίνεται σωστή διαχείριση, το ίδιο σύνολο δεδομένων υποστηρίζει πληθώρα περιπτώσεων χρήσης, γίνεται σχεδόν άμεσα διαθέσιμο κατόπιν αιτήματος και μπορεί να ανταλλάσσεται μεταξύ τμημάτων ή οργανισμών ώστε να αυξάνει συστηματικά την απόδοσή του με κάθε ανάπτυξη.

Αυτά τα πλεονεκτήματα της μόχλευσης δεδομένων ως επιχειρηματικού περιουσιακού στοιχείου είναι τα θεμέλια των αρχών της FAIR για εύκολες προσβάσιμες διαλειτουργικές επαναχρησιμοποιούμενες αρχές (FAIR), οι οποίες επηρεάζουν βαθιά τις δυσκολίες διαχείρισης της γεωλογικής επιστήμης. Πολλές οργανώσεις σε αυτόν τον χώρο έχουν αγκαλιάσει αυτές τις αρχές για να μοιράζονται γρήγορα πληροφορίες μεταξύ μιας ποικιλίας επιστημονικών κλάδων για την ασφαλή καθοδήγηση της διατήρησης της γης.

Σύμφωνα με τον Δρ. Annie Burgess, Διευθυντή Εργαστηρίου Συνεργατών Πληροφοριών Επιστήμης της Γης (ESIP), οι "πιό πιεστικές παγκόσμιες προκλήσεις δεν μπορούν να επιλυθούν από έναν μόνο οργανισμό. Οι επιστήμονες απαιτούν δεδομένα που συλλέγονται σε πολλαπλούς κλάδους, τα οποία συχνά διοικούνται από πολλούς διαφορετικούς οργανισμούς και ιδρύματα ». Όπως συνειδητοποιούν πολυάριθμα μέλη της κοινότητας των επιστημών της γης, ο πιο αποτελεσματικός τρόπος διαχείρισης αυτών των διαφορετικών δεδομένων σύμφωνα με τις αρχές FAIR είναι η χρήση των σημασιολογικών προτύπων υποστηρίζοντας γραφήματα γνώσης.

Αυτές οι ομοιόμορφες προσεγγίσεις για τη διαχείριση των μεταδεδομένων, των μοντέλων δεδομένων και της ορολογίας είναι το επίκεντρο της κίνησης των δεδομένων FAIR, εξασφαλίζοντας τη θέση των δεδομένων ως αναγνωρισμένο πλεονέκτημα της επιστημονικής κοινότητας.

Κοινοτική επιστήμη
Τα σημασιολογικά πρότυπα που υποστηρίζουν γραφήματα γνώσης έχουν σχεδιαστεί για μοναδική αναγνώριση, άμεση πρόσβαση και ανταλλαγή δεδομένων σε μορφή αναγνώσιμη από μηχανή. Είναι τα ίδια πρότυπα που είναι υπεύθυνα για τη διευκόλυνση αυτών των πλεονεκτημάτων στο World Wide Web και είναι εξαιρετικά ευεργετικά για την επαναχρησιμοποίηση δεδομένων στο πεδίο της γεωλογικής επιστήμης. Ο τομέας αυτός είναι ένας από τους πιο απαιτητικούς επιστημονικούς τομείς, διότι είναι τόσο εκτεταμένος, καλύπτοντας τη θαλάσσια ζωή, τις ατμοσφαιρικές ανησυχίες, τις μάζες της γης και τις υπόγειες εξελίξεις. Η δυνατότητα ταχείας ανταλλαγής δεδομένων σε αυτές τις διαφορετικές ειδικότητες αποτελεί αναπόσπαστο στοιχείο της προώθησης του πεδίου στο σύνολό του, όπως και τα άλλα πλεονεκτήματα της μοναδικής αναγνώρισης των δεδομένων και της γρήγορης πρόσβασης σε αυτά μέσω τεχνικών αναγνώσιμων από μηχανές.

Παρατηρήθηκε ο Δρ. Lewis McGibbney, επιστήμονας δεδομένων για το εργαστήριο Jet Propulsion της Καλιφόρνιας του Ινστιτούτου Τεχνολογίας και συμπρόεδρος της ομάδας εργασίας NDSA ESDSWG για την Αναζήτηση στην Αναζήτηση: «Είμαστε σε ένα συναρπαστικό στάδιο όπου υπάρχει μια κρίσιμη μάζα εμπειρογνωμόνων και οργανισμών γύρω από σφαίρα με παρόμοιους στόχους καθώς και τη συνειδητοποίηση ότι χρειαζόμαστε εφαρμογές έντασης γνώσης. Η σημασιολογική τεχνολογική στοίβα είναι ένα κρίσιμο κομμάτι για την κατασκευή έξυπνων εφαρμογών για περιπτώσεις χρήσης της έντασης της γνώσης στην περιοχή των γεωεπιστημών. »Επιπλέον, τα σημασιολογικά πρότυπα επιτρέπουν σε αυτές τις οργανώσεις να δημοσιεύουν δεδομένα και ευρήματα σε επαναχρησιμοποιήσιμη μορφή.

Σύνδεση ανθρώπων και μηχανών
Η προσέγγιση FAIR περιστρέφεται γύρω από τη σύνδεση διαφορετικών στοιχείων δεδομένων σε ένα γράφημα γνώσης. Αυτά τα γραφήματα γνώσης μπορούν με τη σειρά τους να συνδεθούν μεταξύ διαφορετικών οργανισμών ή να «δημοσιευθούν» στο διαδίκτυο για καθολική πρόσβαση - η οποία είναι κρίσιμη για τη διαλειτουργικότητα. Αυτή η προσέγγιση δεν απαιτεί μόνο κάθε ξεχωριστό δεδομένο να έχει το δικό του μοναδικό αναγνωριστικό, αλλά και μια πλούσια περιγραφή των μεταδεδομένων του βασισμένων σε τυποποιημένα λεξιλόγια και ταξινομίες που γρήγορα κατανοούνται και προσπελάζονται μέσω μηχανών. Τα μοντέλα σημασιολογικών δεδομένων (οντολογίες) τυποποιούν τις εγγενείς διαφορές στο σχήμα που χρησιμοποιούν διάφοροι οργανισμοί για διαφορετικές εφαρμογές, ενισχύοντας περαιτέρω τη διαλειτουργικότητα των συστημάτων πληροφορικής που υιοθετούν τις αρχές FAIR.

Το Ινστιτούτο Ερευνών για το Ενυδρείο του Monterey Bay, ο Ανώτερος Μηχανικός Λογισμικού Carlos Rueda σχολίασε ότι "το έργο διαλειτουργικότητας μεταδεδομένων θαλάσσιων μεταφορών (Marine Metadata Interoperability Project) ανέπτυξε το Ορνιθολογικό Μητρώο και Αποθήκη (ORR) του MMI, το οποίο εκμεταλλεύεται την AllegroGraph για την παροχή ισχυρών διαλειτουργικών σημασιολογικών υπηρεσιών που διασυνδέουν περιεχόμενο στο διαδίκτυο με ουσιαστικό τρόπο τόσο για τους ανθρώπους όσο και για τις μηχανές που καταναλώνουν. "Με την παροχή δυνατότητας σε διάφορους επιστημονικούς οργανισμούς στο έργο διαλειτουργικότητας μεταδεδομένων θαλάσσιων μεταφορών να καταχωρήσουν οντολογίες των μυριάδων αποθετηρίων τους με αυτόν τον τυποποιημένο τρόπο, η ολοκλήρωση και η προσβασιμότητα των δεδομένων επιταχύνονται.

Ενιαία ποικιλομορφία

Ίσως το κεφαλαιουχικό πλεονέκτημα της ενεργοποίησης των αρχών FAIR με γραφήματα γνώσης στην κοινότητα της επιστήμης της γης είναι η ικανότητα τυποποίησης στη συλλογή διαφόρων δεδομένων σχετικών με τους επιστήμονες. Ο μεγάλος αριθμός διαφορετικών ειδικοτήτων στον τομέα αυτό απαιτεί δεδομένα από φαινομενικά άπειρες ποικιλίες. Οι πηγές περιλαμβάνουν δεδομένα αισθητήρων από την ύδρευση, την κεραία και τις επίγειες πηγές, εκτός από δορυφορικά δεδομένα και δεδομένα από φυσικά δείγματα. Επιπλέον, τα δεδομένα αυτά χαρακτηρίζονται από πολλές διαφορετικές χωρικές και χρονικές αποφάσεις, προσθέτοντας τη συνολική πολυπλοκότητα της ομοιογενούς διαχείρισης τους. Από την άποψη αυτή, τα μοντέλα σημασιολογικών δεδομένων συμβάλλουν σημαντικά σε ομοιόμορφα λεξιλόγια για την περιγραφή των δεδομένων. Ο Δρ Μπάρμπες μίλησε για την αξία του "Κοινοτικού Οντολογικού Καταστήματος ESIP, μιας κοινοτικής πλατφόρμας για τη διαχείριση και την ανταλλαγή όρων και λεξιλογίων που βοηθούν τους επιστήμονες να δημοσιεύουν, να ανακαλύπτουν και να επαναχρησιμοποιούν δεδομένα".

Μακροπρόθεσμη διάδοση
Όπως αποκαλύπτουν οι άφθονες περιπτώσεις χρήσης στην κοινότητα γεωλογικής επιστήμης, η πραγματική εκτίμηση των δεδομένων βασίζεται στη διαρκή επαναχρησιμοποίησή της και στην άμεση προσβασιμότητα. Αυτές οι προτεραιότητες δημιούργησαν το κίνημα FAIR, το οποίο εξαρτάται από σημασιολογικές τεχνολογίες για εφαρμογή. Αυτή η προσέγγιση παρέχει το ίδιο πλεονέκτημα όταν εφαρμόζεται σε σύγχρονους οργανισμούς: αύξηση της αξίας των δεδομένων ως περιουσιακό στοιχείο επιχείρησης.

Σχετικά με τον Συγγραφέα
Ο Jans Aasman είναι Ph.D. ψυχολόγος, ειδικός στη Γνωστική Επιστήμη και Διευθύνων Σύμβουλος της Franz Inc., πρωτοπόρος στην Τεχνητή Νοημοσύνη και προμηθευτής της AllegroGraph, της κορυφαίας Βάσης Δεδομένων Σημασιολογικού Γραφήματος. Ως Διδάκτορας και Διευθύνων Σύμβουλος, ο Δρ. Aasman συνεχίζει να σπάει το έδαφος στους τομείς της Τεχνητής Νοημοσύνης και των Γνώσεων Γνώσης, καθώς εργάζεται παράλληλα με πολυάριθμους οργανισμούς της Fortune 500 καθώς και με κυβερνήσεις των ΗΠΑ και του εξωτερικού. Ο Δρ. Aasman έχει περάσει μεγάλο μέρος της επαγγελματικής σταδιοδρομίας του που ειδικεύεται σε εφαρμοσμένα έργα τεχνητής νοημοσύνης, έξυπνες διεπαφές χρηστών και έρευνα τηλεπικοινωνιών. Έχει συγκεντρώσει διπλώματα ευρεσιτεχνίας στους τομείς της τεχνολογίας ομιλίας, της αλληλεπίδρασης πολλαπλών μεταφορών χρηστών, των μηχανισμών συστάσεων, ενώ παράλληλα αναπτύσσει πρόδρομη τεχνολογία για δισκία και προσωπικούς βοηθούς. Υπήρξε καθηγητής στο Τμήμα Βιομηχανικού Σχεδιασμού του Τεχνικού Πανεπιστημίου του Delft και ένας σημαντικός ομιλητής σε εκδηλώσεις όπως Smart Data, NoSQL Now, Διεθνές Συνέδριο Σημασιολογικού Ιστού, GeoWeb, AAAI, Enterprise Data World, Global Graph Summit, Text Analytics, και TTI Vanguard.