G.3.1. Δημόσια Δεδομένα, Περιεχόμενο και Λογισμικό από Δημόσιες Αρχές

June 6, 2011 σε Ομάδα για το Ελεύθερο / Ανοικτό Λογισμικό - Διαλειτουργικότητα από Φώτης Ρούτσης

Ο τρόπος με τον οποίον πραγματοποιείται η απόκτηση και διαχείριση των Δημοσίων Δεδομένων, Λογισμικού και Περιεχομένου σήμερα από τις Ελληνικές Δημόσιες Αρχές είναι προβληματικός. Τα προβλήματα εντοπίζονται στην έλλειψη παρακολούθησης των δεδομένων σε όλο τον κύκλο ζωής τους και στην έλλειψη πρόβλεψης για την περαιτέρω χρήση τους από άλλες Δημόσιες Αρχές και τρίτους. Ειδικότερα:

1. Δεν υπάρχει καταγραφή των Δεδομένων, Λογισμικού και Περιεχομένου που αποκτά, δημιουργεί ή επικαιροποιεί κάποια Δημόσια Αρχή με αποτέλεσμα να γίνεται πολλές φορές οι προμήθεια, δημιουργία ή επικαιροποίηση των ίδιων Δεδομένων, Λογισμικού ή Περιεχομένου. Το αποτέλεσμα είναι αυξημένα κόστη κτήσης και συντήρησης και μείωση των δυνατοτήτων δημιουργίας καινοτόμων υπηρεσιών και προϊόντων πάνω στα υπάρχοντα Δεδομένα, Λογισμικό και Περιεχόμενο λόγω της εσφαλμένης κατανομής πόρων.
2. Δεν υπάρχει πάντοτε απόκτηση αδειών για τα Δεδομένα, Λογισμικό και Περιεχόμενο που αποκτά η Δημόσια Διοίκηση. Ακόμη κι όταν αποκτώνται οι άδειες δεν είναι γνωστό το περιεχόμενο τους (π.χ. διάρκεια, κόστος όροι). Δεν υπάρχει σύστημα καταγραφής και αντιστοίχησης Δεδομένων, Λογισμικού και Περιεχομένου με τις σχετικές άδειες. Κατά συνέπεια δεν είναι δυνατόν να ξέρει το Δημόσιο ως σύνολο τα δικαιώματα που έχει αποκτήσει, τη διάρκειά τους και το κόστος των αδειών.
3. Τα δεδομένα και το περιεχόμενο δεν έχουν ελεγχθεί σε σχέση με το εάν παραβιάζουν διατάξεις για δεδομένα προσωπικού χαρακτήρα, εμπιστευτικότητας, προστασία ανηλίκων κλπ. Π.χ. τα δεδομένα και το περιεχόμενο είτε (α) δεν έχουν ανωνυμοποιηθεί ώστε να είναι δεκτικά δημόσιας διάθεσής τους (β) είτε δεν έχουν αποκτηθεί οι απαραίτητες συναινέσεις από τα υποκείμενα επεξεργασίας των προσωπικών δεδομένων ή τους κατόχους των εμπιστευτικών δεδομένων ώστε να είναι δυνατή η δημόσια διάθεσή τους.
4. Δεν υπάρχουν οι τεχνικές προδιαγραφές που κάνουν Δεδομένα, Λογισμικό και Περιεχόμενο πραγματικά διαθέσιμο.
5. Οι άδειες με τις οποίες τα σχετικά Δεδομένα, Λογισμικό και Περιεχόμενο μπορούν να γίνουν διαθέσιμα δεν έχουν προσδιοριστεί ή οι όροι των σχετικών αδειών δεν είναι συμβατοί μεταξύ τους ώστε να είναι δυνατή η ελεύθερη μείξη τους.
6. Τα στοιχεία 1 έως 5 και οι συνακόλουθες διαδικασίες ακόμη κι εκεί που υπάρχουν δεν είναι προτυποποιημένα.
G.3.1.1.1 Στόχος
Στόχος είναι ο καθορισμός ενός συνόλου βασικών κατευθύνσεων που απαιτούνται προκειμένου φορείς του δημοσίου να διαθέσουν τα Δεδομένα, Λογισμικό και Περιεχόμενο τους με ανοιχτές άδειες. Ακολουθείται ο κύκλος ζωής των Δεδομένων, Λογισμικού και Περιεχομένου και προσδιορίζονται διαδικασίες, οργανωτικές δομές και πράξεις που πρέπει να έχει πραγματοποιήσει ή να δεσμεύεται ότι θα πραγματοποιήσει μία Δημόσια Αρχή προκειμένου να μπορεί να αξιολογηθεί η ωριμότητά της ως προς τη δυνατότητα διάθεσης ανοιχτών δημόσιων Δεδομένων, Λογισμικού και Περιεχομένου.
Διακρίνουμε τα εξής στάδια:
1. Στάδιο εισαγωγής των δεδομένων, λογισμικού ή περιεχομένου στη δημόσια αρχή
2. Στάδιο διατήρησης των δεδομένων λογισμικού ή περιεχομένου στη δημόσια αρχή
3. Στάδιο διάθεσης των δεδομένων λογισμικού ή περιεχομένου από τη δημόσια αρχή
Πρέπει να τονισθεί ότι το μοντέλο διαχείρισης των δεδομένων από μια δημόσια αρχή δεν είναι γραμμικό αλλά κυκλικό, καθώς τα δεδομένα, λογισμικό ή περιεχόμενο είναι δυνατόν να περνούν διαρκώς τις τρεις ανωτέρω φάσεις καθώς π.χ. μεταβαίνουν από μία δημόσια αρχή σε μία άλλη ή ενημερώνονται από τους χρήστες.
G.3.1.2 Σημείο εισαγωγής των δεδομένων, λογισμικού και περιεχομένου στη δημόσια αρχή
Πρόκειται για το σημαντικότερο σημείο στον κύκλο ζωής των δεδομένων, λογισμικού και περιεχομένου καθώς στο σημείο αυτό πρέπει να γίνεται η καταγραφή του είδους του υλικού που “μπαίνει” στη σφαίρα ελέγχου του Δημοσίου και η συλλογή όλων των σχετικών αδειών και δηλώσεων συναίνεσης.
Το παρακάτω μοντέλο προϋποθέτει ότι υπάρχει είτε σε εθνικό επίπεδο είτε σε επίπεδο δραστηριότητας ένα μητρώο καταγραφής μεταδεδομένων για το λογισμικό, περιεχόμενο και δεδομένα και τις άδειες που τα συνοδεύουν. Επίσης προϋποθέτει ότι προκειμένου να γίνει οποιαδήποτε δαπάνη για την παραγωγή, προμήθεια, ή επικαιροποίηση δεδομένων, λογισμικού ή περιεχομένου θα πρέπει να γίνεται παροχή ενός μοναδικού αναγνωριστικού και κατά διαδικασία αντίστοιχη με αυτή που προβλέπεται στο Ν. 3861/2010 για τη δημοσίευση αποφάσεων.
Εφόσον υπάρχει ο παραπάνω μηχανισμός, οι Δημόσιες Αρχές οφείλουν να καταχωρούν τα στοιχεία αναφορικά με τα Δεδομένα, Λογισμικό και Περιεχόμενο στα ανωτέρω μητρώα, διαφορετικά θα πρέπει να κρατούν τα ίδια στοιχεία σε δικό τους αρχείο. Ειδικότερα:
1. Χρησιμοποιούμε τον όρο “εισαγωγή” στη Δημόσια Αρχή για να περιλάβουμε όλες τις πιθανές περιπτώσεις με τι οποίες τα Δεδομένα, Λογισμικό και Περιεχόμενο έρχονται στον κύκλο ελέγχου της Δημόσιας Αρχής. Πιο συγκεκριμένα η εισαγωγή μπορεί να περιλαμβάνει παραγωγή, συλλογή, προμήθεια, επικαιροποίηση δεδομένων, λογισμικού ή περιεχομένου
2. Σε όλες αυτές τις περιπτώσεις η Δημόσια Αρχή πρέπει να τηρεί μητρώο στο οποίο καταγράφονται τα δεδομένα, λογισμικό ή περιεχόμενο και προσδιορίζεται:
a. ο χρόνος παραγωγής τους
b. ο δημιουργός και μία διεύθυνση, ηλεκτρονική και φυσική, στην οποία μπορεί να βρεθεί
c. ο δικαιούχος των δικαιωμάτων πνευματικής ιδιοκτησίας και μία διεύθυνση, ηλεκτρονική και φυσική, στην οποία μπορεί να βρεθεί. Εάν υπάρχουν περισσότεροι δικαιούχοι πρέπει τα στοιχεία να υπάρχουν και αυτοί
d. αν η συλλογή/παραγωγή/δημιουργία των δεδομένων, λογισμικού ή περιεχομένου γίνεται από τρίτο, πρέπει να υπάρχουν οι συμβάσεις με τις οποίες γίνεται η εκχώρηση των δικαιωμάτων ή η παροχή άδειας χρήσης και να καταχωρούνται ως παράρτημα στα μεταδεδομένα ή να διατηρούνται σε σταθερό URI το οποίο πρέπει να αναφέρεται στα μεταδεδομένα.
e. για τα δεδομένα ή το περιεχόμενο πρέπει να υπάρχει αναφορά στο ότι έχουν γίνει οι ακόλουθες πράξεις:
i. έχει ελεγχθεί το περιεχόμενο για την ύπαρξη δεδομένων προσωπικού, ευαίσθητου ή εμπιστευτικού χαρακτήρα. Τα πλήρη στοιχεία του φυσικού προσώπου που πραγματοποίησε τον έλεγχο πρέπει να διατηρούνται ως μεταδεδομένα
ii. τα προσωπικά, ευαίσθητα ή εμπιστευτικά στοιχεία πρέπει να αφαιρεθούν με τη διαδικασία που περιγράφεται στη συνέχεια ή
iii. πρέπει να αποκτηθούν δηλώσεις συναίνεσης από τα πρόσωπα που ενδεχομένως θίγονται από τον προσωπικό, ευαίσθητο ή εμπιστευτικό χαρακτήρα των δεδομένων. Όλες οι διατυπώσεις των Ν. 2472/1997 και 3471/2006 πρέπει να τηρηθούν σε σχέση με την απόκτηση των δηλώσεων συναίνεσης και τις πληροφορίες που πρέπει να παρασχεθούν στα πρόσωπα από τα οποία ζητείται η συναίνεση. Η Δημόσια Αρχή πρέπει να ακολουθήσει όλες τις διατυπώσεις που ορίζουν οι ανωτέρω νόμοι προκειμένου να προβεί σε σχετική επεξεργασία και να υποβάλει όλα τα σχετικά έγγραφα, δηλώσεις και αιτήσεις στην Αρχή Προστασία Προσωπικών δεδομένων. Ιδεατά η τήρηση των διατυπώσεων από τη Δημόσια Αρχή θα πρέπει να διατυπώνεται στο σύστημα με αναφορά στο φυσικό πρόσωπο που έχει διενεργήσει κάθε μία από τις απαιτούμενες πράξεις. Εφόσον δοθεί η συναίνεση του υποκειμένου της επεξεργασίας των δεδομένων, η έκταση, διάρκεια και είδος της συναίνεσης θα πρέπει να αποθηκεύεται με τη μορφή μεταδεδομένων και να διατηρούνται όλα τα σχετικά έγγραφα στο μητρώο της Δημόσιας Αρχής.
3. Σε σχέση με την απόκτηση αδειών εφόσον δεν υπάρχει κάποιο νομικό κώλυμα (π.χ. διατάξεις δικαίου του ανταγωνισμού) ή λειτουργικοί περιορισμοί [π.χ. το Ελεύθερο Λογισμικό/ Λογισμικό Ανοιχτού Κώδικα (ΕΛ.ΛΑΚ) δεν ικανοποιεί τις λειτουργικές προδιαγραφές της Δημόσιας Αρχής], η Δημόσια Αρχή θα πρέπει να επιδιώκει:
a. την απόκτηση όλων των δικαιωμάτων διανοητικής ιδιοκτησίας, όπως αυτή ορίζεται στην παράγραφο 18 του άρθρου 8 του ν. 2557/1997 (ΦΕΚ 271 A ́). Εάν αυτό δεν είναι δυνατόν :
i. την απόκτηση των δεδομένων, λογισμικού ή περιεχομένου με τις πλέον ανοιχτές άδειες, όπως προσδιορίστηκε παραπάνω στο 3α. Εάν αυτό δεν είναι δυνατόν,
ii. την απόκτηση των αδειών εκείνων που επιτρέπουν την αδειοδότηση με μία άδεια τόσο ανοιχτή όσο καθορίζεται από την Ανοιχτή Πληροφοριακή πολιτική της Δημόσιας Αρχής.
b. Σε καμία περίπτωση η απόκτηση δεδομένων και περιεχομένου δεν μπορεί να γίνεται με άδεια που παρέχει λιγότερα δικαιώματα στη Δημόσια Αρχή από όσα περιγράφονται και η απόκτηση λογισμικού χωρίς το λογισμικό να τηρεί τις προδιαγραφές διαλειτουργικότητας του Εθνικού πλαισίου διαλειτουργικότητας, να υπάρχουν προδιαγραφές εξόδου, escrow agreement και να υπάρχει σχέδιο βιωσιμότητας για την αποπληρωμή της άδειας εάν αυτή είναι κλειστή.
4. Ειδικά για την περίπτωση λογισμικού, η Δημόσια αρχή θα πρέπει να διασφαλίσει και να τεκμηριώσει στα μεταδεδομένα του μητρώου το οποίο τηρεί για το λογισμικό που έχει στην κατοχή του ότι:
a. έχει τα πλήρη δικαιώματα
b. το έχει αποκτήσει με άδεια (κατά σειρά προτίμησης) GPL, EUPL, BSD άλλη εγκεκριμένη από τον OSI ή την FSF
c. έχει πρόσβαση στον πηγαίο κώδικα για αλλαγές έστω κι αν δεν μπορεί ο κώδικας αυτός να διανεμηθεί πέρα από την ίδια τη Δημόσια Αρχή, ένα υποσύνολο ή το σύνολο των Δημοσίων Αρχών
d. υπάρχει escrow agreement στην περίπτωση πτώχευσης ή αδυναμίας παροχής υπηρεσιών υποστήριξης του παρόχου λογισμικού
e. υπάρχει φορητότητα δεδομένων, exit ή migration agreement και υπηρεσίες στην περίπτωση που η Δημόσια Αρχή θέλει να μεταφερθεί σε άλλον πάροχο λογισμικού ή υπηρεσιών, ειδικά αν το λογισμικό προσφέρεται με τη μορφή Software As a Service. Απαιτείται να έχει γίνει μελέτη πρόβλεψης κόστους και συνεπειών (cost and impact assessment) της μεταφοράς των δεδομένων σε περίπτωση αλλαγής παρόχου λογισμικού ή υπηρεσιών.
f. υπάρχει πρόβλεψη για το κόστος της άδειας και συντήρησης πέρα από τη χρηματοδότηση και ρητή δέσμευση από τη Δημόσια Αρχή ότι μπορεί να καλύψει το κόστος των αδειών αυτών και μετά τη λήξη της χρηματοδότησης με αναφορά στο φυσικό πρόσωπο και με ποιο θεσμικό ρόλο που δίνει παρέχει τη δέσμευση αυτή. Επίσης, θα πρέπει να γίνει εκτίμηση του κόστους σε σχέση με τις ανανεώσεις, αναβαθμίσεις του συστήματος, τις συνέπειες από τη μη αναβάθμιση του συστήματος και την επιρροή που έχουν αυτές οι πράξεις/ μεταβολές στη συμφωνία επιπέδου παρεχόμενων υπηρεσιών (Service Level Agreement)
G.3.1.3 Διάθεση Δεδομένων, Λογισμικού και Περιεχομένου
Η διάθεση Δεδομένων, Λογισμικού και Περιεχομένου που βρίσκεται στον έλεγχο μία Δημόσιας Αρχής με βάση τη διαδικασία που έχει περιγραφεί παραπάνω, θα πρέπει να διατίθεται με τον πλέον ανοιχτό τρόπο όπως περιγράφεται στη συνέχεια ανάλογα με το αν πρόκειται για Λογισμικό, Δεδομένα ή Περιεχόμενο.
Εάν αποφασισθεί ότι μέρος μόνο από τα Δεδομένα, Λογισμικό και Περιεχόμενο θα διατεθούν ανοιχτά θα πρέπει να υπάρχει τεκμηρίωση της απόφασης αυτής με βάση το οικονομικό όφελος και παράδοση του σχετικού επιχειρηματικού σχεδίου ή του σχεδίου βιωσιμότητας.
Ειδικότερα:
1. Στην περίπτωση λογισμικού, αυτό πρέπει να διατίθεται με άδειες GPL, EUPL ή BSD ανάλογα με την άδεια με την οποία έχει αποκτηθεί.
a. Σε κάθε περίπτωση ο κώδικας θα πρέπει να γίνεται διαθέσιμος σε κάποιο από τα αποθετήρια ανοιχτού κώδικα, όπως π.χ. το source forge
i. Στην περίπτωση που δε χρησιμοποιείται κάποια ανοιχτή άδεια και η δημόσια αρχή έχει τα απαιτούμενα δικαιώματα ή άδειες, η μη περαιτέρω διάθεση θα πρέπει να αιτιολογείται στη βάση του οικονομικού οφέλους που η στρατηγική αυτή έχει και ει δυνατόν να κατατίθεται το σχετικό επιχειρηματική σχέδιο της Δημόσιας Αρχής. Ακόμη και όταν το λογισμικό διατίθεται κλειστά σε τρίτους δεν πρέπει να υπάρχει κανένας περιορισμός στο διαμοιρασμό του λογισμικού και του πηγαίου κώδικα μεταξύ των δημοσίων αρχών.
b. Στην περίπτωση περιεχομένου, σε σχέση με την κλειστή διάθεση ακολουθούνται οι ίδιες γενικές αρχές με βάση αυτές του λογισμικού, δηλαδή προκειμένου να διατεθεί με κλειστή άδεια θα πρέπει να γίνεται ρητή αναφορά στο οικονομικό όφελος και στο σχετικό επιχειρηματικό σχέδιο ή σχέδιο βιωσιμότητας.
i. η άδεια με την οποία πρέπει να διατίθεται το περιεχόμενο πρέπει να είναι τυποποιημένη και ιδίως η Creative Commons Greece Αναφορά 3.0.
ii. για οποιαδήποτε παραλλαγή της άδειας θα πρέπει να υπάρχει αιτιολογία.
iii. η αναφορά πρέπει να είναι ενοποιημένη για όλη τη δημόσια διοίκηση ώστε να μειώνεται το πρόβλημα της στοίβας αναφοράς (attribution stack). Εάν κάποιος φορέας θέλει ειδική αναφορά, θα πρέπει αυτό να αιτιολογείται και να προσφέρεται τόσο το κείμενο αναφοράς όσο και η μορφή του σε κάποια Markup Language.
iv. όταν χρησιμοποιούνται άδειες με το στοιχείο του παρόμοιου διαμοιρασμού, αυτές θα πρέπει να είναι οπωσδήποτε τυποποιημένες. Προτείνεται η Creative Commons Αναφορά Παρόμοια Διανομή Ελληνική 3.0 ως η πλέον τυποποιημένη και διαδεδομένη.
v. το στοιχείο Μη Εμπορική χρήση πρέπει να αποφεύγεται για δημόσιο περιεχόμενο. Εάν ωστόσο προσφέρεται, ο φορέας που το προσφέρει, ιδεατά, θα πρέπει να μεριμνήσει για την παροχή τυποποιημένων εμπορικών αδειών χρησιμοποιώντας το CC+ με πλήρες σύστημα ηλεκτρονικής συναλλαγής. Επίσης θα πρέπει να συνοδεύεται και με ένα επιχειρηματικό σχέδιο ή σχέδιο βιωσιμότητας.
vi. εάν χρησιμοποιείται το στοιχείο μη παράγωγα έργα θα πρέπει να τεκμηριώνεται σε σχέση με την ανάγκη μη αλλοίωσης του περιεχομένου που αδειοδοτείται.
c. Σε σχέση με τα ανοιχτά δεδομένα, θα πρέπει να χρησιμοποιείται η πλέον ανοιχτή άδεια και με τους μικρότερους δυνατούς περιορισμούς γιατί διαφορετικά δημιουργούνται πολλαπλά προβλήματα σε σχέση με την περαιτέρω χρήση τους. Ειδικότερα
i. Η προτεινόμενη άδεια θα πρέπει να είναι η CC Zero με μαλακούς κανόνες αναφοράς, η οποία θα χρησιμοποιηθεί και από την Europeana και έχει όλα τα μεταδεδομένα που μπορεί να θέλει ο κύριος ενός συνόλου δεδομένων. Επίσης δε δημιουργεί το πρόβλημα της στοίβας αναφοράς που οι άδειες Αναφοράς μπορεί να προκαλέσουν. Εναλλακτικά θα πρέπει να χρησιμοποιείται η CCBY που είναι η προβλεπόμενη ήδη από την Πρωθυπουργική Απόφαση Υ255/2010 ως η άδεια για μία σειρά από κυβερνητικούς ιστοτόπους. Η Open Database Attribution της Open Knowledge Foundation πρέπει να αποφεύγεται λόγω των δυσχερειών που προκύπτουν από την ερμηνεία της διαφοροποίησης βάσης δεδομένων και των περιεχομένων της. Εναλλακτικά μπορεί να χρησιμοποιηθεί ένα σχήμα σαν αυτό της Open Government Licence (OGL) της Δημόσιας Διοίκησης στο Ηνωμένο Βασίλειο.
ii. Άδειες με το στοιχείο Παρόμοιου Διαμοιρασμού και Μη Εμπορικής χρήσης πρέπει να αποφεύγονται γιατί ουσιαστικά οδηγούν στη δημιουργία πολλαπλών νησίδων περιεχομένου.
iii. Οι άδειες με το στοιχείο Μη Παράγωγο Περιεχόμενο ουσιαστικά ακυρώνουν την έννοια των ανοιχτών δεδομένων, αφού ένα σύνολο δεδομένων σχεδόν πάντοτε θα έχει ανάγκη μετασχηματισμού προκειμένου να αξιοποιηθεί και για αυτό το λόγο δεν πρέπει να χρησιμοποιούνται.
iv. Τα ανοιχτά δεδομένα θα πρέπει να είναι διαθέσιμα σε μορφότυπο (format) που είναι καθολικά αποδεκτός ή ανοιχτό μορφότυπο. Οι αποδεκτές μορφές είναι αυτές που καθορίζονται στο πλαίσιο διαλειτουργικότητας (Πλαίσιο Διαλειτουργικότητας & Υπηρεσιών Ηλεκτρονικών Συναλλαγών) και τεκμηρίωσης (Μοντέλο Τεκμηρίωσης). Τα δεδομένα θα πρέπει να συνοδεύονται από μεταδεδομένα που θα περιγράφουν πλήρως την ακολουθούμενη σύνταξη αλλά και σημασιολογία. Θα πρέπει η περιγραφή να είναι επαρκής ώστε να μπορούν απρόσκοπτα να επαναχρησιμοποιηθούν στο μέλλον. Τα μεταδεδομένα να πρέπει να είναι σύμφωνα με τις προδιαγραφές του πλαισίου τεκμηρίωσης (κεφ. 4 στο Μοντέλο Τεκμηρίωσης).
v. Τα δεδομένα θα πρέπει να είναι προσβάσιμα μέσω διαδικτύου. Για το σκοπό αυτό θα πρέπει να καθορίζεται από την αρχή του έργου ο ακριβής τρόπος διάθεσης και η επάρκεια του εξοπλισμού. Ο τρόπος διάθεσης θα πρέπει να είναι σύμφωνος με όσα προβλέπονται στο πλαίσιο διαλειτουργικότητας (Πλαίσιο Διαλειτουργικότητας & Υπηρεσιών Ηλεκτρονικών Συναλλαγών).