AS OPEN AS POSSIBLE, AS CLOSED AS NECESSARY

Author:

Gagasan utamanya adalah pergeseran dari fokus yang dominan pada publikasi hasil riset untuk kepatuhan regulasi menjadi fokus pada pelestarian dan keberlanjutan akses data primer riset sebagai aset jangka panjang. Dokumen ini menekankan kebutuhan kerangka kerja yang mencegah kegelapan digital, yaitu data ada tetapi tidak lagi terbaca, tidak dapat ditafsirkan, atau tidak dapat digunakan kembali. Perdebatan antara keterbukaan versus risiko, yang kadang terasa dicari-cari.

Diagnosis masalah yang diangkat

  1. Orientasi institusi masih pada publikasi, bukan pada data primer: Repositori sering berisi karya tulis dan laporan akhir, bukan dataset primer dan metadata yang memungkinkan penggunaan ulang.
  2. Praktik penyimpanan masih individual dan tidak sistematis: Data banyak tersimpan di laptop, hard drive eksternal, atau cloud pribadi. Risiko hilang tinggi, termasuk kasus peneliti lupa lokasi penyimpanan. Ada amanat regulasi, tetapi panduan nasional yang eksplisit untuk manajemen data penelitian di perpustakaan akademik dirasa belum cukup operasional. Di tingkat kampus banyak yang belum punya kebijakan spesifik data penelitian meski memiliki kebijakan repositori institusi.
  3. Rendahnya literasi dan kesadaran: Masih banyak yang menyamakan manajemen data penelitian dengan repositori publikasi. Konsep kurasi data untuk penggunaan ulang belum menjadi pemahaman bersama.
  4. Kesenjangan infrastruktur dan kapasitas: Tidak semua institusi memiliki repositori khusus data penelitian. Terdapat catatan kesenjangan infrastruktur di Indonesia dibanding praktik regional.
  5. Faktor budaya dan insentif negatif: Kekhawatiran penyalahgunaan, manipulasi, isu kekayaan intelektual, dan keamanan data menghambat berbagi data. Dokumen juga mencatat adanya pengakuan bahwa sebagian peneliti meragukan validitas datanya sehingga enggan membuka. Mungkin juga kita (para peneliti secara umum) memiliki bias negatif terhadap karya rekan kita sendiri, yang dari Indonesia. Tanggapan kita untuk meng-klik tautan data mungkin berbeda ketika yang ada di layar adalah karya penulis asing.

Rekomendasi dan praktik terbaik yang ditawarkan

Tulisan ini mengusulkan paket solusi lintas aspek.

  1. Penguatan kebijakan dan regulasi di tingkat institusi
    • Menurunkan mandat regulasi nasional menjadi kebijakan kampus yang eksplisit mengenai pengelolaan, penyimpanan, dan berbagi data riset. Rasanya belum ada kampus yang memiliki peraturan tentang serah-simpan dan berbagi data riset.
    • Menyediakan panduan operasional rinci dan pemisahan peran peneliti dan pengelola data. Dalam hal ini, pustakawan mestinya memiliki peran penting.
    • Mendorong lembaga Pemberi Dana (Funder) mensyaratkan berbagi data bagi penerima hibah. Dan bahwa data adalah salah satu luaran riset dan merupakan salah satu indikator kinerja Pemberi Dana (Gates Foundation Data Sharing Policy, Wellcome Trust).
  2. Infrastruktur dan teknologi
    • Membangun repositori data riset yang memang dirancang untuk data, bukan sekadar publikasi, misal: dengan rujukan RIN berbasis Dataverse. Juga mengadopsi standar terbuka dan platform open source seperti Dataverse, Figshare, CKAN untuk interoperabilitas.
    • Menyediakan infrastruktur penyimpanan jangka panjang dan akses berkelanjutan dan membangun integrasi internal eksternal antar repositori termasuk ke RIN.
    • Menyediakan keamanan, kontrol akses, dan lisensi seperti Creative Commons. Juga mengintegrasikan ruang kerja kolaboratif dan sistem informasi riset, serta melibatkan pustakawan sejak tahap proposal. Semacam staf kantor hukum yang terlibat sejak awal penyusunan kontrak kerja.
  3. SDM dan kesadaran
    • Sosialisasi dan pelatihan berkelanjutan mencakup sitasi data dan penggunaan ulang.
    • Penguatan kompetensi pustakawan menuju data librarianship.
    • Membentuk unit atau staf khusus pengelola data riset, dan menerapkan standar proses penilaian kualitas data.
  4. Organisasi dan lingkungan pendukung
    • Dukungan pimpinan universitas dalam visi, pendanaan, kebijakan, dan penghargaan bagi peneliti yang membagikan data.
    • Membangun budaya data sebagai aset institusional dan publik.
    • Melibatkan peneliti dan pengguna dalam desain layanan penyimpanan dan berbagi data.

Tema 1 Kebijakan dan tata kelola

1.1 Persepsi pimpinan apakah investasi jangka panjang atau beban biaya

  • Preservasi data adalah investasi riset, reputasi, dan akuntabilitas institusi. Biayanya nyata, tetapi biaya kehilangan data dan hilangnya kepercayaan jauh lebih besar. Jika riset adalah investasi, maka data adalah bukti dan modalnya. Preservasi data membuat investasi itu tidak hilang.
  • Data riset adalah aset institusional yang menopang replikasi, kolaborasi, dan akumulasi pengetahuan. Tanpa preservasi, kita membayar ulang penelitian yang sama karena data hilang atau tidak dapat digunakan. Preservasi data memperkuat integritas riset, audit trail, dan mitigasi risiko pelanggaran etik karena data dan proses terdokumentasi.
  • Bagi pimpinan, ini bukan proyek IT perpustakaan. Ini bagian dari tata kelola riset, setara dengan etika penelitian, pengelolaan hibah, dan pelaporan kinerja.

1.2 Kedaulatan versus keterbukaan menyeimbangkan open science dengan sensitivitas dan HKI

  • Open data (data terbuka) bukan berarti semua data dibuka tanpa batas. Prinsipnya as open as possible, as closed as necessary. Perguruan tinggi perlu skema klasifikasi data sejak awal, misalnya terbuka, terbatas, tertutup, dan embargo, dengan alasan yang jelas seperti privasi, keamanan, dan perjanjian kemitraan.
  • Untuk data sensitif, kita tetap bisa pro keterbukaan melalui mekanisme akses terkontrol, misalnya perjanjian penggunaan data (data use agreement), ruang aman, atau akses berbasis permohonan. Untuk HKI, gunakan strategi lisensi dan embargo. Dataset bisa dipublikasi dengan metadata terbuka dan akses ditunda atau dibatasi sampai proses paten atau komersialisasi selesai.
  • Kedaulatan data tidak bertentangan dengan keterbukaan. Kedaulatan berarti institusi punya aturan main, dan keterbukaan berarti aturan itu memaksimalkan manfaat publik.

1.3 Tanggung jawab kurasi dan seleksi siapa yang paling berwenang

  • Kurasi harus menjadi kerja tim dengan pembagian peran yang jelas. Peneliti bertanggung jawab atas konteks ilmiah, pustakawan data bertanggung jawab atas standar dan preservasi, dan komite institusi menetapkan kebijakan serta kasus khusus. Targetnya adalah sistem yang memudahkan. Jika kurasi dirancang sebagai beban administrasi, peneliti akan menolak. Jika dirancang sebagai layanan, peneliti akan ikut.
  • Peneliti paling memahami makna ilmiah data, variabel, dan proses pengambilan. Mereka wajib menyiapkan dokumentasi minimal dan memastikan data dapat dipahami. Pustakawan data atau data steward memastikan metadata, format, standar file, lisensi, sitasi data, serta rencana preservasi memenuhi kaidah FAIR. Komite tingkat institusi atau fakultas berperan pada penetapan standar, klasifikasi sensitivitas, dan penyelesaian konflik, misalnya sengketa kepemilikan data atau data dengan risiko tinggi.
  • Peneliti menjaga makna data, pustakawan menjaga keterbacaan dan keberlanjutan, institusi menjaga akuntabilitas dan risiko.

Tema 2 Infrastruktur teknis dan FAIR

2. 1 Kapasitas versus volume data masif dan ketergantungan platform luar negeri

  • Untuk data masif, strategi terbaik adalah federasi dan tiering, bukan satu repositori menampung semua hal. Kemandirian dibangun lewat standar, bukan lewat memaksa semua tersimpan lokal. Kemandirian kita ukur dari kendali tata kelola, standar metadata, dan keberlanjutan akses, bukan semata lokasi server. Tidak semua data harus masuk repositori institusi yang sama. Buat arsitektur bertingkat, misalnya:
    • Tier 1 repositori institusi untuk data ukuran kecil sampai menengah, publikasi dataset, dan metadata.
    • Tier 2 penyimpanan institusional atau nasional untuk data besar.
    • Tier 3 rujukan ke repositori disiplin yang kredibel, dengan metadata institusi tetap menyimpan pointer dan sitasi.
  • Tetapkan standar format terbuka dan rencana migrasi format. Ini mengurangi vendor lock in dan ketergantungan jangka panjang.
  • Kita perlu mandiri dalam tata kelola dan standar. Infrastruktur bisa terdistribusi, tetapi kendali kebijakan tidak boleh hilang.

2.2 Interoperabilitas tantangan integrasi antar repositori (misal dengan RIN)

  • Interoperabilitas adalah pekerjaan standar, identitas, dan metadata. Tantangan terbesar biasanya bukan teknis, tetapi keseragaman praktik.
  • Kunci integrasi adalah penggunaan identifier persisten, misalnya DOI untuk dataset dan ORCID untuk peneliti, serta skema metadata yang disepakati. Banyak repositori tidak konsisten dalam metadata minimal dan penamaan, sehingga sulit dipanen dan disatukan.
  • Perlu kebijakan institusi tentang metadata minimal wajib, template data management plan, serta SOP deposit. Integrasi dengan RIN sebaiknya dimulai dari harvesting metadata dan sinkronisasi identifier, bukan memaksa migrasi data sekaligus.

2.3 Standar metadata pustakawan fasih Dublin Core, bagaimana menuju metadata preservasi

  • Dublin Core penting untuk temuan dan deskripsi, tetapi preservasi jangka panjang perlu metadata teknis dan preservasi. Implementasinya dapat bertahap.
    • Tahap awal, institusi menetapkan metadata minimal yang mencakup deskriptif, administratif, dan teknis sederhana
      • apa, siapa, kapan, bagaimana data dikumpulkan
      • format file, perangkat lunak yang dibutuhkan, struktur folder, checksum
    • Tahap lanjut, adopsi:
      • provenance, event preservasi, perubahan format, hak akses, dan rekam jejak tindakan
  • Yang paling penting adalah keterulangan dan keterbacaan, sehingga dokumentasi metodologi, data dictionary, dan README menjadi wajib.
  • Pustakawan perlu pelatihan praktis, bukan hanya teori standar. Misalnya latihan membuat paket arsip data yang siap dipreservasi. Kita tidak perlu menunggu sempurna untuk mulai. Mulai dengan metadata minimal yang konsisten, lalu naikkan kedalaman preservasi.

Tema 3 SDM dan keberlanjutan

3.1 Kesenjangan kompetensi kompetensi apa yang mendesak untuk ditambahkan agar lulusan siap jadi data steward

  • Data steward adalah gabungan literasi data, literasi metadata, literasi hukum, dan kemampuan layanan. Data stewardship bukan profesi administratif. Ini profesi layanan ilmiah yang menjembatani peneliti, kebijakan, dan teknologi.
  • Kompetensi prioritas
    • Prinsip FAIR dan praktik open science, termasuk sitasi data dan lisensi.
    • Metadata terapan dan quality control dataset, termasuk data documentation. Dasar keamanan data dan privasi, termasuk anonimisasi dan kontrol akses. Dasar kurasi dan preservasi digital, termasuk format terbuka, checksum, dan rencana migrasi.
    • Keterampilan konsultasi layanan riset, karena data steward harus mampu mendampingi peneliti sejak proposal.

3.2 Keberlanjutan fungsi memastikan data tidak hanya ada tetapi tetap berfungsi di tengah perubahan teknologi

  • Kunci keberlanjutan fungsi adalah dokumentasi, format terbuka, dan preservasi yang memikirkan ulang penggunaan. Preservasi bukan menyimpan file. Preservasi adalah menjaga kemampuan data untuk menjawab pertanyaan ilmiah kembali.
  • Terapkan paket deposit yang mencakup data, kode jika ada, dokumentasi lengkap, dan informasi lingkungan perangkat lunak. Gunakan format terbuka dan terstandar, hindari format proprietary jika ada alternatif.
  • Lakukan audit integritas berkala. Bangun kultur bahwa data tanpa dokumentasi adalah data yang tidak dapat digunakan.

3.3 Indikator keberhasilan golden standard repositori digital terpercaya indikator apa paling krusial diukur pertama

Pesan inti

  • Mulai dari indikator yang mengukur kepercayaan. Kepercayaan lahir dari tata kelola, kualitas metadata, dan kepastian akses.
  • Indikator awal yang paling krusial
    • Kebijakan yang jelas tentang deposit, akses, lisensi, klasifikasi sensitivitas, dan retensi minimal. Kepatuhan metadata minimal dan kualitas dokumentasi, bukan hanya jumlah unggahan.
    • Penggunaan identifier persisten dan sitasi data yang dapat dilacak.
    • Keamanan dan kontrol akses yang dapat diaudit. Kapabilitas layanan, misalnya waktu respons pendampingan peneliti dan tingkat kepuasan pengguna.
  • Repositori terpercaya bukan yang paling besar, tetapi yang paling dapat diprediksi, dapat diaudit, dan benar-benar digunakan. Walaupun ini adalah target idealnya, tetapi di atas saya sudah sampaikan bahwa kita tidak perlu menunggu sampai sempurna untuk mengumumkan kebijakan data terbuka.

Penutup

Saya mendukung sains terbuka (open science) karena memperkuat kualitas, integritas, dan dampak riset. Tetapi open science harus ditopang tata kelola, layanan, dan infrastruktur yang membuat berbagi data menjadi aman, adil, dan tidak membebani peneliti.

Prinsip sains mestinya seterbuka mungkin dan tertutup sejauh diperlukan, dengan standar dan akuntabilitas yang jelas.

Kalau ini sudah dipegang, pilihan untuk mempublikasikan riset di jurnal top-tier atau no-tier bukan menjadi masalah lagi, karena sudah pasti sains-nya benar terjadi dan tidak ada prinsip saintifik yang dilanggar.