How to extend data’s lifetime

I-Click 2018 - How to extend your data's lifetime

How to extend data’s lifetime (original image)

Penulis: Dasapta Erwin Irawan, Santirianingrum Soebandhi, Fierly Hayati, Cahyo Darujati, Deffy Ayu Puspito Sari. Preprint is available as preprint at the INArxiv.

Presentasi ini akan sangat terkait dengan artikel kami berjudul “Promoting data sharing among Indonesian scientists: A proposal of generic university-level Research Data Management Plan (RDMP)” yang terbit di RioJournal

Masalah yang sering kita hadapi

  • kehilangan data setelah satu tahun, setelah riset usai
  • kesulitan mengulang eksperimen kita sendiri
  • gagal untuk menyajikan data dalam format yang mudah digunakan ulang, sehingga melanggar prinsip sains “reproducible research

Data seringkali tidak dianggap sebagai output riset. Satu-satunya luaran riset yang masuk perhitungan dalam proses penilaian adalah artikel yang terbit di jurnal atau seminar. Data riset akan dilupakan begitu laporan selesai ditulis atau artikel telah terbit.

Riset mestinya bersifat publik

Di sisi lain, riset mestinya bersifat publik. Hasilnya perlu dapat diketahui, mudah dicari, dan mudah dipahami, tidak hanya oleh sekelompok kecil ilmuwan yang sebidang, tetapi juga masyarakat luas. Itulah dampak. Dampak mestinya tidak diartikan sempit sebagai angka jumlah sitasi, H-indeks, atau penerbitannya di jurnal ber-impact factor tinggi.

Membagikan data untuk meningkatkan dampak

Salah satu cara untuk meningkatkan dampak adalah membagikan data secara luas dalam bentuk dan format yang paling mudah digunakan ulang, dan mudah dicari oleh berbagai pihak.

Kenapa ini kami tonjolkan?

Bercermin dari kepentingan kita sendiri sebenarnya. Pada banyak kesempatan, saat menemukan suatu artikel, sebenarnya kita tidak perlu hasil analisisnya. Yang kita perlukan datanya sebagai sumber analisis yang akan kita lakukan. Untuk melakukan itu, maka kita biasanya akan melakukan “copas” tabel yang ada dalam suatu laporan atau artikel.

Mengapa “copas”?

Karena umumnya, data disampaikan dalam bentuk tabel dan dikemas menjadi satu dalam artikel/laporan dan disimpan sebagai berkas PDF, yang tentunya sulit atau tidak dapat disunting. Pada banyak kasus, dokumen PDFnya bahkan diproteksi dengan meyimpannya sebagai foto. Akibatnya apapun yang ada di dalamnya tidak dapat dimanfaatkan lagi dengan mudah. Akan baik juga bila Yang kami ceritakan di atas sering disebut sebagai machine-readable document. Anda mempelajari format-format machine-readable document.

Alasan klise yang sering kami dengar?

  • “Saya tidak ingin data kami digunakan ulang tanpa izin”.

Pertanyaan kami, “izin” atau “lapor” yang dimaksud. Kalau betul “izin”, maka akan aneh, karena artikel terbit untuk dibaca, setelah dibaca, maka pembaca akan melakukan olah pikir. Setelah itu, mareka akan mencoba mengadaptasi apa yang kita kerjakan ke dalam apa yang mereka kerjakan. Salah satunya adalah analisis data. Ada sesi tanya jawab di Quora yang membahas masalah ini. Tapi memang Anda akan diminta untuk minta izin bila obyek yang akan digunakan tidak jelas lisensinya.

  • “Saya tidak ingin data kami dicuri”.

Tanggapan kami, kok “GR” amat data akan dicuri? Justru dengan membuat dokumen Anda terbuka dan diketahui publik, maka akan ada cukup pembuktian bila ada pihak lain yang “mencuri” atau menggunakan ulang dokumen Anda tanpa izin atau memplagiasinya. Ada baiknya Anda mempelajari pengarsipan-diri (self-archiving) dan kekhawatiran tentang pencurian ide (scooping).

  • “Data saya mengandung informasi yang sensitif”.

Ok untuk alasan ini, kami bisa menerima. Tapi sebetulnya ada beberapa cara untuk mempublikasikan data sensitif. Kami akan mencoba menulis artikel terpisah mengenai hal ini, terkait dengan penyusunan panduan RDMP ITB (Institut Teknologi Bandung) yang juga terdaftar sebagai RDMP publik di direktori DMP tool. Kebetulan kami adalah salah satu timnya. Bila Anda tertarik untuk mempelajari open data secara umum, kami juga telah memiliki materi pelatihannya, terbuka untuk diunduh dan dipelajari.

Berikut solusi yang kami usulkan

  • membuat dokumen rencana pengelolaan data riset (research data management plan/RDMP), yang wajib hukumnya bila kita berminat untuk menjalin kerjasama dengan peneliti luar negeri.
  • membagikan data dengan segera, begitu riset selesai, bahkan saat riset masih belum selesai untuk mempercepat klaim dan menangkap masukan dari berbagai pihak.
  • menempatkan data di lokasi-lokasi daring yang mudah dicari dan ditemukan oleh mesin pencari, misal Google atau Google Scholar.
  • agar tidak lupa juga untuk menyajikan metode/laboratorium protokol/ secara daring.

Sharing is caring

Jangan mengulang kesalahan orang lain dengan tidak membagikan luaran riset seluas mungkin dan sebebas mungkin, karena sharing is caring. Ada satu contoh dari kami untuk memanjangkan usia data dengan membuatkan suatu antarmuka yang memungkinkan pengunjung untuk melakukan analisis statistik sederhana Thermostats-RShiny.