Pentingnya data terbuka

ceritanya

Saya sedang browsing google scholar notification, ketika saya menemukan paper tentang origin of salinity di daerah Gujarat India berikut ini. Di dalamnya saya melihat ada grafik menarik (lihat gambar di bawah ini).

Gambar di atas adalah grafik antara rasio konsentrasi Cl dan Br (sumbu y) dengan konsentrasi Cl (sumbu x). Titik-titik berwarna biru, merah muda, dan hijau adalah sampel data primer yang diambil oleh penulis. Sementara garis-garis hijau dengan berbagai keterangan (misal coastal recharge, agricultural polution) adalah kisaran nilai yang didapatkan dari data sekunder.

Setelah saya telusuri, grafik di atas adalah penggambaran ulang sebuah gambar di dalam paper tentang origin water salinty di daerah Spanyol dan Portugal ini. Berikut gambar aslinya.

Kalau dilacak, gambar di atas berasal dari beberapa penelitian sebelumnya yang dirangkum di dalam tabel 2 di bawah ini.

Table 2 di atas merupakan rangkuman nilai rata-rata dan standar devisasi Cl, Br, dan rasio Cl/Br di Spanyol. Sumber datanya tertera pada keterangan tabelnya.

Ketika saya telusuri secara acak dua makalah yang tertera di dalam keterangan tabel, saya menemukan tautan ini dan ini. Keduanya tidak menayangkan data. Pada kedua dokumen tersebut, data sudah diolah menjadi grafik. Artinya penulis setelah hanya bisa menerka atau memplot ulang nilainya berdasarkan grafik. Tentunya ini mengurangi ketelitian. Grafik yang ditampilkan dalam dua makalah tersebut tidak terlalu jelas. Berikut contohnya.

http://rabida.uhu.es/dspace/bitstream/handle/10272/12863/Caracterizacion-de.pdf?sequence=2

https://revistas.igme.es/ActividadesIGME/lineas/HidroyCA/publica/libros2_TH/tiac-01/Area%20IV-9.pdf

pentingnya open data

Dari tulisan pendek di atas kita dapat merasakan betapa nyamannya kalau setiap makalah menampilkan data (bukan data yang telah diolah menjadi grafik). Akan lebih bagus lagi kalau data tersebut dikemas juga dalam bentuk tabel dalam file terpisah. Di bawah ini ada tiga manfaat menyertakan data:

  • Memberi atau memudahkan orang lain untuk memperdalam analisis.
  • Menghasilkan klasifikasi yang bermanfaat untuk analisis-analisis berikutnya.
  • Kumpulan data juga merupakan akumulasi pengetahuan.

untuk selingan saja

About the author

My current focus is how to provide the hydrostratigraphy of volcanic aquifers in Bandung area. The research is based on environmental isotope measurement in groundwater and morphometry. My work consists of hydrochemical measurements. I am using multivariate statistical methods to provides more quantitative foundation for the analysis and more insight into the groundwater behavior, especially its interaction with surface water. I use open source apps like R and Python to do the job. In my spare time, I also have a side project to promote open science in Indonesia's research workflow. One of my current focus is promoting INARxiv, as the first preprint server of Indonesia (osf.io/preprints/inarxiv) and serving as ORCID and OSF (osf.io) ambassador. Research interest: Hydrochemistry, multivariate analysis, and R programming. Blog: dasaptaerwin.net, derwinirawan.wordpress.com. (https://orcid.org/0000-0002-1526-0863)