Laci bukan data repository: tulisan ringkas mengenai pentingnya open data

Mungkin sedikit norak ya. Tapi kaget jg saat tweet tentang open data repository direspon oleh seorang peneliti dari CERN.
Silahkan memantau komunikasinya diakun @dasaptaerwin.
—-
Selain masalah asuransi yg sedang hangat (padahal sebenarnya biasanya saja dan akibat kurang nanya), di grup lain jg sdg ramai masalah university data repository.

Menurut grup itu semua data riset yang public domain (bukan hanya laporannya ya) dapat disimpan secara aman, mudah diakses dan yang lebih penting citeable (karena punya DOI). Data riset yang dibiayai oleh negara sudah selayaknya dapat dipakai ulang (dianalisis ulang) oleh pihak lain, mengundang kolaborasi, penulisan paper-paper ilmiah baru dan pada akhirnya (walaupun tidak instan) citation index akan meningkat.
Repositori data riset yg terbuka (open data) memang belum populer di Indonesia, karena “laci” masih jadi repository yg paling disukai. Seperti janji kemarin berikut blog post tentang hal ini.
—-

What is data repository?

Menurut Google Translate, definisi “repository” adalah:

– a place, building, or receptacle where things are or may be stored: “a deep repository for nuclear waste”.
– a place in which something, especially a natural resource, has accumulated or where it is found in significant quantities: “accessible repositories of water”
– in COMPUTING, a central location in which data is stored and managed:”the metadata will be aggregated in a repository”.

Menurut saya definisi yang paling sesuai adalah yang ke-3.

Is data citeable?

Dari beberapa peneliti LN yang saya tanya, baik secara personal maupun dari fasilitas Q&A ResearchGate dan Quora, jawabannya adalah “ya, data dapat disitasi”, karena data sebagaimana halnya makalah lengkap juga merupakan hasil olah pikir saintifik. Dalam era open data dan open science, data harus memiliki aksesibilitas dan visibilitas yang tinggi. Ada dua artikel menarik yang dapat saya bagi:

How can we make our data citeable?

Secara konvensional, apapun yang tersedia online dapat disitasi selama ada lamat rujukan yang jelas. Namun perkembangan saat ini, penggunaan kode digital object identifier (DOI) sudah makin meluas, termasuk untuk dataset. Dengan DOI maka obyek yang kita sitasi, apapun itu, tidak akan tertukar dengan obyek yang lain. Kerena DOI adalah kode unik. Jadi saat ini sudah sangat jamak penggunaan (assigning) DOI untuk file data yang telah diunggah. DOI pertamakali digunakan 10 tahun yang lalu (baca tautan ini).

Anda bisa langsung mencoba membuat akun di Figshare.com. Spasi penyimpanan 1 Gb didapatkan gratis bila anda mendaftar. Lumayan besar lho itu.

Setelah mendaftar, maka anda akan masuk ke layar “home” seperti ini.

Screen Shot 2016-01-22 at 8.43.24 PM

 

 

 

 

Tautan ini adalah contoh dataset saya yang diunggah di Figshare. Coba anda copy-paste ke perambah.

https://figshare.com/s/6f06642fdfd7d3779554

Bila diakses maka akan muncul layar seperti ini.

Screen Shot 2016-01-22 at 8.41.57 PM

 

 

 

 

 

 

Why we should make data accessible?

Pertanyaan bagus. Setidaknya ada dua pertimbangan:

  • Pertimbangan substansial: Bila data tersedia secara bebas dan dapat dianalisis ulang, maka makin banyak orang yang menguji validitas data dan validitas analisis. Bila ini terjadi ada dua kemungkinan dampaknya: hasil analisis kita akan didukung oleh hasil analisis orang lain, yang kedua, mungkin juga hasil pemikiran kita direvisi oleh orang lain. Bila jenis yang kedua terjadi, apakah ini akan mengurangi nilai saintifik makalah kita? Jawabannya “tentu tidak”. Karena dunia saintifik adalah dunia yang obyektif, maka dokumen analisis kita tetap (yang telah dipublikasikan) akan tetap terekam dalam khasanah ilmiah, walaupun hasilnya diperbaiki oleh peneliti lainnya.
  • Pertimbangan ekonomis: Bila orang lain dapat menggunakan ulang (reuse) data kita, maka biaya yang dikeluarkan untuk mengambil data tersebut akan memiliki benefit yang berlipat. Kemudian pada akhirnya nilai ekonomisnya akan terus bertambah.

Layanan data hosting?

Beberapa contoh perusahaan atau organisasi yang menyelenggarakan free data hosting di repositorinya:

Data repository dalam bentuk lain:

  • Researchgate: ini sebenarnya adalah media sosial saintifik. Mereka memberikan opsi unggah “dataset” selain opsi “full paper”. Anda dapat secara langsung menawarkan kolaborasi dengan data yang anda unggah.
  • ArXiv, BiorXiv, PeerJ pre-print repository: situs ini adalah repositori preprint yaitu makalah yang sedang atau baru akan disubmit ke jurnal atau konferensi. Di dalam pdf dokumen yang anda unggah, anda dapat menyertakan dataset yang berkaitan. Dalam abstrak yang diunggah anda dapat memberikan penjelasan bahwa dalam dokumen juga disertakan kumpulan data mentah.

Seperti halnya Google Scholar, Crossref atau Scopus yang mengindeks karya tulis, ternyata ada pula organisasi yang mengindeks repositori data online, yaitu:

Datacite
Re3data

Choosing license?

Hal paling akhir yang perlu dilakukan adalah memilih lisensi berkas yang kita unggah ke Figshare atau ke repositori data manapun. Yang paling umum digunakan komunitas open science adalah lisensi Creative Commons (CC). Lisensi yang paling umum adalah:

  • CC-BY: anda hanya boleh merujuk, menggunakan ulang, menganalisis ulang, memodifikasi dokumen kita dengan syarat menyebutkan sumbernya atau,
  • CC-BY-SA: sama dengan ketentuan di atas, ditambah keharusan dokumen turunan untuk dibagikan dengan lisensi yang sama, Share Alike (SA), dengan dokumen milik kita.

Kondisi di ITB?

Situs Digital Library ITB  sebenarnya dapat jadi awal format open data di ITB (mungkin di Indonesia). Sedikit prasyaratnya adalah bahwa data dalam segala format harus disubmit secara terpisah. Tidak menyatu dengan file docx atau pdf yang biasa diminta oleh prodi kepada mahasiswa yang telah lulus sidang sebagai salah satu syarat wisuda.

Output riset yang dapat diunggah adalah:

  • laporan: format docx atau pdf
  • slide presentasi: format ppt atau pdf
  • data: format xls, csv, txt dll. Kondisi saat ini data umumnya menyatu (embedded) ke dalam dokumen teks.

Ketiga jenis output riset tersebut harus dapat diunggah secara terpisah. Selanjutnya perlu dipasang DOI generator terhadap dokumen-dokumen yang diunggah.

Penutup

Dari uraian singkat di atas, maka data adalah output riset yang potensial untuk dikembangkan. Syaratnya harus tersedia secara mudah (visibilitas tinggi) dan dapat diunduh dalam format yang paling umum dipakai (bukan pdf). Dengan dibukanya akses data, maka peluang untuk menghasilkan publikasi-publikasi turunan akan terbuka lebar. Kolaborasi dengan peneliti lain (DN dan LN) juga dapat dibangun dengan lebih mudah.

Harapannya, di masa mendatang “laci” bukan lagi repositori yg paling disukai.

Follow @dasaptaerwin

Apakah semua buku harus ada di Gram****?

Pertanyaan:

  1. Apakah semua buku harus ada di Tb Gram****?
  2. Apakah kualitas dan reputasi sebuah buku ditentukan oleh jawaban no 1 di atas?

Pemikiran bahwa buku hanya ada di TB Gram**** perlu sedikit dikoreksi. Bahwa tidak semua buku yang terbit ada di TB itu. Hanya segelintir orang yang berhasil menerbitkan buku yang berakhir di rak-rak pajangan TB besar. Pada akhirnya orang jadi malas menulis karena merasa besar kemungkinan tidak akan bisa masuk TB besar.

Saat ini pola self publishing lebih mengemuka. Anda yang punya ide, anda yang menulis, anda yang mengurus ISBN nya, dan anda pula yang mencetak (bekerjasama dengan percetakan atau penerbit). Yang terakhir, anda pula yang mempromosikan dan menjualnya.

Di dunia para peneliti aliran open science di LN mereka bahkan melabeli harga bukunya dengan frasa “suggested price”, artinya kita boleh membelinya sesuai kemampuan kita. Bahkan ada juga yang membagikan buku soft file bukunya secara cuma-cuma di i-tunes dan hanya menarik ongkos cetak dan kirim bagi yang ingin memiliki versi cetaknya.

Justru dengan self publishing, anda secara personal akan mengenal siapa yang membeli dan membaca buku anda. Dengan cepat komentar dan masukan akan didapat, sehingga anda bisa mulai membuat versi berikutnya.

Jadi substansi awalnya adalah menulis. Masalah bukunya ternyata bisa masuk TB besar, itu nomor ke-123. Jangan dibalik. Toh status bahwa tidak pernah disebutkan dalam kamus bahwa definisi sebuah buku adalah harus bertengger di rak buku toko besar.

Bagaimana cara mencari makalah (berbayar) secara gratis dan legal



Bagaimana mencari referensi secara gratis




Posting ini berawal dari posting saya kemarin di FB berikut ini:

"Di Twitterland saya menemukan situs www.sci-hub.io yang dikembangkan oleh komunitas open access untuk melawan hegemoni media jurnal berbayar (pay-walled journal). Website ini "somehow" dapat membuka kunci artikel-artikel yang berbayar. Terlepas dari bagaimana hukumnya, tapi situs ini sudah banyak beredar dan diedarkan di dunia Twitter oleh komunitas open access. Anda tinggal mengcopy-paste tautan atau doi dari artikel yang dicari. Menurut saya gunakan hanya bila sangat sangat perlu. Coba juga akses profil penulis makalah dari ResearchGate sebelumnya."

Berikut diagramnya.

Diagram

1 Tuntutan bagi peneliti

Sebagai peneliti kita akan selalu dituntut up to date terhadap perkembangan ilmu yang kita tekuni. Di bidang yang saya tekuni misalnya, di bidang geologi, sub bidang hidrogeologi dan fokus riset hidrokimia, saat ini sangat berkembang teknik machine learning untuk mengklasifikasikan sampel. Dalam kasus saya adalah sampel kualitas air tanah.

Sangatlah beruntung bila anda ada dalam organisasi yang melanggan banyak jurnal berbayar terbitan Elsevier misalnya atau database ilmiah seperti Scopus dan Web of Science. Tapi apa yang terjadi bila koneksi internet adalah satu-satunya yang anda punya. Tulisan pendek ini mencoba menceritakan apa yang harus anda lakukan in the pursue of happiness (mendapatkan artikel rujukan yang penting) secara gratis (bukan gratisan).

Yang pertama anda bisa lakukan adalah memeriksa phonebook anda apakah penulis makalah yang anda cari ada dalam memori ponsel anda. Ini sangat mungkin terjadi bila penulisnya kebetulan orang Indonesia.

Apa yang terjadi bila penulisnya orang asing?

Jangan khawatir ada caranya. Setidaknya ini yang saya lakukan dan berhasil pada banyak kesempatan. Coba perhatikan skema berikut ini ya.

2 Berbagai cara

Ada beberapa cara yang dapat anda lakukan, yaitu:

  • scientific database
  • open access journal
  • social network
  • pre-print repository

2.1 Scientific database

Basis data saintifik yang kita kenal antara lain adalah:

  • Google Scholar: dimiliki oleh Google mulai 2004. Basis data ini menyediakan fasilitas pengenalan makalah dan penulis secara otomatis serta perhitungan indeks sitasi.
  • Microsoft Academic: dimiliki oleh Microsoft dan mulai beroperasi sejak pertengahan 2000 an.
  • Crossref: diinisiasi dan dikembangkan oleh komunitas open access yang dimulai sejak tahun 2000. Beberapa jurnal besar, seperti PLOSONE juga menjadi pendirinya.

2.2 Open access journal

Saat ini sangat banyak jurnal bermutu yang berjenis open access.

Apa itu open access? Silahkan baca definisi open access menurut Jurnal PLOSone ini.

Bahkan saat ini jurnal konvensional (baca: berbayar) juga sudah banyak yang menawarkan opsi open access.

Contoh journal berjenis open access untuk bidang ilmu saya, hidrogeologi dan geosains adalah:

Hati-hati saat memilih jurnal open access. Pastikan tidak masuk ke dalam daftar Beall’s list of predatory journal.

2.3 Social network

  • Twitter: Mungkin anda tidak percaya bahwa menggunakan Twitter anda bisa mengumumkan makalah yang dibutuhkan yang besar kemungkinan ada seseorang yang punya berkas pdf nya dan akan membagikannya ke anda. Anda cukup menggunakan tagar (hash tag) #icanhazpdf atau cukup hazpdf saja. Gunanya tagar ini adalah agar twit anda mudah ditemukan oleh orang lain. Beberapa tagar populer dikalangan peneliti, dosen, dan mahasiswa lainnya juga dapat anda gunakan seperti:

    • acwri: academic writing
    • phdchat: biasanya di komunitas mahasiswa atau supervisor PhD
    • tagar lainnya dapat anda temukan dengan mudah
  • Facebook/FB: siapa yang tidak punya akun media sosial ini. Anda bisa gabung dengan komunitas yang tujuannya membantu orang lain mendapatkan berkas makalah yang diperlukan. Coba anda cari Facebook Group Bantu download jurnal geoscience. Ini hanya salah satu saja, anda juga bisa bergabung dengan FB group lainnya yang bertema riset. Tentunya anda harus mematuhi ketentuan dan kesopanan (netiket) yang berlaku dalam grup tersebut, misalnya: janganlah anda beberapa menit gabung lantas langsung minta pdf paper yang dibutuhkan. Jangan lupa forum ini juga membantu anda memperluas jaringan.

  • ResearchGate/RG: ini adalah FB nya para peneliti. Ia memiliki wall (dinding profil) yang mirip dengan FB. Anda dapat bergabung secara cuma-cuma. Melalui situs ini anda dapat memajang karya-karya saintifik anda seperti: tesis, disertasi, makalah, poster, proposal, dll. Bila anda mengunggah berkas secara lengkap (full paper) baik dalam format pdf, docx, ataupun odt, maka anda akan ditawari untuk memasang digital object identifier (doi). Dengan adanya doi ini maka apapun yang anda unggah ditandai secara digital dan tidak akan tertukar dengan berkas milik orang lain. Dokumen anda jadi punya semacam ISBN. Keren bukan.

Manfaat lainnya adalah anda juga dapat mencari makalah yang anda butuhkan di jejaring ini. Anda hanya perlu mencari tahu apakah penulis makalah tersebut ada atau seluruhnya memiliki halaman profil RG. Bila ada, maka anda tinggal mencari halaman penulis itu (Find Researcher) dan besar kemungkinan (bisa gagal juga) makalahnya dipajang di halaman profil yang bersangkutan. Bila ternyata makalah yang anda perlukan ada tapi tidak lengkap (hanya abstraknya), maka anda bisa mengirimkan pesan Request paper (via RG) kepada penulisnya. Jadi anda tidak perlu lagi mengirimkan email berpanjang-panjang. Itu semua sudah ditangani oleh template RG. Anda tinggal menunggu. Ada penulis yang secara langsung membalas dengan menyertakan pdf tapi ada juga yang agak lama membalas. Anda harus maklum. Bila seminggu tidak ada balasan, maka coba kirim request kedua. Bila dua kali tidak dibalas juga maka mungkin penulis tersebut terlalu sibuk atau tidak memantau akun RG nya. Anda selalu dapat menghubungi penulis kedua atau ketiganya dengan cara yang sama.

Sayangnya situs ini belum dapat melakukan pencarian berbasis dokumen secara langsung, namun anda bisa memanfaatkan Google untuk mencari berkas langsung ke domain jejaring ResearchGate dengan menggunakan perintah: kata kunci site:researchgate.net. Dengan mengetikkan perintah tersebut di kolom pencarian, maka Google akan otomatis mencari dokumen langsung ke domain apapun yang disebut dalam perintah site: berdasarkan kata kunci yang anda masukkan. Anda dapat membuka contoh halaman profil saya di ResearchGate.

  • Academia.edu: situs ini cukup populer di kalangan mahasiswa dan peneliti pada umumnya. Karakternya mirip dengan ResearchGate. Situs milik saya ada di tautan ini.

2.4 Pre-print repository

Pre-print adalah naskah publikasi yang belum terbit. Belakangan jenis makalah seperti ini sedang naik daun. Perdebatannya adalah

apakah dokumen pre-print sudah dapat dirujuk?.

Menurut saya dan beberapa dosen, dokumen ini dapat dirujuk.

Ide awal untuk mengunggah versi pre-prints ke repository online adalah untuk klaim ide dan mempercepat penyebaran hasil riset. Ini karena proses publikasi di jurnal ternama dapat memakan waktu lama (bahkan untuk penulis asing).

Saat ini sudah banyak repositori pre-print, diantaranya yang terkenal adalah:

  • ArXiv: repositori ini dihosting oleh Cornell University, hingga saat ini telah menyimpan lebih dari 1,109,875 di bidang: fisika, matematika, sains komputer, biologi kuantitatif, finance dan statistik.
  • Bio ArXiv: repo ini dihosting oleh Cold Spring Harbour Laboratory khusus untuk bidang biologi dan turunannya.
  • Nature pre-prints: Jurnal Nature juga punya repo pre-prints.
  • PeerJ pre-prints: repo ini milik Jurnal PeerJ. Jurnal ini berjenis open access.

3 Penutup

Begitulah beberapa cara untuk mendapatkan jurnal secara cuma-cuma (atau gratis). Jadi mestinya tidak ada lagi alasan susah mencari jurnal atau tidak ada dana.

Jadi manfaatkan jaringan pribadi, jaringan sosial, dan repository pre-print untuk mendapat rujukan yang diperlukan.