Penjelasan akan disusulkan. Untuk sekarang bisa memperhatikan gambar ini dulu :). Naskah ini saya tulis menggunakan Markdown yang disimpan di sini.
1. Ketika wabah melanda
Saat ini semua orang terdampak wabah pandemi virus Corona. Tidak terkecuali dosen, peneliti, dan mahasiswa. Masalahnya bukan hanya saat belajar mengajar, tetapi juga saat mahasiswa saat ini sedang menyelesaikan tugas akhirnya.
Pandemi Covid ini pastinya akan diingat oleh dunia dan terekam dalam sejarah sebagai pandemi terbesar setelah Pandemi Influenza Tahun 1918. Infografik rekaman pandemik dari Lancet ini bagus untuk dilihat agar kita belajar dari pandemi sebelumnya (simak juga infografis BIG ini).
Google Photos/dasaptaerwin, Lisensi CC-0
Beberapa yang saya sampaikan di bawah ini tidak bersifat generik yang dapat diaplikasikan pada semua bidang ilmu. Beberapa perguruan tinggi mungkin memiliki regulasi yang kaku, beberapa lainnya mungkin lebih fleksibel. Pembimbing sendiri memiliki pemikiran yang tidak seragam. Jadi bagi para mahasiswa yang membaca blog saya ini, pastikan anda berkomunikasi dengan pembimbing anda, karena bisa jadi beliau tidak setuju dengan usulan saya ini. 🙂
Bidang ilmu saya adalah geologi, yang tergabung dalam Fakultas Ilmu dan Teknologi Kebumian. Pola kerja kami umumnya sama, memikirkan masalah, pergi ke lapangan untuk ambil data, olah datanya, dan simpulkan.
2. Edaran Dirjen Dikti
Pada saat pemerintah mengeluarkan pembatasan keluar rumah, posisi mahasiswa tugas akhir (MTA) bisa jadi belum (1) mendapatkan data, (2) sudah mendapatkan data tapi belum lengkap, atau (3) sudah memiliki data lengkap dan sedang menganalisisnya. Untuk kondisi yang ketiga, mestinya tidak ada lagi masalah. Proses bimbingan dapat dilaksanakan secara daring, begitu pula sidangnya. Yang menjadi masalah adalah kondisi kesatu dan kedua. Untuk mengatasi masalah yang mungkin timbul karena pembatasan aktivitas ini, Dirjen Dikti Kemdikbud telah menerbitkan surat edaran yang intinya menghimbau perguruan tinggi agar mempertimbangkan kondisi mahasiswa yang sedang tugas akhir.
3. Perlu fleksibilitas dan kreativitas
Dalam artikel blog ini, saya menyampaikan beberapa hal yang mungkin bisa jadi solusi untuk mahasiswa yang sedang tugas akhir dan juga pembimbingnya. Yang dibutuhkan adalah fleksibilitas pada sisi dosen pembimbing dan kreativitas pada sisi mahasiswa. Tentunya saya menulis ini bercermin dari pengalaman saya sendiri dan sedikit pengalaman rekan-rekan dosen di sekitar saya.
3.1 Fleksibilitas
A. Fleksibilitas dalam hal jenis dan penggunaan data
Dalam data, pembimbing dan perguruan tinggi perlu punya fleksibilitas. Saat tidak ada pandemi, standar yang diminta biasanya adalah data primer, yaitu data yang diambil sendiri oleh mahasiswa sesuai dengan proposal yang telah dibuatnya. Saat aktivitasi di luar sangat dibatasi seperti sekarang, maka akan sangat sempit juga kesempatan bagi mahasiswa untuk mengambil data ke lapangan. Bagi mahasiswa yang tenggat lulusnya masih lama (misal tahun depan) ini bisa diatasi dengan menjadwal ulang program pengambilan data. Namun demikian tetap saja, mahasiswa dan pembimbingnya perlu Rencana B seandainya kondisi darurat Covid belum akan dihentikan hingga tengah tahun ini.
Rencana B yang dimaksud adalah menggunakan data sekunder (data yang diambil orang lain) sebagai data pelengkap atau data utama penelitiannya. Mengenai porsi antara data primer dan data sekunder ini memang akan sangat subyektif, karena itu dibutuhkan fleksibilitas pembimbing. Sangat jamak bagi seorang mahasiswa geologi untuk menggunakan data yang diambil oleh orang lain, sebuah perusahaan pemboran, atau perusahaan minyak, misal: data pemboran, data seismik atau hasil survey geofisika lainnya, data geokimia, dll.
Bila penelitian memang baru dimulai, maka pastikan anda berkonsultasi dengan pembimbing untuk mengubah proposal pada bagian metode. Data primer diganti dengan data sekunder. Tentunya anda perlu mencari dulu apakah data sekunder tersedia atau tidak untuk topik penelitian anda. Kasus terburuknya adalah tidak ada, maka mau tidak mau memang topik harus diubah atau dimodifikasi agar dapat memanfaatkan data sekunder yang tersedia.
B. Fleksibilitas dalam pembimbingan
Membimbing dari jauh pasti tidak bisa disamakan dengan membimbing secara langsung. Khususnya untuk bidang ilmu kebumian. Kami biasanya bekerja dengan peta. Beberapa kesalahan halus dalam penggambaran peta dapat terlewat kalau tidak dilihat secara langsung petanya. Untuk ini kita bisa mencari jalan tengah dengan mengirimkan peta dari rumah atau tempat kos mahasiswa ke rumah dosen pembimbing melalui jasa ojek online. Tapi bagaimana dengan mahasiswa yang telah pulang kampung. Mereka memutuskan pulang kampung untuk mengurangi biaya hidup, juga biasanya diminta pulang oleh orang tuanya agar bisa diawasi secara langsung. Jadi jelas perlu ada fleksibilitas. Beberapa kesalahan kecil harus disadari bisa saja terlewat, bahkan saat sidang dilaksanakan. Dosen pembimbing dapat mengusulkan kepada ketua sidang beberapa hal yang sifatnya disclaimer. Akan lebih bagus kalau Program Studi secara komunal menentukan beberapa kesalahan yang dapat diterima atau dikecualikan ini.
C. Bagaimana bila anda dalam tahap analisis yang perlu menggunakan fasilitas laboratorium
Terus terang saya belum bisa memberikan gambaran, karena kondisi di setiap perguruan tinggi pasti berbeda-beda. Ada yang ketentuan #lockdownnya ketat, ada pula yang mungkin masih memberikan beberapa keleluasaan dengan kriteria dan pengawasan ketat. Saya belum bisa membayangkan juga bagaimana kalau sampel anda harus ada dalam lemari pendingin di dalam lab atau harus menjalani perlakuan khusus lainnya. Saya berharap dengan adanya artikel ini, akan ada artikel sejenis yang ditulis oleh orang-orang yang memang mengalaminya.
3.2 Kreativitas
3.2 Kreativitas
Selanjutnya saya akan bercerita tentang kreativitas mahasiswa, keterampilan yang dibutuhkan untuk mencari data sekunder. Kreativitas yang saya maksud adalah yang diinisiasi oleh insiatif. Jadi menurut saya, ini adalah kreativitas yang terarah. Bukan kreativitas yang tanpa tujuan :). Jadi intinya insiatif sangat diperlukan dikala penelitian sedang terombang-ambing tidak menentu seperti sekarang ini. Ditambah lagi, dalam kondisi seperti ini, saran dari dosen bisa sangat terbatas. dosen juga kan sama. Berikut ini adalah beberapa contoh kreativitas yang mungkin anda kerjakan. Selain yang saya sebutkan pasti ada yang lain, namanya juga kreativitas :).
3.2.1 Menganalisis
- Kalau data sudah ada. Anda sudah dapat melakukan beberapa analisis seperti:
- analisis deskriptif. Misal anda punya beberapa data kuantitatif dari beberapa sampel yang anda ukur. Anda sudah bisa membuat tabel atau grafik sederhana untuk menampilkan nilai rata-rata, maksimum dan minimum. Bila sampel anda bisa dikategorikan (misal kategori sampel air tanah, kategori sampel air sungai, kategori sampel air hujan), maka anda bisa tampilkan sampel-sampel itu dengan warna yang berbeda agar anda mudah melacaknya. Kalau anda fasih menggunakan Ms Excel jangan lupa untuk mengunduh Ms Excel Analysis Toolpak. Saya bukan pegawai Microsoft, tapi di era saya masih pakai Office (terakhir versi 2003), saya senang sekali dengan fitur Add-in. Kalau anda belum pernah menggunakannya, bisa mampir ke sini.
dan
- analisis korelasi. Jika anda memungkinkan, anda bisa melakukan analisis korelasi. Buatlah grafik x-y (scatter plot) buat korelasi. Pilihlah korelasinya, apakah linear atau logaritmik. Jangan lupa untuk membedakan kategori sampelnya (misal jenis sampel air). Nah kalau anda masih senang dengan Ms Excel, maka anda akan punya kendala. Excel hanya mampu menampilkan label dari dari nilai sumbu x atau sumbu y saja. Misal anda ingin menampilkan label berupa nilai elevasi, anda tidak akan dapat melakukannya. Setelah beberapa tahun mengotak-atik ini, saya menemukan add in bernama XY Chart Labeler yang dapat diunduh gratis. Jadi anda bisa sedikit memodifikasi grafik x-y yang sudah dibuat. Di Youtube juga ada beberapa tutorial menarik.
- Kalau anda ingin keluar dari zona aman misal mencoba R atau Python akan lebih bagus lagi (Catatan: saya tidak tahu kenapa dinamai dengan alfabet dan nama ular). Ada banyak tutorial pemrograman yang mudah diikuti. Biasanya tutorial-tutorial ini dilengkapi kode program yang tersimpan di Github atau media sejenis. Kodenya bisa langsung disalin (dengan legal karena lisensinya MIT license) kemudian dimodifikasi sedikit sesuai dengan kebutuhan anda. Pasti mengasyikkan belajar pemrograman saat masa isolasi ini. Prana Ugi dan saya juga menulis buku Belajar Statistika dengan R yang dapat diunduh bebas.
- Analisis time series. Bila data anda berupa data time series, anda dapat melakukan beberapa analisis awal. Bila anda pengguna Excel tutorial ini (Carleton, Exceltable) sepertinya cocok, bila anda pengguna R, maka buku daring dari Rob J. Hyndman ini bisa dicoba.
- Analisis multivariabel. Bila data anda kuantitatif dan terdiri dari beberapa variabel yang diukur, akan bagus kalau dianalisis secara multivariabel, misal: cluster analysis (dengan Excel, R, Python) atau [principal component analysis](dengan excel, R, Python).
3.2.2 Mencari data sekunder
** Kondisi data mentah saat ini**
Sekarang kita bicara bagaimana kalau anda pada akhirnya harus menggunakan data sekunder, baik sebagai data utama atau sebagai data pendukung/pembanding. Untuk ini anda perlu mengetahui cara mencari data sekunder. Data sekunder yang saya maksud adalah data mentah, bukan data yang telah diolah.
Dulu sumber data sekunder bisa dari laporan riset atau makalah ilmiah. Seperti biasa dalam dokumen-dokumen itu akan ada bab tentang data. Masalahnya adalah apakah data tercantum secara jelas dalam dokumen, atau ada dalam lampiran atan appendiks berbentuk buku yang terpisah. Buku data kadang ada sebagai satu kesatuan dengan laporan, kadang tidak menyatu. Begitu pula dengan data yang ada dalam makalah ilmiah. Seringkali data hanya dimunculkan dalam bentuk tabel ringkasan statistik deskriptif, misal: hanya menampilkan angka maksimum, minimum, rata-rata, dst. Data yang seperti ini yang saya maksud sebagai data yang telah diolah. Jangan menggunakan data yang sudah diolah.
Saat dokumen laporan dan makalah ilmiah sudah bergeser ke arah dokumen digital, kondisinya bisa saja sama. Dokumen digital tidak menampilkan data mentah. Kalaupun ada, tampil dalam format PDF. Ini akan menyulitkan kita ketika akan mentabulasikannya. Kalau tidak terpaksa jangan pula memilih yang ini, kecuali anda bersedia mengetik ulang datanya. Begitu pula data yang bersifat spasial, seringkali tayang sebagai peta dalam format PDF, JPG, PNG. Kondisi seperti ini juga menyulitkan, karena kita akan perlu mendigitasi ulang peta tersebut. Istilah bekennya adalah non-reproducible atau tidak dapat dipakai ulang (dengan mudah).
** Tentang sitasi data (data citation) **
Saat ini telah banyak didengungkan ide tentang data citation. Singkatnya, data yang dihasilkan dalam suatu riset harus dapat diolah orang lain dengan cara menyitirnya. Jadi antara data dan laporan dianggap sebagai dokumen yang terpisah tapi harus terhubung. Pengguna dapat menyitir dokumen laporan atau makalah ilmiah kalau yang dibutuhkan adalah hasil telaahnya, tapi mereka juga dapat menyitir datanya saja ingin menggunakannya untuk kebutuhannya.
What is data citation? Data citation refers to the practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to outputs such as journal articles, reports and conference papers. Citing data is now recognised as one of the key practices leading to recognition of data as a primary research output (ANDS.org).
Maksudnya adalah data seperti halnya makalah atau laporan, harus dapat disitasi. Agar itu dapat dilakukan, maka data perlu diunggah daring dengan metadata yang lengkap (data author, title, year, dst). Berkas yang diunggah harus dapat dibuka menggunakan perangkat yang umum dimiliki pengguna komputer. Data yang mudah ditemukan, mudah diakses, mudah dibuka dan dioperasikan, dengan metadata yang cukup lengkap, maka prinsip (Findable, Accessible, Interoperable, Reproducible) dapat dipenuhi. Strategi mengelola data riset (research data management) dapat dibaca dalam slide di bawah ini.
A light Introduction to Research Data Management from Dasapta Erwin Irawan
Presentasi tentang berbagi data oleh Peter Murray-Rust.
Secara praktis, peneliti sebenarnya memiliki kewajiban untuk membuat datanya tersedia untuk publik, terutama untuk riset yang dibiayai dana publik. Ini sangat penting agar:
- data dapat ditemukan untuk dipakai sebagai
- perangkat menguji riset
- menambahnya sejalan dengan waktu dan digabungkan dengan data dari lokasi yang berbeda-beda
- menganalisisnya dengan berbagai cara dan tujuan yang belum dilaksanakan oleh kreator data awal.
Bila empat hal di atas terjadi, maka ilmu pengetahuan akan cepat berkembang.
** Repositori data**
Data repositori saat ini telah didukung infrastruktur standar dan metadata yang bagus, sehingga memungkinkan untuk ditemukan menggunakan mesin pencari, misal Google Scholar. Berikut ini adalah repositori data yang berkaitan dengan ilmu kebumian dan ilmu-ilmu yang terkait.
- repositori data umum (daftar dari Nature):
- Zenodo, modus point and click
- OSF, modus point and click
- Figshare, modus point and click
- Github, menggunakan Aplikasi Git dan perintah teks
- Gitlab, menggunakan Aplikasi Git dan perintah teks
- repositori data khusus (bidang ilmu kebumian):
Berikut ini adalah beberapa repositori data sains sosial:
Kalau anda sudah mencoba masuk ke repositori-repositori tersebut dan membuka salah satu datanya, maka akan terlihat data dibagikan dengan cara yang memudahkan pengguna (saya, anda, kita) menggunakan ulang data tersebut. Tidak perlu mengetik ulang, memplot ulang dst. Prinsip free to read
harus ditambah dengan prinsip free to mine
(bebas untuk dieksplorasi). Prinsip ini dinyatakan oleh Peter Murray-Rust (Simak video di bawah ini).
Mencari dataset melalui basis data saintifik
Anda juga dapat mencari dataset dengan menggunakan basis data saintifik, seperti Scopus dan Web of Science yang berbayar, atau kalau anda berminat bisa menggunakan yang gratis seperti Dimensions dan Lens. Anda bisa mengaktifkan filter dataset, kemudian bidang ilmu, selanjutnya anda persempit lagi dengan beberapa kata kunci, sebagai contoh adalah sebagai berikut. Data (data_dimensions.csv
dan data_lens.csv
) dapat diunduh di Github/dasaptaerwin.
Plot jumlah dataset (sum of datasets
) dan publikasi yang terkait dengan dataset tersebut (sum of publications
) menurut Basis Data Dimensions
Plot jumlah dataset (sum of datasets
) dan publikasi yang menyitir dataset tersebut (works cited
) menurut Basis Data Lens
Pentingnya repositori
Dari uraian pendek tentang data citation di atas, maka jelaskan peran repositori sangat penting di sini. Saya tahu di dunia akademik, makalah yang terbit di jurnal top adalah yang utama dan mungkin itulah satu-satunya yang dipandang berharga. Tapi
Bacaan tambahan
- https://www.nature.com/sdata/policies/repositories
- https://ropensci.github.io/reproducibility-guide/sections/introduction/
- https://hdsr.mitpress.mit.edu/pub/jduhd7og
- https://reusabledata.org/
- https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0213090
- https://datascience.codata.org/articles/10.5334/dsj-2017-008/
- https://data.research.cornell.edu/content/data-citation
- https://www.usgs.gov/products/data-and-tools/data-management/data-citation
Pada bagian akhir saya juga akan menekankan pentingnya repositori kampus untuk mengunggah dokumen tugas akhir secara lengkap. Salah satu manfaatnya adalah pada kondisi darurat seperti ini. Kalau banyak data mentah diunggah lengkap, maka para peneliti, tidak hanya pada saat ada pandemi ekstrim seperti sekarang, akan sangat terbantu. Ilmupun menjadi lebih cepat berkembang karena dipikirkan oleh banyak kepala.