Perlombongan Data dalam Era IR4.0
21 Oktober 2o25
Perlombongan Data dalam Era IR4.0
21 Oktober 2o25
Ditulis oleh:
Prof. Madya Dr. Nurulkamal Masseran
Pensyarah
Jabatan Sains Matematik,
Universiti Kebangsaan Malaysia
Dalam era IR4.0 kini, seringkali kita mendengar ungkapan-ungkapan seperti “data is the new oil”, “machines are learning”, dan juga “everything is connected”. Semua ungkapan-ungkapan ini terbit disebabkan kemunculan pelbagai teknologi sistem cerdas seperti rumah pintar, kenderaan swapandu (autonomous vehicle), teknologi mudah alih dan boleh pakai (mobile and wearable technology) dan teknologi berkuasa-AI yang telah banyak mengubah setiap aspek kehidupan kita dalam tempoh sesingkat 5 tahun kebelakangan ini. Namun, di sebalik itu, kebanyakan masyarakat awam tidak mengetahui bahawa kaedah perlombongan data merupakan “hero yang tidak didendangkan” yang menjadi tulang belakang terhadap kemunculan teknologi-teknologi ini yang sekali gus mendorong kepantasan revolusi era IR4.0 pada hari ini.
Apakah itu Teknik Perlombongan Data?
Secara asasnya, teknik perlombongan data merupakan integrasi kaedah berstatistik dan pembelajaran mesin dengan aplikasi pengaturcaraan komputer yang merupakan proses penting dalam mengekstrak corak, trend dan maklumat-maklumat penting dalam set data raya (big data). Analogi penggunaan istilah “perlombongan” membawa gambaran seolah-olah ia merupakan kaedah untuk “penggalian emas era moden (IR4.0)”. Namun, “penggalian emas” ini bukanlah menggunakan jentera mekanikal ataupun mesin berat. Sebaliknya, pengetahuan ilmu berkaitan matematik, statistik, algoritma, pengaturcaraan komputer dan pangkalan data merupakan “jentera” utama yang diperlukan untuk mengekstrak “maklumat-maklumat emas” yang tersembunYi dalam set data yang besar dan berdimensi tinggi.
Kepentingan peranan teknik perlombongan data ini adalah semakin meningkat dari semasa ke semasa selari dengan ledakan data besar yang secara mudah boleh dijana daripada pelbagai teknologi-teknologi IR4.0 seperti, telefon pintar, sensor-sensor IoT, media sosial, transaksi dalam talian dan lain-lain. Oleh itu, ia bukar sekadar pengumpulan data. Namun yang lebih penting adalah bagaimana kita dapat memahami dan memanfaatkan data besar yang ada dihadapan kita. Manfaat yang boleh boleh diperoleh daripada penggunaan kaedah pelombongan data adalah sangat besar. Pemegang taruh dalam segenap aspek kehidupan termasuk kerajaan, pemain industri, perniagaan, ekonomi, sektor kesihatan, sektor pendidikan dan lain-lain, semuanya sangat bergantung kepada maklumat yang tepat dan komprehensif dalam membuat keputusan yang bijak terhadap permasalahan yang dihadapi, mahupun dalam membuat perancangan masa hadapan.
Aplikasi Perlombongan Data dalam Dunia Sebenar
Dalam bidang perlombongan data ini terdapat empat isu utama yang menjadi “tiang seri” yang memacu perkembangannya. Empat isu ini ialah:
Pengkelompokan,
Pengkelasan,
Perlombongan aturan sekutuan
Pengecaman data pencil.
Daripada empat isu tersebut, pelbagai kaedah-kaedah baharu yang lebih terkehadapan telah berjaya dikembangkan dan diusulkan oleh penyelidik-penyelidik diseluruh dunia bersesuaian dengan kerumitan masalah yang dihadapi dalam pelbagai jenis data yang wujud seperti data reruang, data aliran, data jujukan, data siri masa, data web, data jaringan dan lain-lain.
Mungkin ia agak teknikal untuk diperincikan kaedah-kaedah tersebut terutama dalam konteks bukan akademik. Malah ia mungkin akan menjadi penulisan yang membosankan dan sukar untuk difahami oleh masyarakat awam. Yang mungkin lebih menarik minat masyarakat awam ialah, apakah aplikasi perlombongan data dalam dunia sebenar?. Sebahagian aplikasi ini mungkin telah wujud di Malaysia dan sebahagiannya mungkin masih memerlukan sedikit masa untuk diadaptasi dalam pasaran tempatan. Di bawah, saya nyatakan sebahagian aplikasi dunia nyata berkaitan penggunaan kaedah perlombongan data:
Perlombongan data sebagai model ramalan:
Perlombongan data digunakannya dalam perniagaan dalam talian untuk meramal permintaan dalam pasaran, promosi dan pengesyoran produk kepada pelanggan.
Penganalisis bank menggunakan kaedah perlombongan data untuk mengesan potensi penipuan sebelum ia berlaku.
Sektor penjagaan kesihatan menggunakan kaedah perlombongan data untuk meramal keputusan saringan pesakit dan cadangan rawatan yang bersesuaian.
Kilang pembuatan menggunakan perlombongan data dengan sensor IoT untuk meramalkan kegagalan mesin sebelum ia berlaku. Ini dapat mengurangkan masa operasi proses kilang daripada terhenti dan sekali gus dapat menjimatkan kos yang tinggi.
Perlombongan data untuk memahami sentimen pelanggan dan masyarakat:
Perlombongan data membantu perniagaan untuk mengekstrak maklumat berkaitan sentimen, kehendak dan tingkah-laku pelanggan bagi tujuan meningkatkan jualan produk, menyasarkan iklan kepada segmen masyarakat yang tepat dan mencipta produk baharu berdasarkan permintaan pasaran.
Perlombongan data juga boleh membantu kerajaan dalam memahami sentimen masyarakat berkaitan program-program yang dijalankan serta polisi-polisi yang diperkenalkan.
Perlombongan data juga boleh membantu kerajaan dalam merancang agihan peruntukan yang lebih saksama kepada segenap masyarakat
Perlombongan data dalam membangunkan bandar pintar:
Kerajaan boleh menggunakan kaedah perlombongan data untuk membangunkan bandar pintar dengan mengekstrak maklumat daripada data berkaitan bandar untuk tujuan mengoptimumkan aliran trafik, mengurangkan jenayah dan mengurus sumber dengan lebih berkesan.
Cabaran Perlombongan Data dalam Era IR4.0
Walaupun kaedah perlombongan data mempunyai kemampuan yang tinggi dan boleh memberikan manfaat yang besar, namun sudah pasti ia datang bersama cabaran tertentu. Seperti ungkapan yang popular dalam filem Spiderman iaitu “with great power comes great responsibility”. Antara persoalan serius yang sering dibangkitkan oleh banyak pihak berkaitan perlombongan data ialah melibatkan isu ketelusan dan perlindungan privasi. Iaitu;
Kecenderungan pihak tertentu yang menjalankan pengumpulan data tanpa kebenaran
Pengawasan dan pemprofilan tanpa kebenaran,
Kebocoran data, dan banyak lagi.
Umumnya, orang awam mempunyai kesedaran dan kawalan yang rendah tentang bagaimana data mereka akan digunakan oleh pihak ketiga. Oleh itu, tanggungjawab pihak kerajaan adalah sangat penting untuk menangani isu ketelusan dan privasi ini. Undang-undang yang lebih jelas dan tegas perlu dibangunkan agar kebimbangan berkaitan isu ketelusan dan privasi data ini dapat diatasi dengan baik. Ini kerana, secara prinsipnya, mengimbangi kemajuan teknologi dengan perlindungan privasi adalah sama penting dalam memastikan penggunaan dan perlombongan data yang dibuat adalah beretika.
Selain daripada itu, isu kepincangan dalam perlombongan data juga merupakan kebimbangan yang tidak dapat kita pandang ringan. Hal ini kerana, tanpa aturan dan pengawasan yang teliti, keputusan yang diperoleh daripada perlombongan data mungkin akan memberikan hasil yang pincang atau berat sebelah. Ini boleh membawa kepada keputusan dan perancangan yang tidak adil malah mungkin juga boleh mendorong kepada keputusan yang berisiko. Antara punca yang boleh menyebabkan perlombongan data memberikan keputusan yang pincang adalah disebabkan algoritma mempelajari corak daripada data yang mungkin tidak mewakili variasi sebenar dengan secukupnya. Akibat kepincangan dalam perlombongan data ini akan membawa kepada pelbagai implikasi. Antaranya ialah diskriminasi keputusan, kehilangan kepercayaan terhadap sistem, dan secara tidak langsung akan membawa kepada isu undang-undang dan etika. Oleh itu, negara perlu menghasilkan lebih ramai pakar-pakar perlombongan data dan saintis data pada masa hadapan agar tadbir urus dan pengawasan yang cekap terhadap keseluruhan proses perlombongan data dapat dipantau dengan baik supaya hasil yang keluarkan bukan sahaja boleh dipercayai, malah ia sememangnya “maklumat emas” yang diperlukan untuk proses perancangan dan pembuatan keputusan yang bijaksana
Memandang ke hadapan, bidang perlombongan data pastinya akan menjadi lebih maju terkehadapan jika teknologi pengkomputeran kuantum benar-benar dapat direalisasikan. Ini pastinya akan membantu negara dalam menyelesaikan pelbagai cabaran yang kompleks. Namun, untuk memastikan ia benar-benar memberi manfaat kepada masyarakat, kita perlu memastikan isu-isu yang dibentangkan diatas iaitu berkaitan ketelusan, privasi, kepincangan serta keterangkuman merupakan asas yang perlu ditangani dalam setiap aktiviti berkaitan perlombongan data. Akhir kata, satu ungkapan yang cukup indah untuk kita hayati berkaitan perlombongan data ini, “those who can turn data into decisions will lead the future”.
Rujukan
Aggarwal, C.C. (2015). Data Mining. The Textbook. Springer, New York.
Han, J., Pei, J., Tong, H. (2022). Data Mining: Concepts and Techniques. 4th edition. Morgan Kaufmann.
Liao, S. H., Chu, P. H., Hsiao, P. Y. (2012). Data mining techniques and applications–A decade review from 2000 to 2011. Expert systems with applications, 39(12), 11303-11311.
Naeem, M., Jamal, T., Diaz-Martinez, J., Butt, S. A., Montesano, N., Tariq, M. I., De-la-Hoz-Franco, E., De-La-Hoz-Valdiris, E. (2021). Trends and future perspective challenges in big data. In Advances in intelligent data analysis and applications. Proceeding of the sixth euro-China conference on intelligent data analysis and applications, 15–18 October 2019, Arad, Romania (pp. 309-325). Springer: Singapore.
Tan, P-G., Steinbach, M., Kumar, V. (2018). Introduction to data mining. 2nd edition. Pearson Education, Boston.