Post

Manusia Yang Belajar Dari Machine Learning

Manusia Yang Belajar Dari Machine Learning

Mesin yang belajar, learning machine, machine learning, bisa jadi mengambil inspirasinya dari bagaimana manusia belajar. Machine learning telah merevolusi cara berpikir matematikawan, saintis, dan teknokrat. Bagi masyarakat umum, teknologi ini bisa jadi terlihat seperti magic. Kini, apakah manusia bisa mengambil hikmah-hikmah dari algoritma yang mereka ciptakan sendiri? Mari kita selidiki bagaimana mesin belajar, kemudian kita refleksikan dengan cara belajar manusia.

Tidak peduli pelakunya manusia atau mesin, proses belajar melalui tahap-tahap umum berikut.

Penyimpanan data untuk bernalar

Data adalah hasil observasi yang disimpan ke dalam memori. Data ini bisa diambil kembali sebagai basis dalam bernalar. Kualitas data memengaruhi kualitas hasil belajar.

Mesin menyimpan datanya di hard disk atau RAM. Manusia menyimpan memori di saraf-sarafnya. Kita semua setuju dalam hal ini, mesin (atau komputer) lebih unggul dari pada manusia. Jika manusia hanya mengingat, sesungguhnya ia belum belajar. Masih banyak tahapannya lanjutan sehingga kita bisa dikatakan “belajar”.

Abstraksi data

Setelah disimpan, data diolah menjadi representasi dan konsep-konsep yang lebih luas. Dari tahap ini, digunakan suatu model yang akan dilatih sehingga dapat menyesuaikan dengan dengan data yang tersimpan. Ada beberapa tipe model, di antaranya yakni model matematis, model diagram relasi, logika jika-maka, atau klusterisasi/pengelompokkan. Tipe model ini tidak dipilih sendiri oleh mesin. Manusia yang membuat algoritmanya-lah yang menentukan.

Tidaklah penting bagi sebuah model untuk bisa menjelaskan semua data secara satu per satu. Lihat salah satu Teori Gravitasi Newton, gaya suatu benda sama dengan massa dikali percepatannya. Dalam kehidupan sehari-hari, teori tersebut mampu menjelaskan fenomena-fenomena fisis dengan baik. Tetapi jika bendanya memiliki kecepatan yang sangat tinggi atau massanya sangat besar, kita akan merujuk pada Teori Relativitas Einstein. Abstraksi yang tepat haruslah menghasilkan model yang pas untuk suatu fenomena yang spesifik.

Generalisasi untuk masa depan

Model sudah dipegang. Kita memiliki segala kemungkinan pola yang muncul dari data yang sudah terabstraksi. Kita akan mereduksi pola tersebut menjadi satu atau beberapa saja secara heuristik. Misalnya, dalam pembelajaran mesin terdapat masalah klasifikasi. Mesin diberikan banyak sekali gambar telapak tangan yang lengkap dengan lima jari. Di sini, kita ingin mengajari mesin bahwa ini adalah gambar-gambar tangan. Mesin bisa saja mengeneralisasi tangan sebagai satu bentuk lingkaran yang terhubung dengan lima segmen garis lurus yang sejajar. Mesin akan menggunakan model ini sebagai acuan apakah pada suatu gambar terdapat tangan atau tidak. Mesin tidak perlu berlogika mengapa model tersebut adalah tangan.

Paralel dengan kemampuan ini, manusia dapat mengambil keputusan yang cepat di lingkungan yang tak pasti. Biasanya, ia tidak akan menggunakan nalar logika. Justru ia akan bernalar heuristik menggunakan perasaan dan emosi. Kita mengenalnya sebagai kemampuan insting.

Kadang, insting bisa menyesatkan. Orang-orang lebih ketakutan untuk menaiki pesawat dibandingkan mobil. Padahal secara statistik, tingkat kecelakaan pesawat jauh lebih rendah dibandingkan kecelakaan mobil. Ini terjadi karena manusia akan cenderung terfokus pada memori yang lebih mudah diingat. Tentu, kecelakaan pesawat akan dipublikasikan lebih heboh dibandingkan kecelakaan mobil. Bisa jadi karena kecelakaan di udara terkesan lebih traumatis. Memori kecelakaan pesawat yang lebih traumatis inilah salah satu contoh dari bias data.

Evaluasi keberhasilan belajar

Pada tahap ini, akan ada mekanisme umpan balik. Di sini diukurlah manfaat dari pengetahuan yang dipelajari. Selain itu, diperlihatkan pula potensi perbaikan ke depannya. Dalam pembelajaran mesin, evaluasi model ini diukur dengan loss function, yaitu fungsi yang mengukur seberapa jauh prediksi model dengan data digunakan.

Katakanlah, ternyata model tidak cukup cocok dengan data. Kita perlu mempertanyakan, jangan-jangan data yang disimpan memiliki terlalu banyak noise atau gangguan pada data. Gangguan ini dapat berupa tidak lengkapnya data, kualitasnya jelek, atau fenomena yang dijelaskan oleh data tersebut terlalu kompleks untuk dijelaskan oleh model yang dibuat.

Menggunakan data yang memiliki banyak noise dalam belajar bisa menyebabkan overfittingOverfitting akan membuat model kita sangat bagus jika diterapkan pada data yang dipunya, tapi akan sangat jelek jika digunakan pada data lainnya. Bayangkan pembelajaran di sekolah zaman dahulu–bahkan mungkin sekarang! Siswa mengalami overfitting dengan cara hanya belajar berdasarkan materi yang akan diujikan. Mereka latihan menggunakan soal ujian saja. Ya, siswa dapat lulus tes, bahkan tanpa memakai kecerdasan. Namun, mereka tidak bisa menyelesaikan masalah kehidupan yang lebih umum, karena hanya terbiasa pada persoalan di masa lalu (soal-soal ujian). Inilah yang menjadi problem kebanyakan lulusan sekolah menengah dan sekolah tinggi. Mereka lulus dengan pemahaman yang overfitted. Kemampuannya dalam menyelesaikan masalah ril bisa jadi dipertanyakan.

Manusia masih menang

Intelegensi bisa dipandang sebagai kemampuan untuk mengaplikasikan pengetahuan. Manusia bisa lupa, tetapi intelegensinya lebih tahan lama. Ia masih bisa beradaptasi dengan masalah baru, yang mungkin tidak jelas ke mana arah penyelesaiannya. Kontas dengan itu, mesin hanya bisa menyelesaikan masalah baru jika intelegensi mereka telah dilatih dengan data-data baru. Ya, dalam hal ini kita masih bisa menang.

Banyak hal yang bisa direfleksikan dari bagaimana mesin belajar. Jangan sampai kita merasa malu dengan cara belajar mesin yang lebih canggih dari pada cara kita belajar: bahan ajar yang lengkap dan luas untuk menghindari bias, berlatih dan mengalami kegagalan yang banyak, mengevaluasi diri, dan terus belajar lagi!

Referensi


Essay ini adalah salah satu tugas penulis di Mata Kuliah KU4214 Jurnalisme Sains dan Teknologi di Institut Teknologi Bandung.

This post is licensed under CC BY 4.0 by the author.