Algoritma Data Science: 3 Tipe Algoritma Machine Learning

Oleh: Amira Kartika Rochman

Ketika belajar data science, rasanya mustahil banget kalo kita gak belajar machine learning juga. Buat Sobat MinDi yang belum tau, machine learning adalah sebuah program “pintar” yang bisa belajar dari data tanpa ada intervensi dari manusia. Nah, dalam mempelajarinya, kita perlu buat mempelajari juga algoritma machine learning tersebut.

Ada 3 tipe algoritma machine learning yang penting banget buat dipahami oleh orang yang baru mulai belajar data science. Apa aja tipe-tipe algoritma tersebut? Yuk, langsung kita kupas tuntas satu persatu di artikel ini!

Apa Itu Algoritma Machine Learning?

Photo by Christina Morillo from Pexels

Algoritma machine learning adalah sebuah prosedur yang diimplementasikan pada code dan nantinya akan digunakan untuk mengolah data. Algoritma machine learning bakal mengenali pola dari data-data yang ada, mempelajarinya dan mencocokkannya pada sekumpulan data.

Nah, hasil olahan data tersebut nantinya bakal berguna banget bagi perusahaan dan biasanya digunakan dalam pengambilan keputusan strategi bisnis. Karenanya sebagai seorang soon-to-be data scientist, tentu Sobat MinDi wajib banget buat memahami algoritma machine learning ini.

Tipe Algoritma Machine Learning

Algoritma data science yang digunakan pada machine learning itu banyak banget macamnya. Tapi, algoritma-algoritma tersebut dikelompokkan dalam 3 tipe. Berikut 3 tipe algoritma machine learning tersebut:

  1. Supervised Learning
Photo by Christina Morillo from Pexels

Tipe algoritma supervised learning data science ini merupakan tipe yang gak bisa mempelajari data secara mandiri. Jadi, sebelumnya kita perlu melatih mesinnya dengan memberinya contoh lebih dulu.

Gimana cara memberi contohnya? Caranya adalah dengan menandai beberapa data input dengan hasil output yang benar dan sesuai. Nah, nantinya data tersebut bakal menjadi supervisor yang memastikan kalau si mesin memprediksi output dengan benar.

Biar mudah ngebayanginnya, Sobat MinDi bisa membayangkan si mesin ini sebagai seorang murid sementara data pelatihan yang kita beri adalah gurunya, ya! Seorang guru bakal mengajari dan mencontohkan si murid buat melakukan sesuatu hal. Dan ketika si murid belajar serta mempraktekkan hal yang diajarkan tersebut, si guru bakalan jadi “pengawas” yang memastikan kalau muridnya melakukan hal itu secara benar.

Kira-kira kebayang gak, nih? Kalau udah kebayang, kita lanjut lagi pembahasannya, ya!

Mungkin sekarang Sobat MinDi ada yang bertanya-tanya juga nih, supervised learning ini biasanya dipakai buat apa sih? Di dunia nyata, biasanya supervised learning bisa digunakan dalam mengklasifikasikan gambar, menilai risiko, mendeteksi penipuan sampai bahkan memfilter spam di e-mail kita, lho!

Nah, supervised learning dibagi menjadi 3 model yaitu classification, regression dan forecasting. Buat detailnya, kurang lebih seperti di bawah ini, ya!

  • Classification: Program machine learning harus menarik kesimpulan dari nilai yang diamati dan menentukan kira-kira data tersebut masuk ke kategori apa. Contoh dari classification ini adalah saat program memfilter e-mail dan menentukan apakah e-mail tersebut termasuk ‘spam’ atau ‘bukan spam’. Untuk algoritmanya sendiri, beberapa algoritma data science yang termasuk dalam classification ini adalah Linear Classifiers, Support Vector Machines (SVM), Decision Trees, K-Nearest Neighbor dan Random Forest.
  • Regression: Program machine learning harus memperkirakan dan memahami hubungan antara variabel terikat dan variabel bebas sehingga cocok untuk predikasi dan peramalan. Nah, biasanya regression digunakan untuk membuat proyeksi seperti pada pendapatan penjualan. Beberapa algoritma data science yang termasuk dalam regression ini adalah Linear Regression, Logistical Linear dan Polynomial Regression.
  • Forecasting: Forecasting adalah proses membuat prediksi tentang masa depan berdasarkan data dari masa lalu dan sekarang. Biasanya model yang satu ini dipakai untuk menganalisis tren yang akan terjadi di masa depan.

2. Unsupervised Learning

Photo by cottonbro from Pexels

Berbeda dengan tipe sebelumnya, tipe algoritma unsupervised learning ini bisa mempelajari data secara mandiri dengan cara mengidentifikasi dan menganalisis pola dari data-data yang ada. Karenanya, dalam prosesnya pun tipe algoritma machine learning ini gak memerlukan bantuan dari manusia ataupun contoh sebagai instruksi dalam memproses data. Mesin akan dibiarkan buat menafsirkan dan menangani sendiri kumpulan data besar yang ada.

Nah, tujuan dari unsupervised learning ini sendiri adalah menemukan struktur yang mendasari kumpulan data, mengelompokkannya berdasarkan kesamaan yang ada dan merepresentasikan kumpulan data tersebut dalam compressed format.

Contohnya, misalkan nih algoritma unsupervised learning ini diberikan input dataset yang berikan gambar berbagai jenis kucing dan anjing. Nah, karena algoritma ini gak pernah dilatih dengan data yang diberikan, secara teknis dia pun benar-benar gak tau fitur kumpulan data tersebut. Tugas algoritma ini adalah mengidentifikasi fitur dari gambar-gambar itu sendiri. Nantinya, dia bakal mengelompokkan dataset gambar yang ada sesuai dengan kesamaan yang dimiliki oleh gambar tersebut.

Buat contoh dalam bisnisnya sendiri, biasanya algoritma ini diterapkan ketika kita ingin mengelompokkan customer kita. Dari dataset yang ada, nantinya algoritma unsupervised learning ini bakalan mengelompokkan customer perusahaan kita mulai dari berdasarkan umur, jenis kelamin, hobi hingga bahkan bisa juga pekerjaannya.

Sama seperti yang supervised learning, algoritma unsupervised learning ini dibagi menjadi 2, yaitu Clustering dan Association. Buat detailnya, yuk simak di bawah ini!

  • Clustering: Clustering adalah metode untuk mengelompokkan objek-objek ke dalam cluster-cluster sedemikian rupa sehingga nantinya objek-objek yang paling banyak kemiripannya bisa tetap menjadi satu kelompok dan gak tercampur dengan objek-objek dari kelompok lain. Pokoknya, analisis clustering ini menemukan kesamaan antara objek data dan mengkategorikannya sesuai dengan ada atau gak adanya kesamaan di antara mereka.
  • Association: Association adalah metode unsupervised learning yang digunakan buat menemukan hubungan antara variabel dalam database besar. Contoh penerapannya seperti menemukan hubungan antara teh dan gula, di mana biasanya orang yang membeli teh cenderung bakal membeli gula juga.

3. Semi-supervised Learning

Photo by Olia Danilevich from Pexels

Kalau di dua tipe sebelumnya label datanya antara ada semua (supervised)  atau gak ada sama sekali (unsupervised), nah algoritma semi-supervised learning ini ada di antara keduanya alias datanya sih ada, tapi gak lengkap! Wah, kok bisa gitu, ya?

Pada prakteknya nih, biasanya biaya buat memberi label itu cukup tinggi karena perusahaan memerlukan tenaga ahli yang terampil buat melakukannya. Jadi, algoritma semi-supervised learning ini hadir buat memastikan data-data yang ada tetap bisa diolah.

Biasanya, data yang memiliki label itu pada dasarnya sebuah informasi dengan meaningful tags yang bisa dengan mudah dipahami oleh algoritma machine learning ini. Dengan adanya hal ini, algoritma semi-supervised learning pun tetap bisa mempelajari datanya dan memberikan label pada data yang gak berlabel.

Buat contoh pengaplikasiannya sendiri, biasanya algoritma semi-supervised learning ini diaplikasikan buat mengklasifikasikan dokumen teks. Kalau kita coba mengklasifikasikannya sendiri, tentu bakalan jadi PR banget dan gak efisien karena kita harus membaca lebih dulu semua dokumen yang ada buat mengelompokkannya, kan?

Semi-supervised learning ini memungkinkan algoritma buat belajar dari sedikit bagian dokumen teks yang memiliki label sambil mengklasifikasikan dokumen teks yang gak memiliki label dalam data pelatihan yang ada. Setelahnya, baru deh dokumen teks yang gak memiliki label tersebut bakal melalui proses yang sama seperti yang udah memiliki label.

Nah, itulah 3 tipe algoritma machine learning dalam data science. Kira-kira penjelasan MinDi di atas udah cukup membantu Sobat MinDi buat memahami materinya, gak nih?

Kalau Sobat MinDi mau belajar lebih dalam tentang data science termasuk machine learning, kamu bisa banget lho, ikutan Bootcamp Data Science dari dibimbing.id! Gak cuma bakal diajarin materi dan diajak mempraktekkannya, nanti kamu juga bakal dapat kesempatan buat melakukan konsultasi pribadi dengan mentor yang berpengalaman di bidang data science ini, lho!

Jadi, buat kamu yang masih kebingungan tentang beberapa materi seputar data science, tentu kamu gak perlu khawatir lagi karena nantinya kamu bisa tanya dan berkonsultasi dengan mentormu sampai kamu benar-benar memahaminya. Yang lebih kerennya lagi nih, dengan mengikuti Bootcamp Data Science ini, kamu juga dijamin bakal siap buat langsung terjun dan berkarier sebagai data scientist karena ada program penyaluran kerja juga, lho!

Karenanya, Bootcamp Data Science dari dibimbing.id ini beneran kesempatan yang gak boleh sampai kamu lewatkan banget, deh! Buat kamu yang penasaran sama detail lebih lengkapnya, kamu bisa langsung aja kepoin bootcamp ini dengan KLIK DI SINI, ya!

Dibimbing.id yakin banget, kalau pada dasarnya semua orang bisa dibimbing jadi lebih hebat dan keren lagi. Jadi, buat kamu yang gak punya background IT pun kamu tetap bisa mendaftarkan diri buat mengikuti bootcamp ini kok! Yuk, belajar dan kembangkan kemampuanmu bersama dibimbing.id!

Share on facebook
Facebook
Share on twitter
Twitter
Share on telegram
Telegram
Share on email
Email
Share on whatsapp
WhatsApp

Responses

Your email address will not be published. Required fields are marked *