Decision Tree: Pengertian, Manfaat, Plus-Minus, & Contohnya
Siti Khadijah Azzukhruf Firdausi
โข
03 June 2024
โข
3728
Mengambil keputusan memang tidak selalu mudah, apalagi jika ada banyak faktor yang harus dipertimbangkan. Dalam situasi ini, decision tree adalah salah satu metode machine learning yang bisa membantumu membuat keputusan dengan terstruktur dan jelas.
Bukan hanya membantu dalam klasifikasi dan regresi, decision tree juga memberikan gambaran visual yang memudahkanmu untuk pahami pilihan dan risikonya.
Mau tahu lebih banyak soal decision tree? Pastikan untuk baca artikel ini sampai habis, ya!
Apa yang Dimaksud dengan Decision Tree?
Merangkum dari GeeksforGeeks, decision tree adalah alat populer yang digunakan dalam berbagai bidang seperti machine learning, data mining, dan statistik. Metode ini menyediakan berbagai cara intuitif untuk membuat keputusan berdasarkan data.
Setiap keputusan yang dibuat dengan decision tree diambil dengan memodelkan hubungan antara berbagai variabel.
Lebih detailnya, decision tree adalah jenis supervised machine learning. Mengutip dari Masterโs in Data Science, algoritma ini bisa mengkategorikan atau membuat prediksi berdasarkan cara pertanyaan sebelumnya dijawab.
Untuk melakukan itu, model ini dilatih dan diuji pada set data yang sudah memiliki kategori sesuai harapan. Meski begitu, model ini tidak selalu memberikan jawaban atau keputusan dengan detail dan jelas.
Akan tetapi, decision tree bisa memberikan opsi bagi data scientist untuk membuat keputusan sendiri berdasarkan informasi yang dihasilkan model ini.
Selain itu, decision tree cenderung menirukan bagaimana manusia berpikir. Sehingga, memahami dan menginterpretasikan hasilnya relatif mudah bagi data scientist.
Manfaat Decision Tree
Dari penjelasan di atas, Sobat MinDi mungkin sudah dapat gambaran bahwa model decision tree bisa berguna untuk membuat keputusan berdasarkan data. Selain itu, ada berbagai macam manfaat lain yang bisa didapatkan dari decision tree.
Berikut MinDi jabarkan beberapa manfaat utama dari penggunaan decision tree:
Memudahkan Pengambilan Keputusan: Membantu mengkategorikan atau membuat prediksi berdasarkan pertanyaan atau tugas yang belum diselesaikan.
Memaksimalkan Perolehan Informasi: Memilih atribut terbaik untuk membagi data dan membuat keputusan yang paling informatif.
Bisa Digunakan dalam Random Forest: Melatih beberapa subset data pelatihan untuk mencapai hasil yang lebih akurat.
Visualisasi Keputusan yang Jelas: Memberikan gambaran visual yang jelas mengenai alasan sebuah keputusan dibuat.
Berguna untuk Data Mining: Mengidentifikasi pola dan hubungan dalam data yang kompleks.
Baca Juga: Ini Dia, 7 Tahapan Data Mining Yang Harus Anda Tau!
Struktur Decision Tree
Mengutip dari Masterโs in Data Science, decision tree mencakup berbagai struktur yang memiliki peran masing-masing. Lebih lengkapnya, berikut rangkuman dari MinDi:
Root Node: Simpul dasar dari decision tree yamh merupakan tempat pembagian pertama data terjadi.
Splitting: Proses membagi node menjadi beberapa sub-node berdasarkan atribut yang dipilih.
Decision Node: Simpul yang terus dibagi menjadi sub-node tambahan. Ini adalah titik keputusan di mana data dipisahkan lebih lanjut.
Leaf Node: Simpul terminal yang tidak dibagi lagi. Ini mewakili hasil atau keputusan akhir.
Pruning: Proses menghapus sub-node dari decision tree untuk mengurangi kompleksitas dan meningkatkan generalisasi.
Branch: Bagian dari decision tree yang terdiri dari beberapa node. Ini menggambarkan jalur keputusan dari root node ke leaf node.
Bagaimana Cara Kerja Decision Tree?
Merangkum dari GeeksforGeeks, decision tree bekerja dengan cara membagi dataset menjadi subset yang lebih kecil berdasarkan atribut yang paling signifikan.
Supaya lebih paham lagi tentang cara kerjanya, berikut MinDi jabarkan tiap langkahnya:
Memilih Atribut Terbaik
Atribut terbaik untuk membagi data dipilih menggunakan metrik seperti Gini impurity, entropy, atau information gain. Atribut terbaik ini adalah yang paling efektif dalam memisahkan data menjadi kelas yang berbeda.
Membagi Dataset
Setelah atribut terbaik dipilih, dataset kemudian dibagi menjadi subset. Ini dilakukan berdasarkan atribut yang dipilih. Proses ini disebut splitting. Dalam prosesnya, node (simpul) dibagi menjadi sub-node.
Pengulangan Proses
Proses pemilihan atribut terbaik dan pembagian dataset diulangi secara rekursif untuk setiap subset. Ini terus berlanjut sampai mencapai kriteria penghentian.
Contoh penghetiannya adalah ketika semua instance dalam node termasuk dalam kelas yang sama atau mencapai kedalaman pohon yang telah ditentukan.
Contoh Cara Kerja Decision Tree
Untuk membantu kamu memami cara kerjanya lebih dalam lagi, MinDi akan kasih ilustrasi detailnya. Bayangkan kamu adalah seorang pegolf yang mau memprediksi apakah skormu akan di bawah par atau di atas par di hari tertentu.
Skormu akan dipengaruhi oleh beberapa variabel. Contohnya adalah kecepatan angin, penutupan awan, suhu, atau apakah kamu berjalan kaki atau naik buggy.
Setiap variabel input akan menentukan node keputusan. Misalnya:
Apakah hari itu berangin?
Apakah hari itu dingin?
Apakah Anda bermain dengan teman?
Apakah Anda berjalan kaki atau naik kereta golf?
Dengan data tentang kebiasaan bermain golf kamu, decision tree bisa membantu memprediksi bagaimana performamu di lapangan pada hari tertentu.
Misalnya, jika berangin dan kamu bermain sama teman, decision tree mungkin memprediksi bahwa skormu akan di bawah par.
Mengutip dari Masterโs in Data Science, decision tree dibagi menjadi dua kategori utama yaitu categorical dan continuous variable. Berikut MinDi jabarkan dalam rangkuman lengkapnya:
Categorical Variable Decision Tree
Pada decision tree ini, hasil atau jawaban dari setiap keputusan cocok dengan satu kategori tertentu. Setiap simpul dalam pohon mewakili keputusan yang mengarahkan data ke satu kategori.
Contoh penggunaannya adalah mengklasifikasikan jenis kelamin seseorang berdasarkan nama atau menentukan apakah email termasuk spam atau bukan.
Continuous Variable Decision Tree
Dikenal juga sebagai regression tree. Dalam model ini, hasil atau variabel output tidak hanya ya atau tidak. Hasilnya bergantung pada keputusan-keputusan sebelumnya atau jenis pilihan yang terlibat dalam keputusan tersebut.
Dalam decision tree ini, prediksi didasarkan pada beberapa variabel sekaligus, bukan hanya satu. Contohnya adalah ketika memprediksi harga rumah.
Decision tree akan melakukannya berdasarkan ukuran, lokasi, dan jumlah kamar untuk memberikan estimasi harga yang akurat.
Kelebihan dan Kekurangan Decision Tree
Decision tree adalah alat yang mudah digunakan dalam machine learning. Dengan ini, kamu bisa membuat keputusan yang lebih akurat. Akan tetapi, decision tree tentu juga punya kekurangannya.
Untuk bahan pertimbangan kamu, berikut MinDi jabarkan kelebihan dan kekurangan decision tree:
Kelebihan Decision Tree
Berikut adalah beberapa kelebihan decision tree yang menjadikannnya unggul:
Sederhana dan Mudah Dipahami: Struktur visualnya mudah diinterpretasikan.
Serbaguna: Dapat digunakan untuk klasifikasi dan regresi.
Tidak Memerlukan Feature Scaling: Tidak perlu normalisasi atau skala data.
Menangani Hubungan Non-Linear: Mampu menangkap hubungan non-linear antara fitur dan variabel target.
Kekurangan Decision Tree
Sementara itu, beberapa kekurangan decision tree yang perlu kamu pertimbangkan adalah:
Overfitting: Berisiko overfitting pada data pelatihan jika pohon terlalu dalam.
Ketidakstabilan: Variasi kecil dalam data dapat menghasilkan pohon yang sangat berbeda.
Bias terhadap Fitur dengan Banyak Level: Fitur dengan lebih banyak level dapat mendominasi struktur pohon.
Contoh Penerapan Decision Tree
Decision tree adalah alat yang sangat berguna untuk mengkategorikan hasil berdasarkan atribut yang dapat diurutkan sesuai dengan kriteria yang sudah diketahui. Berikut adalah beberapa contoh penerapan decision tree dalam dunia nyata:
Sistem Rekomendasi Pelanggan
Sistem rekomendasi ini bisa dibangun menggunakan decision tree yang membuat simpul berdasarkan keputusan pelanggan dari waktu ke waktu. Misalnya, jenis produk yang dibeli atau genre film yang ditonton.
Diagnosa Medis
Dalam bidang medis, decision tree dapat membantu dokter dalam membuat keputusan diagnostik dan menentukan perawatan terbaik berdasarkan berbagai input pasien.
Untuk melakukan ini, decision tree memproses berbagai input seperti gejala, hasil tes, dan faktor risiko lainnya. Tujuannya adalah untuk memberikan rekomendasi diagnostik dan perawatan yang paling sesuai.
Baca Juga: 5 Contoh Project Data Science yang Baik sebagai Referensi Kamu
Kembangkan Keahlianmu di Ilmu Data & Machine Learning dengan Dibimbing.id!
Apakah sekarang kamu sudah paham tentang manfaat dari decision tree? Untuk membangun dan mengimplementasikannya, dibutuhkan pemahaman tentang klasifikasi data, pembagian dataset, dan analisis data.
Kalau tertarik, kamu bisa mempelajarinya dengan ikutan Bootcamp Data Science dari Dibimbing.id! Di sini, kamu bakal diajarin data science dari awal hingga mahir bareng ahli-ahli di industri.
Kamu juga bakal mempraktikkan teori yang diajarkan dalam proyek-proyek nyata. Selain itu, program ini juga dirancang dengan kurikulum yang beginner-friendly. Jadi, meskipun baru mulai, kamu tetap bisa mengikuti pelajarannya dengan mudah.
Bukan cuma pembelajarannya yang beginner-friendly, program ini juga ada jaminan kerjanya! Ini sudah dibuktikan oleh 94% lulusan Dibimbing yang berhasil dapat pekerjaan seusai program selesai.
Menarik, bukan? Yuk, segera daftar dan kembangkan keahlianmu di data science bareng Dibimbing.id!
Referensi
Tags
Siti Khadijah Azzukhruf Firdausi
Khadijah adalah SEO Content Writer di Dibimbing dengan pengalaman menulis konten selama kurang lebih setahun. Sebagai lulusan Bahasa dan Sastra Inggris yang berminat tinggi di digital marketing, Khadijah aktif berbagi pandangan tentang industri ini. Berbagai topik yang dieksplorasinya mencakup digital marketing, project management, data science, web development, dan career preparation.