5 Contoh Project Data Science yang Baik sebagai Referensi Kamu
Syaukha Ahmad Risyad
•
07 September 2023
•
8075
Kalau Sobat MinDi lagi menyusun portfolio, pastinya kamu butuh buat menambah project kamu sendiri. Yuk, lihat contoh project data science berikut ini!
Buat kamu menjadi seorang profesional, memperkaya portfolio data science kamu dengan project yang relevan sangatlah penting. Ada beberapa aspek dalam project yang perlu kamu perhatikan. Di artikel ini, MinDi mau nunjukkin project data science karya student dari Dibimbing.id! Baca sampai akhir, ya!
Karakteristik Project Data Science yang Baik
Sebelum kita melihat beberapa contoh, mari berkenalan dengan beberapa hal yang perlu kamu perhatikan dalam membuat project data science. Karakteristik berikut bisa jadi pertimbangan dalam kamu membuat project kamu sendiri.
Orisinil: Project yang baik tentunya memiliki kebaruan dari kamu sendiri. Pilih project yang baru dan tunjukkan karakteristik kamu sendiri.
Fokus: Baiknya, sebuah project memiliki fokus yang sempit terhadap suatu isu atau topik saja.
Relevan: Pastikan bahwa project kamu relevan dengan isu yang benar-benar ada di dunia nyata.
Praktis: Selain relevan, pastikan juga kalau project kamu dapat diimplementasikan secara praktis. Tunjukkan kemampuan kamu dalam melakukan pengumpulan, pembersihan, dan analisis data untuk memperkuat kepraktisan project kamu.
Spesifik: Data science digunakan dalam berbagai sektor, maka pilih project yang spesifik terhadap industri yang kamu tuju.
1. Customer Segmentation and Market Basket Analysis (Widi Destrianda)
Project pertama adalah segmentasi pelanggan oleh Widi Destrianda. Project ini bertujuan untuk meningkatkan profitabilitas perusahaan dengan menganalisis karakteristik transaksi dari pelanggan.
Data yang digunakan diunduh dari instacart.com, kemudian dilakukan exploratory data analysis (EDA) untuk mendapatkan ringkasan dari karakteristik data. Selanjutnya dilakukan pemodelan RFM (recency, frequency, and monetary) untuk menganalisis perilaku dari konsumen. RFM digunakan dengan mengukur waktu belanja, frekuensi belanja, dan intensitas belanja dari konsumen.
Berdasarkan analisis dan pemodelan data, didapatkan informasi bahwa konsumen paling aktif berbelanja pada pukul 10 AM - 15 PM di hari Sabtu dan 9 AM - 11 AM di hari Minggu. Diperoleh juga empat kluster dari konsumen berdasarkan profil pengeluarannya. Dari analisis yang dilakukan, disimpulkan bahwa ada 28 barang yang dapat direkomendasikan, dan diperlukan penyusunan layout untuk meningkatkan efisiensi belanja.
Terakhir, Widi tidak lupa untuk memberikan rekomendasi berdasarkan temuan-temuannya dari data yang sudah diolah. Rekomendasi ini ditujukan untuk meningkatkan engagement dan AOV (average order value).
2. Bank Marketing Production (Indra Yanto Simanihuruk)
Project selanjutnya oleh Indra Yanto Simanihuruk bertujuan untuk mengidentifikasi pola depositor dan meningkatkan efektivitas marketing dari suatu bank, sehingga dapat meningkatkan coversion rate dan profit.
Data diambil dari kaggle.com, kemudian dianalisis menggunakan model machine learning untuk memperoleh nilai AUC (Area Under the Curve).
Dari analisis, diperoleh kesimpulan bahwa faktor sosio-ekonomi berperan paling besar. Hasil project merekomendasikan supaya marketing berfokus pada klien yang lebih muda (di rentang 20 tahun) dan lebih tua (di atas 65 tahun).
3. Predicting Vehicle Insurance (Muhammad Muwahiddin Massaid)
Project dari Muhammad Muwahiddin Massaid mencoba memprediksi karakteristik konsumen yang tertarik pada asuransi kendaraan.
Data yang diperoleh dibersihkan terlebih dahulu dan diberlakukan EDA untuk mendapatkan karakteristik dari data. Light Gradient Boosting Machine (LGBM) dilakukan untuk memperoleh AUC.
Dari model, didapatkan bahwa konsumen mayoritas berumur di bawah 30 tahun, sedangkan konsumen yang paling tertarik dengan asuransi berada di rentang 36-55 tahun. Artinya, diperlukan strategi yang berfokus pada pentingnya asuransi kendaraan bagi masyarakat di bawah 30 tahun.
4. Book Recommendation System (Ulya Azmah Khairiah)
Data science bukan hanya digunakan pada sektor ekonomi dan keuangan saja. Contohnya adalah seperti project sistem rekomendasi buku oleh Ulya Azmah Khairiah yang satu ini. Project ini bertujuan untuk meningkatkan conversion rate pada Amazon Kindle dan membuat sistem yang mempermudah pembaca memilih buku yang sesuai dengan selera mereka.
Data-data penting, seperti rating, metadata buku, tag, dan book-tag digunakan untuk diolah dengan Content Based Filtering dan Collaborative Filtering.
Model berhasil memberikan rekomendasi buku yang memiliki rating tinggi namun tidak populer, populer namun rating tinggi, dan populer serta rating tinggi. Bahkan dari model yang dibuat, Ulya berhasil membuat aplikasi Book Recommender-nya sendiri!
5. Rainfall Forecasting (Nur Annisa)
Sektor lain yang dapat dikembangkan dengan data science adalah agrikultur. Project ramalan curah hujan dari Nur Annisa yang satu ini mencoba memprediksi hujan yang terjadi dalam beberapa periode ke depan, dan memeriksa apakah perubahan iklim dapat mempengaruhi curah hujan tersebut.
Nur mendapatkan data dari Giovanni, sebuah antarmuka yang memungkinkan penggunanya menganalisis data dari satelit NASA. Data kemudian diolah dengan EDA dan dimodelkan dengan Seasonal ARIMA dan Exponential Smoothing (ETS). ARIMA (Auto Regressive Integrated Moving Average) adalah model yang dapat meramalkan data deret waktu.
Hasil pemodelan menunjukkan bahwa pada beberapa tahun ke depan tidak akan ada pergeseran musim, dan curah hujan tidak akan mempengaruhi pola agrikultur.
Membuat Project Data Science yang Baik
Setelah melihat contoh-contoh project data science di atas, apakah Sobat MinDi sudah punya bayangan terkait project yang ingin kamu ambil selanjutnya?
Dalam membuat project yang baik, dibutuhkan keterampilan pengolahan data dan machine learning yang baik, apalagi kalau kamu ingin menjadi profesional di bidang data science. Untungnya, Dibimbing.id punya program Bootcamp Data Science yang bisa kamu ikuti buat kamu belajar Python dan tools lain buat kamu mahir data science!
Di bootcamp, kamu juga bisa punya kesempatan dapetin auto-shortlist dari perusahaan, jadi semakin mempermudah project profesional kamu!
Yuk, jadi profesional data science bareng Dibimbing.id!
Tags