Tutorial Web Scraping Sederhana dengan Python, Lengkap!
Farijihan Putri
•
30 December 2025
•
116
Tutorial web scraping sering dicari pemula data science yang bingung mulai dari mana saat butuh data real untuk latihan. Banyak yang sudah belajar Python dasar, tapi mentok ketika harus ambil data dari website.
Dataset gratis terasa terbatas dan kurang relevan dengan kebutuhan industri. Di sisi lain, lowongan data science menuntut kemampuan eksplorasi data mandiri sejak awal. Tanpa web scraping, proses analisis terasa kurang lengkap dan portofolio sulit berkembang.
Warga Bimbingan pasti paham rasanya ingin upgrade skill tapi takut salah langkah. Makanya, MinDi mau ajak kamu belajar lebih terarah lewat pembelajaran intensif 6 bulan di Bootcamp Data Science & AI Machine Learning Dibimbing.
Baca Juga: Bootcamp Data Science Offline Dibimbing, Pasti Siap Kerja!
Apa Itu Web Scraping?
Web scraping adalah teknik mengumpulkan data dari website secara otomatis menggunakan program, umumnya dengan Python, lalu mengubahnya menjadi data terstruktur untuk dianalisis.
Metode ini membantu pemula data science memperoleh data real langsung dari sumber online tanpa menunggu dataset siap pakai.
Bagi data scientist, web scraping penting karena membuka akses ke data aktual yang relevan dengan kebutuhan bisnis dan riset. Kemampuan ini juga memperkaya portofolio karena menunjukkan inisiatif, problem solving, dan pemahaman alur data dari sumber mentah hingga siap analisis.
Tutorial Dasar Web Scraping
Sebelum praktik, pahami alurnya agar proses pengambilan data lebih terstruktur dan mudah diikuti.
1. Analisis Struktur Website
Buka halaman web target lalu gunakan fitur Inspect Element pada browser untuk melihat struktur HTML. Cari tag, ID, atau class yang menyimpan data penting seperti judul, harga, atau deskripsi. Tahap ini membantu menentukan bagian mana yang perlu diambil.
2. Pengambilan Data
Gunakan library Python seperti requests untuk mengambil kode HTML dari halaman statis. Untuk website dinamis yang memuat data lewat JavaScript, manfaatkan Selenium atau Playwright agar halaman bisa dimuat secara penuh sebelum diproses.
3. Ekstraksi Data
Parsing HTML dilakukan dengan Beautiful Soup untuk mengekstrak teks atau atribut tertentu sesuai kebutuhan. Data yang sudah bersih dapat disimpan ke format CSV, JSON, atau database.
Alternatif tanpa coding juga tersedia melalui ekstensi browser, cocok untuk latihan awal sebelum masuk ke otomatisasi penuh.
Baca Juga: Rekomendasi 7 Bootcamp Data Science Terbaik untuk Pemula
Tutorial Web Scraping dengan Python
Sumber: Freepik
Setelah memahami konsep dan alurnya, kini saatnya masuk ke langkah praktikal agar kamu bisa langsung mencoba web scraping dengan Python.
1. Menentukan Tujuan dan Data yang Dibutuhkan
Tutorial web scraping yang pertama adalah kamu tentukan jenis data yang ingin diambil, misalnya judul artikel, harga produk, atau rating.
Contohnya, data scientist pemula dapat mengambil daftar judul berita untuk analisis teks. Penentuan tujuan membantu fokus pada elemen HTML yang relevan. Dengan arah yang jelas, proses pengambilan data terasa lebih efisien.
2. Menganalisis Struktur Website
Selanjutnya, buka website target dan gunakan fitur Inspect Element pada browser. Perhatikan tag HTML, class, atau id yang membungkus data yang dibutuhkan. Misalnya, judul artikel berada dalam tag <h2> dengan class tertentu. Tahap ini membantu memahami pola struktur halaman sebelum menulis kode.
3. Mengambil Konten Halaman Web
Setelah struktur dipahami, gunakan library requests untuk mengambil HTML dari halaman statis. Contoh penggunaannya cukup sederhana, dengan mengirim request ke URL lalu menyimpan respons HTML.
Untuk halaman dinamis, Selenium atau Playwright dapat memuat konten secara penuh. Langkah ini memastikan data tersedia sebelum diproses lebih lanjut.
4. Mengekstrak Data dengan Beautiful Soup
Tutorial web scraping selanjutnya, parsing HTML menggunakan Beautiful Soup untuk mengambil elemen spesifik.
Contohnya, kamu dapat mengekstrak teks judul dengan mencari tag dan class yang sesuai. Proses ini mengubah HTML mentah menjadi data yang mudah dibaca. Hasil ekstraksi bisa berupa list atau dictionary untuk analisis lanjutan.
5. Menyimpan dan Mengelola Data Hasil Scraping
Terakhir, simpan data ke format yang mudah digunakan seperti CSV atau JSON. Banyak pemula memulai dengan CSV karena mudah dibuka di Excel atau Pandas.
Data juga dapat dimasukkan ke database untuk proyek yang lebih besar. Tahap ini membuat hasil scraping siap dipakai untuk eksplorasi dan visualisasi data.
Baca Juga: 7 Tahapan Belajar Data Science: Panduan Lengkap
Contoh Kode Web Scraping Sederhana
MinDi kasih contoh kode web scraping sederhana dengan Python yang mudah dipahami pemula dan bisa langsung kamu coba
1. Ambil Konten HTML dari Website
Langkah awal, kita mengambil isi HTML dari sebuah halaman web menggunakan library requests.
import requests from bs4 import BeautifulSoup url = 'https://contoh.com' # ganti dengan URL target response = requests.get(url) html_content = response.text |
Kode di atas berfungsi mengirim permintaan ke website lalu menyimpan isi halaman dalam bentuk HTML. Data ini masih mentah dan belum bisa langsung dipakai untuk analisis.
2. Parse dan Ekstrak Data
Setelah HTML didapatkan, tahap berikutnya adalah parsing dan pengambilan data yang dibutuhkan.
soup = BeautifulSoup(html_content, 'html.parser') # Contoh: ambil semua judul dengan tag <h2> judul_list = soup.find_all('h2') # Bisa juga lebih spesifik, misalnya: # soup.find_all('div', class_='nama-kelas') for judul in judul_list: print(judul.get_text()) # get_text() untuk mengambil teks bersih |
Pada bagian ini, Beautiful Soup membantu membaca struktur HTML dan mengekstrak elemen tertentu. Output berupa teks judul yang bisa langsung disimpan atau diolah lebih lanjut.
Contoh sederhana ini sudah cukup kuat untuk latihan awal sebelum masuk ke proyek tutorial web scraping yang lebih kompleks.
Baca Juga: 15 Pertanyaan Interview Data Science & Contoh Jawaban
Mulai Karier Data Analyst Kamu dari Sekarang!
Menguasai tutorial web scraping menjadi langkah awal penting untuk membangun portofolio data science berbasis data real dan kebutuhan industri. Kamu bisa belajar lebih terarah lewat Bootcamp Data Analyst Dibimbing.
Dapatkan benefit gratis mengulang kelas, praktik nyata untuk portofolio, konsultasi 1-on-1 bersama mentor, serta penyaluran kerja ke 840+ hiring partner dengan 96% alumni telah bekerja.
Punya pertanyaan seperti: “Bagaimana alur belajar dan pembagian materi selama 6 bulan bootcamp? atau Seperti apa mekanisme penyaluran kerja setelah lulus?” Jangan ragu konsultasi gratis di sini. dibimbing.id siap #BimbingSampeJadi.
