Data Visualization_Supermarket-Sales
Tahapan Visualisasi Data menggunakan bahasa pemrograman Python dan tools Analisis Microsoft Power BI
Visualisasi Data
Menurut Wikipedia, Visualisasi Data adalah :
Visualisasi data dilihat oleh banyak bidang ilmu sebagai komunikasi visual modern. Visualisasi data tidak berada di bawah bidang manapun, melainkan interpretasi di antara banyak bidang (misalnya, terkadang dilihat sebagai cabang modern dari statistik deskriptif oleh beberapa orang, tetapi juga sebagai dasar alat pengembangan oleh yang lain). Visualisasi data mengikutkan pembuatan dan kajian dari representasi visual dari data, artinya “informasi yang telah diabstraksikan dalam bentuk skematis, termasuk atribut atau variabel dari unit informasi”.
Tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna lewat grafik informasi yang dipilih, seperti tabel dan grafik. Visualisasi yang efektif membantu pengguna dalam menganalisis dan penalaran tentang data dan bukti. Ia membuat data yang kompleks bisa diakses, dipahami dan berguna. Pengguna bisa melakukan pekerjaan analisis tertentu, seperti melakukan pembandingan atau memahami kausalitas, dan prinsip perancangan dari grafik (contohnya, memperlihatkan perbandingan atau kausalitas) mengikuti pekerjaan tersebut. Tabel pada umumnya digunakan saat pengguna akan melihat ukuran tertentu dari sebuah variabel, sementara grafik dari berbagai tipe digunakan untuk melihat pola atau keterkaitan dalam data untuk satu atau lebih variabel.
Visualisasi Data
Sebelum masuk ketahap Visualisasi data, hal yang harus diperhatikan yaitu Kualitas dari data itu sendiri, maka perlu melakukan :
Qualiti Data Checking
Penyesuaian Coloumn untuk keprluan Visualisasi
About Data and Tools
Data yang digunakan bersumber dari Kagle yang bersifat Opensource yang berjudul Super Market Sales, dan tools yang digunakan Untuk Quality Data Checking Jupiter Nootbok menggunakan Bahasa pemrograman Python dan tools analisis/visualisasi menggunakan Microsoft Power BI
Pembahasan Data
Terdiri dari 17 Coloumn, yaitu :
Invoice ID : Nomor identifikasi faktur penjualan yang dihasilkan komputer
Branch : Cabang supercenter (3 cabang tersedia diidentifikasi oleh A, B dan C).
City : Lokasi supercenter
Customer type : Jenis nasabah, dicatat oleh Anggota untuk nasabah yang menggunakan kartu anggota dan Normal untuk tanpa kartu anggota.
Gender : Jenis kelamin pelanggan
Product line : Grup kategorisasi barang umum — Aksesori elektronik, Aksesori mode, Makanan dan minuman, Kesehatan dan kecantikan, Rumah dan gaya hidup, Olahraga dan perjalanan
Unit price : Harga setiap produk dalam $
Quantity : Jumlah produk yang dibeli oleh pelanggan
Tax 5% : 5% biaya pajak untuk pembelian pelanggan
Total : Total harga termasuk pajak
Date : Tanggal pembelian (Catatan tersedia dari Januari 2019 hingga Maret 2019)
Time : Waktu pembelian (10 pagi hingga 9 malam)
Payment : Pembayaran yang digunakan pelanggan untuk pembelian (tersedia 3 metode — Tunai, Kartu kredit, dan Ewallet)
cogs : Harga pokok penjualan
gross margin percentage : Persentase margin kotor
gross income : Pendapatan kotor
Rating : Peringkat stratifikasi pelanggan pada pengalaman berbelanja mereka secara keseluruhan (Pada skala 1 hingga 10)
Quality Data Checking
Untuk Quality Data checking bisa juga menggunakan Microsoft Excel, Microsoft Power BI ataupun menggunakan Python, namun untuk Quality data checking menggunakan Excel ada Batasan baris yang mampu di load.
Dan pada kesempatan kali ini untuk Quality Data Checking saya menggunakan Python :
Mengimport Library yang digunakan dan muat Datanya, memasukan Data kedalam Variabel “data” dan memanggil 10 baris data teratas
Fungsi info () mengetahui informasi yang terkandung pada data yang terdiri dari jumlah baris, nama coloum, jenis type data serta dapat mengetahui jika ada missing value pada data. Dari data dibawah teridiri dari 1000 baris dengan berbagai tipe data dan tidak ada Mising Value, Untuk mengecek Mising Value bisa juga menggunakan isna() atau isnull.
Pada gambar dibawah, saya melakukan looping guna mendapatkan informasi yang lebih spesifik terkait data, karna pada dasarnya missing value tidak hanya nilai yang kosong maksudnya terkadang missing value tersebut diisi dengan value yang tidak memiliki arti dan juga melihat isi yang terkandung dari data tersebut
Memecah Coloum Tanggal yang terdiri dari Hari, Bulan dan Tahun menjadi masing masing coloumn
Mengecek keseluruhan data setelah melakukan perubahan dan menyimpan data dengan Ekstensi Excel
Visualisasi Data menggunakan Microsoft Power BI
Buka Microsoft Power BI kemudian Get Data dan Centang Data. Setelah datanya di pilih maka ada pilihan Load dan Transform data, Jika dirasa datanya sudah Oke bisa pilih load dan jika dirasa perlu melakukan perubahan lagi bisa ke Transform data.
Drag and Drop data, dibagian Visualizations pilih Slicer, dan dibagian pojok kanan atas pilih Dropdown, jika ingin menampilkan bebrapa baris data tertentu jangan lupa untuk memfilter data terlebeih dahulu.
Unit Sales : Drag and Drop data Quantity, dibagian Visualizations pilih Multi row card, dibagian Title Ubah yang tadinya Quantity menjadi Unit Sales
Top Days_1 yaitu menentukan hari terbaik penjualan : New Measure, Top Days = “Top Days : “ & SELECTEDVALUE(Sheet1[Days]), Drag and Drop data Top Days, berdasarkan data Quantity yang di input ke Value kemudian dibagian Visualizations pilih Multi row card, filter data terlebih dahulu dengan cara masukan Coloumn date filter kemudian pilith Top N dan tentukan berapa jumlah hari yang mau ditampilkan, berdasarkan coloumn Quantity Jika sudaah apply Filter
Top Days_2 yaitu menentukan hari terbaik Profit Penjualan : Copy Visualization Top Days_1 dan ubah value nya menjadi Data Profit
Total Profit : copy saja visualisasi Unit Sales, dan jangan lupa ganti value yang awalnya Quantity menjadi Profit dan ubah Title nya menjadi Profit
Dibagian Visualization pilih Area Chart/Line Chart dan untuk Y_axis masukan data Quantity dan untuk X_axis masukan data Month
Terdiri dari 6 Column yaitu :
Producline : Drag and drop data Product Line
Quantity : Drag and drop data Quantity
Revenue : Data Quantity X dengan Data Unit Price
Tax 5% : Drag and drop data Tax 5%
Total : Drag and drop data Total
Profit : Data Unit Price X Data Quantity — Pajak 5%
Contribution by Product : Dibagian Visualization pilih Pie Chart, untuk Valuenya masukan data Quantity dan untuk Legend nya masukan data Product
· Qualiti Data Checking
· Penyesuaian Coloumn untuk keprluan Visualisasi