Contoh Coding Data Kuantitatif

Dalam era digital saat ini, pemahaman dan pengelolaan data kuantitatif menjadi kunci sukses di berbagai bidang. Data kuantitatif, yang berbentuk angka dan dapat diukur, menjadi pondasi bagi analisis, pengambilan keputusan, dan pengembangan produk atau layanan. Bagaimana kita memanipulasi dan menganalisis data ini secara efektif? Jawabannya seringkali terletak pada kemampuan coding. Artikel ini akan membahas contoh coding sederhana untuk data kuantitatif, fokus pada bahasa pemrograman Python yang populer dan mudah dipelajari.

Visualisasi data kuantitatif dalam bentuk grafik batang

Memulai dengan Data Kuantitatif

Sebelum melakukan coding, penting untuk memahami jenis data kuantitatif yang akan kita kerjakan. Data kuantitatif bisa berupa data diskrit (misalnya, jumlah siswa dalam kelas) atau data kontinu (misalnya, tinggi badan seseorang). Dalam contoh ini, kita akan fokus pada manipulasi data tabular sederhana yang sering ditemukan dalam analisis statistik atau sains data.

Contoh Coding dengan Python

Python adalah pilihan yang sangat baik untuk bekerja dengan data kuantitatif karena ekosistem library-nya yang kaya, seperti NumPy dan Pandas. Pandas, khususnya, menyediakan struktur data yang efisien dan alat untuk analisis data.

1. Membuat dan Memanipulasi DataFrame Sederhana

DataFrame adalah struktur data dua dimensi seperti tabel yang menjadi inti dari library Pandas. Kita bisa membuatnya dari berbagai sumber, termasuk dictionary Python.

Contoh Kode:


import pandas as pd

# Membuat dictionary data
data_siswa = {
    'Nama': ['Adi', 'Budi', 'Citra', 'Dewi', 'Eka'],
    'Usia': [20, 21, 19, 22, 20],
    'Nilai': [85, 90, 78, 92, 88]
}

# Membuat DataFrame dari dictionary
df_siswa = pd.DataFrame(data_siswa)

# Menampilkan DataFrame
print("DataFrame Data Siswa:")
print(df_siswa)

# Menampilkan informasi kolom dan tipe data
print("\nInformasi DataFrame:")
df_siswa.info()

# Menampilkan statistik deskriptif untuk kolom numerik
print("\nStatistik Deskriptif Nilai:")
print(df_siswa['Nilai'].describe())
            

Dalam contoh di atas, kita pertama-tama mengimpor library pandas. Kemudian, kita membuat sebuah dictionary Python di mana kunci dictionary menjadi nama kolom dan nilai dictionary adalah list data untuk kolom tersebut. Dengan `pd.DataFrame(data_siswa)`, kita mengubah dictionary ini menjadi DataFrame. Metode `.info()` memberikan ringkasan struktur DataFrame, termasuk jumlah entri non-null dan tipe data setiap kolom. Metode `.describe()` pada kolom 'Nilai' memberikan statistik dasar seperti jumlah (count), rata-rata (mean), standar deviasi (std), nilai minimum (min), kuartil (25%, 50%, 75%), dan nilai maksimum (max).

2. Memfilter dan Mengurutkan Data

Salah satu operasi paling umum dalam analisis data adalah memfilter baris berdasarkan kriteria tertentu dan mengurutkannya. Misalnya, kita mungkin ingin melihat siswa yang memiliki nilai di atas 85.

Contoh Kode:


# Memfilter siswa dengan nilai di atas 85
siswa_nilai_tinggi = df_siswa[df_siswa['Nilai'] > 85]
print("\nSiswa dengan Nilai di Atas 85:")
print(siswa_nilai_tinggi)

# Mengurutkan DataFrame berdasarkan Nilai dari tertinggi ke terendah
df_siswa_urut = df_siswa.sort_values(by='Nilai', ascending=False)
print("\nDataFrame Diurutkan Berdasarkan Nilai (Tertinggi ke Terendah):")
print(df_siswa_urut)
            

Baris `df_siswa[df_siswa['Nilai'] > 85]` menunjukkan bagaimana kita memfilter data. Ekspresi `df_siswa['Nilai'] > 85` menghasilkan serangkaian nilai boolean (True/False) yang sesuai dengan setiap baris. Ketika ekspresi boolean ini digunakan untuk mengindeks DataFrame, hanya baris yang bernilai `True` yang akan dikembalikan. Untuk pengurutan, metode `.sort_values()` digunakan. Parameter `by='Nilai'` menentukan kolom mana yang akan digunakan untuk mengurutkan, dan `ascending=False` menginstruksikan untuk mengurutkan dari nilai terbesar ke terkecil.

3. Menghitung Statistik Agregat

Agregasi data adalah proses merangkum data menjadi satu nilai ringkasan. Ini bisa berupa perhitungan rata-rata, jumlah, nilai maksimum, atau minimum untuk seluruh kolom atau dikelompokkan berdasarkan kategori tertentu.

Contoh Kode:


# Menghitung rata-rata nilai seluruh siswa
rata_rata_nilai = df_siswa['Nilai'].mean()
print(f"\nRata-rata Nilai Seluruh Siswa: {rata_rata_nilai:.2f}")

# Menghitung jumlah siswa per usia
jumlah_per_usia = df_siswa.groupby('Usia').size()
print("\nJumlah Siswa per Usia:")
print(jumlah_per_usia)

# Menghitung rata-rata nilai per usia
rata_rata_nilai_per_usia = df_siswa.groupby('Usia')['Nilai'].mean()
print("\nRata-rata Nilai per Usia:")
print(rata_rata_nilai_per_usia)
            

Fungsi `.mean()` pada Pandas Series digunakan untuk menghitung rata-rata. Untuk agregasi yang lebih kompleks, seperti menghitung jumlah atau rata-rata per kelompok, kita menggunakan metode `.groupby()`. `df_siswa.groupby('Usia')` mengelompokkan DataFrame berdasarkan nilai unik di kolom 'Usia'. Setelah dikelompokkan, kita dapat menerapkan fungsi agregasi seperti `.size()` (untuk menghitung jumlah item dalam setiap grup) atau `.mean()` pada kolom spesifik ('Nilai' dalam contoh ini) untuk mendapatkan hasil yang diinginkan.

Kesimpulan

Contoh-contoh coding di atas hanya menggores permukaan dari apa yang dapat dicapai dengan Python untuk analisis data kuantitatif. Library seperti Pandas menyediakan cara yang kuat namun mudah diakses untuk memanipulasi, memfilter, mengurutkan, dan menganalisis data numerik. Menguasai dasar-dasar ini adalah langkah awal yang krusial bagi siapa saja yang ingin memanfaatkan kekuatan data untuk membuat keputusan yang lebih baik dan wawasan yang lebih dalam.

🏠 Homepage