Ticker

6/random/ticker-posts

Pandas Cheatsheet : 20 Perintah Penting untuk Analisis Data



Jika Anda berkecimpung di dunia analisis data dengan Python, pasti sudah tidak asing lagi dengan library bernama Pandas. Pandas adalah alat utama untuk memanipulasi, membersihkan, dan menganalisis data terstruktur. Karena ada banyak sekali perintah yang bisa digunakan, memiliki sebuah ringkasan atau "cheatsheet" adalah hal yang sangat membantu.

Untuk itu, saya telah merangkum 20 perintah Pandas paling esensial yang wajib Anda ketahui. Simpan halaman ini sebagai referensi cepat Anda!

Pandas Cheatsheet: 20 Perintah Paling Penting

Berikut adalah tabel berisi perintah-perintah Pandas yang paling sering digunakan, beserta deskripsi singkat dalam Bahasa Indonesia.

Perintah Deskripsi
df = pd.read_csv('file.csv') Memuat data dari sebuah file CSV ke dalam DataFrame.
df.head() Menampilkan 5 baris pertama dari DataFrame untuk inspeksi cepat.
df.shape Mendapatkan dimensi DataFrame (jumlah baris, jumlah kolom).
df.info() Menampilkan ringkasan informasi DataFrame, termasuk tipe data per kolom.
df.describe() Memberikan statistik deskriptif untuk kolom numerik (rata-rata, min, max, dll).
df['nama_kolom'] Memilih satu kolom berdasarkan namanya.
df[['kolom1', 'kolom2']] Memilih beberapa kolom sekaligus.
df.loc[label_baris] Memilih baris berdasarkan nama label indeksnya.
df.iloc[posisi_baris] Memilih baris berdasarkan posisi indeks numeriknya (contoh: 0, 1, 2).
df.dropna() Menghapus semua baris yang memiliki nilai kosong (NaN).
df.fillna(nilai) Mengisi semua nilai kosong (NaN) dengan nilai yang kita tentukan.
df.sort_values('nama_kolom') Mengurutkan DataFrame berdasarkan nilai pada kolom tertentu.
df.groupby('nama_kolom').agg() Mengelompokkan data berdasarkan kolom dan melakukan agregasi (sum, mean, dll).
df.merge(df2, on='kunci') Menggabungkan dua DataFrame menjadi satu berdasarkan kolom kunci yang sama.
df['nama_kolom'].value_counts() Menghitung frekuensi kemunculan setiap nilai unik dalam sebuah kolom.
df['nama_kolom'].mean() Menghitung nilai rata-rata dari sebuah kolom numerik.
df.query('kondisi') Menyaring (filter) baris DataFrame menggunakan string kondisi (contoh: 'umur > 25').
df.rename(columns={'lama':'baru'}) Mengganti nama satu atau lebih kolom.
df.drop('nama_kolom', axis=1) Menghapus kolom dari DataFrame.
df.reset_index() Mereset indeks baris DataFrame menjadi urutan numerik standar.

Penutup

Cheatsheet ini adalah teman terbaik Anda saat sedang mengerjakan proyek analisis data. Dengan menguasai perintah-perintah di atas, alur kerja Anda akan menjadi jauh lebih cepat dan efisien.

Simpan atau bookmark postingan ini agar mudah diakses kembali saat Anda membutuhkannya. Punya perintah favorit lain yang sering Anda gunakan? Bagikan di kolom komentar di bawah!

Selamat menganalisis data!

Post a Comment

0 Comments