Jika Anda berkecimpung di dunia analisis data dengan Python, pasti sudah tidak asing lagi dengan library bernama Pandas. Pandas adalah alat utama untuk memanipulasi, membersihkan, dan menganalisis data terstruktur. Karena ada banyak sekali perintah yang bisa digunakan, memiliki sebuah ringkasan atau "cheatsheet" adalah hal yang sangat membantu.
Untuk itu, saya telah merangkum 20 perintah Pandas paling esensial yang wajib Anda ketahui. Simpan halaman ini sebagai referensi cepat Anda!
Pandas Cheatsheet: 20 Perintah Paling Penting
Berikut adalah tabel berisi perintah-perintah Pandas yang paling sering digunakan, beserta deskripsi singkat dalam Bahasa Indonesia.
| Perintah | Deskripsi |
|---|---|
df = pd.read_csv('file.csv') |
Memuat data dari sebuah file CSV ke dalam DataFrame. |
df.head() |
Menampilkan 5 baris pertama dari DataFrame untuk inspeksi cepat. |
df.shape |
Mendapatkan dimensi DataFrame (jumlah baris, jumlah kolom). |
df.info() |
Menampilkan ringkasan informasi DataFrame, termasuk tipe data per kolom. |
df.describe() |
Memberikan statistik deskriptif untuk kolom numerik (rata-rata, min, max, dll). |
df['nama_kolom'] |
Memilih satu kolom berdasarkan namanya. |
df[['kolom1', 'kolom2']] |
Memilih beberapa kolom sekaligus. |
df.loc[label_baris] |
Memilih baris berdasarkan nama label indeksnya. |
df.iloc[posisi_baris] |
Memilih baris berdasarkan posisi indeks numeriknya (contoh: 0, 1, 2). |
df.dropna() |
Menghapus semua baris yang memiliki nilai kosong (NaN). |
df.fillna(nilai) |
Mengisi semua nilai kosong (NaN) dengan nilai yang kita tentukan. |
df.sort_values('nama_kolom') |
Mengurutkan DataFrame berdasarkan nilai pada kolom tertentu. |
df.groupby('nama_kolom').agg() |
Mengelompokkan data berdasarkan kolom dan melakukan agregasi (sum, mean, dll). |
df.merge(df2, on='kunci') |
Menggabungkan dua DataFrame menjadi satu berdasarkan kolom kunci yang sama. |
df['nama_kolom'].value_counts() |
Menghitung frekuensi kemunculan setiap nilai unik dalam sebuah kolom. |
df['nama_kolom'].mean() |
Menghitung nilai rata-rata dari sebuah kolom numerik. |
df.query('kondisi') |
Menyaring (filter) baris DataFrame menggunakan string kondisi (contoh: 'umur > 25'). |
df.rename(columns={'lama':'baru'}) |
Mengganti nama satu atau lebih kolom. |
df.drop('nama_kolom', axis=1) |
Menghapus kolom dari DataFrame. |
df.reset_index() |
Mereset indeks baris DataFrame menjadi urutan numerik standar. |
Penutup
Cheatsheet ini adalah teman terbaik Anda saat sedang mengerjakan proyek analisis data. Dengan menguasai perintah-perintah di atas, alur kerja Anda akan menjadi jauh lebih cepat dan efisien.
Simpan atau bookmark postingan ini agar mudah diakses kembali saat Anda membutuhkannya. Punya perintah favorit lain yang sering Anda gunakan? Bagikan di kolom komentar di bawah!
Selamat menganalisis data!

0 Comments
Terima kasih atas komentarnya
Emoji