๐ Daftar Isi
Manipulasi Data
Apa itu Manipulasi Data?
Manipulasi data pada bahasan kali ini memiliki arti yang positif, bukan sebagai arti yang negatif dengan membuat data bercerita kebohongan dengan memanipulasinya. Manipulasi data merupakan sebuah proses untuk mengatur atau mengorganisir data agar menjadi lebih mudah untuk dibaca.
Manipulasi data merupakan proses penting untuk mengoptimalkan analisis bisnis. Untuk menggunakan data dengan benar dan mengubahnya menjadi sebuah insight yang berguna seperti menganalisis data keuangan, perilaku pelanggan, dan melakukan analisis tren maka harus dapat bekerja dengan data sesuai kebutuhan yang ada.
Manfaat Manipulasi Data
Dengan demikian manipulasi data memberikan banyak manfaat, antara lain:
Data yang Lebih Konsisten
Memiliki data dalam format yang konsisten memungkinkannya untuk mudah diatur, dibaca, dan dipahami dengan lebih baik. Saat mengambil data dari sumber yang berbeda, mungkin saja tidak memiliki format yang baku dan susah terbaca, tetapi dengan manipulasi data maka dapat memastikan bahwa data secara konsisten diatur dan disimpan.
Menghapus atau Mengabaikan Data yang Tidak Diperlukan
Sering kali ada data yang tidak dapat digunakan dan dapat mengganggu hal yang penting. Data yang tidak perlu atau tidak akurat harus dibersihkan dan dihapus. Dengan manipulasi data, dapat dengan cepat membersihkan catatan sehingga dapat bekerja dengan informasi yang penting.
Data Proyek
Mampu menggunakan data historis untuk memproyeksikan masa depan dan memberikan analisis yang lebih mendalam.
Menciptakan Nilai Lebih dari Sebuah Data
Secara keseluruhan, dengan kemampuan untuk mengubah, mengedit, menghapus, dan memasukkan data ke dalam database berarti dapat melakukan lebih banyak hal dengan data. Karena dengan memiliki informasi yang tetap statis, itu menjadi tidak berguna. Namun, saat mengetahui cara menggunakan data untuk misalkan untuk keuntungan bisnis perusahaan, maka dapat memiliki insight yang jelas untuk membuat keputusan bisnis yang lebih baik.
dplyr
Apa itu dplyr?
dplyr
adalah package di R yang cukup powerful yang dapat digunakan untuk mentransformasi, meringkas, dan memanipulasi data. Package ini dibuat oleh Handley Wickham dan Roman Francois yang berisi sekumpulan fungsi yang biasa disebut dengan โverbsโ yang dapat bekerja mulai dengan mem-filter baris, memilih kolom yang spesifik, membuat variabel baru, meringkas data, serta manfaat lainnya yang dapat digunakan dengan package ini. Package ini merupakan package dasar yang dimiliki oleh seorang ahli yang bekerja dengan R karena sangat memudahkan.
dplyr
adalah paket yang menyediakan cara untuk memanipulasi dataset secara efisien di R. dplyr
adalah iterasi berikutnya dari
, dengan fokus hanya pada bingkai data. dplyr
dplyr
lebih cepat, memiliki API yang lebih konsisten dan seharusnya lebih mudah digunakan.
Gagasan Utama
Ada tiga gagasan utama yang mendasari dplyr
, yaitu:
- Meminimalisir waktu.
- Data tersusun dalam tabel atau daftar.
- Hambatan dalam kebanyakan analisis data adalah waktu yang dibutuhkan untuk mencari tahu apa yang harus dilakukan dengan data.
Instalasi
Pertama, Anda harus memasang package-nya di komputer Anda dengan kode berikut. Instalasi package dplyr
dan mengaktifkannya.
install.packages("dplyr")
library(dplyr)
Fungsi dalam dplyr
Silakan pilih beberapa fungsi di bawah ini untuk melihat penjelasan yang lebih detail.
Jika Anda ingin Cheatsheet dari dplyr
yang disediakan oleh Rstudio, kunjungi tautan berikut ini.