join() Data merging atau penggabungan data adalah suatu teknik untuk menggabungkan 2 atau lebih dataset menjadi 1 dataset. Hal ini sangat berguna ketika memiliki raw data yang ada dalam beberapa file/worksheets dan ingin menganalisisnya secara bersamaan. Dengan fungsi join() pada dplyr, hal tersebut dapat teratasi. Secara garis besar fungsi join() dikelompokkan menjadi 2 bagian yaitu mutating join …
dplyr
dplyr – summarise()
summarise() Fungsi ini sangat powerfull jika dikombinasikan dengan fungsi group_by(). Saat berhadapan pada data terkadang kita memerlukan suatu ringkasan dari suatu variabel yang telah dikelompokkan agar kita bisa mendapatkan suatu pola atau keterangan tertentu yang nantinya bisa membuat keputusan yang tepat terhadap suatu permasalahan yang dihadapi. Dengan fungsi summarise() pada dplyr, hal tersebut dapat teratasi. summarise() Fungsi …
dplyr – group_by()
group_by() Terkadang saat dihadapkan pada data, adakalanya memerlukan suatu teknik untuk mengelompokkan data berdasarkan satu maupun beberapa variabel. Dengan fungsiย group_by()ย pada dplyr, hal tersebut dapat teratasi. Fungsi ini mengonversi data frame yang sudah ada ke dalam kelompok operasi sesuai dengan kelompok atau variabel yang diinginkan. Selain itu dapat pula digunakan fungsiย ungroup()ย untuk menghilangkan pengaruh pengelompokkan setelah di …
dplyr – filter()
filter() Saat menganalisis data, adakalanya kita ingin memilah-milah kondisi mana yang cocok digunakan untuk dianalisis agar hasil yang didapatkan sesuai sasaran dan tujuan baik itu dari 1 kondisi tertentu maupun dari banyak kondisi yang ada. Dengan fungsi filter() pada dplyr, hal tersebut dapat teratasi. filter() Digunakan untuk menyeleksi dengan memilih baris atau observasi pada suatu tabel atau …
dplyr – arrange()
arrange() Saat menganalisis data, adakalanya ingin menampilkannya secara terurut baik itu alfabetik maupun numerik berdasarkan variabel tertentu baik itu 1 variabel maupun banyak variabel. Dengan fungsi arrange() pada dplyr, hal tersebut dapat teratasi. arrange() Digunakan untuk mengurutkan berdasarkan variabel tertentu Fungsi Parameter .data merupakan argumen untuk memasukkan data frame … sisanya adalah variabel baru yang ingin ditampilkan secara terurut Operator …