๐ Daftar Isi
group_by()
Terkadang saat dihadapkan pada data, adakalanya memerlukan suatu teknik untuk mengelompokkan data berdasarkan satu maupun beberapa variabel. Dengan fungsiย group_by()
ย pada dplyr, hal tersebut dapat teratasi. Fungsi ini mengonversi data frame yang sudah ada ke dalam kelompok operasi sesuai dengan kelompok atau variabel yang diinginkan. Selain itu dapat pula digunakan fungsiย ungroup()
ย untuk menghilangkan pengaruh pengelompokkan setelah di โgroup byโ. Fungsi ini tidak dapat berdiri sendiri akan tetapi memerlukan bantuan fungsi lain agar lebih powerfull. Fungsi tersebut biasanya adalah summarise()
group_by()
Digunakan untuk mengelompokkan variabel tertentu, baik satu maupun beberapa variabel. Biasanya dikombinasikan dengan fungsi summarise()
. Sehingga untuk memahami lebih lanjut keterkaitan dalam dua fungsi ini, maka baca juga penjelasan fungsi summarise()
(link fungsi summarise)
Fungsi
group_by(.data, ...)
Parameter
.data
merupakan argumen untuk memasukkan data frame- … sisanya adalah variabel yang diinginkan untuk dilakukan pengelompokkan
Praktik Penggunaan
Pada praktik kali ini kita akan menggunakan datasetย Sleepย padaย base Rย yang telah tersedia.
Dataset
Masukkan Dataset
data("sleep")
df <- data.frame(sleep)
Menampilkan 6 Data Teratas
head(df)
dplyr
Impor dplyr
library(dplyr)
Menggunakan group_by()
Mencari rata-rata dari variabel “extra” dengan melakukan pengelompokkan berdasarkan variabel “group”
summarise(.data = group_by(.data = df, group), rataan = mean(extra))
Kode Lengkap
Temukan, simpan, dan berikan bintang pada kode lengkapnya di GitHub “belajarstatistik”.