๐ Daftar Isi
sample()
Fungsi ini digunakan untuk mengambil sampel sebanyak n baris secara acak dari sebuah tabel. Ada 2 fungsi yang tersedia dalam sample()
yaitu sample_n()
dan sample_frac()
sample_n()
Digunakan untuk mengambil data sebanyak n baris secara acak
Fungsi
sample_n(tbl, size, replace = FALSE)
Parameter
tbl
merupakan argumen untuk memasukkan dataframesize
merupakan argumen untuk memasukkan banyaknya observasi yang ingin diambilreplace
merupakan argumen apakah ingin menggunakan WR atau WOR dalam pengambilan sampelnya. TRUE untuk WR dan FALSE untuk WOR
sample_frac()
Digunakan untuk mengambil data sebanyak i% dari total baris secara acak. sample_frac()
sangat bermanfaat saat ingin memasuki tahapan Machine Learning yang membutuhkan data training dan data testing.
Fungsi
sample_frac(tbl, size = 1, replace = FALSE)
Parameter
tbl
merupakan argumen untuk memasukkan dataframesize
merupakan argumen untuk memasukkan berapa persen data yang akan diambil dari data frame (nilainya dari 0 sampai 1)replace
merupakan argumen apakah ingin menggunakan WR atau WOR dalam pengambilan sampelnya. TRUE untuk WR dan FALSE untuk WOR
Praktik Penggunaan
Pada praktik kali ini kita akan menggunakan dataset air quality yang telah tersedia.
Dataset
Masukkan Dataset
df <- datasets::airquality
Menampilkan 6 Data Teratas
head(df)
dplyr
Impor dplyr
library(dplyr)
Menggunakan sample_n()
Menampilkan 5 Sampel (With Replacement)
sample_n(tbl = df, size = 5, replace = T)
Menampilkan 5 Sampel (Without Replacement)
sample_n(tbl = df, size = 5, replace = F)
Menggunakan sample_frac()
Menampilkan 5% Sampel (With Replacement)
sample_frac(tbl = df, size = 0.05, replace = T)
Menampilkan 5% Sampel (Without Replacement)
sample_frac(tbl = df, size = 0.05, replace = F)
Kode Lengkap
Temukan, simpan, dan berikan bintang pada kode lengkapnya di GitHub “belajarstatistik”.