๐ Daftar Isi
join()
Data merging atau penggabungan data adalah suatu teknik untuk menggabungkan 2 atau lebih dataset menjadi 1 dataset. Hal ini sangat berguna ketika memiliki raw data yang ada dalam beberapa file/worksheets dan ingin menganalisisnya secara bersamaan. Dengan fungsi join()
pada dplyr, hal tersebut dapat teratasi. Secara garis besar fungsi join()
dikelompokkan menjadi 2 bagian yaitu mutating join dan filtering join.
Fungsi
*_join(x, y, by, ...)
Parameter
x
dany
merupakan argumen untuk memasukkan data frame yang ingin dipasangkan untuk digabungby
merupakan argumen yang berisi nama vektor variabel yang sama yang sebagai key variable
Mutating join()
Melakukan kombinasi dari 2 data frame secara bersama-sama.
inner_join()
Mengombinasikan 2 data frame dengan menampilkan identitas pada nilai variabel yang sama (key variable) serta variabel lainnya yang sesuai dari masing-masing data frame.
full_join()
Mengombinasikan 2 data frame dengan menampilkan semua identitas pada nilai variabel (key variable) serta variabel lainnya yang sesuai dari masing-masing data frame.
left_join()
Mengombinasikan 2 data frame dengan menampilkan seluruh variabel pada data frame bagian kiri, dan hanya variabel (key variable) yang sama pada data frame bagian kanan.
right_join()
Mengombinasikan 2 data frame dengan menampilkan seluruh variabel pada data frame bagian kanan, dan hanya variabel (key variable) yang sama pada data frame bagian kiri.
Filtering Join
Menampilkan semua cases yang sesuai hanya pada bagian data frame yang didefinisikan paling awal atau posisi sebelah kiri.
semi_join()
Mengombinasikan 2 data frame dengan semua baris (cases) pada variabel bagian kiri yang cocok dengan variabel bagian kanan.
anti_join()
Mengombinasikan 2 data frame dengan semua baris (cases) pada variabel bagian kiri yang tidak cocok dengan variabel bagian kanan.
Praktik Penggunaan
Pada praktik kali ini kita akan membuat dataset sendiri lalu mencoba mempraktekannya.
Dataset
Membuat 2 data frame
df1 <- data.frame(
NIM = 10:12,
Nama = c("Ani","Budi","Cici")
)
df2 <- data.frame(
NIM = c(10,11,13),
Nilai = c(89,94,78)
)
Menampilkan 2 data frame
df1
df2
dplyr
Impor dplyr
library(dplyr)
Menggunakan inner_join()
inner_join(df1, df2, by="NIM")
Menggunakan full_join()
full_join(df1, df2, by="NIM")
Menggunakan left_join()
left_join(df1, df2, by="NIM")
Menggunakan right_join()
right_join(df1, df2, by="NIM")
Menggunakan semi_join()
semi_join(df1, df2, by="NIM")
Menggunakan anti_join()
anti_join(df1, df2, by="NIM")
Kode Lengkap
Temukan, simpan, dan berikan bintang pada kode lengkapnya di GitHub “belajarstatistik”.