dplyr – join()

join()

Data merging atau penggabungan data adalah suatu teknik untuk menggabungkan 2 atau lebih dataset menjadi 1 dataset. Hal ini sangat berguna ketika memiliki raw data yang ada dalam beberapa file/worksheets dan ingin menganalisisnya secara bersamaan. Dengan fungsi join() pada dplyr, hal tersebut dapat teratasi. Secara garis besar fungsi join() dikelompokkan menjadi 2 bagian yaitu mutating join dan filtering join.

Fungsi

*_join(x, y, by, ...)

Parameter

  • x dan y  merupakan argumen untuk memasukkan data frame yang ingin dipasangkan untuk digabung
  • by merupakan argumen yang berisi nama vektor variabel yang sama yang sebagai key variable

Mutating join()

Melakukan kombinasi dari 2 data frame secara bersama-sama.

inner_join()

Mengombinasikan 2 data frame dengan menampilkan identitas pada nilai variabel yang sama (key variable) serta variabel lainnya yang sesuai dari masing-masing data frame.

full_join()

Mengombinasikan 2 data frame dengan menampilkan semua identitas pada nilai variabel (key variable) serta variabel lainnya yang sesuai dari masing-masing data frame.

left_join()

Mengombinasikan 2 data frame dengan menampilkan seluruh variabel pada data frame bagian kiri, dan hanya variabel (key variable) yang sama pada data frame bagian kanan.

right_join()

Mengombinasikan 2 data frame dengan menampilkan seluruh variabel pada data frame bagian kanan, dan hanya variabel (key variable) yang sama pada data frame bagian kiri.


Filtering Join

Menampilkan semua cases yang sesuai hanya pada bagian data frame yang didefinisikan paling awal atau posisi sebelah kiri.

semi_join()

Mengombinasikan 2 data frame dengan semua baris (cases) pada variabel bagian kiri yang cocok dengan variabel bagian kanan.

anti_join()

Mengombinasikan 2 data frame dengan semua baris (cases) pada variabel bagian kiri yang tidak cocok dengan variabel bagian kanan.


Praktik Penggunaan

Pada praktik kali ini kita akan membuat dataset sendiri lalu mencoba mempraktekannya.

Dataset

Membuat 2 data frame

df1 <- data.frame(
  NIM = 10:12,
  Nama = c("Ani","Budi","Cici")
)

df2 <- data.frame(
  NIM = c(10,11,13),
  Nilai = c(89,94,78)
)

Menampilkan 2 data frame

df1
join head df1
df2
join head df2

dplyr

Impor dplyr

library(dplyr)

Menggunakan inner_join()

inner_join(df1, df2, by="NIM")
join inner_join

Menggunakan full_join()

full_join(df1, df2, by="NIM")
join full_join

Menggunakan left_join()

left_join(df1, df2, by="NIM")
join left_join

Menggunakan right_join()

right_join(df1, df2, by="NIM")
join right_join

Menggunakan semi_join()

semi_join(df1, df2, by="NIM")
join semi_join

Menggunakan anti_join()

anti_join(df1, df2, by="NIM")
join anti_join

Kode Lengkap

Temukan, simpan, dan berikan bintang pada kode lengkapnya di GitHub “belajarstatistik”.


Tonton juga playlist pilihan dari kami berikut ini

Bagikan ke teman-teman Anda

Contact Us

How to whitelist website on AdBlocker?

How to whitelist website on AdBlocker?

  1. 1 Click on the AdBlock Plus icon on the top right corner of your browser
  2. 2 Click on "Enabled on this site" from the AdBlock Plus option
  3. 3 Refresh the page and start browsing the site
error: Content is protected !!
Up