Membaca Dataset Berformat ‘csv’ dengan readr – read_csv()

Apa itu file CSV?

File Comma Separated Values (CSV) adalah file teks yang berisi sebuah data. File ini bisa disebut Character Separated Values atau Comma Delimited files. Pada umumnya file CSV menggunakan karakter koma atau karakter lainnya sesuai yang telah ditetapkan untuk memisahkan atau membatasi antar variabel pada data. Suatu file berformat CSV memiliki struktur yang sederhana dimana tiap daftar variabel dipisahkan dengan koma atau titik koma (secara default, tergantung PC masing-masing).

Berikut contoh dari data dalam format CSV yang memiliki 4 variabel dengan 3 observasi:

NIM,Nama,Usia,Nilai

223134409,Abi Khaidar,19,83

223134410,Budi Prasetya,18,84

223134411,Suci Fadhila,19,91

Penulisan data seperti di atas merupakan contoh dari file yang berformat CSV. Pada praktiknya, terdapat ribuan observasi (baris) dan variabel (kolom) dengan berbagai tipe data sesuai hasil penelitian yang tersedia. Beberapa file CSV ada yang memiliki header atau nama variabel (kolom) dan ada pula yang tidak.


read_csv()

Pada pembahasan kali ini kita akan berfokus untuk mengetahui bagaimana membaca teks atau file berformat CSV di R dengan fungsi read_csv() pada package readr agar dapat dengan mudah terbaca oleh manusia dan dapat dilakukan eksplorasi maupun analisis lebih lanjut.

Fungsi

read_csv(file, col_names = TRUE, col_types = NULL)

Parameter

  • file merupakan argumen untuk memasukkan lokasi file .csv yang ada dalam komputer, bisa juga dengan situs website yang berisi file .csv
  • col_names merupakan argumen yang berisi nilai logical (TRUE atau FALSE), secara default berisi TRUE. Jika TRUE, maka baris pertama pada file .csv akan terbaca sebagai nama variabel, sedangkan jika FALSE, maka baris pertama pada file .csv tidak terbaca sebagai nama variabel tetapi sebagai nilai observasi pertama dan nama variabel secara default akan bernama X1, X2, X3, dan seterusnya
  • col_types merupakan argumen yang digunakan untuk menentukan tipe data pada tiap variabel dimana dalam menentukan tipe datanya dapat menggunakan fungsi cols()

Praktik Penggunaan

Pada praktik kali ini kita akan menggunakan dataset dengan format yang kami sediakan.

readr

Impor readr

library(readr)

Dataset

Masukkan dataset

df <- read_csv("data read_csv.csv")

Menampilkan 6 data teratas

head(df)
read_csv-head-data

Menampilkan struktur dari dataset

str(df)
read_csv-str-data

Contoh penggunaan argumen col_names

df <- read_csv("data read_csv.csv", col_names = F)

Menampilkan 6 data teratas

head(df)
read_csv-head-data-2

Keterangan: Terlihat bahwa pada baris pertama dipandang sebagai nilai dari observasi pertama, bukan sebagai nama variabel.


Contoh penggunaan argumen col_types

df <- read_csv("data read_csv.csv",
                col_names = T,
                col_types = cols(
                  No = col_character(),
                  Nama = col_character(),
                  Kelas = col_factor(),
                  Nilai = col_integer()
               ))

Menampilkan 6 data teratas

head(df)
read_csv-head-data-3

Menampilkan struktur dari dataset

str(df)
read_csv-str-data-3

Keterangan:
Terlihat perbedaan tipe data yang dihasilkan pada data df yang disajikan dengan bantuan argumen col_types dan tanpa col_types. Secara default, variabel yang memiliki nilai-nilai berupa angka akan bertipe numerik sedangkan variabel yang memiliki nilai-nilai berupa huruf akan bertipe character.


Kode Lengkap

Temukan, simpan, dan berikan bintang pada kode lengkapnya di GitHub “belajarstatistik”.


Tonton juga playlist pilihan dari kami berikut ini

Bagikan ke teman-teman Anda

Contact Us

How to whitelist website on AdBlocker?

How to whitelist website on AdBlocker?

  1. 1 Click on the AdBlock Plus icon on the top right corner of your browser
  2. 2 Click on "Enabled on this site" from the AdBlock Plus option
  3. 3 Refresh the page and start browsing the site
error: Content is protected !!
Up