veri <- read.table(file = "data/iris.txt", header = T, sep = "\t")
13 Dosya okuma
Şu ana kadar kendi verimizi R üzerinde oluşturduk. Ancak genel bir veri analizi sürecinde, hazır bir veriyi R içerisine aktarıyoruz.
Bir dosyayı okumak için o dosyanın ya bilgisayarımızda olması gerekir ya da internet üzerinde erişilebilir bir adreste olması gerekir.
Şimdi aşağıda belirtilen dosyaya sağ tıklayıp “Farklı Kaydet” tuşuna basalım ve bilgisyarımıza kaydedelim:
Bu dosyayı incelerseniz farklı sütunlardan oluştuğunu göreceksiniz. Genelde veri dosyaları sütunlar tarafından ayrılmaktadır. Farklı ayraçlar kullanılabilir:
- Tab işareti
\t
- Noktalı virgül
;
- Virgül
,
Ayrıca ilk satır ise başlıkları göstermekte. Bunlar bizim için önemli bilgiler.
13.1 Bilgisayarımızdaki dosyayı okuma
Bilgisayarımızdaki dosyayı okumak için read.table
fonksiyonunu kullanıyoruz.
Burada dikkat ederseniz bazı opsiyonlar var. Gelin onlara bakalım:
-
file
opsiyonu bize o dosyayı okuyacağımız yolu gösterir. -
header
opsiyonu ise ilk satırın başlık satırı olduğunu gösterir -
sep
ise dosyada kullanılan ayraç karakterini belirtir. Bizim dosyamızda\t
karakteri (tab)
Bu derste en çok zorlandığımız konu dosya okumak. Bir dosyayı okumak istiyorsanız, o dosyanın yolunu belirtmeniz gerek. Bunu iki farklı şekilde yapabilirsiniz:
-
Tam yol: O dosyanın tam okuma yolunu gösterirsiniz,
C:/Users/User/Documents/Veri-Analizi/veri.txt
gibi. Burada dosya yolunu kendi dosyanıza göre değiştiriniz. - Göreceli yol: Bir R projesi kullandığınızda, dosyalarınız o proje içerisine yüklerseniz, tam yolu göstermeden kullanabilirsiniz.
Bunun dışında farklı opsiyonlar da bulunmakta. Bütun opsiyonlara erişmek için konsola read.table()
yazınız.
13.2 İnternet üzerinden okuma
Eğer dosyanın tam internet adresine biliyorsak onu da doğrudan okuyabiliriz. Aynı komutu yazacağız ancak bu sefer file
opsiyonuna o dosyanın internet adresini girmeliyiz:
veri <- read.table(file = "https://raw.githubusercontent.com/emrahkirdok/ybva/main/02-veri-analizi/data/iris.txt", header = T, sep = "\t")
Bu iki yöntemi de kullanabilirsiniz.
## Dosyayı inceleyelim
Elimizdeki dosya aslında normal bir veri çerçevesi. Bütün veri çerçevesi işlemlerini yapabiliriz artık.
Veri çerçevesindeki sütun isimleri:
colnames(veri)
[1] "Sepal_Uzunlugu" "Sepal_Genisligi" "Petal_Uzunlugu" "Petal_Genisligi"
[5] "Tur"
Veri çerçevesindeki satır ve sütun sayısı:
dim(veri)
[1] 50 5
## Farklı dosyalara bakalım
Şimdi gelin farklı verilerin biçimlerini inceleyelim: