Google Colaboratory için Google Drive üzerinden Dosya Yükleme

Google Colaboratory, makine öğrenimi araştırmalarına ve çalışmalarına yardımcı olmak için oluşturulan bir projedir. Kurulum gerektirmeyen ve tamamen bulutta çalışan bir Jupyter notebook ortamıdır.

Colab, derin öğrenme çalışmalarında yardımcı olacak pek çok seçenek ve alternatif sunmaktadır:

  1. Ücretsiz GPU kullanımı:

Notebook çalışma ortamımızda “Runtime” sekmesinde bulunan “Change runtime type” seçeneği tıklandığında aşağıdaki “Notebook settings” pop-up açılacaktır. “Hardware accelerator” default olarak CPU seçildiği için, GPU seçiminden emin olmamız gerekir. Tüm bu işlemlerden sonra, Google compute engine backend (GPU) bağlanıldığını işaret eden “connected” bağlantısı kontrol edilir.

Bir GPU üzerinde çalışıp çalışmadığımızı kontrol etmek için aşağıdaki kod parçası çalıştırılabilir. Eğer bağlantı varsa çıktı “/device:GPU:0” şeklinde olacaktır.

  1. Google drive hesabımızdaki dosyayı yükleme

Google drive erişimi için PyDrive kütüphanesi yüklenir ve böylece dosyalara erişim için Colab ortamında çalışan notebook yetkilendirilir. Aşağıdaki kod parçası çalıştırıldığında, Google Colab, drive erişimi doğrulamak için linke tıklamanızı isteyecek ve unique bir key üretecektir. Verilen key “verification code” kısmına yapıştırılarak işlem tamamlanır.

!pip install -U -q PyDrive

from pydrive.auth import GoogleAuth

from pydrive.drive import GoogleDrive

from google.colab import auth

from oauth2client.client import GoogleCredentials

auth.authenticate_user()

gauth = GoogleAuth()

gauth.credentials = GoogleCredentials.get_application_default()

drive = GoogleDrive(gauth)

 

Colab notebook ortamında kullanılacak verilere ihtiyacımız var. Şimdi Google drive hesabıımızda “train.csv” isimli haber yorumları ve etiketleri bulunan bir dosyamız olduğunu düşünelim. Local dosyalarımızı notebook ortamına yüklemek için aşağıdaki kodu çalıştırmamız yeterlidir. Tabi drive üzerinde kullanmayı istediğimiz dosyanın paylaşım ayarlarından “file key” alınmalıdır.

from google.colab import files

file_id = '1l54eoDqh4cgPj6EZwxIKY5Ai_zcu2HUq'

downloaded = drive.CreateFile({'id': file_id})

downloaded.GetContentFile('train.csv')

Tüm bu adımlardan sonra pandas kullanarak verimizi projeye import edebiliriz:

import pandas as pd

column_names = ['labels','reviews']

labels=pd.read_csv('b.txt',delimiter='\t',usecols=['labels'], names=column_names)

reviews=pd.read_csv('b.txt', delimiter='\t', usecols=['reviews'], names=column_names)

reviews.head()