Sunday, April 2, 2023

Mendownload Dataset dari Kaggle ke Google Driver

Pada tulisan ini akan diberikan contoh untuk mendownload dataset pada kaggle dan tersimpan langsung pada Google Drive, tanpa terlebih dahulu di download ke storage pada PC/Laptop. Proses download dilakukan melalui Google Colab.

  1. Jalankan perintah berikut :
    • !pip install kaggle
    • !pip install google-auth google-auth-oauthlib google-auth-httplib2
  2. Buat API pada web kaggle, kemudian pada program di bawah isi dengan username dan key yang didapatkan.
  3. Upload file kaggle.jason pada directory google drive

from google.colab import drive
from google.colab import files
from google.colab import auth
import os

# Mount Google Drive
drive.mount('/content/drive')

# Path untuk menyimpan file kaggle.json yang sudah diupload ke Google Drive
kaggle_json_path = '/content/drive/MyDrive/kaggle.json'

# Path untuk dataset pada Kaggle
kaggle_dataset_path = 'tawsifurrahman/tuberculosis-tb-chest-xray-dataset'

# Jalankan autentikasi
auth.authenticate_user()

# Set konfigurasi API Kaggle
os.environ['KAGGLE_USERNAME'] = "xxxxxx"
os.environ['KAGGLE_KEY'] = "xxxxxxx"

# Mengcopy file kaggle.json dari Google Drive ke direktori .kaggle
!mkdir -p ~/.kaggle
!cp "/content/drive/MyDrive/Colab Notebooks/kaggle.json" ~/.kaggle/kaggle.json
!chmod 600 ~/.kaggle/kaggle.json

# Mengunduh dataset dari Kaggle
!kaggle datasets download -d {kaggle_dataset_path} -p "/content/drive/MyDrive/dataset/"

# Menampilkan file yang sudah terunduh
!ls "/content/drive/MyDrive/dataset/"

Ekstrak DataSet pada Google Drive

import zipfile

zip_file = "/content/drive/MyDrive/dataset/tuberculosis-tb-chest-xray-dataset.zip"
destination_folder = "/content/drive/MyDrive/dataset/tuberculosis-tb-chest-xray-dataset"

with zipfile.ZipFile(zip_file, 'r'as zip_ref:
    zip_ref.extractall(destination_folder)






No comments :

Post a Comment