Home > Data Warehouse > Arsitektur Data Warehouse dan Proses ETL

Arsitektur Data Warehouse dan Proses ETL

Sebelum menuju pembahasan arsitektur data warehouse, mari kita perdalam lagi mengenai definisi data warehouse.

Menurut Inmon (2002), yang dikenal sebagai “Bapak Data Warehouse”, mendefinisikan data warehouse sebagai berikut : “A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions”.

Ada beberapa kata kunci yang dapat dijelaskan dari definisi di atas yaitu :

  • Subject-oriented

Data warehouse diogranisir berdasarkan subyek yang akan dicapai dengan menggali informasi yang terdapat pada database suatu perusahaan. Contohnya adalah pembuatan data warehouse untuk analisis keuntungan transaksi penjualan pada tahun 2012.

  • Integrated

Data warehouse terintegrasi dari berbagai data operasional yang berbeda dalam suatu sumber database.

  • Nonvolatile

Data dalam data warehouse tidak dapat berubah secara real-time tetapi dapat diperbaharui secara periodik.

  • Time-variant

Data dalam data warehouse sangat bergantung pada keputusan waktu pengambilan. Contohnya adalah data warehouse yang bersifat bulanan atau tahunan.

Berikut adalah gambar arsitektur data warehouse :

Dari gambar di atas terlihat bahwa data warehouse merupakan kumpulan dari sebuah data operasional atau sumber data lain yang terseleksi dengan proses ETL (Extraction Transformation Loading) untuk kemudian dilanjutkan pada 3 tahap pemanfaatan data warehouse (Olap Analysis, Reporting, dan Data Mining).

Salah satu proses yang paling penting dalam pembuatan data warehouse adalah proses ETL. Oleh karena berikut akan dijelaskan mengenai rangkaian proses ETL :

  • Extraction

Proses ektraksi merupakan proses pengambilan data dari satu database atau beberapa database yang berbeda, text files, dan sumber data yang lainnya. Proses ektraksi mencakup tugas memvalidasi data dan membuang data yang tidak cocok dengan pola yang diharapkan. Sehingga tidak seluruh data yang ada dalam data operasonal dimasukkan, tetapi hanya bagian-bagian yang dibutuhkan saja.

  • Transformation

Proses transformasi data merupakan proses mengubah data dari format operasional menjadi format data warehouse. Proses transformasi berupa tugas-tugas seperti mengkonversi tipe data, melakukan beberapa perhitungan, penyaringan data yang tidak relevan, dan meringkasnya. Proses transformasi dibutuhkan untuk memenuhi kebutuhan bisnis suatu perusahaan.

  • Loading

Proses loading merupakan tahap akhir dalam pengisian data warehouse. Tujuan dari proses ini adalah untuk memuat data yang sudah terseleksi dari proses transformasi ke dalam data warehouse.

Untuk memperjelas pembahasan mengenai proses ETL, berikut adalah gambar proses ETL sederhana pada Pentaho Data Integration :

Proses ETL

Ikuti terus pembahasan mengenai data warehouse di L Blog ini. Semoga bermanfaat. :)

Pustaka :

_______, 2008. Data Warehouse. http://datawarehouse4u.info/.

Roldan, M.C., 2010. Pentaho 3.2 Data Integration Beginner’s Guide. Packt Publishing.

Ramadhan, T.I., 2013. Perancangan dan Pembuatan Data Warehouse (Studi Kasus Database Swalayan Kopma UGM). Universitas Gadjah Mada, Yogyakarta.

About these ads
  1. December 23, 2014 at 9:22 am

    Terimakasih

  1. No trackbacks yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Follow

Get every new post delivered to your Inbox.

%d bloggers like this: