RESUME PERTEMUAN 3 - MANAJEMEN DATA
Teknologi Manajemen Data
DMT
Database (DBMS)
Kumpulan kumpulan data atau catatan yang disimpan dengan cara yang sistematis
Data Warehouse
Gudang data mengintegrasikan data dari beberapa database dan file data, dan mengaturnya untuk analisis kompleks, penemuan pengetahuan, dan untuk mendukung pengambilan keputusan.
Data Marts
Data warehouse skala kecil yang mendukung satu fungsi atau satu departemen. Perusahaan yang tidak mampu berinvestasi dalam pergudangan data dapat memulai dengan satu atau lebih data mart.
Business Intelligence
Alat dan teknik memproses data dan melakukan analisis statistik untuk wawasan dan penemuan—yaitu, untuk menemukan hubungan yang bermakna dalam data, tetap mendapat informasi secara real time, mendeteksi tren, dan mengidentifikasi peluang dan risiko
Selama 25 tahun terakhir, database relasional telah menjadi model database standar yang diadopsi oleh sebagian besar perusahaan.
Database relasional menyimpan data dalam tabel yang terdiri dari kolom dan baris, mirip dengan format spreadsheet.
Sistem Manajemen Basis Data
DBMS
Centralized
Dalam database terpusat, semua data organisasi disimpan di satu tempat seperti komputer mainframe atau server. Pengguna di lokasi terpencil mengakses data melalui Wide Area Network (WAN) menggunakan program aplikasi yang disediakan untuk mengakses data. Database terpusat (mainframe atau server) harus dapat memenuhi semua permintaan yang masuk ke sistem, oleh karena itu dapat dengan mudah menjadi penghambat. Tetapi karena semua data berada di satu tempat, lebih mudah untuk memelihara dan mencadangkan data. Lebih lanjut, lebih mudah untuk menjaga integritas data, karena setelah data disimpan dalam database terpusat, data yang sudah usang tidak lagi tersedia di tempat lain.
Kelebihan : Kontrol kualitas data yang lebih baik dan Keamanan TI yang lebih baik.
Kekurangan : Penundaan transmisi saat pengguna tersebar secara geografis dan Diperlukan perangkat keras dan jaringan yang lebih kuat
Distributed
Dalam database terdistribusi, data disimpan di perangkat penyimpanan yang terletak di lokasi fisik yang berbeda. Mereka tidak terpasang ke CPU umum tetapi database dikendalikan oleh DBMS pusat. Pengguna mengakses data dalam database terdistribusi dengan mengakses WAN. Untuk menjaga database terdistribusi tetap mutakhir, ia menggunakan proses replikasi dan duplikasi. Proses replikasi mengidentifikasi perubahan dalam database terdistribusi dan menerapkan perubahan tersebut untuk memastikan bahwa semua database terdistribusi terlihat sama. Bergantung pada jumlah database terdistribusi, proses ini bisa menjadi sangat kompleks dan memakan waktu. Proses duplikasi mengidentifikasi satu database sebagai database master dan menduplikasi database tersebut. Proses ini tidak serumit proses replikasi tetapi memastikan bahwa semua database terdistribusi memiliki data yang sama.
Data Warehouse
Gudang data mengintegrasikan data dari beberapa database dan file data, dan mengaturnya untuk analisis kompleks, penemuan pengetahuan, dan untuk mendukung pengambilan keputusan.
Teknologi Big Data
Data Mining
Menggunakan Data Mining pada tumpukan data dapat IBARAT kita menggunakan sensor logam saat mencari jarum di dalam tumpukan jerami. Mempercepat waktu pencarian dan proses yang OTOMATIS!
Dengan Data Mining, kita dapat fokus pada detail pepohonan SEKALIGUS mengidentifikasi hutannya.
1st Root of DM
Ilmu tua yang tanpanya, DM tidak akan pernah ada.
2nd Root of DM
- Artificial Intelligence berkontribusi dalam teknis pemrosesan informasi berdasarkan human reasoning model.
- Machine Learning memungkinkan komputer belajar melalui ‘training’.
- Natural Computing sebagai pelengkap penting dalam data mining.
3rd Root of DM
Menyediakan informasi yang akan ditambang menggunakan metode2 di atas.
Contoh :
- Sistem yang mampu digunakan untuk mencari informasi khusus (misal: masak) di google. (salah)
- Sistem yang mampu mengelompokkan informasi yang mirip-mirip sesuai berdasarkan konteksnya (misal: masakan prancis, itali, jawa, padang, dll). (benar)
- Dokter mencari data medis untuk menganalisa riwayat penyakit seorang pasien. (Salah)
- Peneliti di dunia kesehatan menemukan cara untuk mengelompokkan pasien dengan penyakit yang sama, berdasarkan beberapa tanda tertentu. (benar)
Data mining
Klasifikasi
- Data diskrit.
- Data training dengan label.
Klasterisasi
- Data training tanpa label
Regresi/Estimasi
Asosiasi
- Data kontinyu
- Istilah lain : Market based Analysis
KDD (Knowledge Discovery in Database) merupakan analisa dan pemodelan data secara otomatis pada suatu database.
KDD merupakan rangkaian proses identifikasi POLA-POLA yang valid, baru (novel), berguna (useful) dan dapat dipahami (understandable) dari dataset yang besar dan kompleks.
DATA MINING merupakan CORE-nya KDD.
Data Mining berperan dalam pemanfaatan algoritmanya untuk mengeksplorasi data, memodelkannya, dan mengungkap pola-pola yang sebelumnya tidak diketahui/terlihat.
Business Intelligence
Business intelligence
- Akses & Bagikan Informasi dengan Mudah
- Mengaktifkan Analisis Waktu Nyata
- Kurangi Risiko Kemacetan
- Membantu Anda Memahami Bisnis Anda
- Meningkatkan Proses Pengambilan Keputusan
Flow of Data #1
Flow of Data #2
Flow of Data #3
Business Intellingence Management
Posted by 






