Normalisasi Data

Setelah kita berhasil memetakan "arsitektur" data melalui ERD dan menentukan "kunci-kunci" pengaman pada bab sebelumnya, sekarang kita akan masuk ke tahap penyempurnaan yang disebut Normalisasi.

Normalisasi adalah teknik pengorganisasian data ke dalam tabel-tabel untuk meminimalkan redundansi (pengulangan data yang tidak perlu). Tujuan utamanya adalah memastikan bahwa setiap keping informasi hanya disimpan di satu tempat yang tepat. Data yang terpecah-pecah atau tidak sinkron dapat menyebabkan kesalahan diagnosis hingga kesalahan pemberian terapi kepada pasien.

3.1. Anomali Data

Sebuah desain basis data yang buruk biasanya ditandai dengan tabel yang "terlalu gemuk", di mana terlalu banyak informasi dipaksakan masuk ke dalam satu tabel besar. Desain seperti ini akan memicu munculnya Anomali Data, yaitu keanehan atau kesalahan yang terjadi saat kita melakukan manipulasi data. Mari kita ambil contoh jika data mahasiswa, data mata kuliah, dan nilai digabungkan dalam satu tabel raksasa tanpa aturan:

3.1.1. Insert Anomaly

Anomali ini terjadi ketika kita tidak bisa memasukkan sebuah data karena ada data lain yang belum tersedia.

Contoh: Anda ingin mendaftarkan mata kuliah baru berjudul "Etika Medis", tetapi sistem menolak karena belum ada mahasiswa yang mengambilnya. Secara teknis, sistem memaksa harus ada nim agar data mata kuliah bisa disimpan.

3.1.2. Delete Anomaly

Kondisi ini terjadi ketika kita menghapus sebuah baris data, namun secara tidak sengaja kita juga kehilangan informasi penting lainnya yang seharusnya tetap ada.

Contoh: Perhatikan gambar relasi yang Anda miliki sebelumnya. Jika mahasiswa bernama "Indah Susanti" mengundurkan diri dan datanya dihapus, maka informasi mengenai mata kuliah "Bahasa Indonesia" mungkin akan ikut hilang dari sistem jika ia adalah satu-satunya peserta.

3.1.3. Update Anomaly

Anomali ini muncul saat kita ingin mengubah (update) suatu data, namun data tersebut tersimpan di banyak tempat (duplikasi).

Contoh: Jika mahasiswa "Ali Akbar" pindah alamat, dan namanya tercatat di 10 baris mata kuliah yang berbeda, maka petugas harus mengubah alamat tersebut 10 kali secara manual. Jika ada satu baris yang terlewat, maka terjadi ketidakkonsistenan data (alamat Ali Akbar berbeda-beda di sistem).

3.2. Functional Dependency

Secara sederhana, Ketergantungan Fungsional (FD) adalah kondisi di mana nilai suatu atribut ditentukan secara penuh oleh atribut lainnya. Kita menggunakan notasi panah (A → B) yang dibaca sebagai "A secara fungsional menentukan B", atau "B bergantung secara fungsional kepada A".

Bayangkan atribut NIM (Nomor Induk Mahasiswa). Jika saya menyebutkan NIM 100001, maka sistem secara otomatis akan menunjuk pada satu nama saja, yaitu Ali Akbar. Tidak mungkin NIM yang sama merujuk pada dua orang berbeda.

Di sini, NIM adalah Determinant (Penentu).
Nama Mahasiswa dikatakan memiliki ketergantungan fungsional terhadap NIM.