Validasi data

|| || || Leave a komentar

Dalam komputasi, validasi data atau validasi input adalah proses memastikan data telah melalui pembersihan data untuk memastikan kualitas data, yaitu, bahwa data tersebut benar dan berguna. Ini menggunakan rutinitas, sering disebut "aturan validasi", "batasan validasi", atau "rutinitas pemeriksaan", yang memeriksa kebenaran, makna, dan keamanan data yang dimasukkan ke dalam sistem. Aturan tersebut dapat diimplementasikan melalui fasilitas otomatis dari kamus data, atau dengan inklusi logika validasi program aplikasi eksplisit dari komputer dan aplikasinya.

Ini berbeda dari verifikasi formal, yang berusaha membuktikan atau membantah kebenaran algoritma untuk mengimplementasikan spesifikasi atau properti.

Validasi data adalah proses penting yang memastikan bahwa informasi yang dimasukkan atau disimpan dalam suatu sistem adalah akurat, lengkap, dan valid. Validasi data memastikan bahwa data yang digunakan dalam pengambilan keputusan adalah dapat dipercaya dan relevan.

Ikhtisar
Validasi data dimaksudkan untuk memberikan jaminan yang terdefinisi dengan baik untuk kecocokan dan konsistensi data dalam sebuah aplikasi atau sistem otomatis. Aturan validasi data dapat didefinisikan dan dirancang menggunakan berbagai metodologi, dan dapat diterapkan dalam berbagai konteks. Implementasi mereka dapat menggunakan aturan integritas data deklaratif, atau aturan bisnis berbasis prosedur.

Jaminan validasi data tidak selalu termasuk keakuratan, dan mungkin terjadi kesalahan entri data seperti kesalahan pengejaan diterima sebagai valid. Kontrol lainnya baik itu clerical dan/atau komputer dapat diterapkan untuk mengurangi ketidakakuratan dalam sebuah sistem.

Berbagai Jenis

Dalam mengevaluasi dasar-dasar validasi data, generalisasi dapat dibuat mengenai berbagai jenis validasi sesuai dengan cakupan, kompleksitas, dan tujuannya.
Misalnya:

  • Validasi jenis data;
  • Validasi rentang dan batasan;
  • Validasi kode dan cross-reference;
  • Validasi terstruktur; dan
  • Validasi konsistensi


Pengecekan Jenis Data
Validasi jenis data biasanya dilakukan pada satu atau lebih bidang data sederhana.
Jenis validasi data yang paling sederhana memverifikasi bahwa karakter-karakter individu yang disediakan melalui input pengguna konsisten dengan karakter-karakter yang diharapkan dari satu atau lebih tipe data primitif yang dikenal seperti yang didefinisikan dalam bahasa pemrograman atau mekanisme penyimpanan dan pengambilan data.

Misalnya, sebuah bidang bilangan bulat mungkin memerlukan input untuk menggunakan hanya karakter 0 hingga 9.

Pengecekan rentang dan constraint sederhana dapat memeriksa input untuk konsistensi dengan rentang minimum/maksimum, atau konsistensi dengan tes untuk mengevaluasi urutan karakter, seperti satu atau lebih tes terhadap ekspresi reguler. Sebagai contoh, nilai penghitung mungkin harus berupa bilangan bulat non-negatif, dan kata sandi mungkin harus memenuhi panjang minimum dan mengandung karakter dari beberapa kategori.

Pengecekan kode dan referensi silang meliputi operasi untuk memverifikasi bahwa data konsisten dengan satu atau lebih aturan, persyaratan, atau koleksi yang mungkin-eksternal yang relevan untuk suatu organisasi, konteks, atau rangkaian asumsi yang khusus. Kendala validitas tambahan ini dapat melibatkan pengecekan silang data yang disediakan dengan tabel pencarian yang diketahui atau layanan informasi direktori seperti LDAP. Sebagai contoh, kode negara yang diberikan pengguna mungkin diperlukan untuk mengidentifikasi wilayah geopolitik saat ini.

Pengecekan terstruktur memungkinkan untuk mengombinasikan jenis validasi lain, bersama dengan pemrosesan yang lebih kompleks. Pemrosesan kompleks tersebut dapat mencakup pengujian kendala kondisional untuk seluruh objek data kompleks atau rangkaian operasi proses dalam suatu sistem.

Pengecekan konsistensi memastikan bahwa data adalah logis. Sebagai contoh, tanggal pengiriman pesanan dapat dilarang mendahului tanggal pengiriman.

Contoh

Beberapa jenis validasi data relevan untuk ISBN 10 digit sebelum tahun 2007 (edisi 2005 dari ISO 2108 memerlukan ISBN harus memiliki 13 digit mulai tahun 2007).

Ukuran. Sebuah ISBN sebelum tahun 2007 harus terdiri dari 10 digit, dengan tanda hubung atau spasi opsional yang memisahkan empat bagian.

Pengecekan format. Setiap dari 9 digit pertama harus berupa 0 hingga 9, dan digit ke-10 harus berupa 0 hingga 9 atau X.

Digit cek. Untuk mendeteksi kesalahan transkripsi di mana digit telah diubah atau ditransposisi, digit terakhir dari ISBN sebelum tahun 2007 harus sesuai dengan hasil dari formula matematika yang memasukkan 9 digit lainnya (digit cek ISBN-10).

Jenis Validasi
Pengecekan Karakter yang Diperbolehkan
Pengecekan untuk memastikan bahwa hanya karakter yang diharapkan yang ada dalam suatu field. Sebagai contoh, sebuah field numerik mungkin hanya mengizinkan digit 0-9, titik desimal, dan mungkin tanda minus atau koma. Sebuah field teks seperti nama pribadi mungkin tidak mengizinkan karakter yang digunakan untuk markup. Sebuah alamat email mungkin memerlukan setidaknya satu tanda @ dan berbagai detail struktural lainnya. Ekspresi reguler bisa menjadi cara efektif untuk menerapkan pengecekan tersebut.

Total Batch
Pengecekan untuk rekaman yang hilang. Field numerik dapat ditambahkan bersama untuk semua rekaman dalam sebuah batch. Total batch dimasukkan dan komputer memeriksa bahwa total tersebut benar, misalnya, menambahkan field 'Total Biaya' dari sejumlah transaksi.

Pemeriksaan Kardinalitas

Memeriksa bahwa sebuah rekaman memiliki jumlah rekaman terkait yang valid. Sebagai contoh, jika sebuah rekaman kontak diklasifikasikan sebagai "pelanggan" maka harus memiliki setidaknya satu pesanan terkait (kardinalitas > 0). Aturan ini bisa menjadi rumit dengan kondisi tambahan. Sebagai contoh, jika sebuah rekaman kontak dalam database gaji diklasifikasikan sebagai "mantan karyawan" maka tidak boleh memiliki pembayaran gaji yang terkait setelah tanggal pemisahan (kardinalitas = 0).

Pengecekan Digit
Digunakan untuk data numerik. Untuk mendukung deteksi kesalahan, sebuah digit tambahan ditambahkan ke sebuah nomor yang dihitung dari digit lainnya.

Pemeriksaan Konsistensi
Memeriksa field untuk memastikan data dalam field tersebut sesuai, misalnya, jika tanggal kadaluwarsa sudah lealu maka status tidak "aktif".

Pengecekan Konsistensi Antar Sistem
Membandingkan data di sistem yang berbeda untuk memastikan konsistensinya. Sistem bisa merepresentasikan data yang sama secara berbeda, dalam hal itu perbandingan memerlukan transformasi (misalnya, satu sistem bisa menyimpan nama pelanggan dalam satu field Nama sebagai 'Doe, John Q', sementara yang lain menggunakan Nama_Depan 'John' dan Nama_Belakang 'Doe' dan Nama_Tengah 'Quality').

Pengecekan Tipe Data
Memeriksa kesesuaian masukan dengan data yang diketik. Sebagai contoh, kotak masukan yang menerima data numerik mungkin menolak huruf 'O'.

Pengecekan Kehadiran
Memeriksa bahwa data ada, misalnya, pelanggan mungkin diharuskan memiliki alamat email.

Pengecekan Rentang
Memeriksa bahwa data berada dalam rentang nilai yang ditentukan, misalnya, sebuah probabilitas harus berada antara 0 dan 1.

Integritas Referensial
Nilai dalam dua tabel database relasional dapat dihubungkan melalui foreign key dan primary key. Jika nilai dalam field foreign key tidak dibatasi oleh mekanisme internal, maka harus divalidasi untuk memastikan bahwa tabel yang merujuk selalu merujuk ke baris dalam tabel yang dirujuk.

Pengecekan Keunikkan

Memeriksa bahwa setiap nilai bersifat unik. Ini bisa diterapkan pada beberapa field (yaitu. Alamat, Nama Depan, Nama Belakang).

Pengecekan lookup Tabel
Pengecekan lookup tabel membandingkan data dengan kumpulan nilai yang diperbolehkan.

Tindakan Penegakan
Tindakan penegakan biasanya menolak permintaan entri data dan memerlukan pelaku input untuk melakukan perubahan yang membawa data ke dalam kepatuhan. Ini paling cocok untuk penggunaan interaktif, di mana orang nyata duduk di komputer dan melakukan entri. Ini juga berfungsi baik untuk pengunggahan batch, di mana input berkas mungkin ditolak dan serangkaian pesan dikirim kembali ke sumber input untuk alasan mengapa data ditolak.


Bentuk lain dari tindakan penegakan melibatkan secara otomatis mengubah data dan menyimpan versi yang sesuai alih-alih versi asli. Ini paling cocok untuk perubahan kosmetik. Misalnya, mengonversi entri [SEMUA KAPITAL] menjadi entri [Pascal case] tidak memerlukan input pengguna. Penggunaan otomatis yang tidak pantas dari penegakan akan terjadi dalam situasi di mana penegakan menyebabkan kehilangan informasi bisnis. Misalnya, menyimpan komentar yang dipotong jika panjangnya lebih dari yang diharapkan. Ini biasanya bukan hal yang baik karena dapat mengakibatkan kehilangan data yang signifikan.

Tindakan Penasehat
Tindakan penasihat biasanya memungkinkan data dimasukkan tanpa perubahan tetapi mengirimkan pesan ke pelaku sumber yang menunjukkan masalah validasi yang dihadapi. Ini paling cocok untuk sistem non-interaktif, untuk sistem di mana perubahan tidak kritis secara bisnis, untuk langkah pembersihan data yang ada, dan untuk langkah verifikasi proses entri.

Tindakan Verifikasi

Tindakan verifikasi adalah kasus khusus dari tindakan penasihat. Dalam hal ini, pelaku sumber diminta untuk memverifikasi apakah data ini benar-benar ingin mereka masukkan, dalam cahaya saran yang bertentangan. Di sini, langkah pemeriksaan menyarankan alternatif (misalnya, pemeriksaan alamat surat mengembalikan cara pemformatan alamat yang berbeda atau menyarankan alamat yang berbeda sama sekali). Anda ingin dalam kasus ini, memberi pengguna opsi untuk menerima rekomendasi atau tetap menggunakan versi mereka. Ini bukan proses validasi yang ketat, secara disain dan berguna untuk menangkap alamat ke lokasi baru atau ke lokasi yang belum didukung oleh basis data validasi.

Log validasi
Bahkan dalam kasus di mana validasi data tidak menemukan masalah, menyediakan log validasi yang dilakukan dan hasilnya penting. Ini membantu mengidentifikasi adanya pemeriksaan validasi data yang hilang dalam kasus masalah data dan dalam meningkatkan

Validasi dan keamanan
Kegagalan atau kelalaian dalam validasi data dapat menyebabkan korupsi data atau kerentanan keamanan. Pemeriksaan validasi data memeriksa apakah data sesuai untuk tujuan, valid, masuk akal, wajar, dan aman sebelum diproses.

/[ 0 komentar Untuk Artikel Validasi data]\

Posting Komentar