جامعیت داده ها در انباره داده ( Data Integrity)
Data Integrity یا جامعیت دادها که گاهی به یکپارچگی داده ها هم ترجمه شده است، به اعتبار داده ها اشاره می کند. به این معنی است که داده ها سازگار و صحیح هستند. در پیاده سازی انبار داده نقل قول معروفی وجود دارد که بیان می کند: “اگر آشغال وارد شود آشغال خارج می شود” بنابراین اگر جامعیت داده وجود نداشته باشد، هیچ تحلیل و گزارشی مفید نخواهد بود.
تعریف جامعیت داده ها
پایگاه بیزنس دیکشنری جامعیت داده ها را به صورت زیر تعریف می کند:
صحت و سازگاری داده های ذخیره شده، که با عدم وجود تغییر در داده ها بین دو بروزرسانی داده های ثبت شده نشان داده می شود. جامعیت داده هادر مرحله طراحی پایگاه داده از طریق قواعد و روال های استاندارد اعمال می شود. در مراحل بعدی جامعیت داده ها با استفاده از روتین های بررسی خطا و اعتبارسنجی حفظ می شود.
جامعیت داده ها در سطح پایگاه داده
می توانیم جامعیت داده ها را در سطح پایگاه داده اجرا کنیم. شیوه های رایج اجرای جامعیت داده عبارتند از:
- جامعیت ارجاعی داده ها: روابط بین کلیدهای اصلی یک جدول و کلید خارجی باید همیشه حفظ شود. برای مثال اگر یک کلید خارجی وجود دارد که به کلید اصلی اشاره می کند، کلید اصلی نباید حذف شود.
- محدودیت یکتا بودن کلید اصلی: کلیدهای اصلی و محدودیت یکتایی برای اطمینان از این که هر سطر جدول باید به صورت منحصر به فرد قابل شناسایی باشد استفاده می شوند.
- Not NULL و NULL-able: برای ستون هایی که به عنوان Not-NULL تعیین می شوند نباید مقدار NULL وجود داشته باشد.
- مقادیر معتبر: تنها مقدارهایی که مجاز هستند در پایگاه داده امکان ورود داشته باشد. برای مثال اگر یک ستون تنها می تواند اعداد صحیح مثبت را اختیار کند، مقدار “۱-” را نباید بتوان وارد کرد.
جامعیت داده ها در فرآیند ETL
در هر مرحله از فرآیند ETL بررسی های جامعیت داده باید انجام شود تا از یکسان بودن داده منبع و مقصد مطمئن شویم. بررسی های رایج شامل جمع یا تعداد رکوردها می شود.
سطح دسترسی
باید مطمئن شویم که داده ها از طریق ابزارهای غیر مجاز چه در فرآیند ETL و چه در انبار داده تغییر نمی کند. برای این کار باید در مقابل دسترسی غیرمجاز موانع و ترفندهایی را به کار گرفت. مانند ثبت تاریخچه تمام دسترسی ها. اگر دسترسی غیرمجازی به داده ها وجود داشته باشد نمی توانیم از جامعیت داده ها مطمئن باشیم.