مرحله تبديل (Transformation) در ETL چيست؟
پس از استخراج اطلاعات، بايد پردازشهايي روي آنها انجام شود تا فرمت آنها مناسب و يکپارچه شود. در اين مرحله موارد زير انجام مي شوند:
1- اعتبارسنجي دادهها: سازگاري و عدم تناقض اطلاعات جديد استخراج شده از منابع اطلاعاتي و اطلاعات موجود در DWHدر اين قسمت بررسي ميشود.
2- بررسي صحت دادهها: آيا فيلدها مقادير درستي به خود گرفتهاند؟ براي مثال آيا در فيلدي که ارزش مقادير on و offهستند، تمامي دادهها يکي از اين دو مقدار را دارند؟
3- تبديل انواع دادهها: دادهها از منابع اطلاعاتي مختلف ميآيند و در نتيجه ممکن است فيلدهاي مشابه داراي مقادير مختلفي باشند. براي مثال يک فيلد دو مقداري در يک منبع اطلاعاتي on و offباشد و در منبع اطلاعاتي ديگر ۰ و ۱. تمامي اطلاعاتي که واردDWHميشوند بايد از اين جهت اصلاح شوند.
4- اعمال قوانين تجاري: در اين مرحله ميتوان بررسي کرد آيا دادههاي موجود مطابق با نيازهاي سازماني هستند؟ براي مثال آيا در اطلاعات مربوط به مشتريان نام و نام خانوادگي آنها وجود دارد.
5- يکپارچهسازي اطلاعات: براي مثال ممکن است يک سيستم اطلاعات مشتريان را نگهداري کند و سيستم ديگر اطلاعات فروش را. اطلاعات موجود در دو سيستم مذکور بايد با هم يکپارچه شوند.
اين مرحله در واقع، پيچيده ترين مرحله در فرآيند ETLاست. قسمتي از اين فرآيند را ميتوان در مرحله استخراج دادهها انجام داد. مانند سيستمهاي اطلاعاتي قديمي که در آنها اطلاعات از تمامي فايلهاي اطلاعاتي موجود جمعآوري شده و يک فايل متني از روي آنها ساخته ميشود.