استانداردسازي دادهها به مجموعه فعاليتهايي گفته ميشود كه تلاش دارد تا دادههاي مورد استفاده در فرآيندهاي يك سازمان را يكنواختسازي نمايد به نحوي كه در نمايش يك حقيقت خارجي در سيستمهاي مختلف سازمان همه كاربران الفاظ و نمادهاي يكسان و مشتركي را به كار برند. در نمايش حقيقت خارجي يك كالا در يك سازمان، اگر اتفاقي نظير شكل زير روي دهد، استانداردسازي دادهها به درستي انجام نشده است. همان گونه كه در شكل مشاهده ميشود، براي معرفي اطلاعات كالا چندين شيوه متفاوت به كار گرفته شده است كه همگي به يك حقيقت خارجي يكسان يعني يك كالا اشاره دارند.
در سالهاي اخير، به منظور رفع اين مساله مفهومي با نام حل مساله موجوديت (ER) در برنامه درسي برخي رشتههاي دانشگاهي در دانشگاههاي مهم جهان نظير MIT گنجانده شده است. اين اتفاق اهميت پرداختن به مفهوم حل مساله موجوديت را نشان ميدهد. حل مساله موجوديت ارتباطي تنگاتنگ با مفهوم
دادههاي با كيفيت
در سازمان دارد. به بيان ديگر، هر سازمان براي نيل به دادههاي با كيفيت ميتواند از طريق استانداردسازي دادهها به حل مساله موجوديت بپردازد.
بر اساس تعريف سازمان ايزو (ايزو 11179) داده، "نمايش باز تفسير پذير از اطلاعات به شيوهای رسمي مناسب برای ارتباط، تفسير يا پردازش" است. در نتيجه، به عنوان گام بديهی اوليه در فعاليت استانداردسازی دادهها بايد به يكسانسازی الفاظ اشارهكننده به حقايق خارجی سازمانی پرداخت. به بيان ساده و به طور مثال، هر كالا بايد در سراسر سازمان نامی به اندازه كافی كامل، يكسان و مشترك داشته باشد. درك اين مهم كه اطلاعات مربوط به موجوديتهای مهم سازمانی نظير كالاها و مشتريان بايد در سراسر يك سازمان يكسانسازی گردد منجر به توسعه مفهوم مديريت دادههای اصلی شده است (لوشين، 2010). در مديريت دادههای اصلی، منظور از دادههای اصلی دادههايی هستند كه به موجوديتهای مهم و پايهای يك سازمان نظير كالاها، مشتريان و موقعيتهای فيزيكی نظير انبارها اشاره دارند. در نتيجه مديريت دادههای اصلی كه هدف آن دستيابی به كيفيت اطلاعات است منجر به بيشينهسازی ارزش دارايیهای اطلاعاتی سازمان و تضمين برآوردهسازی انتظارات مصرفكنندگان محصولات اطلاعاتی آن میگردد (تالبورت، 2009).
در تبيين چگونگی دستيابی به كيفيت اطلاعات، چنانچه اطلاعات را نظير آنچه در تئوری معروف شانون (1948) مطرح است، در حكم پيامی كه از يك فرستنده به يك گيرنده ارسال میشود تلقی كنيم به گونهای كه پيام از سوی گيرنده مورد فهم واقع شود، آنگاه قواعد حاكم بر انتقال پيام، محتوای پيام و هدف از انتقال پيام سه مفهوم بسيار مهم است كه در اين فرآيند پيامرساني بايد مورد توجه قرار بگيرد تا كيفيت اطلاعات تضمين گردد. در برخي مراجع از اين سه مفهوم به ترتيب با نامهاي سينتاكتيكس، سمانتيكس و پراگماتيكس ياد ميشود (اكو، 1976؛ شاندلر، 2009). علت اصلي حساسيت در مديريت كيفيت اطلاعات از آنجا ناشي ميشود كه دادهها در حكم مدلهايي از دنياي واقع هستند كه نقش تصويرگري يك دنياي پيچيده و تفصيلي به زير فضايي كوچكتر (درمان، 2011) را ايفا مينمايند. بنابراين دادهها به واسطه ماهيت مدلي كه دارند سادهسازي هستند و سادهسازي ممكن است خطرناك باشد (درمان، 2011). در نتيجه، مهم است كه اين سادهسازي از دنياي واقع به طور صحيح مديريت گردد تا اطلاعات كيفي مبناي تصميمگيريهاي مبتني بر آنها قرار بگيرد.
Chandler, D. (2009, February). Semiotics for Beginners, 1994. Web.
Derman, E. (2011). Models. Behaving. Badly.: Why Confusing Illusion with Reality Can Lead to Disaster, on Wall Street and in Life. Simon and Schuster.
Eco, U. (1976). A theory of semiotics (Vol. 217). Indiana University Press.
International Standards Organization. (2004-07-15). ISO/IEC 11179-4 information technology–metadata registries (MDR) Part 4 formulation of data definitions (2nd ed.).
Loshin, D. (2010). Master data management. Morgan Kaufmann.
McGilvray, D. (2010). Executing data quality projects: ten steps to quality data and trusted informationTM. Morgan Kaufmann.
Shannon, C. E. (1948). A mathematical theory of communication. The Bell System Technical Journal, 27.
Talburt, J. (2009). A new view of information quality. In Proceedings: 2009 Database Grand Conference (pp. 241-251).
دغدغه كيفيت داده زمانی برجسته میشود كه نياز باشد از منابع مختلف دادهای پراكنده با يكديگر تلفيق شوند. در اين صورت بايد سيستم مديريت برای داده نظير آنچه ردمن (2008) بيان میدارد به منظور تعريف و اكتساب دادهها، تضمين بالا بودن كيفيت دادهها، ذخيرهسازی دادهها، پردازش و به كارگيری آنها به منظور خدمترسانی به مشتريان، مديريت سازمان و ايجاد محصولات و خدمات جديد به كار گرفته شود. براي نيل به اين مقصود میتوان از اصول شش گانه (تالبورت، 2011) حاكم بر كيفيت دادهها بهرهگرفت:
اصل 1
اطلاعات تنها زمانی ارزش توليد میكند كه در كاربردی معين مورد استفاده قرار گيرد.
اصل 2
كيفيت يك محصول اطلاعاتی با ارزشی كه در كاربرد خود ايجاد میكند، متناسب است.
اصل 3
كيفيت يك محصول اطلاعاتی وابسته به كاربرد آن است. اطلاعات يكسان در كاربرد با اهداف مختلف از خود كيفيتهای
مختلف نشان میدهد.
اصل 4
اطلاعات بايد نظير يك محصول مديريت شود.
اصل 5
به منظور موفقيت يك سازمان در مديريت كيفيت اطلاعات، از كيفيت اطلاعات بايد در بالاترين سطح مديريتی حمايت
صورت پذيرد و در عين حال به صورت مسئوليت توزيع شده از سوی همه كاركنان سازمان مورد توجه قرار گيرد.
اصل 6
پيادهسازی موفق سيتمهای اطلاعاتی نيازمند توجه يكسان و همزمان به كيفيت نرمافزار و كيفيت اطلاعات است.
به منظور تحقق موفقيتآميز اصول فوق در معرفي كيفيت اطلاعات به يك سازمان بايد نظير آنچه تالبورت (2011) بر آن تاكيد دارد، به مرتبط نمودن كيفيت اطلاعات با تاثير ارزشمند بر كسب و كار سازمان، معرفي شيوهاي به ذينفعان براي صحبت كردن راجع به كيفيت اطلاعات- واژگان و مفاهيم و نشان دادن راهي به آنها براي بهبود كيفيت اطلاعات و يك چشمانداز براي
استمراربخشي به آن توجه نمود. در همين راستا و مبتني بر تجارب توسعه نرمافزار، موفقيت بلند مدت در كسب كيفيت اطلاعات وابسته به ايجاد توانمندي سازماني و پختگي براي تكرار موفقيت و بهبود مستمر است (تالبورت 2011). به طور مثال، باسكارادا مدل پختگي و توانمندي پنج سطحي را تعريف نموده است كه در آن هر سطح بر حسب شاخصهاي پختگي كه بايد تامين شود تعريف ميگردد. (باسكارادا، 2009)
Baskarada, S. (2009). Information quality management capability maturity model. Weisbaden: Vieweg & Teubner.
McGilvray, D. (2010). Executing data quality projects: ten steps to quality data and trusted informationTM. Morgan Kaufmann.
Redman, T. C. (2008). Data driven: profiting from your most important business asset. Harvard Business Press.
Talburt, J. R. (2011). Entity resolution and information quality. Elsevier.