استفاده از علم دادهها در سرشماری ثبتی مبنا از ملزومات و ضروریات اصلی خواهد بود
یکی از مهم ترین حوزه های مدرن در حوزه آمارهای رسمی تولید آمارهای ثبتی مبنا از داده های اداری است.
اولین سمینار مجازی با عنوان "علم داده ها و کاربردهای آن "روز چهارشنبه مورخ 25 فروردین 1400 با سخنرانی دکتر حسین زاده رئیس مرکز آمارایران افتتاح شد. در این مراسم دکتر حسین زاده ضمن تبریک سال نو و فرا رسیدن ماه مبارک رمضان وآرزوی قبولی طاعات وعبادات مومنان در درگاه حضرت حق ، گفت : عصری که در آن زندگی می کنیم به عصر دیجیتال معروف است. عصری که در آن پیشرفت های تکنولوژی و فناوری اطلاعات با سرعت بسیار بالا شکل می گیرد. سرعت ظهور این تکنولوژی ها به حدی بالاست که در بسیاری مواقع فراتر از نیاز بشریت احساس می شود.
رئیس مرکز آمار ایران افزود: در عصر دیجیتال و در کنار این پیشرفت ها همانند قبل برای آگاهی از وضع موجود، ارزیابی وضعیت ، پیش بینی آینده و برنامه ریزی ،نیازمند داده ها و اطلاعات دقیق و پویا هستیم. طبیعی است با توجه به سرعت رشد این تکنولوژی و توسعه استفاده از سیستم های اطلاعاتی، سرعت تولید داده ها و اطلاعات و کیفیت آنها نیز افزایش یافته است.
ایشان با اشاره به این که ظهور این تکنولوژی ها باعث ایجاد منابع داده ای جدیدی مانند مه داده های تلفن همراه، داده های آزاد مرتبط با خریدهای اینترنتی، منابع اطلاعاتی OSINT و .. نیز شده است ، گفت: سازمان ملی آمار کشورها در سراسر دنیا، برای تأمین نیازهای آماری و برنامه ریزی دولتهای خود ناگزیر به سمت استفاده از منابع داده ای جدید شامل داده های اداری، مه داده ها، داده های وب، داده های آزاد، OSINT و ... سوق داده شدهاند و استفاده از این منابع داده ای متفاوت از تولید آمارهای رسمی سنتی به روش نمونه گیری و سرشماری های کلاسیک، نیازمند استفاده از تکنیک های مختلفی مانند جورسازی(Matching) بین رکوردهای مختلف از منابع داده ای فراوان، انطباق بین رکوردهای مشابه(Record linkage)، استفاده از تکنیک های همجوشی داده ها(Data Fusion) برای استخراج اطلاعات بیشتر از منابع مختلف و .. است.
رئیس مرکز آمارایران افزود : برای حرکت همراستا و هم شتاب با دیجیتالی شدن دنیا و تامین نیازهای اطلاعاتی، مراکز آماری دنیا ناگزیر به تغییر رویه خود به سمت مدرن شدن در تمامی سطوح کارکردی خود خصوصا استفاده از منابع داده های جدید و تولید آمار از آنها هستندو یکی از سطوح مدرن سازی که اشاره شد استفاده از منابع نوین داده ای با استفاده از تکنیک های مختلف است که نیازمند تخصص های مختلف از علومی مانند رایانه، آمار، سیستم های اطلاعاتی، ریاضی و ... است که مجموعه این علوم در قالب مباحث علم دادهها طرح می شود.
دکتر حسین زاده با تاکید برپیشرفت در حوزه تولید و ارائه آمار و اطلاعات ، پرورش نیروها برای توسعه نظام آماری کشور را ضروری خواند.
ایشان در ادامه ضمن اشاره به این که سرشماری که یکی از مهمترین منابع تولیدآمارهای رسمی هر کشوری است ، گفت : یکی از مهم ترین حوزه های مدرن در حوزه آمارهای رسمی تولید آمارهای ثبتی مبنا از
داده های اداری است. جایی که یکی از بزرگ ترین فعالیت های آماری کشور یعنی سرشماری عمومی نفوس و مسکن در سال 1405 قرار است به صورت ثبتی مبنا اجرا شود.
دکتر حسین زاده افزود : با عنایت به گستردگی سیستم های اطلاعاتی در کشور و در کنار آن مشکلات فراوان در عدم وجود شناسه های یکتا و صحیح برای اتصال آنها با یکدیگر به عنوان جورسازی قطعی برای تولید آمار، استفاده از هنر علم دادهها در این سرشماری از ملزومات و ضروریات اصلی خواهد بود و مرکز آمار ایران به عنوان تنها مرجع رسمی تهیه و تولید آمارهای رسمی کشور، رویکرد مدرن خود را تمرکز بر منابع نوین داده ای و تولید آمارهای متنوع از این منابع قرار داده که در این راه نیازمند استفاده از تواناییها و استعدادهای مختلف در حوزه علم دادهها است.