در دنیای آنالوگ، ثبت و نگهداری دانش سخت بود. لذا فقط آن دسته از دانش ذخیره میشدند که ارزش آن مشخص و نقد بود اصطلاحاً از جنس «اطلاعات» بود؛ مثل شرح احوال بزرگان، نظرات و مقالات دانشمندان. در عوض، دادههایی مثل سوابق بیماری افراد معمولی و یا تعداد قدمهای روزانه آن شهروند اهمیتی نداشت و در عمل دور ریخته میشد.
اما با تحول حاصل از انقلاب دیجیتال علاوهبر آسان شدن ثبت اطلاعات، حجم و فضای فیزیکی لازم برای ذخیره داده نیزکم شد. از اینرو میزان دادهای که در حافظههای دیجیتال ذخیره میشد به تدریج افزایش یافت. در چنین شرایطی، همه چیز برای ثبت دادههایی که تا آن زمان نگهداری آنها دشوار بود و دور ریخته میشد، فراهم شد. لذا بسیاری از «اطلاعات» آنالوگ، مثل کتب قدیمی و نسخ خطی یا فیلمها و تصاویر آرشیوی تاریخی دیجیتال شدند.
با گسترش فضای سایبر و مبتنی بر خصلت «نافراموشی» این فضا، حتی کوچکترین کنش و رفتار کاربران در سکو (پلتفرم) های مجازی، امکان ثبت و ذخیرهسازی دارد: مانند شناسه کاربری افراد، مکان اتصال به سکو و یا حتی حرکت موشواره (ماوس) آنها. این موارد تنها برخی از نمونههای دادههایی است که به آنها «ردپای دیجیتال» میگویند. این ردپاها وقتی کنار هم قرار بگیرند، «کلانداده»[1] را تشکیل میدهند که با تحلیل آن میتوان اطلاعاتی مثل اینکه کدام تصویر یا محتوا بیشتر توجهشان را جلب کرده، پراکندگی جغرافیایی بازدیدکنندگان چگونه است، متناسب با دستگاه (دیوایس) و سیستمعامل کاربران چه تغییرات فنی برای بهینهسازی سکو اعمال شود و غیره بدست آورد. اما این پایان مسیر دادهها نیست.
با گسترش رسانههای اجتماعی، کاربران با فعالیت در آنها علاوه بر ردپاهای دیجیتال فنی، ردپاهای دیجیتال رفتاری نیز از خود به جا میگذارند. اینکه چه عبارتی جستجو را کردهاند، چه کسانی را دنبال میکنند، توسط چه کسانی دنبال میشوند، چه محتواهایی را پسند (لایک) کردهاند یا برایشان نظر (کامنت) گذاشتهاند، چه عکسی برای نمایه (پروفایل) خود گذاشتهاند و … کلاندادهای است که از آن میتوان اطلاعاتی درباره عقاید و علایق کاربران بدست آورد.
علاوهبراین، فناوری «اینترنت اشیاء» (IoT) این بستر را فراهم کرده است که بتوان از ساعتهای مچی، خودرو، چراغهای روشنایی، در و پنجره، جاروبرقی، یخچال و لباسشویی دادههایی مثل میزان ضربان قلب و تعداد قدمها، مکانهایی که فرد به آنها رفته، ساعات خواب و بیداری، نقشهی خانه و وسایل داخل آن، محتویات یخچال و میزان لباسهایش را جمعآوری کرد و کلاندادهای از سبک زندگی افراد تشکیل داد.
در نهایت کلانداده حاصل از این ردپاهای دیجیتال، از نوع فنی آن گرفته تا رفتاری و سبکزندگی، به عنوان ماده خام تحلیل در فرایند «دادهکاوی» و استخراج اطلاعات مورد استفاده در حوزهها و صنایع گوناگونی قرار میگیرد.
[1]Bigdata