خبرگزاری مهر؛ گروه فرهنگ -مجید سلیمانی ساسانی*
کتاب «کلاندادهها؛ انقلابی که زندگی ما، کار و تفکر را تغییر میدهد» (۲۰۱۳) نوشته ویکتور میرشنبرگر و کینت کیکر، با ۴۲۰۰ ارجاع، یکی از پراستنادترین کتابهایی است که تاکنون در حوزه شبکههای اجتماعی و فناوریهای جدید نگاشته شده است. این کتاب، تحقیقی خاص از آخرین روندهای فنّاوری و تأثیرات چشمگیر آن بر اقتصاد، علم و جامعه میشود و توضیح میدهد که چگونه ما در احاطه دادههای کلان قرارگرفتهایم و چه مزایا و خطراتی در برابر ما وجود دارد. دادههایی که بهسرعت میتواند نتیجهگیریهای شگفتانگیزی به ما دهد و در کسبوکار، سلامت، سیاست، آموزش، و نوآوریها تغییرات زیادی ایجاد کند. نوشتار حاضر، درسهایی از مطالعه این کتاب است:
۱- دادهها را نمیتوان بهصورت ایستا یا پایدار در نظر گرفت، بلکه دادهها تبدیل بهصورت ماده خام کسبوکار شده و منبع اقتصادی حیاتی برای ایجاد یک فرم جدید ارزش اقتصادی است. در توضیح این واقعیت، نویسندگان توضیح میدهند که چگونه گوگل میتواند گسترش آنفولانزای زمستان را در ایالاتمتحده، نهفقط در سطح ملی، بلکه در مناطق خاص پیشبینی کند. گوگل این کار را با در نظر گرفتن ۵۰ میلیون واژه جستجوی رایج در مورد گسترش آنفولانزا انجام داد و دادهها را از سالهای ۲۰۰۳ تا ۲۰۰۸ مقایسه کرد. نرمافزار آنها ترکیبی از ۴۵ جستجو را پیدا کرد و نشان داد که بین پیشبینی و آمار رسمی در سراسر کشور همبستگی زیادی وجود دارد. گوگل دقیقاً نشان داد که چگونه آنفولانزا گسترش یافته است و این یافتهها نه بر اساس تماسهای افراد و یا تماسها در مطبهای پزشکی و درمانگاهها، بلکه از طریق کلاندادهها به دست آمد. بنابراین شواهد نشان میدهد که کلاندادهها میتواند قدرت پیشبینی ایجاد کند.
۲- شرکتهای خصوصی با جمعآوری و مرتب کردن اطلاعات قدرت یافتهاند، درحالیکه در گذشته، این وظیفه بیشتر بر عهده نهادهای قدرتمندی مانند کلیسا و دولت بود. این حجم از دسترسی به اطلاعات، مفهوم پیمایش و نظرسنجی را نیز تغییر میدهد. بهعنوانمثال، گوگل برای تحلیل آنفلوانزا، نمونهگیری نکرده و بر نمونهها کوچک تصادفی تکیه نمیکند، بلکه از میلیاردها جستجوی اینترنتی بهره میبرد. این مسئله باعث افزایش کیفیت پیشبینی میشود و درواقع، دادههای بزرگتر، نتایج بهتری خواهد داشت.
۳- استفاده از دادههای موجود در زمینههای مختلف امکانپذیر است، اما درعینحال، احتمال ایجاد خطا نیز افزایش مییابد. این خطاها به قالببندی مجدد دادهها برمیگردد. درواقع، تلفیق انواع مختلف اطلاعات از منابع گوناگون، درعینحالی که میتواند مثمر ثمر باشد، میتواند موجب ناهماهنگی و افزایش خطا نیز شود. این ناهماهنگی و آشفتگی به کلاندادهها مرتبط نیست، بلکه به روشهای استفاده ما از دادهها برمیگردد. درواقع، این عملکرد ناشی از نقص ابزارهایی است که برای سنجش، ثبت و تجزیهوتحلیل اطلاعات استفاده میشود. اما درهرصورت، بینشی که کلاندادهها در سطح کلان و همچنین سرعت دسترسی به اطلاعات ایجاد میکنند، مزیتهای غیرقابلانکاری است.
۴- پیشازاین، همبستگیها در دادههای کوچک پیمایشی مفید بودند، اما شناسایی همبستگیها در کلاندادهها، به معنی واقعی نقطه درخشانی در پژوهشهای کمی محسوب میشود. زیرا شناسایی همبستگیها، بهگونهای پدیدهها را تجربه میکنند که میتوان بر اساس آن در «پیشبینی آینده» پیشقدم شد. را پیشبینی کنیم. چنین همبستگیهای قدرتمندی را در روندپژوهی گوگل در مورد آنفلوانزا مشاهده کرد: بین افراد مبتلا به آنفولانزا در یک مکان جغرافیایی خاص و میزان جستجو در این موضوع همبستگی وجود دارد. نهایتاً اینکه با وجود کلاندادهها، فرضیهها اهمیت خود را ازدستدادهاند و برای تجزیهوتحلیل همبستگیها خیلی مهم نیستند، زیرا دادههای زیادی وجود دارد و پژوهشگر نیازمند ارائه فرضیههای پیشین نیست. درواقع، تجزیهوتحلیل کلاندادهها نیازی به نظریههای یک حوزه خاص ندارد.
۵- باید بین «دادهسازی»
[div id='ftn1']
[span dir='LTR'][۱]
datafication
[span dir='LTR'][۲] digitization
نظر شما چیست؟
لیست نظرات
نظری ثبت نشده است