معرفی و نقد کتاب «کلان‌داده‌ها؛ انقلابی که زندگی، کار و تفکر ما را تغییر می‌دهد»

کلان‌داده‌ها، منبع جدید شکاف و نابرابری در جهان

فرهنگی

کلان‌داده‌ها منبع سود و رقابت برای بسیاری از شرکت‌ها محسوب می‌شود و ساختار صنایع را تغییر خواهد داد. این مسئله باعث شکاف‌ها و نابرابری‌هایی می‌شود.

خبرگزاری مهر؛ گروه فرهنگ -مجید سلیمانی ساسانی*

کتاب «کلان‌داده‌ها؛ انقلابی که زندگی ما، کار و تفکر را تغییر می‌دهد» (۲۰۱۳) نوشته ویکتور میرشنبرگر و کینت کیکر، با ۴۲۰۰ ارجاع، یکی از پراستنادترین کتاب‌هایی است که تاکنون در حوزه شبکه‌های اجتماعی و فناوری‌های جدید نگاشته شده است. این کتاب، تحقیقی خاص از آخرین روندهای فنّاوری و تأثیرات چشمگیر آن بر اقتصاد، علم و جامعه می‌شود و توضیح می‌دهد که چگونه ما در احاطه داده‌های کلان قرارگرفته‌ایم و چه مزایا و خطراتی در برابر ما وجود دارد. داده‌هایی که به‌سرعت می‌تواند نتیجه‌گیری‌های شگفت‌انگیزی به ما دهد و در کسب‌وکار، سلامت، سیاست، آموزش، و نوآوری‌ها تغییرات زیادی ایجاد کند. نوشتار حاضر، درس‌هایی از مطالعه این کتاب است:

۱- داده‌ها را نمی‌توان به‌صورت ایستا یا پایدار در نظر گرفت، بلکه داده‌ها تبدیل به‌صورت ماده خام کسب‌وکار شده و منبع اقتصادی حیاتی برای ایجاد یک فرم جدید ارزش اقتصادی است. در توضیح این واقعیت، نویسندگان توضیح می‌دهند که چگونه گوگل می‌تواند گسترش آنفولانزای زمستان را در ایالات‌متحده، نه‌فقط در سطح ملی، بلکه در مناطق خاص پیش‌بینی کند. گوگل این کار را با در نظر گرفتن ۵۰ میلیون واژه جستجوی رایج در مورد گسترش آنفولانزا انجام داد و داده‌ها را از سال‌های ۲۰۰۳ تا ۲۰۰۸ مقایسه کرد. نرم‌افزار آن‌ها ترکیبی از ۴۵ جستجو را پیدا کرد و نشان داد که بین پیش‌بینی و آمار رسمی در سراسر کشور همبستگی زیادی وجود دارد. گوگل دقیقاً نشان داد که چگونه آنفولانزا گسترش یافته است و این یافته‌ها نه بر اساس تماس‌های افراد و یا تماس‌ها در مطب‌های پزشکی و درمانگاه‌ها، بلکه از طریق کلان‌داده‌ها به دست آمد. بنابراین شواهد نشان می‌دهد که کلان‌داده‌ها می‌تواند قدرت پیش‌بینی ایجاد کند.

۲- شرکت‌های خصوصی با جمع‌آوری و مرتب کردن اطلاعات قدرت یافته‌اند، درحالی‌که در گذشته، این وظیفه بیشتر بر عهده نهادهای قدرتمندی مانند کلیسا و دولت بود. این حجم از دسترسی به اطلاعات، مفهوم پیمایش و نظرسنجی را نیز تغییر می‌دهد. به‌عنوان‌مثال، گوگل برای تحلیل آنفلوانزا، نمونه‌گیری نکرده و بر نمونه‌ها کوچک تصادفی تکیه نمی‌کند، بلکه از میلیاردها جستجوی اینترنتی بهره می‌برد. این مسئله باعث افزایش کیفیت پیش‌بینی می‌شود و درواقع، داده‌های بزرگ‌تر، نتایج بهتری خواهد داشت.

۳- استفاده از داده‌های موجود در زمینه‌های مختلف امکان‌پذیر است، اما درعین‌حال، احتمال ایجاد خطا نیز افزایش می‌یابد. این خطاها به قالب‌بندی مجدد داده‌ها برمی‌گردد. درواقع، تلفیق انواع مختلف اطلاعات از منابع گوناگون، درعین‌حالی که می‌تواند مثمر ثمر باشد، می‌تواند موجب ناهماهنگی و افزایش خطا نیز شود. این ناهماهنگی و آشفتگی به کلان‌داده‌ها مرتبط نیست، بلکه به روش‌های استفاده ما از داده‌ها برمی‌گردد. درواقع، این عملکرد ناشی از نقص ابزارهایی است که برای سنجش، ثبت و تجزیه‌وتحلیل اطلاعات استفاده می‌شود. اما درهرصورت، بینشی که کلان‌داده‌ها در سطح کلان و همچنین سرعت دسترسی به اطلاعات ایجاد می‌کنند، مزیت‌های غیرقابل‌انکاری است.

۴- پیش‌ازاین، همبستگی‌ها در داده‌های کوچک پیمایشی مفید بودند، اما شناسایی همبستگی‌ها در کلان‌داده‌ها، به معنی واقعی نقطه درخشانی در پژوهش‌های کمی محسوب می‌شود. زیرا شناسایی همبستگی‌ها، به‌گونه‌ای پدیده‌ها را تجربه می‌کنند که می‌توان بر اساس آن در «پیش‌بینی آینده» پیش‌قدم شد. را پیش‌بینی کنیم. چنین همبستگی‌های قدرتمندی را در روندپژوهی گوگل در مورد آنفلوانزا مشاهده کرد: بین افراد مبتلا به آنفولانزا در یک مکان جغرافیایی خاص و میزان جستجو در این موضوع همبستگی وجود دارد. نهایتاً اینکه با وجود کلان‌داده‌ها، فرضیه‌ها اهمیت خود را ازدست‌داده‌اند و برای تجزیه‌وتحلیل همبستگی‌ها خیلی مهم نیستند، زیرا داده‌های زیادی وجود دارد و پژوهش‌گر نیازمند ارائه فرضیه‌های پیشین نیست. درواقع، تجزیه‌وتحلیل کلان‌داده‌ها نیازی به نظریه‌های یک حوزه خاص ندارد.

 ۵- باید بین «داده‌سازی» [div id='ftn1']

[span dir='LTR'][۱] datafication

[span dir='LTR'][۲] digitization

کد N1987530