آیا اینترنت شما را بهتر از خودتان می شناسد؟ کاملاً درست است! به گفته استفان داویدس، که در کتاب خود یک مورد سرگرمکننده برای این موضوع عنوان کرده است: «همه دروغ میگویند: کلاندادهها، دادههای جدید و آنچه اینترنت میتواند دربارهی آنچه واقعاً هستیم به ما بگوید.» اینترنت میداند که شما چه فیلمی تماشا میکنید، از گرایش و علایق جنسی شما باخبر است و حتی اینکه آیا کتابی را که میخوانید، به فصل آخر میرسانید یا خیر!
تحلیلگر دادهها
ست استیونز داویدوویتس، تحلیلگر سابق دادههای گوگل و دکترای اقتصاد از دانشگاه هاروارد، استدلال میکند که کلاندادهها، بینشی بیسابقه از وضعیت انسان را تصویر میکنند. او با این شیوه از ادعای خود پشتیبانی و ما را با مطالعات موردی بمباران میکند؛ استفاده از تثلیث مقدس دادههای اینترنت: گوگل، فیسبوک و پورنهاب. این افشاگریها هریک در نوبهی خود آرامشبخش، ناراحتکننده و خندهدار است. برخی از آنها مورد انتظار هستند، مانند این واقعیت که مردم در مورد میزان رابطه جنسی خود اغراق می کنند، برخی کمتر، مانند تعداد دفعات جستجوی گوگل مربوط به زنای با محارم و نزدیکان. ابتدا بیایید یک قدم به عقب برویم. کلانداده چیست؟ کلانداده اصطلاحیست که برای توصیف حجم گسترده، تنوع و کیفیت دادههایی که فناوری مدرن به ما امکان میدهد بهدست آوریم، استفاده میشود. داویدوویتس این مسئله را بررسی میکند که چه کاری میتوانیم با این دادهها انجام دهیم. وی آنچه را «چهار رکن اصلی کلانداده» میداند و انقلابی در علم داده ایجاد میکند، ارائه میدهد: دادهها اطلاعاتی مورد اطمینان، بدیع، مکفی و شایسته هستند.
بزرگترین تغییردهندهی بازی، دادههای مورد اطمینان است. ست استیونز داویدوویتس در تازهترین قسمت کتابش بیان میکند که برخلاف پایگاههای اطلاعاتی متداول که خودبهخود گزارش میدهند، مانند نظرسنجیها، منابع جدید داده مانند جستجوهای گوگل انگیزهای برای افشای حقیقت دارند. گوگل ممکن است تنها منبع قابلاعتماد برای برخی از اطلاعات، مانند تعداد دفعات سقط خودبهخودی باشد. استیون داویدوویتس از دادههای جستجوی گوگل برای از بین بردن خرافات میان مردم استفاده میکند، و تصورات کلیشهای را رد میکند. در مطلب
حقایق مجازی
درست قبل از انتخاب مجدد اوباما در سال ۲۰۱۲، گزارشهای مبتنی بر نظرسنجیها حاکی از آن بود که بهطور کلی، نژادگرایی بر رایگیری آمریکاییها تأثیرگذار نبود. با این حال، یک مطالعهی انجامشده توسط نویسنده، نشان داد که رابطهی قابلتوجهی بین مناطق دارای میزان بالای جستجوی نژادپرستانه در گوگل، و مناطقی که اوباما در انتخابات عملکرد کمتری داشته است، مقدار زیادی است که با عوامل دیگر قابل توضیح نیست. همین الگو برای عملکرد ترامپ در انتخابات مقدماتی جمهوریخواهان در سال ۲۰۱۶ بهتر از آنچه انتظار می رفت، یافت شد. اثبات شد که تحقیقات نژادپرستانه، عامل اصلیترین ارتباط با محبوبیت وی است. این یک اطلاعات کاملاً مهم است که در بحث پیرامون روابط نژادی در ایالات متحده از دست رفته است. گوگل نهتنها منبع دادههای صادقانه است، بلکه تنها مکانی است که برخی اعترافات در آن مانند روز روشن است.
در حالی که استیون داویدوویتس آرزو دارد از دادههای بزرگ برای ارضای کنجکاوی فکری و بهبود جامعه استفاده شود، وی خاطرنشان میکند که سودآوران از این منبع جدید با بهرهگیری از دادههای جدید به منظور دستکاری در مصرف کنندگان، سرمایهگذاری میکنند. چگونه آنها دادههایی را که برای آنها مفید است می یابند؟ از طریق استفاده بیوقفه از آزمونهای آنلاین A / B – آزمایشاتی که در آن دو گروه تصادفی از مشتری در معرض دو گزینه مختلف (A یا B) قرار دارند، به شرکت اجازه میدهد گزینه ای را، که بهترین پاسخ را ارائه میدهد، شناسایی کند. چرا یک شرکت رسانههای اجتماعی از کاربران خود میپرسد کدامیک از ویژگیهای جدید را ترجیح میدهند؛ و آنها را به خطر می اندازد گزینه ای را که کمتر استفاده می کنند-هنگامی که یک آزمون A / B نشان میدهد کدام یک جذاب تر و در نتیجه سودآور است؟ این آزمونها تقریباً در هر حضور آنلاین گستردهای که فکر میکنید، از نتفلیکس گرفته تا همهی رسانهها، بهکار گرفته میشوند. همهی ما خواهناخواه در این کار شرکت میکنیم.
آزمونهای A / B در حقیقت نسخههای آنلاین و گستردهای از آزمایشات کنترلشدهی تصادفیست که هر روز توسط محققان علمی انجام میشود. آزمایشات تصادفی کنترلشده نوعی آزمایش است که در آن تعدادی از افراد بهطور تصادفی در یکی از دو گروه قرار میگیرند. یک گروه در معرض «مداخله» است -این می تواند یک دارو، یک ورزش یا هر چیزی باشد که فرض میشود تأثیر قابل اندازهگیری بر روی شرکتکنندگان دارد- و گروه دیگر چنین نیست. در تحقیقات پزشکی، این آزمایشات استاندارد طلایی برای اثبات موفقیت یک درمان هستند زیرا میتوانند ارتباط علیّتی بین درمان و نتیجه بیمار نشان دهند. با استفاده از دادههای بزرگ، قدرت استنتاج علّت و معلولیّت از همبستگی ارزانتر و آسانتر از گذشته است. در مطلب «جملاتی از کتاب همه دروغ میگویند» میتوانید نقل قولهای برتر کتاب همه دروغ میگویند را مطالعه نمایید.
آمار جرم و جنایت
انواع جدید دادهها و حجم عظیمی از دادهها -ارائه دانهبندی کافی برای «بزرگنمایی» در زیر مجموعههای جمعیت -چهار قدرت را کامل میکنند. باهم، آنها به ما اجازه میدهند تا به انواع سوالات قدیمی و جدید پاسخ دهیم. برای نشان دادن این موضوع، داویدوویتس یک مطالعهی عالی درباره رابطهی بین جرم خشن و خشونت در رسانهها را بازگو میکند، که از مقادیر فراوان دادههای گیشه و جرم استفاده میکند. برخلاف نتایج حاصل از آزمایشات آزمایشگاهی، که میزان پرخاشگری را پس از قرارگرفتن در معرض فیلمهای خشونتآمیز اندازهگیری میکند، این نتیجه اثر معکوس را نشان میدهد: کاهش جرم و جنایت در آخر هفتهها که یک فیلم محبوب خشونتآمیز در سینماها افتتاح شد. دادههای دنیای واقعی تحتتأثیر عواملی هستند که آزمایشگاهها هرگز نمیتوانند حساب کنند. از نظر جامعه، این مطالعه احتمالاً نتیجهی معتبر زیستمحیطی دارد.
شاید مهمترین قطعهی باقیمانده در اثر انفجار کلاندادهها، توانایی استفاده از همبستگیها برای پیشبینی رفتار و وضعیت افراد با افزایش دقت و صحت باشد. تاریخچهی جستجوی Google در مورد افرادی را که مبتلا به سرطان لوزالمعده تشخیص داده شدهاند، جمع کنید و شما یک ابزار جدید برای تشخیص خود دارید. داویدوویتس معتقد است که جمعآوری دادههای غنی درمورد مشکلات جهان اولین قدم برای رفع آنهاست»، و کمپین حقوق بشر و آژانسهای خدمات محافظت از کودکان از قبل مشتاق کمک گرفتن از او هستند. با انگیزه خطرات مختلف این قدرت پیشبینیکنندهی تازه کشفشده، این کتاب با این هشدار به پایان میرسد: با کلاندادهها مسئولیت بزرگی به وجود میآید. یافتن همبستگیها آسان است. با این حال، این همبستگی به معنای علیّت نیست و هرچه بیشتر به نظر برسید احتمال تصادف با یک همبستگی اتفاقی که دو متغیر کاملاً مستقل را بههم پیوند میزند، بیشتر میشود. در مطلب «نگاهی به کتاب همه دروغ میگویند نوشتهی ست استیونز دیویدُویتس» میتوانید بررسی خلاصهای از این کتاب را در وبلاگ کتابچی مطالعه نمایید.
لطفاً خودکشی نکنید!
خطرات مرتبط با تصمیمگیری حتی بر اساس معتبرترین پیشبینیکنندههای رفتار هستند. درحالی که اکثر مردم از انتخاب Google برای نمایش خط کمک سامریها به افرادی که عبارت «افکار خودکشی» را جستجو میکنند حمایت میکنند، من شک دارم که سیاست دستگیری مجرمان پیشبینیشده قبل از اینکه قانون را نقض کنند مورد توجه بسیاری قرار گیرد. مسئلهی دیگر سختگیری یا فقدان آن در علم دادههای بزرگ است. بهنظر میرسد داویدوویتس دادهای جستجوی Google را کم و بیش به ارزش اسمی آنها میرساند. او اذعان میکند که Google میتواند جنبهی دیگری از مردم را به نمایش بگذارد. که «کج به سمت ممنوعیت» را جستجو میکند. اما آیا میتوان این اثر را کمی کرد؟ بهعنوان مثال، من احساس بسیار مشکوکی را در جعبه جستجو ابراز کردهام، که توسط عبارتی ظالمانه پیشنهاد شده توسط تکمیل خودکار وسوسه میشوم، و اغلب از Google به عنوان خروجی کنجکاوی بیمارگونهی خود استفاده میکنم. با این وجود، نویسنده بهطور متقاعدکنندهای درمورد کاربردهای بالقوه و احتمالاً فراگیر شدن علم دادههای بزرگ در آینده بحث میکند.
بهشخصه، این فراگیر بودن -«کلانداده» است- بهعنوان بزرگترین نگرانی، داویدوویتس بهعنوان بزرگترین نگرانی آن را لمس میکند و قبول میکند که «کلاندادهها نیازی به سایر راههای توسعهی بشر در طی هزارهها برای درک جهان را از بین نمیبرد.» او چند نمونه خاص از مواردی که میتواند دادههای بزرگ خراب شود را میدهد. اما در مورد پیامدهای بلندمدت چه میتوان گفت؟ همانطور که افراد بیشتری شروع به درک پاداشهای قابل جمع آوری از دادههای بزرگ میکنند، خطر کاهش تقریباً همه جنبههای زندگی به یک علم داده وجود دارد. از این گذشته، ما بهعنوان یک گونه دانشمند اطلاعات بدوی هستیم. غریزه رفتن به کنار بیماران برای مراقبت از آنها به گونههای ما برای زندهماندن هزارهها کمک کرد. بعد از مشاهده و تجزیه و تحلیل بسیاری از شیوع بیماریهای مسری، ایده جداسازی برخی از بیماران بعداً مطرح شد. در این صورت ما غریزهای را که به نفع خود است بیش از حد سوار شدهایم. در زمینههای دیگر، این میتواند منجر به انکار کمک به افرادی شود که به دلیل نتایج پیشبینیشده، فشار برای کاهش حریم خصوصی و تأکید کمتر بر درک عمیق، به آن نیاز دارند.
در مورد جامعهای که شرکت ها میتوانند به طور مداوم رفتار افراد را کنترلنشده کنترل کنند، چه میکنید؟ مجموعهای از قوانین متمایز برای جلوگیری از این امر و بسیاری از آنها تلاش میکنند انگشت خود را دقیقا روی دلیل ناراحتی آنها قرار دهند. این کنترل صریح نیست، بلکه یک شکل ظریفتر، با عواقبی از جمله اعتیاد به شبکههای اجتماعی است. من میترسم از قبل شاهد اثرات آن باشیم. ما هرگز شاهد تکامل گونهای با این قدرت در اختیار آن نبودهایم. اکنون، بیش از هر زمان دیگر، ممکن است لازم باشد که تفکر انتقادی خود و ارزشهایی را که بهعنوان یک جامعه آرزو میکنیم، زیر نظر داشته باشیم. در عین حال، علم دادههای بزرگ، فرصتهای منحصربهفردی را در اختیار ما قرار میدهد. برای گسترش دانش و بهبود کیفیت زندگی، خارج از حوزهی علوم سنتی. علاوه بر ارائهی برخی از امیدهای موقت به آینده، مقاله «همه دروغ میگویند» مقاله بسیار خوبیست که اگر آدم کنجکاوی هستید یا به علم داده، و روانشناسی رفتاری علاقهمند هستید، خواندن این مقاله به شما توصیه میشود. این مقاله توسط آنا هنشل و کریستن وولکوت ویرایش شده است.
منبع: the-gist.org