ترکیب روشهای مدلسازی نظری و یادگیری ماشین: موردی از تأثیر کار تیمی بر هزینههای تلاش فردی
(مجله: ایدههای نو در روان شناسی، 2024)
ترجمه مریم امینی دانشجوی
دکتری تخصصی روانشناسی بالینی دانشگاه علوم پزشکی شهید بهشتی
در این مقاله به این موضوع مهم پرداخته شده است که مدلهای یادگیری ماشینی قدرت پیشبینی بالا و در مقابل، شفافیت پایینی دارند و به مقادیر زیادی داده و توان محاسباتی پیچیده نیاز دارند. بنابراین، ترکیبی از یادگیری ماشین و مدلهای نظری میتواند دقت پیشبینی بالاتر، ارزش توضیحی بیشتر، نیاز به دادههای کمتر و توان محاسباتی کمتر پیچیده را در مقایسه با هر یک از این دو رویکرد به تنهایی به همراه داشته باشد.
در ادامه به بخشهایی از این مقاله اشاره شده است:
اهمیت تبیین نظری در تحقیقات علمی به سختی قابل دست کم گرفتن است. مدلهای نظری را میتوان بر اساس دادههای نسبتاً کمی توسعه داد، معمولا درک آن آسان است و میتوان آنها را در طیف وسیعی از زمینهها تعمیم داد. علاوه بر این، مدلهای نظری جهتگیری را در زمینههای تجربی پیچیده و مبهم ارائه میدهند که ممکن است به ویژه در مورد «دادههای بزرگ» مهم باشد، جایی که جمعآوری و استفاده همهجانبه از مقادیر زیادی از دادهها برای اولین بار امکانپذیر است (1). با این حال، تمرکز فقط بر توضیح، تأثیر تحقیقات علمی را محدود میکند (2). این هم از نظر عمق و قابلیت تعمیم و هم از نظر کاربرد نتایج صدق میکند. در واقع، مدلهای نظری با قدرت توضیحی بالا به طور مشابه، قدرت پیشبینی بالایی ندارند (3). این به نوبه خود ممکن است خطر گزارش یافتههای مثبت کاذب را افزایش دهد (4). در واقع، «بحران تکرار» در روانشناسی و سایر رشتهها تا حدی با مشاهده اینکه تعداد قابل توجهی از اثرات پیشبینیشده نظری را نمیتوان به صورت تجربی تکرار کرد، آغاز شد. این مشکل با وجود ابتکارات جدیدتر در مطالعات تجربی، همچنان پابرجاست (5). در این جا، رویکردهای استقرایی و بیشتر پیش بینی محور ممکن است به عنوان مکملهای موثر برای نظریههای قیاسی در نظر گرفته شوند. مدلهای یادگیری ماشین مبتنی بر دادههای بزرگ، نمونهای امیدوارکننده از رویکردهای استقرایی هستند. یادگیری ماشینی به عنوان مطالعه الگوریتمهایی تعریف میشود که از تجربه یاد میگیرند (6). در عمل، یادگیری ماشین با ارائه یک الگوریتم که به طور مستقل الگوها و قوانین کلی را استخراج میکند، اعمال میشود و میتواند برای پیش بینی داده های جدید استفاده شود. با این حال، نتایج یادگیری ماشین با مجموعهای از چالشها، مانند نیاز به توان محاسباتی بالا، نیاز به به روز رسانی برای بهبود کیفیت و کمیت دادههای آموزشی، و نیز عدم شفافیت ذاتی همراه هستند (7). با توجه به اینکه یادگیری ماشین و مدلسازی نظری اهداف مشابهی دارند و دارای نقاط قوت و ضعف مکمل هستند، ترکیبی از این دو ممکن است اثرات همافزایی ایجاد کند. در واقع، ترکیب مدلسازی نظری و یادگیری ماشین به مدلهای نظری اجازه میدهد تا پیشبینیهای بهتری را در حین کسب بینشهای نظری جدید انجام دهند و با شفافسازی بیشتر، در عین حال نیاز به دادههای بیشتر و توان محاسباتی بالاتر را کاهش دهد (8).
سودمندی مدلهای نظری بسیار متنوع است، زیرا توضیح میدهد که چرا اثرات مشاهدهشده باید در زمینههای مختلف وجود داشته باشند. همچنین، نظریهها از مغالطههای منطقی مبتنی بر دادههای ناهمسو جلوگیری میکنند و اطمینان میدهند که یافتهها به عنوان بخشی از یک کل دیده میشوند و به تنهایی معنا ندارند (9 و 10). حال در صورتی که مفروضات نظری در دادهها نمایش داده شوند، استفاده از فرضیههای ابطال پذیر امکان آزمون دقیق و محاسبه شده را فراهم میکند (11). در عمل، مدلهای نظری بهعنوان الگوریتمهایی برای مداخلات، آموزشها یا شناسایی روندها و فرصتها برای پیشرفتهای آینده مفید هستند (12). علیرغم مزایای فراوان مدلسازی نظری، دامهایی نیز وجود دارد. برای مثال، بحران تکرار که منجر به نرخ بالاتری از مثبتهای کاذب نسبت به نرخ خطای فرضی آلفا میشود (4). یادگیری ماشین ممکن است فرصتهای امیدوارکنندهای را برای تکمیل فرآیندهای تحقیق قیاسی در این زمینه فراهم کند. محدودیت دیگر مدلهای نظری، قدرت پیشبینی محدود آنها به دلیل ساختار صرفهجویی است. معمولاً مدلهای نظری در روانشناسی الگوهای کلی متغیرهای پیامد را پیشنهاد میکنند، اما نمرههای دقیقی از نتایج مورد انتظار را برای ترکیب معینی از پیشبینیکنندهها مشخص نمیکنند. با این حال، دومی به ویژه برای کاربردهای عملی بسیار مفید خواهد بود. رویکردهای یادگیری ماشین پیشبینیمحور ممکن است این محدودیتها را برطرف کنند، زیرا چنین نمرات دقیقی از متغیرهای نتیجه را برای مجموعه معینی از پیشبینیکنندهها ایجاد میکنند. علاوه بر این، مدلهای یادگیری ماشین استانداردهای اعتبارسنجی متقاطع دقیقتری را در مقایسه با نظریههای قیاسی ارائه میکنند. در نهایت، یادگیری ماشین میتواند با کشف ساختارهای ناشناخته بر اساس الگوی دادهها به شکلگیری نظریهها کمک کند (8).
یادگیری ماشینی یک حوزه بین رشتهای به سرعت در حال رشد است که از علم آمار محاسباتی پدید آمده است. ایده کلی آن استفاده از الگوریتمهای محاسباتی با قابلیت یادگیری برای استخراج الگوها و قوانین از مجموعه دادههای بزرگتر است (7). سپس میتوان از آنها برای پیش بینیهای بعدی استفاده کرد. به عبارتی، این الگوریتمها در ابتدا الگوها و قوانین را از دادهها استخراج کرده و سپس پیشبینیها را بهینه و قابل تعمیم میکنند. پس از آن، تعمیم پذیری را میتوان با دادههای جدید آزمایش کرد. این فرایند شبیه همان ابطالپذیری نظریهها است. برای قدرت پیشبینی بالا، مدلهای یادگیری ماشین باید بین سادگی و پیچیدگی تعادل برقرار کنند که اغلب به راهحلهای کاملا پیچیده منجر میشود. به طور چشمگیری، این تعادل سادگی و پیچیدگی با تلاشهای مدلسازی نظری برای تفکیک واریانس سیستماتیک (پیشبینی نظری سازههای خاص) از واریانس غیرسیستماتیک (خطای اندازهگیری و تأثیرات خاص زمینه) قابل قیاس است. حوزه یادگیری ماشین روشهای متعددی را برای یافتن این تعادل اتخاذ کرده است. مانند روش «جنگل تصادفی» که میتواند تعاملات متعدد و پیچیدهای را بین پیشبینیکنندههای بالقوه در نظر بگیرد و نسبت به برازش بسیار قوی باشد (13). با این حال، رویکردهای یادگیری ماشین محدودیتهایی نیز دارند. بسیاری از فرآیندهای یادگیری ماشینی به منابع محاسباتی قابل توجهی برای اجرا نیاز دارند که این توان کدنویسی را مشکل کرده است. علاوه بر این، روشهای پیچیدهای مانند «یادگیری عمیق» به مجموعه بسیار بزرگی از دادههای قابل اعتماد برای تحقق کامل پتانسیل خود نیاز دارند (7). برآورده شدن این تقاضا، حتی در عصر حاضر و با ردیابی مداوم دادهها، دشوار است. زیرا برای رسیدن به حجم نمونه کافی و از طرفی، رعایت استانداردهای با کیفیت کافی و نیز الزام به سیاستهای ملی حفاظت از داده، به مکانیسمهای فیلتر و مرتبسازی دقیق نیاز است. محدودیت دیگر روشهای یادگیری ماشینی میزان شفافیت پایین آن برای انسان است. این عدم شفافیت، مطابقت بالقوه داده را با مدلهای نظری و در نتیجه کاربردها و مداخلات عملی محدود میکند. این عدم شفافیت، کنترل مسائل اخلاقی را نیز دشوار کرده است (14). برای مثال، در یک مورد برجسته نشان داده شد که آمازون یک الگوریتم استخدام را بر اساس دادههای منابع انسانی خود توسعه داه است که به طور سیستماتیک علیه متقاضیان زن (برخلاف قصد قبلی)، تبعیض قائل شده است و اصلاح این سوگیری نیز ممکن نیست (15). دلیل این سوگیری این بود که متقاضیان مرد اکثریت قریب به اتفاق در بازار بودند و دادههای به دست آمده در سالهای گذشته به طور خودکار توسط الگوریتم استفاده شده بود. بنابراین، شفافیت مدلهای تصمیمگیری برای ارزیابی مسائل اخلاقی و پرورش اعتماد و پذیرش مدلهای یادگیری ماشین بسیار مطلوب است.
در اینجا به نتایج پژوهشی که در این مقاله گزارش شده است، اشاره میکنیم:
در این مطالعه، انگیزه تیمی مبتنی بر نظریه (مدل تلاش جمعی) با استفاده از آرشیوی از دادهها شامل 1،425،926 به دست آمده از مسابقه انفرادی و امدادی شنا بررسی شده است. در حالی که نتایج پیشبینی بهتر را در رابطه با مدل یادگیری ماشین نشان داد، اما کاوش در مدل یادگیری ماشین با کمک روشهای هوش مصنوعی قابل توضیح توسط نظریه زیربنایی، بینشهای جدیدی را نیز به مدل نظری به کار برده افزود. در نهایت، ترکیب یادگیری ماشین و مدلسازی نظری به قدرت محاسباتی کمتری نسبت به رویکرد یادگیری ماشین به تنهایی نیاز داشت. اما از طرفی، دادههای کمتری برای ساخت مدل به کار نبرد که ممکن است در به روز رسانی الگوریتم مطالعه اصلاح شود (8).
Resources
1. Wise AF, Shaffer DW. Why theory matters more than ever in the age of big data. Journal of learning analytics. 2015;2(2):5-13.
2. Shmueli G. To explain or to predict? Statistical Science. 2010, 25(3).
3. Yarkoni T, Westfall J. Choosing prediction over explanation in psychology: Lessons from machine learning. Perspectives on Psychological Science. 2017 Nov;12(6):1100-22.
4. Simmons JP, Nelson LD, Simonsohn U. False-positive psychology: Undisclosed flexibility in data collection and analysis allows presenting anything as significant. Psychological science. 2011 Nov;22(11):1359-66.
5. Scheel AM, Schijen MR, Lakens D. An excess of positive results: Comparing the standard psychology literature with registered reports. Advances in Methods and Practices in Psychological Science. 2021 Apr;4(2):25152459211007467.
6. Mitchell TM. Artificial neural networks. Machine learning. 1997 Jan;45(81):127.
7. Alzubi J, Nayyar A, Kumar A. Machine learning from theory to algorithms: an overview. InJournal of physics: conference series 2018 Nov (Vol. 1142, p. 012012). IOP Publishing.
8. Eisbach S, Mai O, Hertel G. Combining theoretical modelling and machine learning approaches: The case of teamwork effects on individual effort expenditure. New Ideas in Psychology. 2024 Apr 1;73:101077.
9. Ashkanasy NM. Why we need theory in the organization sciences. Journal of Organizational Behavior. 2016 Nov;37(8):1126-31.
10. Lange D, Pfarrer MD. Editors’ comments: Sense and structure—The core building blocks of an AMR article. Academy of Management Review. 2017 Jul;42(3):407-16.
11. Sutton RI, Staw BM. What theory is not. Administrative science quarterly. 1995 Sep 1:371-84.
12. Makadok R, Burton R, Barney J. A practical guide for making theory contributions in strategic management. Strategic Management Journal. 2018 Jun;39(6):1530-45.
13. Joel S, Eastwick PW, Finkel EJ. Is romantic desire predictable? Machine learning applied to initial romantic attraction. Psychological science. 2017 Oct;28(10):1478-89.
14. Mangino AA, Smith KA, Finch WH. Modeling ResponsiblyToward a Fair, Interpretable, and Ethical Machine Learning for the Social Sciences. InTMS proceedings 2021 Nov 3.
15. Cook J. Amazon scraps “sexist AI” recruiting tool that showed bias against women. The Telegraph. 2018 Oct;10(10).