ترکیب روش‌های مدل‌سازی نظری و یادگیری ماشین: موردی از تأثیر کار تیمی بر  هزینه‌های تلاش فردی

  • صفحه اصلی
  • ترکیب روش‌های مدل‌سازی نظری و یادگیری ماشین: موردی از تأثیر کار تیمی بر  هزینه‌های تلاش فردی

ترکیب روش‌های مدل‌سازی نظری و یادگیری ماشین: موردی از تأثیر کار تیمی بر  هزینه‌های تلاش فردی

(مجله: ایده‌های نو در روان شناسی، 2024)

ترجمه مریم امینی دانشجوی

 دکتری تخصصی روان‌شناسی بالینی دانشگاه علوم پزشکی شهید بهشتی 

در این مقاله به این موضوع مهم پرداخته شده است که مدل‌های یادگیری ماشینی قدرت پیش‌بینی بالا و در مقابل، شفافیت پایینی دارند و به مقادیر زیادی داده و توان محاسباتی پیچیده نیاز دارند. بنابراین، ترکیبی از یادگیری ماشین و مدل‌های نظری می‌تواند دقت پیش‌بینی بالاتر، ارزش توضیحی بیشتر، نیاز به داده‌های کمتر و توان محاسباتی کمتر پیچیده را در مقایسه با هر یک از این دو رویکرد به تنهایی به همراه داشته باشد.

در ادامه به بخش‌هایی از این مقاله اشاره شده است:

اهمیت تبیین نظری در تحقیقات علمی به سختی قابل دست کم گرفتن است. مدل‌های نظری را می‌توان بر اساس داده‌های نسبتاً کمی توسعه داد، معمولا درک آن آسان است و می‌توان آن‌ها را در طیف وسیعی از زمینه‌ها تعمیم داد. علاوه بر این، مدل‌های نظری جهت‌گیری را در زمینه‌های تجربی پیچیده و مبهم ارائه می‌دهند که ممکن است به ویژه در مورد «داده‌های بزرگ» مهم باشد، جایی که جمع‌آوری و استفاده همه‌جانبه از مقادیر زیادی از داده‌ها برای اولین بار امکان‌پذیر است (1). با این حال، تمرکز فقط بر توضیح، تأثیر تحقیقات علمی را محدود می‌کند (2). این هم از نظر عمق و قابلیت تعمیم و هم از نظر کاربرد نتایج صدق می‌کند. در واقع، مدل‌های نظری با قدرت توضیحی بالا به طور مشابه، قدرت پیش‌بینی بالایی ندارند (3). این به نوبه خود ممکن است خطر گزارش یافته‌های مثبت کاذب را افزایش دهد (4). در واقع، «بحران تکرار» در روان‌شناسی و سایر رشته‌ها تا حدی با مشاهده اینکه تعداد قابل ‌توجهی از اثرات پیش‌بینی‌شده نظری را نمی‌توان به صورت تجربی تکرار کرد، آغاز شد. این مشکل با وجود ابتکارات جدیدتر در مطالعات تجربی، همچنان پابرجاست (5). در این جا، رویکردهای استقرایی و بیشتر پیش بینی محور ممکن است به عنوان مکمل‌های موثر برای نظریه‌های قیاسی در نظر گرفته شوند. مدل‌های یادگیری ماشین مبتنی بر داده‌های بزرگ، نمونه‌‌ای امیدوارکننده از رویکردهای استقرایی هستند. یادگیری ماشینی به عنوان مطالعه الگوریتم‌هایی تعریف می‌شود که از تجربه یاد می‌گیرند (6). در عمل، یادگیری ماشین با ارائه یک الگوریتم که به طور مستقل الگوها و قوانین کلی را استخراج می‌کند، اعمال می‌شود و می‌تواند برای پیش بینی داده‌ های جدید استفاده شود. با این حال، نتایج یادگیری ماشین با مجموعه‌ای از چالش‌ها، مانند نیاز به توان محاسباتی بالا، نیاز به به روز رسانی برای بهبود کیفیت و کمیت داده‌های آموزشی، و نیز عدم شفافیت ذاتی همراه هستند (7). با توجه به اینکه یادگیری ماشین و مدل‌سازی نظری اهداف مشابهی دارند و دارای نقاط قوت و ضعف مکمل هستند، ترکیبی از این دو ممکن است اثرات هم‌افزایی ایجاد کند. در واقع، ترکیب مدل‌سازی نظری و یادگیری ماشین به مدل‌های نظری اجازه می‌دهد تا پیش‌بینی‌های بهتری را در حین کسب بینش‌های نظری جدید انجام دهند و با شفاف‌سازی بیشتر، در عین حال نیاز به داده‌های بیشتر و توان محاسباتی بالاتر را کاهش دهد (8).

سودمندی مدل‌های نظری بسیار متنوع است، زیرا توضیح می‌دهد که چرا اثرات مشاهده‌شده باید در زمینه‌های مختلف وجود داشته باشند. همچنین، نظریه‌ها از مغالطه‌های منطقی مبتنی بر داده‌های ناهمسو جلوگیری می‌کنند و اطمینان می‌دهند که یافته‌ها به عنوان بخشی از یک کل دیده می‌شوند و به تنهایی معنا ندارند (9 و 10). حال در صورتی که مفروضات نظری در داده‌ها نمایش داده شوند، استفاده از فرضیه‌های ابطال پذیر امکان آزمون دقیق و محاسبه شده را فراهم می‌کند (11). در عمل، مدل‌های نظری به‌عنوان الگوریتم‌هایی برای مداخلات، آموزش‌ها یا شناسایی روندها و فرصت‌ها برای پیشرفت‌های آینده مفید هستند (12). علی‌رغم مزایای فراوان مدل‌سازی نظری، دام‌هایی نیز وجود دارد. برای مثال، بحران تکرار که منجر به نرخ بالاتری از مثبت‌های کاذب نسبت به نرخ خطای فرضی آلفا می‌شود (4). یادگیری ماشین ممکن است فرصت‌های امیدوارکننده‌ای را برای تکمیل فرآیندهای تحقیق قیاسی در این زمینه فراهم کند. محدودیت دیگر مدل‌های نظری، قدرت پیش‌بینی محدود آن‌ها به دلیل ساختار صرفه‌جویی است. معمولاً مدل‌های نظری در روان‌شناسی الگوهای کلی متغیرهای پیامد را پیشنهاد می‌کنند، اما نمره‌های دقیقی از نتایج مورد انتظار را برای ترکیب معینی از پیش‌بینی‌کننده‌ها مشخص نمی‌کنند. با این حال، دومی به ویژه برای کاربردهای عملی بسیار مفید خواهد بود. رویکردهای یادگیری ماشین پیش‌بینی‌محور ممکن است این محدودیت‌ها را برطرف کنند، زیرا چنین نمرات دقیقی از متغیرهای نتیجه را برای مجموعه معینی از پیش‌بینی‌کننده‌ها ایجاد می‌کنند. علاوه بر این، مدل‌های یادگیری ماشین استانداردهای اعتبارسنجی متقاطع دقیق‌تری را در مقایسه با نظریه‌های قیاسی ارائه می‌کنند. در نهایت، یادگیری ماشین می‌تواند با کشف ساختارهای ناشناخته بر اساس الگوی داده‌ها به شکل‌گیری نظریه‌ها کمک کند (8).

یادگیری ماشینی یک حوزه بین رشته‌ای به سرعت در حال رشد است که از علم آمار محاسباتی پدید آمده است. ایده کلی آن استفاده از الگوریتم‌های محاسباتی با قابلیت یادگیری برای استخراج الگوها و قوانین از مجموعه داده‌های بزرگتر است (7). سپس می‌توان از آن‌ها برای پیش بینی‌های بعدی استفاده کرد. به عبارتی، این الگوریتم‌ها در ابتدا الگوها و قوانین را از داده‌ها استخراج کرده و سپس پیش‌بینی‌ها را بهینه و قابل تعمیم می‌کنند. پس از آن، تعمیم پذیری را می‌توان با داده‌های جدید آزمایش کرد. این فرایند شبیه همان ابطال‌پذیری نظریه‌ها است. برای قدرت پیش‌بینی بالا، مدل‌های یادگیری ماشین باید بین سادگی و پیچیدگی تعادل برقرار کنند که اغلب به راه‌حل‌های کاملا پیچیده منجر می‌شود. به طور چشمگیری، این تعادل سادگی و پیچیدگی با تلاش‌های مدل‌سازی نظری برای تفکیک واریانس سیستماتیک (پیش‌بینی‌ نظری سازه‌های خاص) از واریانس غیرسیستماتیک (خطای اندازه‌گیری و تأثیرات خاص زمینه) قابل قیاس است. حوزه یادگیری ماشین روش‌های متعددی را برای یافتن این تعادل اتخاذ کرده است. مانند روش «جنگل تصادفی» که می‌تواند تعاملات متعدد و پیچیده‌ای را بین پیش‌بینی‌کننده‌های بالقوه در نظر بگیرد و نسبت به برازش بسیار قوی باشد (13). با این حال، رویکردهای یادگیری ماشین محدودیت‌هایی نیز دارند. بسیاری از فرآیندهای یادگیری ماشینی به منابع محاسباتی قابل توجهی برای اجرا نیاز دارند که این توان کدنویسی را مشکل کرده است. علاوه بر این، روش‌های پیچیده‌ای مانند «یادگیری عمیق» به مجموعه‌ بسیار بزرگی از داده‌های قابل اعتماد برای تحقق کامل پتانسیل خود نیاز دارند (7). برآورده شدن این تقاضا، حتی در عصر حاضر و با ردیابی مداوم داده‌ها، دشوار است. زیرا برای رسیدن به حجم نمونه کافی و از طرفی، رعایت استانداردهای با کیفیت کافی و نیز الزام به سیاست‌های ملی حفاظت از داده، به مکانیسم‌های فیلتر و مرتب‌سازی دقیق نیاز است. محدودیت دیگر روش‌های یادگیری ماشینی میزان شفافیت پایین آن برای انسان است. این عدم شفافیت، مطابقت بالقوه داده را با مدل‌های نظری و در نتیجه کاربردها و مداخلات عملی محدود می‌کند. این عدم شفافیت، کنترل مسائل اخلاقی را نیز دشوار کرده است (14). برای مثال، در یک مورد برجسته نشان داده شد که آمازون یک الگوریتم استخدام را بر اساس داده­های منابع انسانی خود توسعه داه است که به طور سیستماتیک علیه متقاضیان زن (برخلاف قصد قبلی)، تبعیض قائل شده است و اصلاح این سوگیری نیز ممکن نیست (15). دلیل این سوگیری این بود که متقاضیان مرد اکثریت قریب به اتفاق در بازار بودند و داده­های به دست آمده در سال‌های گذشته به طور خودکار توسط الگوریتم استفاده شده بود. بنابراین، شفافیت مدل‌های تصمیم‌گیری برای ارزیابی مسائل اخلاقی و پرورش اعتماد و پذیرش مدل‌های یادگیری ماشین بسیار مطلوب است.

در اینجا به نتایج پژوهشی که در این مقاله گزارش شده است، اشاره می‌کنیم:

در این مطالعه، انگیزه تیمی مبتنی بر نظریه (مدل تلاش جمعی) با استفاده از آرشیوی از داده‌ها شامل 1،425،926 به دست آمده از مسابقه انفرادی و امدادی شنا بررسی شده است. در حالی که نتایج پیش‌بینی بهتر را در رابطه با مدل یادگیری ماشین نشان داد، اما کاوش در مدل یادگیری ماشین با کمک روش‌های هوش مصنوعی قابل توضیح توسط نظریه زیربنایی، بینش‌های جدیدی را نیز به مدل نظری به کار برده افزود. در نهایت، ترکیب یادگیری ماشین و مدل‌سازی نظری به قدرت محاسباتی کمتری نسبت به رویکرد یادگیری ماشین به تنهایی نیاز داشت. اما از طرفی، داده‌های کمتری برای ساخت مدل به کار نبرد که ممکن است در به روز رسانی الگوریتم مطالعه اصلاح شود (8).

Resources

1. Wise AF, Shaffer DW. Why theory matters more than ever in the age of big data. Journal of learning analytics. 2015;2(2):5-13.

2. Shmueli G. To explain or to predict? Statistical Science. 2010, 25(3).

3. Yarkoni T, Westfall J. Choosing prediction over explanation in psychology: Lessons from machine learning. Perspectives on Psychological Science. 2017 Nov;12(6):1100-22.

4. Simmons JP, Nelson LD, Simonsohn U. False-positive psychology: Undisclosed flexibility in data collection and analysis allows presenting anything as significant. Psychological science. 2011 Nov;22(11):1359-66.

5. Scheel AM, Schijen MR, Lakens D. An excess of positive results: Comparing the standard psychology literature with registered reports. Advances in Methods and Practices in Psychological Science. 2021 Apr;4(2):25152459211007467.

6. Mitchell TM. Artificial neural networks. Machine learning. 1997 Jan;45(81):127.

7. Alzubi J, Nayyar A, Kumar A. Machine learning from theory to algorithms: an overview. InJournal of physics: conference series 2018 Nov (Vol. 1142, p. 012012). IOP Publishing.

8. Eisbach S, Mai O, Hertel G. Combining theoretical modelling and machine learning approaches: The case of teamwork effects on individual effort expenditure. New Ideas in Psychology. 2024 Apr 1;73:101077.

9. Ashkanasy NM. Why we need theory in the organization sciences. Journal of Organizational Behavior. 2016 Nov;37(8):1126-31.

10. Lange D, Pfarrer MD. Editors’ comments: Sense and structure—The core building blocks of an AMR article. Academy of Management Review. 2017 Jul;42(3):407-16.

11. Sutton RI, Staw BM. What theory is not. Administrative science quarterly. 1995 Sep 1:371-84.

12. Makadok R, Burton R, Barney J. A practical guide for making theory contributions in strategic management. Strategic Management Journal. 2018 Jun;39(6):1530-45.

13. Joel S, Eastwick PW, Finkel EJ. Is romantic desire predictable? Machine learning applied to initial romantic attraction. Psychological science. 2017 Oct;28(10):1478-89.

14. Mangino AA, Smith KA, Finch WH. Modeling ResponsiblyToward a Fair, Interpretable, and Ethical Machine Learning for the Social Sciences. InTMS proceedings  2021 Nov 3.

15. Cook J. Amazon scraps “sexist AI” recruiting tool that showed bias against women. The Telegraph. 2018 Oct;10(10).

آدرس انجمن روان‌شناسی ایران:

تهران، سیدخندان، ابتدای سهروردی شمالی، کوچه سلطانی (قرقاول)، پلاک ۳۷، طبقه سوم

کدپستی: 

1555716755

تلفن:  09367740873 (ساعت پاسخگویی: شنبه تا چهاشنبه، از ساعت 9 الی 14)

فکس: 86120659

کلیه حقوق برای انجمن روانشناسی ایران محفوظ است. – 1400©

طراحی سایت توسط شرکت مهندسی اشاره شرق