האם המוח שלנו אופטימלי? — הכל בראש
מדעי המוח, תכנות, חברה, כלכלה, זכויות יוצרים וכל דבר אחר שעובר לי בראש

האם המוח שלנו אופטימלי?

תגיות:‏ , , ,

בשעטו"מ, התפרסם המאמר הראשון שלי בעיתון PLoS Computational Biology. העיתון הזה הוא Open Access, כך שאפשר לקרוא את המאמר כולו באתר, או להוריד גרסת PDF. חוץ מזה, החלטתי לנסות לספק כאן גרסה ידידותית יותר (ואם לא ידידותית, אז לפחות בעברית…).

כמו שראינו בדוגמאות אחרות, מה שאנחנו תופסים הוא לא יצוג מדויק של מה שקורה בעולם, אלא פרשנות שלנו על מה שמספרים לנו החושים.

בשנים האחרונות יש תאוריה שהפכה למקובלת מאוד, שמנסה להסביר את הרציונל מאחורי מנגנון הפרשנות הזה, ולכמת אותו באופן מדויק. התאוריה נקראת התאוריה הבייסיאנית, על שם חוק בייס עליו היא מבוססת (והוא נקרא על שם מי שניסח אותו, תומאס בייס). אני אחסוך מכם את התאור המדויק של החוק, ורק אציין שזהו הכלל המתמטי שבעזרתו אפשר, בין היתר, לחשב מה היא הדרך הנכונה והטובה ביותר לשקלל מידע ממקורות שונים, אם יודעים כמה כל אחד מהמקורות הללו מדויק. כאמור, בשנים האחרונות יש מאמרים רבים שמסבירים תופעות פסיכולוגיות בעזרת ההנחה שהמוח שלנו מפעיל את חוק בייס, ומשלב בתהליך התפיסה ידע מוקדם (לדוגמה, ידע על שכיחות המילים בשפה) יחד עם התצפיות (מה שהעין מדווחת למוח שהיא רואה) כדי ליצור את מה שבסופו של דבר יהיה התפיסה שלנו (ההחלטה הסופית לגבי מה היא המילה שאתם חושבים שקראתם).

מה הבעיה? לא ברור בכלל מניין למוח יש את הידע המוקדם (שכיחות המילים בשפה, לדוגמה). במחקרים שחוקרים משימות בהן אנחנו מאומנים מאוד, כמו קריאת טקסט או זיהוי פרצופים, אפשר כנראה להניח שפשוט למדנו את הסטטיסטיקה לאורך שנים של אימון. הבעיה היא שיש גם מחקרים בהם אפשר לראות השפעות של סטטיסטיקה של הגירויים בניסוי עצמו, אליה הנבדק לא נחשף, חוץ מאשר כמה דקות במעבדה.

עוד בעיה בתאוריה הזו מגיעה מכיוון אחר: בספרות הפסיכולוגית יש הרבה דוגמאות להשפעה של אירועים מסוימים על התפיסה של אירועים שקורים אחריהם. ניסויים רבים בפסיכולוגיה מורכבים מחזרות רבות על "צעד" ניסוי בסיסי. למשל, אפשר לחשוב על ניסוי בו נותנים לנבדק להעריך משקל של עצמים שונים, בזה אחר זה. בניסויים רבים מסוג זה מוצאים השפעה של גירויים מצעדים קודמים על התגובה של הנבדק בצעד הנוכחי, למרות שהוראות הניסוי דורשות מהנבדק להתעלם מגירויים קודמים ולענות על מה שהוא נשאל עכשיו. בהסבר הבייסיאני אין לתצפיות בצעדים הקודמים תפקיד ישיר בהחלטה, והעובדה שהן כן משפיעות, והתצפיות האחרונות משפיעות יותר מהתצפיות שהיו לפניהן, מהווה בעיה שקשה להסביר בעזרת התאוריה הבייסיאנית.

המחקר הנוכחי עוסק בשאלה כיצד פועל המנגנון הזה: איך משפיעה ההיסטוריה קצרת הטווח של הגירויים הקודמים שנחשפנו אליהם על התפיסה של הגירוי הנוכחי, ומה זה יכול ללמד אותנו לגבי השאלה האם המוח באמת פועל באופן אופטימלי כפי שהתאוריה הבייסיאני טוענת.

המשימה בה אנחנו משתמשים היא פשוטה מאוד: משמיעים לנבדק 2 צלילים בזה אחר זה, ושואלים אותו מי מהם היה גבוה יותר.
לחצו כאן כדי לשמוע הדגמה של 5 צעדי ניסוי. ניסוי אופיני במעבדה כולל כמה מאות צעדים כאלה.

אינטואיטיבית, הינו מצפים לתוצאות הבאות: ככל שזוג הצלילים קרוב יותר זה לזה, כך המשימה קשה יותר, וסיכוי ההצלחה יהיו נמוכים יותר. אם הצלילים שונים מאוד זה מזה, סיכוי ההצלחה אמורים להיות טובים. אם שני הצלילים גבוהים יחסית, או נמוכים יחסית, זה לא אמור להשפיע (כל עוד אנחנו בתחום בו בני אדם שומעים טוב בערך באותה מידה). אולם, כפי שניתן לראות בגרף הבא, התוצאות נראות שונה מאוד מהציפיה הזו.

איור 2 מתוך המאמר

נתחיל מצד שמאל (פאנל A) – כל נקודה בגרף מייצגת צעד ניסוי אחד של נבדק אחד. הנקודה בצבע כחול אם התשובה היתה נכונה, ובצבע אדום אם לא. המיקום בציר X של הנקודה מייצג את הגובה של הצליל הראשון בזוג והמיקום בציר ציר Y מייצג את הגובה של הצליל השני. סביב האלכסון מרוכזים הצעדים הקשים, בהם היינו מצפים שהביצועים יהיו הכי נמוכים. בצד ימין (פאנל B) אפשר לראות את אותם נתונים מקובצים כך שהצבע שניתן לכל אזור מייצג את אחוז התשובות הנכונות בו – צבע בהיר מסמן אחוזי דיוק גבוהים, וצבע כהה מייצג אחוזי דיוק נמוכים (יש מקרא בצד). שימו לב במיוחד לשני הריבועים המסומנים בחצים. למרות שהמרחק שלהם מהאלכסון (כלומר, ההפרש בין הצלילים, או הקושי של הצעדים בהם) זהה, בריבוע שעליו מצביע החץ העליון הנבדקים ענו נכון ב- 50.3% מהמקרים (שזה בעצם אומר שהם מנחשים, כי יש רק 2 תשובות אפשריות), ואילו בתחתון הם ענו נכון ב- 93.3% מהמקרים כלומר כמעט תמיד נכון. סה"כ ניתן לראות את התופעה הבאה: כאשר שני הצלילים גבוהים, יש לנבדקים העדפה לענות שהצליל השני גבוה יותר (וכאשר זו באמת התשובה הנכונה, מעל האלכסון, זה משפר את אחוזי הדיוק, ומתחת לאלכסון זה מוריד את אחוזי הדיוק).  כאשר הצלילים נמוכים, יש לנבדקים העדפה לענות שהצליל הראשון גבוה יותר. כיצד ניתן להסביר את ההטיה הזו?

ההסבר הבייסיאני

שימו לב שיש חוסר סימטריה בין הצליל הראשון לצליל השני. את הצליל הראשון צריך לזכור במשך הצעד עד שמושמע הצליל השני, כדי שנוכל להשוות ביניהם. לכן, בזמן ההשוואה התפיסה שלנו לצליל הראשון היא פחות מדויקת. נניח לרגע מקרה קיצוני בו הנבדק שכח לגמרי את הצליל הראשון עד שהגיע הצליל השני. מה הוא יכול לעשות כדי לענות? הוא יכול לנחש, אבל אז הביצועים שלו לא יהיו כל כך טובים. אפשרות יותר טובה היא להשוות את הצליל השני לסטטיסטיקה של הצלילים בניסוי – אם הצליל השני הוא מהצלילים הגבוהים ביותר שמשתתפים בניסוי, סביר להניח שהוא גם גבוה יותר מהצליל הראשון… נחזור עכשיו למקרה היותר סביר, בו הנבדק לא שכח לגמרי את הצליל הראשון, אלא רק הזכרון שלו פחות מדויק מהזכרון של הצליל השני. במקרה כזה אפשר לחשב בעזרת חוק בייס, מה צריך לעשות כדי למקסם את סיכויי ההצלחה. מבלי להכנס למתמטיקה (שאפילו במאמר מתוארת רק בנספח…) הפתרון יוצא במקרה זה, שצריך להשוות בין הצליל השני, לממוצע משוקלל כלשהו של הצליל הראשון, יחד עם הסטטיסטיקה של הגירויים. אפשר לחשוב על זה כעל "דחיפה" או "כיווץ" של הצליל הראשון לעבר הצליל הממוצע בניסוי (השם של התופעה הזו באנגלית הוא Contraction Bias).

במאמר אנחנו מציגים תוצאות שמראות שהמודל הביסיאני אכן מסביר את התופעה שתארנו קודם: אם נקח לדוגמה את הריבוע באיור 2B שמסומן בחץ העליון – שני הצלילים נמוכים יותר מהממוצע, והצליל הראשון נמוך עוד יותר מהשני. ה"כיווץ" של הצליל הראשון לכיוון הממוצע מעלה אותו בתפיסה שלנו, וגורם לו להשמע גבוה יותר מהצליל השני, למרות שבמציאות הוא היה נמוך יותר, ולכן זה גורם לאחוזי הביצוע הנמוכים באזור הזה. בריבוע המסומן בחץ התחתון, שני הצלילים נמוכים, אבל הצליל הראשון גבוה מעט מהשני. הכיווץ שלו לכיוון הממוצע גורם לנו לשמוע אותו אפילו יותר גבוה, ולכן דווקא לענות נכון במרבית המקרים.

הבעיות בהסבר הבייסיאני

יש 3 בעיות עיקריות בהסבר הבייסיאני:

  1. ההסבר דורש שלנבדק יהיה ידע לגבי התפלגות הצלילים בניסוי. מכיוון שהניסוי קצר יחסית, לא ברור איך בדיוק הנבדקים לומדים את הסטטיסטיקה כל כך מהר.
  2. בניסוי שלנו הסטטיסטיקה לא משתנה – הצלילים מוגרלים כל הזמן לפי אותם חוקים. מכיוון שכך, מי שרוצה ללמוד את הסטטיסטיקה, צריך לתת משקל שווה לתצפיות המוקדמות והמאוחרות – אין סיבה להניח שהצלילים ששמענו בתחילת הניסוי או הצלילים ששמענו לפני רגע הם "מייצגים יותר" מאשר צלילים אחרים. כל הצלילים "מייצגים" את הסטטיסטיקה באותה מידה. בכל זאת, אפשר לנתח באיזו מידה הנבדקים מסתמכים על צלילים קודמים, והתוצאה היא שהם נותנים משקל גבוה מאוד לצלילים שהם שמעו אחרונים, וכמעט לא מייחסים משקל לצלילים מוקדמים יותר.
  3. עשינו ניסוי שני, בו הסטטיסטיקה של הצלילים נבחרה באופן מיוחד, כדי "להטעות" את המנגנון הזה. בחרנו צלילים בעיקר מהאזורים שמסומנים באפור באיור 2A, כלומר, האזורים בהם השימוש במנגנון הכיווץ בעיקר פוגע בביצועים. אם אכן המערכת לומדת את הסטטיסטיקה של הצלילים בניסוי, ומשתמשת בה באופן אופטימלי כדי לשפר את הביצועים לפי חוק בייס, היינו מצפים שתלמד את הסטטיסטיקה החדשה הזו, ותמנע משימוש במנגנון זה, כי הוא פוגע בביצועים. זה לא מה שקרה – מתוצאות הניסוי עולה שהמערכת הקוגניטיבית השתמשה באותה אסטרטגיה בדיוק, למרות שזו גרמה לפגיעה בביצועים.

הסבר פשוט יותר

אנחנו מציעים מודל פשוט יותר, היוריסטי (כלומר, מבוסס על כללי אצבע, ולא על חישוב מדויק כמו התאוריה הבייסיאנית), בו המערכת הקוגניבית ממשקלת את הצליל הראשון יחד עם משקל מסוים להיסטוריה קצרת הטווח. ההיסטוריה קצרת הטווח היא פשוט ממוצע נע, שמתעדכן בעצמו באופן דינמי לפי התצפיות שמגיעות. עדכון זה יוצר את ההעדפה והמשקל הגבוה יחסית שניתן לצעדים האחרונים.

אנחנו מראים במאמר שכל 3 התופעות שהצגנו (אפקט הכיווץ, השפעה של הצלילים האחרונים על התפיסה, וחוסר גמישות להתאים לתנאים חדשים) מסתדרים עם המודל הפשוט הזה.

מסקנות

מעבר למסקנות הספציפיות לגבי אופן ביצוע המטלה של הבחנה בין צלילים, העבודה הנוכחית מתחברת לדיון גדול יותר – האם המוח שלנו פועל באופן אופטימלי? למרות שקיימות עדויות רבות להטיות ולחוסר אופטימליות באופן הפעולה של המוח (בין המפורסמות שבהן, אלו של כהנמן וטברסקי, ושל דן אריאלי), נראה שעדיין מאוד אופנתי, בעיקר בקרב אנשי מדעי המוח החישוביים-תאורטיים להניח שהמוח פועל באופן אופטימלי. התוצאות שלנו מחזקות דווקא את העמדה שטוענת שהמוח פועל בעזרת כללי אצבע. כללי האצבע הללו לא נבחרו באופן אקראי – הם הותאמו, אולי במהלך האבולוציה, לתנאים מסוימים, ובהם הכללים האלה מתפקדים טוב, ולפעמים אפילו נראים כאופטימליים בסיטואציות מסוימות. אבל, אי אפשר להסיק מכאן את מה שתומכי התאוריה הבייסיאנית היו רוצים להסיק – שהמוח פועל באופן אופטימלי בכל סיטואציה שהיא.

FacebookEmailDeliciousShare


6 תגובות

1 ארז‏11.01.12 ‏בשעה 1:42 pm‏

מאוד מעניין וגם מוסבר בצורה טובה וברורה. מאוד מזכיר את ההתפתחות בתחום הכלכלה (כפי שהזכרת בהקשר כהנמן וטברסקי), למרות עדויות רבות נגד, הנטייה היא להמשיך עם מודל האדם הרציונלי/מוח אופטימלי. אני תוהה אם זה נובע מהטייה בפני עצמה, משהו בסגנון של הטייה אגואיסטית שמניחה שאנחנו טובים יותר ממה שאנחנו באמת (הטייה בשיפוט החסרונות שלנו, האם בדקו הטייה כזו?). יש עוד הרבה מה לכתוב והמאמר שלך העלה לי המון רעיונות, אבל התגובה שלי ארוכה מדי גם ככה… (גיליתי הוכחה נפלאה, אך השוליים צרים מלהכילה).

2 עפרי רביב11.01.12 ‏בשעה 2:21 pm‏

ארז,
תודה.
יש הרבה מחקרים שמצביעים על הטיה של אנשים לדרג את עצמם כטובים יותר ממה שהם באמת. למשל זה שמדבר על כך שאנשים מדרגים את עצמם בממוצע כטובים יותר מ- 3/4 מהאנשים האחרים, ובערך 40% מהאנשים שמדרגים את עצמם כחלק מהעשירון העליון בביצוע סוגים שונים של עבודות. אולי יש גם הטיה דומה להעריך את עצמנו יתר על המידה גם כמין, ולא רק כפרטים, כמו שאתה מציע, אם כי אני לא מכיר עבודות שבחנו את זה ספציפית.

3 אורי‏11.02.12 ‏בשעה 8:31 pm‏

יפה מאוד. נהניתי לקרוא.

4 יובל‏11.18.12 ‏בשעה 12:04 pm‏

מאד מוצלח ומזל טוב על המאמר.
דרך אגב, גם בתחום שעבדתי בו קודם, חקר תאים, יש איזה הנחה מובלעת שתאים עובדים באיזו אופטימליות נפלאה כזאת, למשל מבחינת המטבוליזם שלהם. אני תוהה אם זה סתם מעיד על נסיון לפצות על חוסר במידע או שזו אמונה מוגזמת באבולוציה.
בכל מקרה, מחזק את ידיך בשחרור משימוש מופרז בתיאוריה הבייסיאנית.

5 טל ירון12.11.12 ‏בשעה 8:08 am‏

מרשים מאד, ומזל טוב!

נראה שהאסכולה שלך נוטה לכיוון של היורסטים. אני בעד :-)

קהנמן מדגים בספרו Thinking fast and slow עשרות מקרים ממגוון רחב של דיסיפלינות, לכך שהמוח שלנו חושב בעיקר באמצעות מודלי חשיבה היוריסטים (system1). ונראה שהניסיוי שלכם מחזק את הטענה של קהנמן וטברסקי. רק לעיתים נדירות, על פי קהנמן, המוח חושב בצורה "רציונלית" (system2). מהניסיון שלי בתהליכי קבלת החלטות קבוצתיות, אני מקבל הרבה אישושים לטענה של קנהמן. ולכן, אני מנסה לברר כיצד ובאילו אמצעים ותנאים אפשר להגביר את השימוש ב-system2. וכדי לעודד קבלת החלטות "רציונליות ומושכלות יותר", אני מנסה ליצור תנאים שיוצרים אופטימום לחשיבה רציונלית.

כיום אני יודע לזהות כמה מצבים שיצרו חשיבה היוריסטית וכמה מצבים(וטכניקות) שיצרו חשיבה "רציונלית".

אשמח לעקוב אחר עבודתך וללמוד. כל כך יפה לראות, איך בנחישות ובמקצועיות, אתה מבסס את השאלות בהן אתה עוסק.

בהצלחה,
טל

6 רון‏08.03.13 ‏בשעה 2:52 pm‏

עפרי, אם יחיד "זוכר" (יותר נכון "מאחזר" או "ניזכר") את גובה הצליל הראשון – הייתי מבקש הסברים לדברים הבאים: איך מיוצג גובה של צליל בזיכרון (הפועל, working memory) או לטווח ארוך? איזו תאורית זיכרון מתארת זיכרון צלילי? השני – אם אין ייצוג בזיכרון של צליל (הראשון או בכלל) האם ההחלטה מתבססת על הסתברות לגובהו – כי אז איך הסתברות כזו (וכמובןההתפלגות שממנה היא מחושבת) מיוצגת, ואם תכונותיה האחרות ידועות (זו אחת האפשרויות). השלישי – בהנחה שהאפשרות האחרונה תקפה (זמנית, לצורך בחינתה) האם ההתפלגויות תלויות (לפחות מתואמות, לא סיבתית) בגובהי הצלילים (בניסוי או שנפגשו בהם בחיים).
תודה

השארת תגובה

ניתן להשתמש בתגיות הבאות: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>