EPV: כשכדורסל ושחמט נפגשים / אלמוני

MBK – הקדמה

את הפוסט הבא קיבלתי לכתובת האימייל שלי מבחור נהדר שביקש לפרסם את הפוסט אך לשמור על אלמוניותו

הפוסט נהדר ומוסיף נדבך סטיסטי יוצא מן הכלל שהיה חדש בעבורי

EPV: כשכדורסל ושחמט נפגשים.

ב2006 נפגשו אלוף העולם בשחמט דאז, קראמניק, ותוכנת המחשב דיפ פריץ, למלחמת עולם בין האדם והמכונה. אחרי שהמשחק הראשון הסתיים בתיקו (כרגיל אצל קראמניק, שחקן הגנה קשוח הרבה יותר מאינדיאנה מודל סוף 2013) הגיע המשחק השני אשר נקרא לאחריו – "המשגה של המאה". לא אכביד במילים ומי שרוצה יכול לקרוא על זה בקישור הבא –

http://en.wikipedia.org/wiki/Blunder_(chess)#Deep_Fritz_vs._Vladimir_Kramnik אך בקיצור יחסי – קראמניק, שהיה בעמדת תיקו בכלים השחורים (שזה כמו לשחק בחוץ) פיספס מט במהלך אחד! שזו טעות ברמה שילד שמשחק שחמט כמה שנים לא אמור לטעות, או במונחי הופס – דוראנט מחטיא 100 הטבעות קלות רצופות במתפרצת כשהוא לבד.

אמנם היו כמה הקלות כמו למשל התחלת הקשר עם אם ילדיו לעתיד

http://en.chessbase.com/post/marie-laure-germon-marries-vladimir-kramnik

  וקונספירציות למיניהן, אך מה שבטוח הוכח- שאפילו אדם מהחכמים ביותר והמרוכזים ביותר בפלנאטה מסוגל לטעות טעות מחפירה, מה שלעולם לא יקרה למכונה, וכן שהמכונה עברה את האדם.. מאז לא מתחרים אלופי שחמט בתכונות מחשב אלא רק נעזרים בהם למשחקיהם ואימונהם.

ומה שקרה בשחמט קורה לנגד עיננו גם בעולם הnba (והספורט האמריקאי כככל..) אז אמנם עוד לא נחליף את השחקנים ברובוטים (למרות שכנראה אם  הייתי מנסה לייצר אחד כזה הוא לא היה נראה רחוק מלברון) אך בהחלט ניתן להגיד שהיום הדעה הרווחת הינה שהמצלמות באולמות מבינות כדורסל יותר טוב מהמאמנים והשחקנים וכל בני האנוש כולם.

זהו בעצם הepv או expected possession value או בתרגום מאוד חופשי – ערך הפוסישן הצפוי. שזה מונח שניקבע ע"י אסופה של דוקטורנטים בהארווד שאוהבים כדורסל, ואוהבים מספרים אפילו יותר, כאשר ביקשו מהם לקחת את כל הנתונים בכמה החודשים ראשונים שמצלמות הספורט וי.יו הותקנו ב14 האולמות הראשונים, סה"כ 800 מיליון פוזשנס. את כל המאמר תוכלו לקרוא בלינק בhttp://grantland.com/features/expected-value-possession-nba-analytics אך אנסה להסביר טיפה את  החלק הטכני של המאמר.

כדי לעשות זאת אחזור שוב פעם לשחמט. בתורת המשחקים ישנו משפט מוכח ששחמט הינו משחק סופי. כלומר בשחמט, אם נריץ את כל המהלכים (קשה למצוא את המספר המדויק אבל זה 10 בחזקת המון ומספר שקשה לתופסו) נגיע ל"תוצאה" של השחמט. אם נקביל זאת למשחקים פשוטים אז באיקס עיגול, לדוגמא, אם כולם משחקים הכי טוב ה"תוצאה" הינה תיקו. במי אומר את המספר הגבוה ביותר השחקן האחרון תמיד ינצח. כך גם בשחמט- ישנה תוצאה למשחק. אמממאי? החישוב הוא כל כך מסובך שאין לנו מספיק כוח חישוב כדי לפתור את משחק השחמט. (אוכל בשמחה לכתוב את ההוכחה שהינה הוכחה שגם ללא ידע מתמטי אוניברסיטאי ניתן להבין, אם יהיו מספיק דורשים) אז איך בכל זאת המכונה קרעה את האדם??

בעצם מה שעושים זו ההערכה לסיטואציה/עמדה שיש על הלוח (כדרך אגב שיטה זו נהוגה בהרבה אלגוריתמים של בינה מלאכותית) אם תור הלבן  ויש ללבן מט במסע הבא אז הלוח הזה "זוכה" לווליו גבוה. שני צעדים לפני, הלוח מבחינת השחקן הלבן היה בניקוד יחסית גבוה כנראה כי הוא הצליח להגיע למט במסע אחד. אם לבן שוקל לבצע מסע שלאחריו השחור יקח לו את המלכה – כנראה שהמסע הזה לא טוב ללבן והלוח לאחר המסע הזה ינוקד בניקוד נמוך. כך בעצם כל מצב על הלוח מקבל איזשהו ניקוד וכאשר המחשב מקבל לוח מסוים אז הוא בודק כמה שלבים קדימה לכל צעד אפשרי שיש לו,  מחשב את התוחלת של כל הלוחות האפשריים לצעד מסויים וקובע את הניקוד לצעד זה, כאשר המתכנת קובע כמה צעדים לעומק התוכנה תבדוק (כלומר האם לבדוק 3 צעדים שזה לבן שחור לבן או 10 צעדים שזה לבן שחור לבן שחור כפול 5)  באופן כללי מזינים את תוכנות המחשב האלו בכל משחקי השחמט שהיו אי פעם בערך כדי ליצור את הניקוד לעמדה מסוימת בלוח (בעמדות שוות יחסית , קשה להניח מה הניקוד, כאן נכנסת ההיסטוריה בין אלופים – כמה פעמים הלבן ניצח מעמדה זו וכמה השחור)

כך זה הepv – נותנים לכל פוזישן של 10 שחקני כדורסל את התוחלת של מספר הנקודות לפוזישן הזה. למשל – אם לברון עומד מתחת לסל, לבד,  אז התוחלת של העמדה קרובה מאוד (מאוד) ל2 נקודות. אם הארווד עומד בסוף המגרש עם שניה על השעון ושלושה שחקנים יריבים לידו – התוחלת של המהלך קרובה מאוד (מאוד) לאפס..

הביטו  בסרטון הבא:


מי יצא המלך?

הרוב יגידו שקוואמי, הרוב באתר כנראה שיגידו פארקר. אולי בעצם הרוב יגידו שהפלח..

בכל מקרה כולם עשו את שלהם אבל איך זה נראה מבחינת הepv?

כשבאנר נותן לפארקר את הכדור 9 שניות לסיום הepv הוא 0.97 (כלומר בתוחלת אנו מצפים שהספרס ייקלעו קצת פחות מנקודה בכל התקפה שמתחילה בעמדה המדויקת הזו – שזה לא מספיק כי קליבלנד מובילים בשתיים..) אחרי החסימה מדאנקן וההתקרבות לסל הepv עולה ל1.36 ואחרי המסירה לקוואמי הפנוי אנחנו מגיעים ל1.75 שזה עדיין אומר שהוא יצא מלך שהוא הכניס את הכדור פנימה (לא כתוב בכתבה אבל מ1.75 ל3 זה 1.25 epv לטעמי..) אבל פארקר העלה את הepv מהרגע שהוא קיבל את הכדור עד שהוא שיחרר אותו ב0.78..

כאן בעצם אנחנו מקבלים תפנית באיך להסתכל על סטיסטיקה של המשחק בעידן החדש – לא כמה קלע שחקן מסוים אלא כמה הוא היה שווה בepv פר גיים..

כדי להוכיח שהשיטה טובה, נסו לנחש מי השחקן שיש לו את הepv הגבוה ביותר? כנראה שאם תצטרכו לנחש 5 שחקנים כמעט כולם יכללו את כריס פול שאכן לוקח את המקום הראשון ב ל3.98 לגיים. את המקום האחרון לוקח, מי שאני די בטוח שהפרופ היה מנחש ב5 הגרועים ביותר,  ריקי רוביו עם 3.3 – , בעיקר בשל הקליעה הממש גרועה שלו (זה נכנס לתוך חישוב הepv).

ולמרות זאת בטבלה של 10 הראשונים ו10 האחרונים תמצאו כל מיני הפתעות למינהם. כדאי לזכור שהנתונים הינם לעונת 2012-13, רק על חצי מהאולמות בליגה ורק על שחקנים עם 100 נגיעות בעונה שזה מוריד די הרבה שחקנים. כמו כן כנראה שככל שיהיה יותר נתונים על השחקנים ועל עוד עמדות ועוד זמן עם הפונקציות האלה הההערכה תהיה יותר מדויקת. סה"כ לקח לתוכנות המחשב כמה שנים טובות כדי לנצח את קראמניק. הנה הטבלה – יש כמעט קבוצה שלמה בטור המינוסים וכמעט קבוצה שלמה בטור הפלוסים חפשו אותם.. (פארקר 20 ולברון 23 לתוהים מבינכם)

וכך נראה לוח של חישוב epv ממשחק של סאן אנטוניו ואוקלהומה:

 

כבר נראה שאנחנו מתחילים להבין את המהפך שהנתונים האלו גורמים למשחק ההופס, אך אני עדיין מאמין שהרוב עוד תלוי בשחקנים הגדולים ומה הם מסוגלים לעשות – למרות שהקבוצת המכונה, שאני בטוח שמסתמכת על השיטות האלה המון, סאן אנטוניו, איכשהו שוב מובילה את הליגה הזו.

או אולי צריך לשאול את צוות האימון של סאן אנטוניו כמה לדעתם שווה הepv של בוש מלפני הריבאונד עד למסירה לאלן באותו גיים 6 המקולל?

 

מנחם לס

בעל האתר ועורך ראשי

לפוסט הזה יש 28 תגובות

  1. תודה רבה על הפוסט! 🙂
    למדתי על השח בקורס אינטליגנציה מלאכותית ותמיד כיף להיזכר.
    מדהים ההפרש של כריס פול משאר הליגה.

  2. פוסט מרתק על נושא שידוע לי. אני קראתי את רוב המאמרים של אנשי הרווארד ו-MIT בקשר ל-EPV ואינדיקטורים אחרים.
    מה שמפריע לי בקריאה זאת האלמוניות של הכותב.
    מהי הפרנוייה הישראלית הזאת? הכותב הוא לא הראשון שמעדיף להישאר אלמוני במקום להתגאות בפוסט שכתב, ועוד להשתמש בו ברזומה שלו יום אחד. מה כבר יכול לקרות לטוב או לרע לבן אדם שמפרסם פוסט חשוב כל כך אך מעדיף להתחבא מאחורי אלמוניות.
    לי זה מפריע.
    אני שם את שמי, את תמונתי, את תמונתה של אשתי, של בנותי, של נכדותי, ואף פעם לא בא שודד לביתי.
    מה שלי מפריעה זו התנועה בארץ. שעה להגיע מנוד השרון לקניון שבעת הכוכבים, ועוד שעה לחזור הביתה. מה זה משנה אם אתה גר בהוד השרון ולוקח לך שעה להגיע להרצליה, 10 מייל בקושי, או שעה וחצי מאטלנטה – 120 מייל מהבית? הכל בערך אותו דבר. ומאחר ומחירי הדלק כאן הם פי ארבע כמעט, הכל בערך שווה.
    חוזרים לסרט בסינמה סיטי (עוד שעה נסיעה?) סרט שהזקנה החמיצה בבית PHILOMENA ב-4, ומ-7 אני עם חברים בטיווי עד אמצע הלילה.
    להשתמע!

  3. משובח וכתוב נהדר ופשוט.
    פעולות בהגנה גם כן נחשבות?
    בדיוק לפני שבוע קראתי באי אס פי אן כתבה על קטגוריה סטטיסטית חדשה (נראה לי שזה היה rpm- real plus minus) שבעצם בודקת כמה השחקן תורם לקבוצה שבה נחשו מי היה במקום הראשון?
    תאמינו או לא אבל ריקי רוביו.
    זה שאותו שחקן מופיע בשני קצוות של קטגוריות סטטיסטיות שבעצם באות למדוד משהו דומה מראה עד כמה רחוק הכדורסל מה״סופיות״ של שח-מט.
    לשמחתנו זה לא משחק שאפשר לשחק עם רובוטים וגם מחשב העל בעוד 100 שנה (אלא אם כן יקראו לו יבור 3.0) לא היה מנחש שקונטיקט תזכה באליפות המכללות

      1. נכון הוא היה בכתבה אחרת שדיברה על המובילים הלא צפויים.
        http://insider.espn.go.com/nba/story/_/id/10742364/real-plus-minus-all-stars/refresh/true
        זה מה שקורה שכותבים מזיכרון.
        עדיין- מהמובילים בליגה והכי גרועים בליגה בקטגוריות ששניהן אמורות למדוד יעילות ותרומה לקבוצה בכל רגע נתון, זה קצת מוזר ומוריד מהאמינות של כל הסטטיסטיקות החדשות האלו

  4. ההבדל בין האדם למכונה הוא מה שמחזיק את הליינים של ההימורים בווגאס…
    לך תצפה מישהו כמו ג'יי אר סמית. עם כל נתוני העבר שתאסוף לא תצליח.
    בכל זאת, מעניין
    ובכדורגל אולי… ממש עוד מעט… יש סיכוי… לא רע… שבקרוב….
    יכניסו את מצלמת קו השער.
    מצחיק

  5. בכדורסל קשה למדוד את יחסי הגומלין בין שחקן למשניהו חוץ מאשר בתוצאה. כך שכריס פול שחקן נהדר ויעיל כולם יודעים. אך אישיותו הדומיננטית גורמת לשחקנים לעיתים לפחד להעז או לקחת יוזמה (עם הזמן המועט שהוא משאיר לאחרים לגעת בכדור). הוא שחקן מספיק טוב כך שהביא קבוצות בינוניות לפלייאוף. בכמעט כל מדד הוא מרשים. השוני השנה הוא שגריפין סוף סוף הבין כמה הוא טוב והפסיק להסס כל כך. כשפול חזר גריפין לא מתבייש לדרוש את הכדור ולהזיז אותו לעיתים הצידה כעושה משחק כשפול בוויק סייד.

  6. כתבה מרתקת מאד, אם כי יש לי המון ביקורת על הנושא.
    1. האם ניתן לומר מהמסקנות, שריקי רוביו מזיק לקבוצתו ?
    2. הכל מבוסס על ממוצעים, שנכונים רק בכמות אינסופית של דגימות.
    אם קוואמי היה מחטיא זריקה כזו עדיין היו אומרים שפארקר עשה מהלך עם EPV חיובי ? את מי זה מעניין אם הוא הפסיד. האם יהיו לו עוד אינסוף הזדמנויות כדי "ליישר" את הממוצע ?
    3. כמות האפשרויות היא אינסופית, לדעתי, ולא ניתנת לפורמליזציה
    לדוגמא: אם שחקן עומד 7 מטר מהסל. האם שומר עליו אחד או שניים. האם הוא עם הפנים לסל או 90 מעלות לסל. 91 מעלות וכו.
    4. לפי השיטה הזו מייקל עשה מהלכים עם EPV נמוך מאד כשקלע 8 שלשות מתוך 10 על הפרצוף של דרקסלר (הרי האחוז שלו מהשלוש לא היה גבוה בכלל).
    לעניות דעתי, ניתן לומר שכל הווינרים הגדולים עושים בסוף משחק מהלכים גדולים שאולי הם בעלי EPV נמוך אבל האינסטינקט שלהם , שנבנה במהלך השנים, מביא אותם לעשות.

    בכל מקרה הנושא מרתק ותודה רבה על העלאתו אפילו שנראה לי שקצת משועממים בהרוורד

  7. קודם כל תודה למידן שפירסם. חשבתי על מה שמנחם ורועי כתבו ובאמת לפחות שם לתגובות לפוסט כדאי שאסדר לעצמי. ואנונימי בפיתה היה תפוס.. תודה על התגובות וחשבתי שיהיה נחמד לענות לחלקם או כולם. קודם כל דיוק קטן שאני לא בטוח שהוא מובן מהכתוב – ההוכחה היא שיש תוצאה לשחמט. זה ששחמט הינו משחק סופי זה פועל יוצא מחוקי המשחק (המצבים שנראים אינסופיים הם למעשה תיקו לפי החוק) את ההוכחה אכתוב באיזשהו שלב בלי נדר.. אפלטון-בקשר לפי.אר.אמ ניסיתי לקרוא על זה אבל אין מספיק מידע שם על איך בדיוק הם מודדים את זה אז אני בטח אחפור על זה שבוע הבא.. אבל כרגיל במספרים אפשר להגיע לכל מיני תוצאות השאלה מי ניצח.. בגדול האי.וי.פי מהכתבה לא חישב הגנה למרות שבעתיד הוא יעשה את זה (ימדוד את המיקומים של השחקנים) ואז נראה יותר שחקני אינדי בטופ של הדירוג, וגם את רוביו,ופחות שחקני פורטלנד לדעתי. ברך – אי אפשר לצפות אמנם, אבל בריצה לטווח ארוך הסטיסטיקה תתישר וגיי.אר יפסיד.. ג'ון – נראה לי הביטחון שהוא נוסך בשחקנים עולה בגלל שהוא שם שחקנים במקום הנכון, אבל כמובן יש צדק בדברך, אלו בני אדם.. אורי 88 – 1. באיזשהי מידה בהתקפה ניתן להגיד שכן. ושהייתי לוקח את פול קודם במשחק בשכונה. 2 צודק אבל זה המעט שאפשר לעשות לדעתי. בלונג רנ סא מנצחים כבר 15 שנה כי לפלח חשוב שייקחו זריקות נכונות לדעתי אפילו שהם לא לקחו אליפות שנה שעברה. 3 מסכים. בגלל זה נראה לי שייקח להם עוד כמה שנים עד שזה יהיה מושלם. גם בשחמט יש מלא אפשרויות.. 4. מסכים לחלוטין. זה מה שהתכוונתי בסוף הפוסט. אבל אין הרבה גורדנים.. חג שמייח..

  8. פוסט מעניין מאד אלמוני. אני לא בטוח שהבנתי עד הסוף את אופן החישוב של המצבים בכדורסל, אבל אני מקווה שזה לא את רמת היצירתיות של שחקנים שידרשו להיות מתוכנתים למצבים שלא מאפשרים יותר מדי חופש פעולה כך שהמשחק יתבסס בעיקר על רמת ביצוע גבוהה של מצבים ידועים מראש. אם לשם המשחק הולך לדעתי זה רק יגרע מההנאה.
    בכל אופן היה מרתק לקרוא תודה.

  9. הערה שחמטית.
    המט שקרמניק קבל ע"י מלכה ח7 היה כנראה בדוחק זמן, בעמדה שלא נראית מסוכנת(לא היתה התקפה ממושכת של דיפ פריץ, ובעמדה בה הוא חשב שהוא עשה מסע שגורם לשיוויון והצעת תיקו מיידית.
    להשוות את זה להחמצת 100 ליי אפים של דורנט לבד ברציפות זה עלבון לכל מי שמבין קצת שחמט וקצת כדורסל.
    הסיכוי שדורנט יעשה את זה כשהוא בהכרה ולא בסימום כבד הוא מספר כה קטן שצריך אפס נקודה אלפיים אפסים של אחוז.
    השגיאה של קרמניק יכולה לקרות. אחת ל 200 מקסימום.
    כל שאר המאמר שעוסק בתוחלת הצלחה של עמדות מעניין ולדעתי כבר מיושם בהרבה קבוצות.

כתיבת תגובה

סגירת תפריט