תיאוריה בגרוש 2

מאזן העוצמה בין מזרח ומערב – איך אחוז הנצחונות של המזרח והמערב משתנה ככל שהעונה מתקדמת

לפני כמה זמן כתבתי טור שמטרתו היתה להציג מודל מאוד פשוט שמתאר איך הבדלים קטנים בין העוצמות של שני קונפרנסים יכולים להתפתח להבדלים מאוד גדולים אחרי כמה שנים [http://www.hoops.co.il/?p=42492]. כאן אני רוצה לתאר איך אחוז הנצחונות של הקונפרנסים משתנה ככל שהליגה מתקדמת. כמו בטור הקודם אני מניח שניתן להתייחס אל המזרח כאל מכלול אחד ואל המערב כאל מכלול בלי להיכנס לפרטים שכל קונפרנס מורכב מקבוצות שלא שוות בכוחן.

בתחילת העונה כל קונפרנס, מזרח או מערב, מתחיל עם כוח יחסי מסוים, e ו-w. כאן e ו-w מייצגים את אחוז הנצחונות בנקודת זמן מסוימת. הערך שלהם בתחילת העונה הוא "התוצר" של המודל הקודם.

אני מניח שהמזרח משחק α אחוז מהמשחקים נגד המזרח ואת השאר נגד המערב. אם  α=0.7 זה אומר שהמזרח משחק 70% מהמשחקים נגד עצמו ו-30% מהמשחקים נגד המערב.

נניח שבשבוע ישנם בממוצע שלושה משחקים. מה הוא השינוי של e בשבוע זה ? ובכן, אם קבוצה מהמזרח משחקת נגד קבוצה אחרת מהמזרח, סיכוי הנצחון הוא 50% כי אני מניח שכל הקבוצות במזרח שוות זו לזו, וישנם  3α משחקים כאלה. אם לעומת זאת המזרח משחק נגד המערב סיכוי הנצחון הוא

e/(e+w)

וישנם 3(1-α)- משחקים כאלה. כלומר סך השינוי בכמות הנצחונות של e הוא

3(α/2+(1-α)e/(e+w))

אם כך, ניתן לכתוב את השינוי ליחידת זמן של e ו-w בצורה:

equation

את השורה השניה קיבלנו מהראשונה על ידי החילוף הסימטרי של e ב-w בכל מקום.

מה הן תוצאות המודל ? בגרף 1 למטה רואים את אחוז הנצחונות של המזרח והמערב עם הזמן (הזמן הוא שרירותי, ניתן לחשוב שהוא מס' השבועות). התחלתי עם 60% הצלחה למערב ורק 40% הצלחה למזרח. מכיוון שכל קונפרנס משחק יותר עם עצמו מאשר עם הצד השני אחוז ההצלחה שואף עם הזמן לכיוון ה-50%, כלומר אחוז ההצלחה המערבי יורד עם הזמן בעוד זה של המזרח עולה. בזמן ארוך יותר ממה שנראה בגרף שניהם מתייצבים על 50%.

fig3
אחוז הנצחונות של המזרח והמערב ככל שהעונה מתקדמת. הזמן הוא שרירותי ו- alpha=0.7.

איך זה מסתדר עם נתוני ההצלחה של המזרח והמערב בפועל ? בגרף מס' 2 רואים את אחוז הנצחונות של המזרח והמערב בנקודות זמן שההפרש בינהן הוא בערך 10 ימים. לכל קונפרנס לקחתי את אחוז הנצחונות הממוצע. הנקודות הן הנתונים והקווים השחורים הם מהמודל שלי. רימיתי קצת בשתי נקודות: ראשית, מכיוון שכל קונפרנס מתחיל ביומה הראשון של הליגה ב-50% סיכויי הצלחה ואז "צולל" (מזרח) או "נוסק" (מערב) אל כוחו האמיתי, נקודת ההתחלה היא ה-30 בנובמבר 2014. שנית, לא טרחתי לברר מה הוא האלפא האמיתי ובחרתי ערך של α=0.6, כלומר שכל קבוצה במזרח משחקת 60% ממשחקיה עם קבוצות אחרות במזרח. זה נראה כאילו המגמה היא בעיקרה נכונה אם כי העקמומיות של עקומת הנתונים האמיתיים שונה מזו של המודל.

אחוז הנצחונות הממוצע של כל קונפרנס (מזרח/מערב) מול מספר הימים מתחילת הליגה. היום הראשון שמופיע הוא ה-30 בנובמבר והאחרון הוא ה-8 לפברואר. קווים שחורים הם קווי המודל עם alpha=0.6.
אחוז הנצחונות הממוצע של כל קונפרנס (מזרח/מערב) מול מספר הימים מתחילת הליגה. היום הראשון שמופיע הוא ה-30 בנובמבר והאחרון הוא ה-8 לפברואר. קווים שחורים הם קווי המודל עם alpha=0.6.

ניתן להכליל את המודל הפשוט הזה לתיאור של ליגה קצת יותר ריאליסטית בה יש N קבוצות שמשחקות האחת נגד השנייה. כולן מתחילות עם "עוצמה" מסוימת, כלומר אחוז ניצחונות מסוים, ואחוז זה גדל אם קבוצה משחקת נגד קבוצה נחותה ממנה וקטן אם היא משחקת מול קבוצה טובה ממנה. גם כאן מסתבר שכל הקבוצות שואפות לאחוז נצחונות קבוע, כפי שמשתקף מגרף 3.

השינוי של אחוז הנצחונות עם הזמן עבור "ליגה" בה ישנן 9 קבוצות שמתחילות את העונה עם אחוז הצלחה של 0.1, 0.2, 0.3, . . .
השינוי של אחוז הנצחונות עם הזמן עבור "ליגה" בה ישנן 9 קבוצות שמתחילות את העונה עם אחוז הצלחה של 0.1, 0.2, 0.3, . . .

כאן הנחתי שכל קבוצה משחקת באותה תדירות עם כל קבוצה אחרת.

המסקנה העיקרית ממודל מפושט זה היא שאחוז הנצחונות של כל הקבוצות שואף ל-50%.

מנחם לס

מנהל הופס. הזקן והוותיק מכולם בצוות. מנסה לכתוב יומית - כל זמן שאוכל!
הצטרף כמנוי
הודיעו לי על
23 Comments
הישן ביותר
חדש ביותר הנבחרות
משוב מוטבע
הצג את כל ההערות
גיא
גיא
08/04/2015 20:07:56

אלו הרבה חישובים מאוד מסובכים בשביל להגיע לנק' שאם אתה מסתכל על כל הקבוצות יחדיו אז אחוז הנצחונות הוא 50, איך זה יכול להיות אחרת כשבכל משחק יש קבוצה אחת שמנצחת וקבוצה שניה שמפסידה?

שגיא נאור
שגיא נאור
08/04/2015 20:26:09

לא הבנתי למה אי אפשר להכניס את הנתונים רק של המפגשים בין הקונפרנסים? מה הערך של המפגשים בתוך הקונפרנס לטובת חיזוק הטענה כי הפערים מצטמצמים? לא יותר פשוט לקחת את כל המפגשים בין הקונפרנסים ולחלק אותם לפי תקופות זמן או לחילופין חלוקה אחרת, נגיד קפיצות של 20 מפגשים? כל קבוצה משחקת בערך 30-35 משחקים נגד קבוצות מהקונפרנס המקביל, כלומר סה״כ בסביבות 400 משחקים בין הקונפרנסים, הכי פשוט יהיה לחלק לקבוצות יותר קטנות ולראות אם יש שינוי עם הזמן.

עגל
עגל
08/04/2015 21:19:13

לשגיא – אתה צודק, הנקודה היא שהמשחקים בין הקונפרנסים לא מקטינים את הפערים אלא מגדילים אותם. המשחקים בתוך הקונפרנסים גורמים לאחוז הנצחונות להתקרב ל-50%.
(מסתתרת פה נקודה עדינה שהעוצמה של כל קונפרנס נקבעת לפי אחוז הנצחונות בנקודת זמן מסוימת).
לגיא – סה"כ המאזן של כל הליגה הוא 50% כמו שציינת, כאן אנחנו מתחקים על ההתפלגות הלא טריוויאלית בין שני הקונפרנסים ובעיקר על ההשתנות שלה בזמן.

שגיא נאור
שגיא נאור
08/04/2015 21:55:26
הגב ל  עגל

ברור שהמשחקים בכל קונפרנס מקרבים ל50% ובגלל זה נראה כאילו ההבדלים אינם כל כך גדולים כי עומדים על בערך 55% למערב אבל דווקא בגלל זה אני לא מבין למה מראש להכניס את אותם מפגשים לתוך המאזן והגרפים. בתכלס, המשחקים בתוך הקונפרנסים לא משנים את הכיוון אבל הם מטשטשים את ההבדל האמיתי, במיוחד בגלל שרוב המשחקים משוחקים בתוך הקונפרנס

מנחם לס
מנחם לס
08/04/2015 20:32:36

המוח עייף (וזקן) מדי מכדי להיכנס לזה, אבל כפי שציינתי, ב-ESPN היו משלחמים לך עבור הנסיון.

Berch
Berch
08/04/2015 22:35:43

פתרת את הויכוח עתיק היומין בין פילוסוף לסטטיסטיקאי….
מה הסיכוי שתדרוס אותך משאית ?

חישוב הסתברותי מסובך
או 50% – או שכן או שלא…..

יפה לראות תוצאות אמת מסתדרות עם הגרף שלך…. ואל תדאג על הרמאויות הקטנות…. גדולי וטובים ממך (או כמוך) עשו את זה קודם 🙂

אורן
אורן
09/04/2015 1:53:25
הגב ל  Berch

סתם לידע (אולי אתה יודע..)

בסטטיסטיקה מסתכלים על כל תוצאות העבר ועל כל או רוב המשתנים העיקריים ולפי זה בונים מודלים שמתארים את ההתנהגות של התוצאות לפי הזמן ושאר המשתנים

בהסתברות לוקחים את המודל המתאים וחוזים בעזרתו תוצאות עתידיות בקירוב

זה בגדול. מכאן שהחישובים ההסתברותיים מאוד פשוטים כל עוד יודעים את כל הפרמטרים 🙂

אורן
אורן
09/04/2015 2:07:52
הגב ל  Berch

הדוגמה הכי טובה שיש לי זה שסטטיסטיקה מראה אחרי משחק כמה כל אחד קלע, באילו אחוזים, איך שומר מסוים השפיע על המשחק שלו..

כך זה מצטבר לעונה שלמה ואפשר להתקדם עם חישובי יעילות יותר מסובכים (השאלה כמה חשיבות נותנים לכל פעולה חיובית כמו נקודה, אסיסט ושלילית כמו איבוד, עבירה) ולראות מי ה-MVP לפי שקלול הדברים.

בעזרת זה בונים מודל הסתברותי ואפשר להשתמש בו לדוגמה במשחקי מחשב שמנתחים התפתחות של שחקן ומכניסים לזה גורמים שונים לכדי rating ושינוי בו, ויכולים גם לבצע סימולציה של משחקים בין קבוצות..

Berch
Berch
09/04/2015 9:14:13
הגב ל  Berch

זה בדיוק מה שהחבר הסטטיסטיקאי שלי היה אומר…. 🙂

אורן
אורן
09/04/2015 12:58:06
הגב ל  Berch

D:

Mbk
Mbk
08/04/2015 22:48:47

לא ירדתי לסוף דעתך
אולי כי מתפוצץ לי הראש או אולי כי על צד המומי שלי
עניין המשחקים הוא פשוט כל קבוצה משחקת 52 משחקים בתוך הקונפרנס שלה ו 30 מול הקונפרנס היריב

בעקרון לאחר פגרת האול סטאר 40% מקבוצות המערב מחוץ לתמונת הפלייאוף מול 20% מקבוצות המזרח . מעניין לבדוק את ההשפעה הזו על מאזן הקונפרנסים

אורן
אורן
09/04/2015 2:02:08

המודל מעניין אבל כמו שנאמר הוא לא יכול להביא למסקנות לגבי הבדל בין חוזק הקונפרנסים

כמו כן אפשר היה קצת לשנות ולגרום לנגזרת חיוביות למי שמתחיל מעל 1/2 ושלילית מתחת ל-1/2.. כך שהחוכמה בעצם היא לקלוע למודל הנכון וזה כמובן הרבה יותר מסובך

בכל מקרה תודה על הפוסטים המעניינים, אולי זה יגרום לאנשים להתעניין קצת יותר באנליטיקס

עגל
עגל
09/04/2015 8:23:18
הגב ל  אורן

הי אורן, כתבתי פוסט אחר על החוזק של הקונפרנסים, ראה קישור בטור הנוכחי למעלה. זה מחק די נחמד, בעיקר אם הוא עובד. אני די בטוח שהליגה מעסיקה אנשים שיודעים לכתוב מודלים כאלה או יותר ריאליסטיים.

אורן
אורן
09/04/2015 12:57:49
הגב ל  עגל

כן ראיתי, אחלה פוסט. רק אמרתי שבפוסט הזה זה לא מה שאתה בודק.. תודה.

נתן גולד
נתן גולד
09/04/2015 12:05:57

אשכרה פיתחת מערכת דינמית לחזות את מאזן הכוחות…
המרצה שלי עכשיו היה מבסוט. בשבילי לעומת זאת כל המערכות האלה כבר יצאו מכל החורים…

אפלטון
אפלטון
09/04/2015 14:56:58
הגב ל  נתן גולד

לך תדע אולי הוא המרצה שלך 😉

עגל
עגל
09/04/2015 15:38:44
הגב ל  נתן גולד

אולי המרצה של נתן הוא סומפולינסקי, אם כן זה משעשע מאוד מפני שלקחתי אצלו שני קורסים של מדעי המוח ברשתות נוירונים.

נתן גולד
נתן גולד
10/04/2015 15:10:37
הגב ל  עגל

סומפולינסקי הוא לא המרצה במקרה הזה אבל הוא מי שקבע את הסילבוס של הקורס ואני כנראה אעשה אצלו שנה הבאה את רשתות ב'. מצחיק שגם אתה למדת אצלו היה לי את הרושם שאתה בפיזיקה…

עגל
עגל
10/04/2015 16:30:53
הגב ל  נתן גולד

אני פיסיקאי אבל בצעירותי התעניינתי גם במדעי המוח, עד שסומפולינסקי הצליח להרוג את זה 🙁

נתן גולד
נתן גולד
10/04/2015 19:48:50
הגב ל  עגל

שמעתי שיש לו השפעה כזאת לפעמים…

bobby
bobby
09/04/2015 15:53:10

תמיד שנאתי סטטיסטיקה מורכבת שכזו, אבל סחתיין על המאמץ!
מסכים עם מה שרשמו פה באחת התגובות – ששווה לבדוק האם ריבוי הקבוצות במזרח בעלות סיכוי העפלה לפליאוף לקראת האולסטאר, בניגוד למערב, משפיע בצורה כזו או אחרת..

רועי ויינברג
09/04/2015 17:17:50

אחלה כתבה של הולינגר הישראלי, יש לי שאלה אחת:

אם היית מקטין את אלפא ל-0.5 אז המרחק בין הקווים של המזרח והמערב היה קטן, נכון?

עגל
עגל
09/04/2015 22:05:39

ככל שאלפא גדול יותר כך כל קונפרנס משחק יותר עם עצמו ופחות עם הצד השני, ולכן החזק "מפסיד" והחלש "מרוויח", כלומרשני הקווים צריכים להתקרב יותר האחד אל השני.