סתמיסטיקה/מתן גילור

הבהרה מקדימה: כל המספרים בטור הם הערכות אישיות שלי, אבל בגדול משקפים היטב את התמונה אותה אני מנסה להציג.

*

"ישנם שלושה סוגי שקרים – שקרים, שקרים ארורים וסטטיסטיקה" (בנימין ד'יזראלי).

היכולת של סטטיסטיקה לשקף את המציאות משתנה בין ענפי הספורט השונים. ישנם ענפי ספורט בהם הסטטיסטיקה תופסת חלק מינורי של עד 10%, כגון כדורגל. התנאים צריכים להיות מאד דומים או שיהיו לנו סטטיסטיקות מאד מתקדמות או שהפערים יהיו עצומים, כדי שנוכל להגיע למסקנות הנכונות. ישנם ענפים בהם הסטטיסטיקה היא יותר משמעותית, כגון בייסבול, בו ממוצע חבטות של שחקן לאורך העונה, קל וחמר לאורך קריירה, נותן לנו מספר שאנחנו יכולים בנקל לחוות עליו דעה מבלי שראינו את השחקן. ישנם ענפי ספורט בהם סטטיסטיקה היא כמעט הכל כמו כדורת או אתלטיקה, לא כל שכן כשהיום יודעים לבצע נרמול בין תקופות ותנאי רוח/גובה/טמפרטורה. באופן די פשוט, מבלי שראינו את ג'סי אוונס, אנחנו יכולים לדעת האם הוא מאיץ (ספרינטר) טוב יותר לא רק מטומי כפרי אלא גם מקארל לואיס או יוסיין בולט.

אבל אנחנו התכנסנו כאן כדי לדבר על כדורסל. בכדורסל, להערכתי, הסטטיסטיקה, קרי הניתוח הכמותי, משקף כ-50% מהמציאות בעוד שהניתוח האיכותי וכן מראה עיניים נותנים את 50% הנוספים.

סטטיסטיקה יכולה לשמש אותנו בשני אופנים עיקריים:

  1. זיהינו תופעה מסוימת במשחק ואנחנו רוצים לבדוק האם יש לה תימוכין כמותי. אם נבחר בדוגמה פשוטה – שמנו לב שדיאנדרה ג'ורדן לוקח הרבה כדורים חוזרים והלכנו לבדוק אם להרגשתנו יש אחיזה במציאות (ולא משנה כרגע איך בחרנו להגדיר "הרבה").
  2. נתקלנו בפרט סטטיסטי מסוים והלכנו לראות איך הוא בא לידי ביטוי במציאות. אם שוב נבחר בדוגמה של ג'ורדן, ראינו שהוא קולע באחוזים גבוהים מהשדה (ואם השתמשנו בסטטיסטיקות מתקדמות, אפילו ראינו מהיכן מגיעות הזריקות והקליעות שלו), אבל רק כשנראה מספיק זריקות וקליעות נבין את הקושי האמיתי שנדרש ממנו לשם כך. או נבין האם הוא קולע פנוי ליד הטבעת כי יש לו תנועה מופתית או שמע חדירות של שחקני חוץ מושכות את השומרים שלו ומותירות אותו פנוי.

היתרון הגדול שנותנת לנו הסטטיסטיקה היא המוחלטות. אם שחקן א' קלע 30 נקודות ושחקן ב' קלע 20 נקודות, אז שחקן א' קלע יותר משחק ב' ולא משנה אם היתה לנו הרגשה אחרת. ייתכן שהוא עשה זאת באמצעות זריקות קלות יותר או באחוזים נמוכים יותר, אבל את העובדה הראשונית לא ניתן לשנות. האם הנתון לעיל מספר לנו משהו על יכולותיו של השחקן? לא בהרכח, אבל הוא בהחלט יכול לתת לנו נקודת מוצא טובה להתחיל ממנה ולבדוק עוד נתונים סטטיסטים קשורים וכן לצפות במשחק עצמו ולהבין איך הנתון בא לידי ביטוי.

בנוסף, בסטטיסטיקה ניתן להגדיר קריטריונים. לצורך העניין, אנחנו יכולים להגדיר שאם שחקן קלע 10% יותר נקודות משחקן אחר וב-10% יותר נקודות לכל פוזשן ושניהם באותה העמדה, אזי שהוא מייצר נקודות טוב יותר. כלומר, אם הסכמנו על הגדרה מספרית מסוימת, ייתכן שהיא תיתן לנו הכרעה מוחלטת למחלוקת כלשהי. זאת בניגוד לניתוח איכותי שרווי לא רק באי הסכמות, אלא במסקנות שונות לגבי אותו בסיס נתונים.

עם זאת, אם מענים את הנתונים מספיק זמן ומספיק חזק, בסופו של יום, הם יראו כמעט כל מה שנבקש מהם. למשל, פלוני משחק בעמדת הרכז ולוקח 7 כדורים חוזרים למשחק מתוך 8 הזדמנויות. מנגד אלמוני שהינו שחקן ציר לוקח 10 כדורים חוזרים למשחק מתוך 15 הזדמנויות. כמו כן, בעוד שפלוני עושה זאת באמצעות ניחוש מושכל של מיקום נפילת הכדור וכן באמצעות סגירה נכונה של שחקן יריב, אלמוני מוריד את הכדורים החוזים מקצה הקרש. במצב כזה, אין כל בעיה למי שיבחר לטעון לטובת כל אחד מהם כריבאונדר טוב יותר. בשביל לקבל תמונת מצב אמיתית, יש לצפות בהם ולקבל "תחושה", שמתחשבת בעמדה, בסגנון, בשחקנים אחרים אותם ראינו וכיו"ב. בסופו של דבר, נגיע למסקנה שמסתמכת הן על הסטטיסטיקה והן על ה"תחושה".

אבל…(וזה אבל גדול), יש גבול כמה אנחנו יכולים לתת מקום לתחושה ולהתעלם מהסטטיסטיקה. אם למשל פלוני קולע 30 נקודות למשחק ב-50% אפקטיבי ואלמוני קולע 29 נקודות למשחק ב-49% אפקטיבי, אי אפשר לומר באופן מוחלט שפלוני מייצר נקודות טוב יותר מאלמוני. ברם, אם פלוני קולע 30 נקודות למשחק ואלמוני רק 10 נקודות למשחק ופלוני גם עושה זאת ב-20% טוב יותר, באותה הליגה ובאותה התקופה, בהחלט שניתן לומר שהוא מייצר נקודות טוב יותר. כן, אפילו מבלי לראות אותם משחקים ולו דקה בודדת. כמובן שככל שהפערים הסטטיסטים מצטמצמים, יש צורך במראה עיניים וכן בסטטיסטיקות מתקדמות יותר. אז אם המצב הראשון שתיארנו נותן לנו אותי 5% מהיכולת לשפוט מי קולע טוב יותר והמצב השני כבר נותן לנו 99%, אז מצב ביניים כמו שחקן א' קולע 30 נקודות ב-50% ושחקן ב' קולע 25 נקודות ב-45% נותן לנו 80% מהמסקנה הסופית, שזה די הרבה. האם זה אומר שבלי לראות נוכל להגיע בוודאות למסקנה הנכונה? לאו, אבל זה בהחלט נותן לנו אפשרות לקבל ניחוש מושכל או, לכל הפחות, נותן לנו נקודת מוצא די איתנה לבסס עליה גם את הניתוח האיכותי כשניגש לשלב הצפייה.

ואם לכל הנ"ל נוסיף את זה שפלוני גובר סטטיסטית על אלמוני בעוד פרמטרים של המשחק כגון כדורים חוזרים, אסיסטים, חטיפות, חסימות, יחס אסיסטים/איבודים וכיו"ב, המסקנה שלנו לגבי קביעת השחקן הטוב יותר בהחלט תוכל להתבסס על הנ"ל באופן לא מבוטל. כמובן שהרבה יותר מאשר במצב בו לא היתה הכרעה כה ברורה לטובת אחד מהם. ואם לכל זה גם נוסיף שלפלוני יותר תארים אישיים (לרבות בחירות לחמישיות וכדומה) ויותר תארים/הישגים קבוצתיים, כבר נוכל לבסס מסקנה שהסיכוי שתסטה מהמציאות קיים, אך נמוך. את ההשלמה למסקנה הסופית אין לנו ברירה לבצע באמצעות צפייה במספיק זמן משחק הן של פלוני והן של אלמוני וכן בשיפוט בהתאם לתקופה בה כל אחד שיחק, לשאר השחקנים ששיחקו איתם/נגדם ועוד.

לסיכום, בכדורסל, צפייה במשחקים וסטטיסטיקה שלובות זו בזרועה של זו וכמעט בלתי אפשרי להגיע למסקנות חותכות ללא שימוש משולב בשתיהן. חוטא למציאות מי שמנסה לבסס את מסקנתו על מודלים סטטיסטיים בלבד, אך חוטא לה לא פחות מי שמנסה לבסס את מסקנתו רק על מראה עיניים ולא מייחס לניתוח הסטטיסטי את המשקל הראוי לו.

כמובן שיש מקומות בהם לסטטיסטיקה משקל רב יותר (קליעה) ומקומות בהם לצפייה במשחק משקל רב יותר (מנהיגות) ואין זה סותר את הטור לעיל.

בסופו של יום, הכי קל לסיים דיון ב"לא מעניין אותי מה ראו עיינך, המספרים מראים אחרת" או "ספורט הוא לא מספרים והתבססות עליהן מראה על חוסר הבנה" או שפשוט אפשר לנהל דיון כשהטיעונים לא מתעלמים ממראית עין, אך בו בזמן יודעים לתת גם למספרים את מקומם הראוי.

לפוסט הזה יש 15 תגובות

    1. הכל בגוגל. אפילו אני שיודע מה זה PER ניכנס לגוגל לוודא. אז מציע לך לעשות אותו דבר, אלא אם כן ישנו איש צוות (לא אני) שמוכן להגדיר את כל המונחים בהם משתמשים ב-NBA

  1. מסכים איתך, אסור להתבסס על הבוקס סקור הפשוטה ביותר בשביל ללמוד הכל על שחקנים, דיאנדרה והווארד עשו המון מוניטין בזכות ריבאונדים ובלוקים למרות שהיו שחקני הגנה טובים מהם

  2. כמובן שסטטיסטיקה ואבחנה יכולים להיות שונים, אבל בכמה שיותר משחקים אתה חוזה, אבחנתך והסטטיסטיקה יתקרבו יותר ויותר.
    השחקנים שאנחנו יודעים מהסתכלות שהם צלפי שלשות, ברוב המקרים הם בעלי אחוזי קליעה גבוהים, ואותו דבר בשאר היכולות.
    וכמובן ישנם מספרים שלא משקרים אף פעם כגון אחוזי קליעה מהפאולים, מספר הפאולים ששחקן זוכה למשחק (שהם אינדיקציה לחדירה לסל) או מספר הפאולים ששחקן מבצע בממןצע לזמן נתון, וכו'.,

  3. בסוף היום הנתונים החשובים הם רק W/L…

    ועדיין יש הרבה נתונים שחסרים בשביל למדוד שחקן קבוצתי בכלים סטטיסטים:

    – כמות הקילומטר שעבר במהלך הדקות על המגרש יחסית לכלל הדקות שבמשחק

    – כמות הפעילות שגרמה לנקודות לחובתו של השחקן

  4. נחמד מאוד.
    צריך להבין דבר אחד בקשר לסטטיסטיקה. היא כלי,
    והשאלה היחידה היא איך משתמשים בו.

    מי שמגיע עם תזה כתובה מראש, לא יתקשה לערוך מניפולציות בנתונים הסטטיסטים בשביל להוכיח שהוא צודק
    (ע"ע נערי האוצר, כל פרופסור לכלכלה שאי פעם שמעתי מדבר, וכמות לא מבוטלת של פרשני כדורסל…)

    להבדיל, מי שמגיע עם ראש פתוח – יכול לפעמים ללמוד דברים חדשים,
    שלא בהכרח עברו כראוי במבחן "העין".

  5. טור משובח.
    אהבתי ביותר את המשפט האחרון. כל כך נכון והלוואי ואנשים היו מצליחים להבין את זה במקום להתבצרבעמדתם

    וחשוב לזכור
    סטטיסטיקה אינה מסוכנת
    השימוש הלא נכון בה הוא המסוכן
    🙂

  6. פוסט מצוין על נושא חשוב. הסתכלות על נתון סטטיסטי אחד משולה למשל הידוע של העיוורים והפיל, האחד ממשש את החדק ואומר "זה נחש",השני מישש את הרגל ואמר "זה עץ" וכ"ו.
    מבחינה מתימטית יותר, המשחק מתואר על ידי פרמטרים רבים והוא פונקציה רב-מימדית. כל סטטיסטיקה בודדת היא חיתוך, או היטל, של הנתונים הרב-מימדיים על ציר אחד.

  7. הכי חשוב זה לזכוג מה אתה בא לבדוק. בסטטיסטיקות קבוצתיות זה קל יותר, כי יש לך אבסטרקציה מסויימת ואתה יכול להצמיד את המדד לניצחונות/+- מול היריבות, אבל זה קשה יותר לאינגיבידואלים

  8. כשרואים שחקן עם סטטיסטיקה מרשימה לכל הדעות כמו למשל שיש לבירד, אז ברור רק מזה שמדובר בשחקן איכותי מאוד, אך כדי לדעת עד כמה איכותי צריך לדעת נתונים נוספים כי בירד היה כוכב-על והפורוורד הטוב ביותר בכל הזמנים לא רק בגלל הסטטיסטיקה אלא בגלל תכונות ויכולות נוספות.

  9. פרדוקס הסטטיסטיקה:
    בעבודתי, אני משתמש רבות בסטטיסטיקה על מנת להוכיח את מה שרציתי להוכיח (ממילא)
    אני מודע היטב לניצול הרע של המדע הזה כי ע"י הגדרת השאלה, אתה יכול להגיע לאיזו תוצאה שאתה רוצה.

    אדגים זאת בשאלה הפשוטה מי השחקן הטוב ביותר בהיסטוריה של ה- NBA. אם אבחר את הפרמטר הפשוט ביותר (מס' אליפויות), אגיע לתשובה אחת ויחידה (שאני מאמין בה בכל ליבי): ביל ראסל.
    עכשיו בואו נראה אתכם מתווכחים איתי ללא שימוש בפרמטרים אחרים.

    לכן, כדאי שניקח בזהירות ובהסתייגות רבה מאד את הנתונים של מדע הסטטיסטיקה שמגיעים ב- NBA לאבסורדים מטורפים.

כתיבת תגובה

סגירת תפריט