הטור הזה הוא מעין המשך לטור 'סתמיסטיקה' שכתבתי בעבר. בקצרה, בטור הקודם התייחסתי לכך שעל פי רוב לא ניתן להגיע למסקנות חותכות רק על ידי שימוש בסטטיסטיקה הזמינה בעת הנוכחית, אבל בהחלט מדובר על כלי חשוב שניתן ללמוד ממנו רבות, שיכול לאשש/להפריך תזות שונות ומשונות, ובעיקר כלי שאסור להתעלם ממנו. כל זאת, אם יודעים להשתמש בנתונים הנכונים, במקומות הנכונים ובשילוב עם צפייה במשחקים עצמם. בכל מקרה, מומלץ לקרוא את הטור הקודם כהקדמה, כיוון שהטור הנוכחי נשען על החזקות אשר כתובות בו ולא אחזור עליהן.
*
עכשיו בואו נעבור לדבר קצת על מדדים. בענף הכדורסל קיימים מדדים מפורסמים יותר או פחות ונפוצים בשימוש בפורומים אלה ואחרים יותר או פחות. אני מעוניין להתייחס למדדים הנפוצים, כגון: PER, RPM וכיו"ב.
ראשית, חשוב להבין מה נותנים לנו המדדים. גם אם אין אנו בקיאים בנוסחה, בבואנו לבחון את מדד PER למשל, כדאי שנבין שמדובר על ציון שמקבל לוח המספרים של השחקן לעומת הביצועים הממוצעים של כלל האוכלוסייה הנבדקת. למה זה חשוב? בדוגמה של שימוש במדד PER זה חשוב כי הנחה סבירה היא שממוצע הרמה בליגה, כפי שמשתקפת בלוח המספרים של כל שחקן ושחקן, די דומה בין שנים סמוכות, זולת הבדלים מינוריים ולא מהותיים. נכון, אפשר להניח שהליגה היום יותר איכותית מאשר בשנות ה-60' של המאה הקודמת, אולם לא סביר להניח שהיא טובה מהליגה לפני שלוש עונות. הווה אומר שהמדד נותן לנו ציון של השחקן ביחס לתקופתו. עם זאת, הנחה שהרמה בין שתי סדרות גמר סמוכות היא דומה איננה סבירה, כיוון שמדובר על שינויים פרסונליים גדולים מדי, הטיית הכושר הרגעי ועוד. כעת ניתן להחליט האם, כמה ומתי להשתמש במדד הזה, לרבות השוואה בין עונות שונות.
לא פחות חשוב מהנזכר לעיל, ואולי אף יותר, הוא עניין המתאם – האם קיים מתאם חיובי בין מדד מסוים לבין דעת הקונצנזוס לגבי בנק מקרים רחב? פה חשוב לשים דגש ולהבין שבכלים אשר עומדים לרשותנו בעת הנוכחית לא ניתן להגיע למתאם של 1 וכנראה שגם לא להתקרב אליו. ברם, בהחלט ניתן להגיע למתאם חיובי, ולא בהכרח נמוך מאד.
*
[אני ממשיך פה עם הדוגמה של PER, אבל הדבר רלוונטי גם למדדים שונים בבואנו לבחון סוגיות שונות.]
כשאנחנו רוצים לבדוק האם מדד PER (או אחר) משקף לנו כמה שחקן טוב או איכותי (בואו נשים רגע בצד את ההגדרות הרכות הללו – מבטיח שנחזור אליהן), כל שעלינו לעשות הוא להסתכל על רשימת השחקנים לפי ציונים ולראות האם הדבר עושה לנו שכל עם המציאות והאם קיים חוט שני בינו לבין הקונצנזוס לגבי החלק הארי של המקרים. כך גם נוכל לבחון איזה מדד עדיף מבחינתנו לבחינת סוגיה כלשהי.
האם לדעתכם, כשמסתכלים על השחקנים בראש מדד PER של עונת 2015/2016, מזהים, במתאם חיובי ואף גבוה, את השחקנים שאתם חושבים שהם הטובים בליגה (כמובן שבהתאמות הנדרשות, ללא עיוותי מיעוט דקות וכיו"ב)?
האם לדעתכם, כשמסתכלים על השחקנים בראש מדד PER ההיסטורי, מזהים, במתאם חיובי ואף גבוה את השחקנים שאתם חושבים שהם הטובים ביותר?
הביטו, PER (או כל מדד אחר ידוע) אינו מושלם. אבל! אם כשמסתכלים על הציונים ששחקנים מקבלים במדד הזה וזה נראה לנו למעלה מסביר לתיאור איכותם, מדוע לפסול שימוש באותו המדד? ברור שעבור אחד מדד א' ישקף יותר ועבור אחר מדד ב', אבל אני חושב שבאופן די גורף אנשים ימצאו מתאם גבוה יותר במדד PER או במדד RPM (לרבות ההבנה שהרכיב הקבוצתי משפיע), מאשר במדד שהמצאתי כרגע והוא דקות*אחוזי קליעה/עבירות, לשיקוף טיב השחקן.
אני מדגיש ושב ומדגיש חזור והדגש – המתאם אינו 1 ואינו קרוב ל-1. עבור כל מדד אשר ידוע לנו היום לבחינת טיב שחקנים (או כל דבר אחר בכדורסל). בהחלט ייתכן שנמצא ששחקן פלוני טוב בהרבה משחקן אלמוני, אך מדורג הרבה מתחתיו. זה לא צריך לפסול כל שימוש במדד. זה פשוט צריך להבהיר לנו שלא מדובר על כזה ראה וקדש, אלא על כלי עזר בלבד.
רוצה לומר שאם אני מעוניין לבצע השוואה בין שני שחקנים, לא אגיע למסקנה רק על סמך PER (או EFF או RPM או כל מדד אחר), אבל אם המתאם הוא חיובי, בהחלט אמצא לנכון להתבונן גם עליו.
כמו כן, חשוב להבין שהמתאם והמובהקות עולים ככל שההפרשים בציון גדלים. מחד גיסא, להניח ששחקן עדיף כי הוא מוביל על חברו בשליש נקודת מדד זה על גבול המגוחך. מאידך גיסא, להתעלם מהפרש של 20 נקודות מדד יהיה מגוחך לא פחות. שימו לב שלא להתעלם אינו בהכרח אומר להכריע.
בכל מדד זמין נמצא בעיות ודוגמאות שנראות מנותקות מהמציאות, אך אין זה אמור לגרום לנו לפסול אותו על הסף, אם אותן דוגמאות אינן מייצגות.
*
למרות משפטו האלמותי של ראש ממשלת ישראל השלישי, לוי אשכול, אשר אמר: "הבטחתי, אבל לא הבטחתי לקיים"; אני אעמוד בהבטחתי ואדבר קצת על מי הוא או מה הוא שחקן טוב.
אני לא יודע להגדיר באופן מדויק מה זאת אומרת "שחקן טוב". אני כן יודע להגיד על השחקן האם לדעתי הוא טוב או האם פלוני טוב מאלמוני. אני אפילו יודע לטעון לטובת היותו של שחקן טוב או לטובת היותו של פלוני טוב מאלמוני, למרות שכלל אינני יודע להגדיר באופן מדויק מהו טוב. אני מניח, ותקנו אותי אם אני טועה, שכולנו נמצאים בקלחת הזו.
לפיכך, אין סתירה בין חוסר היכולת להגדיר מיהו שחקן טוב לבין שימוש במדדים מספריים כדי לתמוך בטענה ששחקן טוב. כל מה שצריך הוא לבחון האם תווית הערטילאית הזו מסתדרת עם המדד לגבי רוב רובם של המקרים.
לאן אני חותר? אני חותר לכך שעד שלא נדע להגדיר מה המשמעות של שחקן טוב, לעולם לא נוכל לייצר מדד שייתן לנו מתאם של 1 ואף קרוב לכך. באותו האופן בדיוק, גם מראה עיניים לעולם לא ייתן לנו תשובה חד משמעית.
אבל… ביום בו נוכל להגיע להסכמה על הגדרה כזו הוא יהיה היום בו יפתח הפתח למציאת המדד המושלם לבחינת איכות שחקנים. כי המספרים שם, אנחנו פשוט עדיין אל יודעים למדוד אותם או בכלל לא חושבים בכיוון של לנסות לבחון איך מודדים אותם, עבור המון קריטריונים.
אם למשל נגדיר שחקן טוב כשחקן שאם נשים אותו בקבוצה אקראית הוא ישפר באופן הניכר ביותר את הסיכוי הממוצע שלה לנצח (ואני לא אומר שזו ההגדרה מבחינתי – זוהי רק דוגמה), ואם ההגדרה הזו תתפוס ברחבי העולם, אזי שיימצא מי שידע לכמת זאת לציון. זה יכול לקחת 20 שנים או 200 שנים. ייתכן שזה ידרוש חלק מטובי המוחות וטובי מחשבי העל, אבל כשתהיה לנו הגדרה ברורה, נוכל לייצר מדד שנותן מתאם גבוה מאד. אולי אפילו נושק ל-1.
כל עוד אין לנו כזה מדד, אי אפשר להגיע למסקנות רק על סמך אותם מדדים. אבל כן אפשר להיעזר בהם, אם מבינים את שלל המשמעותיות שנכתבו לעיל, לרבות בחינת התאמתו של המדד למציאות בשיעורים גבוהים, לרבות הבנה שככל שהפער בציון גדל הנתון איתן יותר וכיו"ב.
*
לסיום, כמו בטור הקודם, אסכם שאסור לנו להישען רק ואולי אף בעיקר על סטטיסטיקה ומדדים, אבל להתעלם מהם ולפסול על הסף כל נתון וכל מדד רק כי מצאנו דוגמה אחת שגויה, לדעתי, זו טעות מרה, שמונעת מאיתנו להיעזר בכלים שיכולים לסייע רבות.
מעולה ומעניין, מתן.
אם יורשה לי, אני חושב שהוספת לינקים מתוך הכתבה (או בתגובות) למיקומי הרשימות של מדדים שונים. עבור עכברים לייט כמוני, זה עשוי להפרות ולהרחיב את הדיון, כמו גם לסייע בחיזוק טיעונים והעלאת ספקולציות פלפליות.
הדברים ידועים אבל הצלחת לחדד ולבהיר היטב את הנקודה. טנקס.
ושאלה למתמצאים. האם חסימות של שחקנים לקלעים ובכלל נספרים ? ואם כן האם מבדילים בין חסימות שהביאו לסל וכאלה שלא (קשה לי להאמין שאפשר לעקוב אחרי כל חסימה)
אין שום בעיה לספור חסימות היום הליגה מפרסמת נתונים רק לגבי אלו שהובילו לסל:
http://stats.nba.com/players/hustle/#!?sort=SCREEN_ASSISTS&dir=1
אני חושב שהבעיה המרכזית נמצאת בנקודה שהעלית. הקושי הגדול הוא בלנסות לקבוע מה בעצם מגדיר שחקן טוב. קשה למצוא קבוצה של N>1 אנשים שיגיעו על כך להסכמה.
נכון, אבל גם בלי להגדיר אפשר למצוא בנקל N>99% מאוכלוסיית האנשים הנשאלים שיסכימו שקווין דוראנט שחקן טוב.
זו נקודת מוצא לא רעה בכלל לבחון את הדברים.
תראה הטעות היא בלנסות לחפש מדדים שיתאימו לדעה הרווחת. בשביל זה לא צריך מדד. צריך שאלון.
אם אנחנו אומרים ש"שחקן טוב"=מי שהקונצנזוס שם לו תווית של שחקן טוב", אז שאלון (לכאורה) היה מוצלח, אבל שאלון, לעומת מדד, אינו פרקטי על כמות כזו של נבחנים, אינו מתעדכן, כמעט אינו השוואתי, ובעיקר נתון להטיות רגעיות רבות.
העניין הוא שאנשים מחפשים מספר כדי לדרג את השחקנים לפיו. זה לא אפשרי בלי מה שציינתי קודם.
זו לא בעיה בעיניי. הבעייה היא בחלחול ההבנה שגם קביעה כזו היא סובייקטיבית.
המשתנים שעשויים להיכנס לקביעה כזו הם כה רבים, וגם שונים בין אדם אחד למשנהו. זו כמובן הסיבה לכל ההתנצחויות והדיונים המאלפים בתגובות.
העניין הוא שלמרות הסובייקטיביות, יש עדיין מן, איך מתן אמר, חוט שני שעובר בין כולם ויוצר קונצנזוס בנוגע למדדים ו/או שחקנים שונים.
תודה מתן, היה מעניין ואני די מסכים איתך עם המסקנה הסופית שמדדים הם בסה"כ חיזוק לטענות שאנחנו יודעים כבר או מאמינים בהן כבר..
ביום מן הימים אני אכתוב כאן טור על מודל KISS הידוע בשמו המלא –
"keep it simple stupid".
לתחושתי, וזאת אף על פי שאני לפעמים נהנה מסטטיסטיקות מורכבות, לפעמים המספרים והנוסחאות המורכבות עושים עבודה שאפשר לעשות בקלות עם שכל ישר ועין טובה לכדורסל (ניסיון גם לא יזיק).
מצטער, אני לא צריך מספרים שיגידו לי שלברון הוא שחקן אדיר ואני לא צריך מדדים שייספרו לי שראסל ווסטברוק אמנם עומד על ממוצע טריפל דאבל אבל עדיין בסימן שאלה גדול לגבי התרומה שלו לקבוצה שלו.
מדדים וכל מהפכת האנליטיקס הזו היא לפעמים קצת מוגזמת.
ולגבי החזון על המדד המושלם – רק אגיד, שלעולם לא יהיה אחד כזה ולו רק מהסיבה הפשוטה שחלק עצום מהספורט הוא פסיכולוגיה (שאני מאמין בה יותר מאשר אני מאמין במספרים) ואת החלק הזה קשה מאוד למספר.
יפה.
אוסיף ואומר, שעבורי ההנאה מסטטיסטיקות מורכבות היא עצומה הרבה יותר כאשר המספרים לא תואמים את מה שהשכל הישר והעין הטובה שלי רואים…
תדמיין לרגע שאני מישהו אחר עם כינוי מאד ארוך הקשור לשחקן עבר ענק.
הכל ענין של הטכנולוגיה העומדת לרשותנו. תחשוב שבעוד מאה שנה ישתילו לכל אחד צ'יפ במוח שרושם את פעילות המוח בכל רגע נתון. כך ניתן יהיה למדוד גם את המצב הרגשי של השחקנים ואפילו לשנות אותו.
טוב אולי זה חיקוי לא כל כך מוצלח, אבל הנקודה היא שכל היבט ניתן בסופו של דבר למדידה. אם אנחנו מעוניינים או צריכים להשקיע בזה את האנרגיה הדרושה זה כבר סיפור אחר.
"אני לא צריך מדדים שייספרו לי שראסל ווסטברוק אמנם עומד על ממוצע טריפל דאבל" באופן דמגוגי חתכתי את המשפט שלך באמצע, כדי לשאול – איך אתה לא צריך מספרים שיספרו לך שראסל על TD? 😉
לגבי KISS – אספר סיפור קצרצר.
בקורס לפסיכומטרי היו מקרים שנפלתי בהיקש ולא הבנתי למה.
למשל, אני הלכתי על הלוגיקה שזהב שייכת למשפחת המתכות בעוד שהכוונה היתה שזהב היא מתכת יקרה.
אז אמרתי למדריך שיש הרבה מתכות יקרות יותר כמו פלטינה או טיטאניום.
אז הוא כתב לי בענק על הלוח KISS ואמר: "מעכשיו עבור לחשוב כמו איש טיפש."
אז גאון גדול אני לא, אבל בהיקש הפסקתי לטעות וזה עזר לי לקבל הכי גבוה בכיתה 🙂
נייס. יפה ש"מלמדים אותך לחשוב" בצורה דוגרית ולא מתקטננת.
עבר קצת זמן מאז הפסיכומטרי שלי (יותר מ-20 שנה) אז מצטער שאין לי סיפור לשתף…
אני מאמין שמלבד הנושא הסטטיסטי המובהק קיים הנושא התודעתי
מג'יק בירד קארים ימוקמו מאוד גבוה בתודעה גם אם ב PER שלהם נמוך משחקן זה או אחר
אם אני לא טועה לקובי בריאנט מסורתית היה PER לא גבוה במיוחד אסל עדין בתודעה הוא נחשב בפרק זמן מסויים לטוב בליגה
ווסטברוק – סטיטסטית הוא מכונה ,תודעתית – אחד שעלול לחרב לך משחק בדקה האחרונה
הגדולה היה לספק את הנתונים הגבוהים מבחינת המספקים ועל זה לספק תודעה של ווינר + 2-3 רגעים גדולים
אני בטוח שאם לברון היה נשאר עם ה PER שלו ללא אף אליפות ( בעולם מושלם בו הוא 0 מ 7 בגמר ) ברמת התודעה זה לא היה אותו הדבר
צריך לזכור גם את רוח התקופה ,בבייסבול לדוגמא סטיסטקות מהשנים הראשונות של המשחק לא ישברו לעולם כנ״ל כמות הריבאונדים של ראסל וצמברליין
עם כל הכבוד להשוואה לאוסקר אם ווסטברוק יסיים עם ממוצע של TD אותי זה ירשים הרבה יותר
אחלה פוסט ואחלה סיום לפוסט
אני גם מרגיש שהשורה התחתונה היא החשובה.
מסכים לגמרי. בגלל זה חשוב לנו להשתמש גם בהיגיון בריא ובחוויות שלנו (וכמובן ברגעים עליהם כתבת) בצירוף המדדים.
מסכים ???? לגמריי ????
צילמתי את המסך
אני מקווה שנחזור שלא להסכים במהרה בימנו,לא נעים לי מגיא 😉
כן גם אני הסתכלתי החוצה לראות שלא נופלים כדורי אש מהשמים.
מה עובר עליכם? תחזרו להתכסח ומיד.
לדעתי מישהו השתלט למתן על היוזר של הגוואטר
אני לא אתפלא אם זו פעולה של גור או האשך
ואיך נדע שאתה מי שאתה טוען שאתה?
עידו, אני חושב שרנה דקארט כבר סיפק תשובה לשאלה שלך.
אני חלש בפילוסופיה. נעצרתי ב"אני חושב משמע אני קיים". פשוט בגלל החלק הראשון של המשפט.
אגב אם בפילוסופיה עסקינן, חשוב לדעת שהציטוט המקורי של דקרט צריך להיות מפורש כ"אני חושב, אני קיים". התוספת של המילה משמע היא לא מדויקת ונחשבת טעות נפוצה – לפחות עד כמה שידוע לי.
עידו, על הביטוי הזה דיברתי.
משמעותו היא שאתה לא יכול לדעת שמידן הוא מידן או שאני הוא אני, אלא רק שאתה הוא אתה, כי אתה חושב. או יותר מדויק, כי יש לך יכולת להטיל ספק.
והדבר היחיד שאינך יכול להטיל בו ספק הוא היכולת שלך להטיל ספק.
אז מה זה אומר על ה-PER?
Probably Entirely Rubbish
🙂
זו בעייה מאד מורכבת.
כי יש כל כך הרבה משתנים שלא נספרים כמו:
הקבוצה רודפת או נרדפת? משחק ביית או חוץ? חמשייה ראשונה שנייה או ערבוב?
ועד למריבה אם הפרטנר, קלקול קייבה, ג'ט לג או זימון למשפט
בגלל זה אני טוען שקשה להסיק ממדגם קטן. אבל אם נשווה לצורך העניין את 10 העונות הטובות יותר של כל שחקן, אז יש גבול כמה קלקול קיבה או ג'ט לג ישפיע. או יותר נכון ישפיע יותר לעומת שאר השחקנים שגם להם יש אי אלו תופעות על פני תקופה.
מתן, תודה על ההשקעה במאמר. הדיון אחריו מעולה.
אני רוצה להעלות נקודה נוספת: האם בזכות מדד ה PER (או כל מדד טוב אחר) נוכל לגלות שחקנים שלא חשבנו שהם כאלה טובים ? כאלה שהם יעילים אך שקטים. לא תמיד מגיעים לאוסטאר אבל תורמים המון לקבוצתם וביעילות. תוכל לחשוב על אחד כזה ?
אני חושב שדרימונד גרין החל לנצוץ ב-RPM לפני שהקונצנזס היה שהוא חלק מהטופ של שחקני הליגה.
ללא ספק –
טוני אלן קיבל את החוזה שלו בממפיס, אחרי שאלו קבלו את המלצתו של הולינג'ר המושמץ להחתימו.
הסטטיסטיקות של הולינג'ר נבאו שאלן הוא שחקן טוב יותר, ושהוא שווה יותר, ממה שהסלטיקס היו מוכנים לשלם.
אל תשכח שממפיס גם שכרו אח"כ את שירותיו של אותו הולינג'ר
מסכים מאוד עם רוח הדברים, אבל חייב להעלות עוד נקודה: אני לא חושב שיהיה אפשר למצוא מדד מדויק מסיבה אחת פשוטה – כלל הסטטיסטיקות והמדדים לא מתייחסים לסיטואציה. אם ניקח את מוטומבו למשל, נראה שיש לו הרבה חסימות ונבין שהוא חוסם מעולה – אבל לא נדע שהוא היה גורם לשחקנים לברוח מהצבע ולקחת זריקות קשות. האם אפשר לייצר מדד לשחקן שמפחדים לזרוק מעליו? שמפחדים לכדרר לידו כי הוא חוטף אדיר? שההגנות מתכווצות נגד החדירות המצוינות שלו ומרווחות את המשחק לקלעי שלוש? לא משנה מה תעשה – כל מדד יהיה מוגבל ביכולת שלו למדוד את הנתונים הללו.
ההתאמה של כל מדד לסיטואציה מסוימת תמיד תהיה תלויה ברזולוציה של הנתונים שלך. פעם זה היה רק לגבי משחק היום ניתן כבר לפרוט כל מהלך למרכיביו ולשים בקונטקסט של סיטואציה (כמובן שצריך לעשות את זה בפועל וזה מצריך השקעה) .
כן. ברור שאפשר. כלומר, לא, אי אפשר כי אין לנו את הידע והטכנולוגיה, אבל ברמת התאוריה הכל ביקום, בהינתן הידע והטכנולוגיה, מדיד.
אלא אם אתה מאמין בעל טבעי.
עידו כבר כתב על זה לעיל – אם היתה הטכנולוגיה לקרוא את מוחם של אנשים, אז היינו יכולים לדעת גם איך איום החסימות משפיע עליהם.
נכון שכרגע זה לא מדיד, אבל אם זה יהיה דבר שמספיק חשוב למדוד, אפשר לחקור ולייצר טכנולוגיה. מחר או בעוד 500 שנים.
זה אפשרי ולא אתפלא אם כבר עושים את זה. היום לליגה יש את המיקום של כל השחקנים כפונקציה של הזמן (כ 8 מצלמות בכל אותם). אם תסתכל על קורלציות בין מיקום השחקן המגן שחוסם טוב לבין מסלולו של שחקן במגמת חדירה לסל אתה תקבל את זה.
כל העולם קורלציות
פוסט מצוין, מתן. הבהרת יפה נושא שקשה להבהרה.
שימושיות הסטטיסטיקה תלויה לחלוטין במשתמש.
לדוגמה –
אני יכול לטעון שההפסד של הקאבס בפלייאוף 2010 לסלטיקס, לא היה בגלל לברון, אלא למרות לברון.
הרי הוא הוביל את 2 הקבוצות בנק' למשחק, ברב' למשחק, בחטיפות למשחק, והוא היה שני באס' למשחק, ושלישי בחס' למשחק.
כמובן שזה מקרה קלסי של לתקוע חץ, ולצייר סביבו מטרה.
לקחתי סטטיסטיקה, וניצלתי אותה בכדי לחטוא לאמת.
(וכל מי שראה את הסדרה ראה איך לברון בשלב מסוים פשוט וויתר על הסדרה)
סטטיסטיקה יכולה גם לשמש ככלי אובייקטיבי בשביל להפריך או לאמת preconceptions –
לדוגמה:
מידן כתב על "התודעה". הוא טוען שקובי בראיינט שחקן טוב יותר ממה שמראות הסטטיסטיקות, ושראסל ווסטברוק מחרב משחקים, ושהטריפל דאבל הממוצע זו סטטיסטיקה שמשקרת.
גם אני ראיתי את הלייקרס, ואני חושב שבגלל שיש כל כך הרבה אוהדים ללייקרס, אז תודעתית, הוא נחשב לשחקן טוב יותר ממה שהוא באמת.
וזה המקום שהשימוש בסטטיסטיקה נדרש.
אני אביא לדוגמה את עונת 2003 .
קובי באותה עונה קלע 30 נק' למשחק ב-48.3% אפקטיבי, קטף 7 רב' ומסר 6 אס' למשחק.
ווסטברוק השנה קולע 30.9 נק' ב-47.1% אפקטיבי, קוטף 10.4 רב', ומוסר 11.3 אס'.
למי יש עונה טובה יותר?
ואז אני נזכר שמידן ציין את העובדה שווסטברוק מחרב משחקים בדקות האחרונות.
אז אם אני בוחר לחזור לעונת 2003, לחצי גמר המערב,
הסטטיסטיקה מזכירה לי את מה שראיתי בזמן אמת –
קובי שזורק הרבה יותר מדי (159 זריקות לסל בסדרה ב- 48% אפקטיבי, כאשר ללייקרס היה את שאקיל שזרק בסדרה רק 102 פעמים לסל ב-59% אפקטיבי.
ובראיינט, למרות הרבה כישרון מסביבו, מסר משמעותית פחות אסיסטים בסדרה (בממוצע למשחק) מאשר בעונה הרגילה (3.7 אס' ב-43 דקות, 6 אס' ב-41.5 דקות בעונה הרגילה)
כך שזה מקרה בו הסטטיסטיקה משמשת ככלי שמאושש את מה שראיתי בזמן אמת.
השורה התחתונה – סטטיסטיקה היא אמצעי, ולא מטרה. ככלי עזר, היא ללא ספק תורמת המון.
נאה דרשת
מעניין
האם פר לוקח בחשבון כמות השניות ששחקן נוגע בכדור בהתקפה ?
אם לא, אני חושב שהוא מפספס אלמנט מאוד חשוב בכדורסל של היום.
ואם בדקרט ומדידות עסקינן, לגמרי לא בטוח שיהיה אפשר לפתור את בעיית הגוף – נפש, ז"א אפשר יהיה למדוד את המוח את פעילות המוח וההשפעה על הגוף עד גבול מסוים. בתאוריה הכל מדיד, מעשית זה יותר מורכב.
PER חי רק מדברים שאפשר למצוא בבוקס-סקור סטנדרטי.
מדידה היא עניין מורכב כי בסופו של דבר מדובר בהתערבות -כלומר בהשפעה על המערכת הנמדדת. כל עוד זה סתם מישהו שיושב בצד ורושם מספרים זה באמת חסר משמעות, אבל כשמגיעים לסקלה של מחשבות לדוגמא קשה לי להאמין שלמדידה לא תהיה השפעה.
זה לא כל כך חסר משמעות, והבחור שרושם את המספרים בצד באמת משפיע על המדידה – כל שחקן היום וגם בעבר הלא רחוק בודק בניירת, בזמן פסקי זמן והפסקות כמה הוא מתקרב לטריפל דאבל או הישג סטט' אחר ודואג לשפץ אותו. אם לא המודעות הזאת הרבה שיאים ספורטיבים לא היו קיימים איתנו.
צודק. אם טריפל דאבל קורה במשחק אימון הוא באמת קרה?
כמה נרקיסיסט שחקן יכול להיות בשביל לרשום טריפל דאבל באימון ?
אחלה טור.
הסיפור הזה קצת מזכיר לי את שיטות המדידה של נתוני צריכת הדלק שמפרסמים יצרני הרכב. הצריכה האמיתית גבוהה הרבה יותר מהצריכה שנמדדת בתנאי המעבדה. הנתונים אכן לא מדויקים אבל בהחלט אפשרי להשוות את צריכת הדלק ביחס לרכבים האחרים שגם הם נבחנים בשיטת מדידה שרחוקה מהמציאות.
ברור שאין דרך אחת להגדיר מי הוא הכי טוב, זה סובייקטיבי בגלל שהמשחק הוא קבוצתי (אם היה אישי לא היתה בעיה).
למה נחוץ PER? כדי, כמו שגילרי אמר, לראות תופעה שנסתרת לנו מהעין, או כדי להתעסק בצורה מהירה במסות אדירות של שחקנים בצורה אובייקטיבית ובלי ויכוח. ככה אנחנו מסדרים במהירות ובקלות אלפי שחקני עבר על סרגל אחד. אני כמובן לא אוהב את זה, לדעתי הדירוגים של מס' 1, מס'2 וכ"ו הם חסרי משמעות וכל השחקנים מהשורה הראשונה נמצאים, ובכן, בשורה הראשונה.
המשפט של לוי אשכול על ההבטחה מזכיר לי משפט מאוד מפורסם שאמר ז'אק שיראק: במהלך מערכת הבחירות לנשיאות ניגשה אליו אישה והטיחה בו מול המצלמות שהוא לא קיים את הבטחתו מהבחירות הקודמות. הוא ענה
"la promesse n'engage que ceux qui y croit"
בתרגום חופשי: ההבטחה מחייבת רק את אלה שמאמינים לה
🙂
לגבי המשפט הראשון שלך – ספר לאוהדי הטניס…
הבעיה הכי בסיסית היא הניסיון לחלץ דירוג לספורטאי בודד בענף ספורט קבוצתי.
מאד נכון מה שאתה אומר.
אבל גם כשאנחנו מנסים לדרג קבוצות אנחנו נתקלים בבעיות שנובעות מהגורמים שכבר צויינו כאן.
בעצם ניסחת פסוידו-מדעית את הקלישאה "בסוף, זה משחק בין בני-אדם…"
🙂
הבעיה האמיתית עם כל המדדים האלה היא שיש לאנשים נטיה להתאהב בהם ולשכוח שכל מדד כזה הוא רק דרך אחת מסוימת שאמורה לעזור לנו לפרש מציאות מורכבת ולקבל החלטות (במנג'ר…).
בעצם, זה נכון גם לגבי אלוהים או הומאניזם…
בני-אדם SUCKS
תודה.
אני לא ממומחי הסטטיסטיקה אבל מבין את הערך שלה ומשתמש בה כשהיא מחזקת את הטענה שלי (ומתעלם ממנה בהפגנתיות כשלא).
הייתי שמח להסבר קצר במילים פשוטות, על ההבדל בין סטטיסטיקות 'מתארות' וסטטיסטיקות 'חוזות'. לדוגמא, מדד ה-PER הוא מדד שנחשב סטטיסטיקה 'חוזה' אבל כל הנתונים שלו נלקחים מבוקס סקור פשוט, שזה סטטיסטיקה תיאורית.
מכאן אני מבין שה-PER הוא לא מדד ממש טוב לחזות יכולת של שחקן אלא יותר תיאור בדיעבד. לכן לא נכון להשתמש ב-PER כשעושים פאוור רנקינג לדוגמא.
Winshhare לעומת זאת, (לפי מה שאני זוכר מכמה מאמרים שקראתי בעבר) מראה קורלציה גבוהה יותר לחזות בהצלחה של שחקן לתרום לקבוצה שלו.
תקנו אותי בבקשה איפה שאני טועה ותסבירו לי באיזה מדדים כדאי להשתמש כדי להוכיח שהארדן הוא השחקן הטוב ביקום.
אף אחד מהמדדים המדוברים אינו מדד חוזה. בשביל זה צריך שיהיה לך איזושהיא תכונה מדידה שהמדד מסוגל לחזות ואז לבנות מודל סטטיסטי שיחזה אותה.
אם אתה רוצה להוכיח שהארדן הוא הכי טוב ביקום תצטרך קודם להגדיר מה "טוב" אומר.(אתה כמובן יכול ללכת בהנדסה הפוכה ולראות במה הארדן טוב ואז להחליט שזו התכונה).
שיהיה בהצלחה.
הנדסה הפוכה זו הגדרה מעולה לסטטיסטיקה. תודה
לא. זו דוגמא נהדרת לשימוש מוטעה בסטטיסטיקה.
במדד השיער על הפנים
בשביל לחזות קדימה צריך תיאוריה שלוקחת את הנתונים ומעבדת אותם. לאף אחד אין תיאוריה שמתארת משחק כה מורכב. זה קצת יותר מורכב מהחוק השני של ניוטון
אז למה מתכוונת ההגדרה: predictive statistics באנליטיקס?
למודל על בסיס נתונים קיימים שמודד תכונה מסוימת המנבא מה יהיו התוצאות עבור סט של נתונים בעלי אופי דומה.
לדוגמא מודל שמנבא חוזק של קבוצות על בסיס תוצאות המשחקים שלהם.
נניח והשתשמשנו בנתונים של עשר העונות האחרונות. עכשיו השאלה אם המודל שבידינו יוכל לחזות כמה כל קבוצה תנצח בעונה הנוכחית.
כך לדוגמא פועלים כל המודלים שמנבאים סיכויי פלייאוף של קבוצות.
אני לא מכיר. זה לא מתחום המדעים המדויקים.
אחלה פוסט.
אני מחכה שיספרו מסירות שלאחריהן זריקה במקום אסיסטים. בשביל אסיסט צריך גם מסירה טובה של שחקן 1 וגם הצלחה בקליעה של שחקן 2.
במקרה ווסטברוק זה יכול להיות משמעותי.
אם אחוז גבוה מהמסירות לזריקה הם אסיסטים אז ווסטברוק לא משתף מספיק את החברים.
אם אחוז נמוך מהמסירות לזריקה נגמרות בקליעה אז זה סימן שהוא צריך להחליף חברים 🙂
סופרים גם סופרים.
http://stats.nba.com/players/passing/#!?sort=POTENTIAL_AST&dir=1
אני אמשיך את זה:
האם סופרים גם מסירות שלאחריהן שחקן קיבל עבירה עם זריקות עונשין? האם זה נחשב אסיסט (נראה לי שלא)? האם מחשיבים מסירה מהחוץ להאלי הופ כאסיסט?
כן זה נרשם (באותו הלינק). תחת FT AST. זה לא נחשב כאסיסט בספירה הכללית אבל יש שם גם סיכום כללי של כל המסירות שהובילו לנקודות שכולל אסיסטים, מסירות לזריקות עונשין, וגם אסיסטים משניים (מסירה למסירה לאסיסט) תחת AST ADJ.
תודה
תודה גם ממני 🙂
מתן אני רוצה להודות לך על כתיבה יפה ומעניינת שמכבדת את האינטלגנציה של הקוראים שלנו.
סטטיסטיקה היא כלי חשוב כדי לכמת נתונים. אבל כפי שאמרת יפה מאוד (או אני פירשתי), יש סיבה שסטטיסטיקה יושבת במדעי החברה ולא במדעים המדוייקים. המילה "ממוצע" יש לה משמעות חברתית קודם כל. היא מסתכלת על העולם מקשה בה לכל פרט אותה יכולת השפעה על הכלל ביחס לכמות של הכלל. אם אני מרוויח 50,000 שח לחודש ואתה מרוויח עשרת אלפים, הממוצע נותן הרגשה שכל אחד מאיתנו מרוויח כ-30 אלף ש"ח. כך שכשאומרים שהשכר הממוצע הוא עשרת אלפים ש"ח לא מציינים כמה אנשים מרוויחים עשרת אלפים או קרוב אלא שהמשכורת של כלל המשק אילו היו עוברים חלוקה שווה לכולם כך כל אחד היה מרוויח. הסטטיסטיקאים מאזנים זאת על ידי הוספת סטיות תקן ומדידת percentile (אחוזון בעברית נראה לי…) וכך אנו מחלקים את כולם מהגבוה לנמוך ומשנים מי נמצע באיזה אחוזון או באיזה מקום ברשימה. אגב אחוזון 50 בשכר הוא בסביבות 5000 ש"ח לחודש…
האם שחקן כדורסל הוא סך כל ההופעות שלו? או האם שחקן כדורסל הוא טוב כמו ההופעה הכי טובה שלו? האם יש היררכיה בין משחק למשחק? כחברה אנו הפכנו למדידים ומודדים כפייתיים (כמה חברים ועוקבים בפייס ובאינסטוש, כמה כסף מרוויחים, איזה בגרות הוצאת, פסיכומטרי, תואר, אוניברסיטה, נכסים וכו'…)
וזה בהחלט חלחל למשחק מצד השחקנים (אני כותב מאמר בנושא קשור) אבל לא פחות זה חלחל לצופים.
קשה לנו להינות מאומנות אמיתית לא מדידה ומייצרת רגש. או לפחות להודות שאנו עדיין מונעים מאותו ערך פרימיטיבי/ראשוני שלא קשור לכמויות ולרציונל… אנו אובססיבים במספרים כי זה נותן לנו הרגשה של שליטה ושל עליונות ואובייקטיביות. כי זה שם אותנו בפנטזיה במקום בו אנו כבר לא רק יכולים להחליף את השחקן בדימיוננינו (פעם כולם רצו להיות כמו מייק או לארי) אלא גם להחליף את הפרשן המאמן וה-GM (מישהו אמר פנטזי ולא קיבל?). יכול להיות שניתן להוכיח שווסטברוק השחקן הגדול בכל הזמנים. אבל אני מעדיף את סטף ואת אנטוני דיוויס ואת סטיב נאש ואת קאווי ואפילו את KAT על צפייה בווסברוק.
צודק. בהחלט ישנו היבט אסתטי במשחק, אבל אם הוא לא מקדם אותך לעבר הנצחון אז הוא לא שווה הרבה, מה לעשות . . .
אני נהנה מזחק עם מעניקת זריקה מוזלמת אבל אם הוא לא קולע טוב אז עדיף שישב על הספסל.
אגב במדעי הטבע משתמשים בניתוחים סטטיסטיים מתקדמים בהרבה מאשר במדעי הרוח/חברה
מזחק=משחקן
מעניקת זריקה מוזלמת=מכניקת זריקה מושלמת
תודה ג'ון. יפה כתבת.
מסכים מאוד .
שמתי לב שמישהו מעלי העיר את זה , לא יודע איך זה היום אך בזמנו היה חוג לסטטיסטיקה במדעים מדויקים וחוג לסטטיסטיקה במדעי החברה . רוב המרצים הרצו בשני החוגים , ההבדל היה ברמת המתמטיקה שנדרשה לתאוריה שנלמדה , וגם במודלים .
השילובים המקובלים היו
מתמטיקה וסטטיסטיקה
כלכלה וסטטיסטיקה .
מענין מה הרקע המדעי של הסטטיסטיקאים שמפתחים את המדדים האלו .
אני חושב שהמחלוקת הנוכחית לגבי ווסטברוק היא בעצם חוסר קונצנזוס לגבי החשיבות ההיסטורית של נתונים אישיים לעומת השגים קבוצתיים .
אני מניח שלא הרבה אנשים יגידו שבטווח הקצר השג סטטיסטי פנומנלי יותר חשוב מזכיה באליפות .
אבל מה יזכרו עוד 50 שנה מהעונה הזו ?
מה זוכרים היום מהעונה של אוסקר ?
מה מעמדו של אוסקר כיום ?
באין קונצנזוס כזה , מי שאוהב אותו יציג את זה כמדד אוביקטיבי לגדולתו
ומי שפחות אוהב אותו ימצא מדד נוסף שהיה צריך להלקח בחשבון שהוא הוא המוכיח אוביקטיבית שהוא לא כזה גדול .
אני מזכיר לכם את המחלוקת שהיתה פה בעונה שעברה על גדולתם היחסית של לברון וקארי .
בדיעבד , חלק נכבד מהדעות שיקף בעצם את היחס הרגשי של אותו מגיב לענין דיויד בלאט .
לפני שזזים עוד שעתיים לשדה התעופה:
תודה מתן על מאמר חשוב, שעיקרו כמובן הוא ה-VALIDITY וה-RELIABILITY) של מבחנים. אותה בעייה קיימת בכל בחינה. קחו את ה-IQ למשל. מי קבע ואיך קבעו איזה בדיקות לתת כדי למדוד IQ?
קודם כל היו צריכים לקחת אוכלוסיה שהיא משתנה שהוא DEPENDENT ולדרג אותם מ-טפשים עד 'גאונים'. מי קבע את רמת הטפשות או הגאונות? כפי שאנחנו מחליטים על שחקנים מי הטובים ביותר ומי הגרועים ביותר.
כלומר, אם יתנו לאנשים היודעים ומכירים כדורסל לדרג אנשים מליאור, בעלה של בתי, דרך מידן, אייל ספיר, שחקן כאוחיון, ועד שחקן כלברון, הדרוג של "טיבם" משמש כ-DEPENDENT VARIABLE שהוא נתון המקובל, ואז אנחנו מנסים למצוא דברים שלפיהם ליאור יקבל בם ציון הכי נמון ולברון הכי גבוה. בחינה ב-SURFING בים לא תעשה זאת. גם בחינה באלגברה לא תעשה זאת. אבל כמה סלים ניתן לקלוע בדקה כן יבדיל בין לברון וליאור.
אז מה שעושים זה FACTOR ANALYSIS של הרבה מאד מבחנים ורואים איזה מהם נמצאים בקורלציה גבוהה אחד עם השני ונותנים לם שם, ואז רואים איזה מה-FACTOR ANALYSES נותנים קורלציה הכי גבוהה עם רשימת השחקנים שהם המשתנה ה-DEPENDENT.
ככה קובעים את ערך (וטיב) בחינת ה-SAT, והPER או כל בחינה אחרת. ז"א יכולתם לנבא את טיב שחקנים לפי דיעה של מומחים.
כמובן שהבעייה היא לדרג את "טיב השחקנים" ולהחליט מה קובע בהחלטה אם שחקן הוא מצויין, טוב, בינוני, או רע.
אבל אם אנחנו שמים את לברון, ווסטברוק, קרי, הארדן, דרוזן, דמיאן לילארד, ג'ימי באטלר, וקאווי לינארד, ואז ממשיכים עם שחקנים כפסטוס אזלי, שבאז נפייר,דניאל אושפו, דנואל האוז, וכאלה, ואז שחקני ליגה לאומית מישראל, נצפה שהקבוצה הראשונה תעשה ב=PER יותר מקבוצה השנייה, ושנייה טוב יותר מהשלישית.
אבל לצפות שמבחן כלשהו מהסוג של PER יבדיל ביכולת בין לברון וסטפן קרי הוא הרבה יותר מדי לבקש, כי דרוג ה-DEPENDENT VARIABLE בעצמו נתון לויכוח.
ז"א שבבחינה כגון PER הרבה תלוי בהעדפה האישית של מרכיב הבחינה. אם הוא אחד שכמו אפלטון מעדיף שחקנים נמוכים מהירים, גאנרים כהארדן, הוא היה מרכיב PER שלהארדן וסטפן קרי היה סכוי לציון גבוה יותר מאנטוני דייויס או קאזינס, אבל אם מרכיב הבחינה מעדיף שחקנים תחת הסל עם ריבאונדים ואחוז קליעות גבוה אז לשחקני פרונטליין היה סכוי לציון גבוה יותר.
תודה מנחם. היטבת לנסח.
הסבר מצויין!
פוסט טוב ודיון נהדר בתגובות והכי טוב זה שתי התגובות של מנחם. מסכם טוב את הנושא.
לדעתי מדד הPER הוא מדד מצוין ואובייקטיבי להגדרת טיב השחקנים.
כמובן שהשאלה מי שחקן טוב יותר חשובה רק בשעת חתימת ההסכמים בין השחקן והקבוצה שלו, זמן בו ההצטיינות הסטטיסטית עוזרת לו לקבל יותר כסף פר שנה. הויכוחים בבארים ובאתרים מי טוב יותר יכולה לשעשע ולעזור להעביר את .הזמן.
עיון ברשימת 50 השחקנים המצטיינים לפי ה PER מוכיח שכל הרשימה מורכבת מהשחקנים הטובים ביותר בעבר ובהווה. לו היינו עורכים רשימה של השחקנים הטובים כאן באתר היתה מתקבלת רשימה דומה.
לא קראתי את התגובות, למרות שמספרים זהו כידוע נושא שקרוב לליבי, לא מצאתי את הפנאי לכך.
טור מעולה, מסכים עם הטענה העקרונית שצריך לבחון את המתאם בין מה שאנחנו חושבים על המשחק לבין המדד והדירוג שהוא יוצר של שחקנים. התקווה למציאת מתאם 1 היא בלתי אפשרית. ראשית, כיוון שהמתאם אמור להתרחש בין דעות של אנשים לבין מדד. גם ביטוי מספרי שישקלל את דעות האנשים "יעלים" חלק מהדעות. לבד מכך, אני מתקשה להאמין שיכול להיות מדד 1 בהקשר הספורטיבי. אבל הטור מעולה ואני לגמרי מסכים ההיגיון שעומד מאחורי העיקרון המתאמי.
רק עכשיו ראיתי את הפוסט. מהנה ביותר, הוא והדיון הקשור אליו, וזאת למרות שעל מסקנת הסיום של הפוסט נדמה לי שרובנו נסכים, ואולי גם כך היה ברור לנו מהתחלה.
לא יודע אם זה לא מאוחר מדי, כי בהופס, פוסט מאתמול זה כמו עיתון של לפני שבועיים, ובכל זאת, אם מישהו יראה:
1. כפי שהצביעו עצם המשחק בסטטיסטיקות בספורט קבוצתי בעייתי ויוצר בעיית השוואה. עם זאת רציתי לשאול לדעתכם, אם נניח, אתם רואים הבדל בין ענפים קבוצתיים, כלומר: האם למשל פוטבול, שבו קריירת השחקן קצרה פי כמה, תקרת השכר קשוחה וכדומה, ממילא מצבת השחקנים הסובבים אותך משתנה יותר ואז אולי ניתן להשוות בצורה טובה יותר? למשל בירד ומג'יק שיחקו בקבוצות עם אותם סטארים רוב הקריירה, גם ג'ורדן קשה לניתוק מפיפן, וממילא ברור שההשוואה יותר מופרכת. אבל נניח אם באים להשוות את נתוני השלמות או יארדים למסירה של בריידי ומאנינג נניח, נוכל לומר שזה יותר הגיוני כי מצבת השחקנים סביבם יותר משתנה (או בהגדרה סטאטיסטית קרובה יותר להיות אקראית)?
2. מדהים לפעמים איך דברים שכולנו מבינים כאן ומסכימים עליהם, בשיח הציבורי (לא רק בארץ) הופכים ללא ברורים. למשל בשימוש בנתונים סטטיסטים שמראים שגברים מרוויחים יותר מנשים, ללא פילוח מעמיק יותר (כשברור שכדי להשוות חייבים לרדת לרזולוציות גבוהות יותר) או שאחוז השתתפות גברים בתאונות גבוהה יותר וכד'.
3. האם ניתן לדעתכם ניתן לטעון שהסבירות הסטטיסטית, למאורע: "כל נתון שמגיב באתר נותן ייסתר ע"י ציטוט סטטיסטי הפוך שיסופק ע"י המגיב עידו גילרי" הינה כ-95%, ועולה להיות קרובה לאחד באם הטענה נוגעת לבעיטות בפוטבול?
לא מאוחר 🙂
You snooze you lose
זה לא נכון שעל כל נתון שמישהו מביא באתר יש נתון שסותר אותו. הנתונים הם אובייקטיביים, הבעיה היא הפרשנות שלהם.
תודה מתן.הבעיה שלי עם הפוסט הזה היא שאנשי המספרים של האתר דהיינו אתה וגיא אומרים רחמנא לצל שהמספרים זה לא הכל וצריך לקחת אותם בקונסטלציה הנכונה.עכשיו אם אתם אומרים את זה איך נוכל להמשיך להתווכח ????
כמו שקיפודים מתנשקים – לאט ובזהירות 🙂
פוסט נהדר כמו גם התגובות.
אני עדיין לא אוהב את ה-PER, למרות שאם להודות על האמת אני לא זוכר בדיוק למה. אני כן זוכר שזה קשור להוגה שלה הולינג'ר ולדברים שאמר שגרמו לי לא לסמוך כלל על מוח הכדורסל שלו.
אבל גם אני מזדקן אז אולי הסיבה ההיא כבר לא רלוונטית.
אחד הספרים שאני הכי אוהב להקריא לילדים הוא "אוזו ומוזו מכפר קאקארוזו".
זה גורם לי מדי פעם להיזכר למה אני מתנגד לכל מיני דברים 🙂
פוסט מעולה שמשום מה פספסתי אתמול.
באמת פוסט נהדר שעורר דיון נהדר