ספורט ומספרים: איך מדע הנתונים שינה את משחק הכדורסל / אסף זריצקי

ספורט ומספרים: איך מדע הנתונים שינה את משחק הכדורסל / אסף זריצקי

ספורט ומספרים: איך מדע הנתונים שינה את משחק הכדורסל

מאת אסף זריצקי

***

אסף ומשפחתו חזרו מארה"ב שם עשה את הפוסט-דוקטורט, והם מתגוררים במושב בצרה ליד רעננה. כעת הוא עובד במכון ויצמן, ובשנה הבאה הוא פותח מעבדת מחקר שהיא עתה בשלבי הקמה באוניברסיטת בן גוריון שייעודה לחקור את התפר בין ביולוגיה תאית למדעי המחשב.. הוא אב לשלושה ילדים, והבוגר גילעד כבר מתעורר עם האב לפנות בוקר לחזות במשחקי פלייאוף של NBA.

***

 

********************************

הערה של מנחם לס: קראתי בעיון את המאמר ובחנתי את השקופיות. זהו אחד הפוסטים המושקעים והמשכנעים ביותר שפורסמו באתר, ואני גאה להציגו בפניכם. כמובן שכל תיאוריה ניתנת להיבחן ולהיבדק ע"י תיאוריה אחרת המתבססת על הנחות שונות, היבטים שונים, ונתונים אחרים, אבל אסף מציע לנו כאן כיוון מחשבה מעניין ביותר המשתמש בסטטיסטיקה בזמן אמת, והתוצאה היא מאמר מעניין ביותר. 

וישנה לי הערה: אם ילדים בכיתות ה' ו-ו' הבינו את כוונת המרצה, אני משער שהפוסט הזה לא יהיה מעל הרמה האינטלקטואלית של K-700 וידידיו העליזים באתר!

*******************************

 

רקע:

לפני כמה שבועות הוזמנתי להכין שיעור עבור "יום שיא במתמטיקה" בבית הספר של הילדים שלי. כחובב כדורסל שעוסק במחקר בתחום של מדע הנתונים (בפרט, ביולוגיה תאית חישובית) חשבתי שיהיה נחמד להנגיש לילדים רעיונות בסיסיים בניתוח נתונים בהקשר של מהפכת הנתונים (אנליטיקס) שליגת הכדורסל האמריקאית, ה-NBA, עוברת בשנים האחרונות. המוטיבציה בפוסט זה היא לפרסם את מערך השיעור כדי שאחרים יוכלו להשתמש בו. ניסיתי לכתוב את הפוסט באופן בלתי תלוי במצגת, שמצד אחד יהיה כייף לקריאה ומצד שני לספק את המידע הנדרש כדי לאפשר להכין את התוכן כהרצאת העשרה.

העברתי את השיעור לכיתות ה' ו-ו'. אני חושב שהוא מתאים גם לילדים בחטיבות הביניים, ואולי גם לתיכוניסטים ומבוגרים כהרצאת העשרה. השיעור שהעברתי נמשך 45 דקות, משך זמן שלא הספיק לכל הסיפורים שכללתי בשקפים. השיעור עבר בעניין רב, גם אצל מי שלא התעניין בכדורסל. בהמשך הפוסט (כ-1600 מילים), אתאר בפירוט את האופן שבו העברתי את ההרצאה כדי לאפשר לאחרים להשתמש בה.

חלק משמעותי מהתוכן מבוסס (באישור) על השקפים של Statistics and the NBA, Vik Gopal, https://bit.ly/2x5tDda . גרסת PDF של השקפים נמצאת בלינק הבא, https://speakerdeck.com/assafzar/sport-and-math-in-hebrew. גרסת pptx (עם אנימציה והסרטים המלאים) להורדה,https://goo.gl/7sy3jD . אשמח לשמוע ביקורת / הצעות לשיפור / שאלות / הארות בתגובות או לדוא"לassafzar@gmail.com .

**********************

הערת מנחם לס: ממליץ מאד שתעשה DOWNLOAD של מצגת ה-POWER POINT הזו ב-,https://goo.gl/7sy3jD, ולא תצטער!!!

הערה שנייה: כמה איורי הפאור-פוינט נכנסו על ידי לפוסט בצורה שרירותית ללא קשר לפרק הכתוב!

********************

תוכן ההרצאה:

מוטיבציה (שקפים 3-7): לאחר רקע כללי על מה הוא "מדע הנתונים" ורקע מינימלי להבנת משחק הכדורסל (שקפים 2-3), בחרתי להתחיל במוטיבציה מהסרט המשובח Money Ball (שקף 4). למי שלא מכיר, הסרט מספר על קבוצת בייסבול ענייה שמנסה להתמודד עם העזיבה של שלושת שחקניה המובילים. כאשר תקציב הקבוצה נמוך מכדי להתמודד עם קבוצות עשירות יותר על השחקנים המובילים בשוק. בילי בין, המנהל המוכשר של הקבוצה (בראד פיט), ביחד עם כלכלן צעיר מאוניברסיטת ייל (ג'ונה היל), משתמשים ב-"אנליטיקס" כדי לבחור שחקנים מצוינים וזולים ששאר הקבוצות פספסו בגלל הגישה הסובייקטיבית והטיות שונות. (לדוגמא, הערכה נמוכה של שחקנים עם סגנון זריקה מוזר, אבל אפקטיבי). שלושת הקטעים הקצרים שבחרתי להציג מתארים את הבעיה, הרעיון להשתמש בנתונים במקום חוות דעת סובייקטיבית (ומוטה), והמימוש (שקפים 5-7).

מהפכת השלשות (שקפים 8-23): נתחיל בשאלה הפשוטה – מאיפה הכי משתלם לזרוק לסל במהלך משחק? (שקף 8) כדי לענות על השאלה יש צורך בנתונים: עלינו לאסוף את המיקום של כל הזריקות לסל ע"י שחקנים רבים ובמהלך משחקים רבים. אפשר לעשות זאת באופן ידני, אבל זה ידרוש מאמץ רב. עדיף לעקוב באופן אוטומטי (כלומר בעזרת מחשב) אחרי כל זריקה של כל שחקן במהלך כל משחק (שקף 9). החברה הישראלית SportVU (נקנתה ע"י חברת STATS) מספקת טכנולוגיה כזו באמצעות רישות המגרש במצלמות ותוכנת מחשב מתוחכמת למעקב מדויק אחרי השחקנים והכדור (שקף 10). כאשר אוספים את הנתונים ניתן לראות שזריקות מתחת לסל (restricted area) מובילות לסלים בכ-60%. ככל שמתרחקים מהסל אחוזי ההצלחה יורדים (שקף 11). כאשר מודדים את תוחלת הנקודות לזריקה, מתברר שהזריקות בעלות התוחלת הגבוהה ביותר – להלן ה"יעילות" ביותר – הן מתחת לסל ואחרי קשת השלוש (בעיקר בפינות המגרש, שם המרחק בין הקשת לסל הוא הקטן ביותר), והזריקות הפחות יעילות הן באיזור הצבע וחצי-מרחק (שקפים 12-13).

 

האבחנה הפשוטה הזו שינתה את אופי המשחק ב-NBA. לאורך השנים האחרונות אנו עדים לעליה מתמשכת במספר הזריקות מעבר לקשת השלוש ומתחת לסל, ובמקביל ירידה מתמשכת במספר הזריקות בטווחים הבינוניים והפחות יעילים (שקף 14). סטף קארי מהווה את דוגמת הדגל למהפך הזה (שקף 15). אפשר להתרשם גם מהגידול במספר השלשות שנקלעו בעונה בודדת ע"י שחקן אחד לאורך השנים (שקף 16, שימו לב לחריגה בכמות השלשות ב-2016 – זהו סטף קארי). השינוי הזה – העדפה של זריקת שלשה על פני זריקה לשתי נקודות מטווח בינוני – גורם למשחק להיות הרבה יותר "מרווח" מבעבר (שקפים 17-18, התכווצות ההגנה בשנות השמונים לעומת הריווח כיום). הריווח הזה גורם לכך שעמדות ותפקידים שפעם היו מאוד דומיננטיים, כבר לא רלוונטיים בכדורסל המודרני (שקף 19). סנטרים גבוהים שמשחקים אך ורק מתחת לסל, כדוגמת רוי היברט בהווה או מארק איטון בעבר, היו פעם מצרך נחשק בליגה, אבל לא היום. סנטרים כבר לא יכולים יותר ל"היתקע" מתחת לסל וחייבים להיות מהירים וזריזים מספיק להגן על קשת השלוש ולרווח את משחק ההתקפה ע"י קליעה מרחוק. לעומת זאת, תפקידים שפעם היו נדירים בליגה (שחקנים בין-עמדות, טווינרים, שמתמחים בהגנה ושלשות – 3&D) מאוד מחוזרים כיום בעקבות ההתאמה שלהם לאופי החדש של המשחק.

הדוגמא הבאה מגיעה מהגמר של 2013 שבו התמודדו מיאמי היט מול סאן-אנטוניו ספרס (שקפים 20-23, בחרתי לדלג עליהם בשיעור של 45 דקות). לאחר שלושה משחקים הספרס הובילו 2-1 כאשר את המשחק השלישי נצחו בהפרש של 26 נקודות! בסופה של הסדרה מיאמי ניצחה 4-3. השאלה היא מה השתנה בין שלושת המשחקים הראשונים והמשך הסדרה? מתברר שנתונים סטטיסטיים קריטיים של לברון ג'יימס, השחקן המוביל במיאמי והטוב בליגה, עלו באופן מאוד משמעותי במהלך המשחקים האחרונים (שקף 21). מתברר שבמשחקים הראשונים הספרס צופפו את ההגנה, מה שהקשה על לברון לחדור לסל ביעילות. לעומת זאת, החל מהמשחק הרביעי, מיאמי שיתפה יותר שחקנים שמצטיינים בקליעה לשלוש נקודות (למשל, ריי אלן ומייק מילר) על חשבון שחקנים שקולעים פחות טוב (יודוניס האסלם ודווין וייד) (שקף 22). את התוצאה – ריווח של המשחק ויעילות התקפית משופרת – ניתן למדוד באמצעות בחינת ה-convex hull (הסבר אינטואיטיבי בשקף) של השחקנים (שקף 23).

איך להרכיב קבוצה אלופה? (שקפים 24-48): החלק השני חוזר לשאלה שהוצגה בסרטMoney Ball – איך למדוד שחקנים באופן כמותי (שקף 24). אחת מהמטרות של החלק הזה היא להעביר את המסר שאפשר להגדיר מדדים רבים ושונים, חשוב להבין את היתרונות והמגבלות של כל מדד ולהצליב מדדים שונים כדי לדעת להעריך באופן יותר מדויק את "שוויו" של כל שחקן.

ראשית, חשוב להזכיר את תקרת המשכורות בליגת ה-NBA (שקף 25). כדי לפשט את הנושא נניח שקבוצה מוציאה בדיוק את גובה תקרת המשכורות. המשמעות היא שהיכולת למדוד באופן יעיל יכולת של שחקן עשויה להוביל להרכבת קבוצה יותר מוצלחת.

המדד הכי פשוט ליכולת של שחקן, ממנו נתחיל, הוא מספר נקודות משחק (שקף 26). את מי משני השחקנים הבאים הייתם מחתימים לקבוצתם? הראשון קולע 15 נק' למשחק והשני קולע 14 נק' למשחק. שני השחקנים בשנתם הרביעית בליגה, משכורתם זהה והנתונים האחרים גם כן זהים. התשובה הטבעית היא לבחור את השחקן שקולע 15 נק' למשחק, אבל ברגע שמציגים את המגמה בזמן, רואים שהשחקן הראשון במגמת ירידה ביכולת, בעוד השני במגמת עליה (שקף 27). מטרת הדוגמא הזו להדגיש שנתונים בזמן עשויים להיות חשובים.

 

נחזור לשאלה. איך ניתן להשוות בין שני שחקנים? נכון, מספרי הנקודות, הריבאונדים והאסיסטים למשחק הם חשובים, אבל לא מספיקים. כדי להשוות בין שני שחקנים יש לנרמל תחילה את הנתונים שלהם למספר דקות המשחק שלהם (שקף 28). דוגמא לנרמול ל-36 דק' משחק (36 דק' נבחר משום שזה זמן משחק מקובל לשחקן מוביל, משך זמן זה מאפשר לקבל אינטואיציה לגבי המשמעות בהקשר של זמן משחק כדורסל שלם) (שקף 29). חשוב להיות מודעים לחסרונות של המדד (שקף 30 – ניתן לדלג על חלק ממגבלות המדד כדי לחסוך בזמן). ראשית, בעיית גודל המדגם: קשה לחזות ביצועים של שחקן ששיחק מספר מועט של דקות (צילום המטבע בשקף נועד להסביר זאת באמצעות דוגמא של השפעה של גודל המדגם בהטלת מטבע). שנית, ההנחה ששחקן ששיחק 10 דק' ישמור על קצב דומה לאורך 36 דקות כמעט תמיד לא נכונה. שלישית, לעיתים הסיבה ששחקן הוגבל לזמן משחק קצר עשויה למנוע מלאפשר לו להשתתף לזמנים ארוכים יותר (לדוגמא, שחקן הגנה חלש במיוחד שמשחק רק בזמנים בהם נמצא שחקן התקפה מוגבל בצד היריב). רביעית, שחקן שמשחק מספר מועט של דקות לעיתים קרובות ישחק אותם מול השחקנים הפחות מוכשרים של הקבוצה היריב. אפשר לפתח דיון על איך להשוות בין קבוצה שמשחקת בקצב מהיר מול כזו שמשחקת בקצב יותר איטי (הסטטיסטיקה תראה "פחות טובה"), אבל ויתרתי על זה בשיעור שהעברתי. חלק מהחומר בחלק הזה מבוסס על רעיונות מhttps://bit.ly/2rZJ2Xg.

נתבונן בסטטיסטיקה של שני שחקנים, פול מילסאפ ודירק נוביצקי (השחקן החביב עלי! התגוררתי שלוש שנים בדאלאס…). ניתן לראות שהסטטיסטיקה של נקודות לדקה אצל פול מילסאפ יציבה ואפילו קצת משתפרת כאשר הוא מקבל יותר דקות משחק (שקפים 31-32, ההשוואה היא בין הביצועים שלו בשנים השונות). אצל דירק נוביצקי, לעומת זאת, רואים עליה משמעותית בנקודות לדקה ככל שקיבל יותר זמן משחק (שקפים 33-34). ניתן להיכנס קצת יותר לעומק ולדבר על התקדמות הקריירה של נוביצקי (עד לשנים האחרונות היה מאוד יעיל התקפית אפילו שזמן המשחק שלו התקצר, בשנים האחרונות רואים ירידה תלולה במדד הזה) (שקפים 35-36). השוואה ישירה בין מדד הנקודות לדקה של נוביצקי מול מיילסאפ מראה שנוביצקי מוביל ללא תלות במספר הדקות ששיחקו (הנקודות האדומות גבוהות מהכחולות) (שקף 37).

כעת נעבור למדד היעילות ההתקפית (שקף 38). מתואר מדד ה-individual scoring efficiency (ISE): כמה נקודות מייצר שחקן בכל זריקה. המונה במדד הוא מספר הנקודות שהשחקן קלע, בעוד המכנה מורכב ממספר הזריקות, מספר איבודי הכדור (אפשר לחשוב על איבוד כדור כניסיון קליעה מבוזבז), ופקטור כפול מספר קליעות העונשין (משקלל את ערך זריקת עונשין לעומת שכלול קליעה ל-2 או ל-3 נקודות בהתקפה). כדי להדגיש שמדדים שונים עשויים ללמד אותנו תובנות חדשות נשווה את מדד היעילות ISE  עבור עשרת הקלעים המצטיינים בליגה (שקפים 39-40, הנתונים נכונים לשנת 2016). ההסבר למדד היעילות הנמוך של ראסל ווסטברוק ביחס לאיזייאה תומאס נובע מכך שהראשון מנסה 30% יותר זריקות לסל, ומאבד פי שתיים כדורים (שקף 41).

המדד הבא לביצועים של שחקן יהיה מדד ה-"פלוס-מינוס". נאלצתי לדלג על החלק הזה בשיעור שהעברתי מפאת חוסר זמן, והנושא כנראה מתאים לילדים בוגרים יותר. מדד פלוס-מינוס מחושב כמספר הנקודות שהקבוצה קלעה פחות המספר שהיא ספגה בזמן שהשחקן היה על המגרש (מנורמל ל-48 דק', משך הזמן של משחק) ומטרתו לכמת כמה שחקן בודד תורם לביצועי הקבוצה (שקפים 42-43). חיסרון ברור של המדד הוא שלשחקנים בקבוצות חזקות המדד יהיה גבוה, גם אם התרומה שלהם לא משמעותית לקבוצה (שקף 44). לדוגמא, זאזה פצ'וליה נמצא בצמרת הליגה מבחינת מדד פלוס-מינוס. אלא, שכאשר בודקים את הצלחת הקבוצה שלו (גולדן-סטייט ווריורס, הקבוצה המובילה בליגה) רואים שעיקר הקרדיט מגיע להימצאותו של סטף קארי על המגרש (שקף 45). לסיכום, מדד פלוס-מינוס נותן חשיבות לשחקנים האחרים בקבוצה. לקהל יותר בוגר אפשר להרחיב לגבי טיפול בבעיה שהצגנו במדד פלוס-מינוס ולשוחח על מדדים אחרים (שקפים 46-47). לסיכום החלק הזה, נזכיר שמדדי הסטטיסטיקות המתקדמות יותר אינפורמטיביות ולמעשה מחליפות את המדדים הפשוטים של נק'-ריב'-אס' בקבלת החלטות מקצועיות וכן שעלינו להבין את היתרונות והחסרונות של כל מדד ולדעת לשלב בין מדדים שונים על מנת לקבל החלטה מושכלת (שקף 48). הנושאים האלה לא פשוטים וכיום כל קבוצת NBA מעסיקה מספר אנשים מרקע כמותי שעוסקים בניתוח נתונים מתקדם.

ניתוח חוזקות וחולשות של שחקן (שקפים 49-53): החלק (הקצר) הבא מבוסס על המאמר, https://on.wsj.com/2kZPcUF. אני ממליץ מאוד לשמור לו (וכן לחלק הבא, האחרון) זמן – הוא קצר ומעניין. ג'יימס הארדן מהווה תעלומה, הוא לא הכי מהיר, גבוה, חזק או מדוייק אבל בכל זאת הוא כנראה ייבחר לשחקן המצטיין בליגה (MVP, ב-2018) – מה מיוחד בו? סדרת בדיקות פזיולוגיות מתקדמות גילתה כי "כח העל" של הארדן הוא האטה – הוא מצליח לעצור (להאט) בקצב מהיר באופן חריג ביחס לשאר השחקנים ב-NBA (שקף 50). היכולת הזו כנראה אפשרה לו לשכלל את מהלך ה-stepback לבלתי עציר (אנימציה ודוגמא חיה עם הסבר בשקפים 51-53).

החלטות בסיום משחק (שקפים 54-55): נסיים בחידה. האם עדיף לנסות זריקה ל-2 נק' או ל-3 נק' במהלך האחרון במשחק כאשר הקבוצה שלנו מפגרת בשתי נקודות? מתברר, שתחת התנאים הנתונים בשקף, זריקה ל-3 עדיפה. זאת משום שבסופו של דבר המטרה היא כמובן לנצח את המשחק ולכן יש לקחת בחשבון את הסיכוי (המשמעותי) להפסיד בהארכה, אפילו שהסיכוי להצלחה בניסיון זריקה ל-2 נק' עדיף.

שני שקפים נוספים שהוספתי מאפשרים לפתח דיון לגבי אסטרטגיות לבניית קבוצה אלופה (שקף 56) וקישור להרצאת TED  מעניינת בנושא ניתוח נתונים בכדורסל.

 

מנחם לס

מנהל הופס. הזקן והוותיק מכולם בצוות. מנסה לכתוב יומית - כל זמן שאוכל!

לפוסט הזה יש 52 תגובות

  1. מענייין מאוד

    אכן צריך את השקופיות שיהיה יותר מובן

    אותי הסטטיסטיקות הידועות לא משכנעות מדי..למשל ה+- הוא תלוי בככ הרבה גורמים שבצורה הפשוטה שלו הוא לא משכנע..
    -שחקן משחק בקבוצה מנצחת/מפסידה
    -הוא משחק עם כוכב על המגרש/שחקן שהוא חור בהגנה ועוד הרבה אוםציות אחרות

    לכן סטט' אולי בגרסה המשודרגת מאוד שלה היא נכונה אבל כמו שאמרת שנעלמו הספירת נק'/ריב' של שנות ה80 בסוף נגיע לסטט' עמוקות שיכסו כמה שיותר פאשלות אפשריות בחישובים(אולי יש היום גם)

    לכן כרגע אני עדיין מנסה לראות בעיניים את יכולת של שחקן מסוים על המגרש מאשר בסטט'-מה שלא יעיל לבניית קבוצות שלמות שצריך לחקור לא מעט שחקנים..מזל שסרבתי להצעה מיוסטון 🙂

    -דבר אחרון..לגבי החידה בסוף-אני מקווה מאוד שלא בגלל זה בבNBA לוקחים זריקות לשלוש בעיקר על הבאזר ולא שתיים, תמיד חשבתי (ועדיין חושב) שזה עוד אחד מהמנהגים שיש שם..כמו לא לעשות עברה על השחקן כדי שיזרוק 2 זר' עונשין ולא יוכל לזרוק לשלוש ולהשוות תוצאה…

    1. אני מסכים שהמדדים הפשוטים לא משכנעים אבל לא חושב שזה נכון לדבר על מדדים יותר מורכבים בשיעור של 45 דקות לילדים.

      המטרה היתה לגרום לילדים לחשוב על הנושא, להבין את המשמעות והמגבלות של המדדים השונים ושיש צורך להתסכל על כמה מהם על מנת להבין יותר טוב (וכנראה לא באופן מושלם) את התמונה המלאה..

  2. תודה רבה אסף – מעורר מחשבה.
    חייב להתייחס לפאן המתודולוגי ללא קשר לתוכן ולמרות שדשנו בנושא הזה עד דק אני לא מסוגל להתעלם ממנו כל פעם מחדש.
    אתה כותב כך: "ביחד עם כלכלן צעיר מאוניברסיטת ייל (ג'ונה היל), משתמשים ב-"אנליטיקס" כדי לבחור שחקנים מצוינים וזולים ששאר הקבוצות פספסו בגלל הגישה הסובייקטיבית והטיות שונות. (לדוגמא, הערכה נמוכה של שחקנים עם סגנון זריקה מוזר, אבל אפקטיבי). שלושת הקטעים הקצרים שבחרתי להציג מתארים את הבעיה, הרעיון להשתמש בנתונים במקום חוות דעת סובייקטיבית (ומוטה), והמימוש"

    ככל שעוברות השנים אני שם לב לנטייה, במיוחד של אנשים הבאים מאסכולות של מדעים מדוייקים לדבר על הטיות חשיבה מחד ולדבר על "הסתמכות על נתונים" מאידך כמאגר אשר הסתמכות עליו הינה ההסתמכות שצריכה ללכת לכיוונים אבסולוטים. אך האם הסתמכות על נתונים הינה אינה חוטאת בהטיות לא פחות גדולות?
    קח למשל את הטיעון הבא: לווסטברוק אין עם מי לשחק. הראיה שמבוססת על נתונים היא שהוא עם ממוצע טריפל דאבל כן כן שתי עונות רצופות הקבוצה שלו מורידה אותו למטה ובגללה הוא לא עובר סיבוב ראשון.
    נכון אפשר להביא נתונים אחרים על אחוז אפקטיבי הירוד שלו אבל מדוע הנתון הזה חשוב יותר מנתונים אחרים?
    אם הייתי מסתמך על נתונים ולא על דעתי המוטה הייתי מהמר על טורנטו כאלופת המזרח ולא כנתונה לחסדי המטאטא של לברון שלא חס עליהם. אני חושב שחייבים להיות זהירים ומסויגים יותר, ולהבין שגם למספרים ישנם מגבלות והטיות – אפילו במדעים שנחשבים ליותר מדויקים.

    1. תודה על הפידבק 🙂

      ראשית, מדובר פה בשיעור לילדים, המטרה שלו היא לא בהכרח לשכנע את קהל חובבי הכדורסל שהישועה נמצאת במספרים.

      שנית, אני חושב ששנינו מסכימים שהיכולת להבין את כדורסל כיום משופרת מאוד ביחס לעבר בזכות נתונים כמותיים, מדדים וסטטיסטיקה. עדות לכך היא השינוי באופי המשחק שמתואר בחלק הראשון של המצגת. אני מסכים שלבעלים \ מנהל \ מאמן של קבוצה (או אוהד) צריכה להיות דיעה אישית ואג'נדה (שבהגדרה היא מוטה) – אפילו בזה המספרים יכולים לעזור.

      לגבי הטיעון שלך "אפשר להביא נתונים אחרים על אחוז אפקטיבי הירוד שלו אבל מדוע הנתון הזה חשוב יותר מנתונים אחרים?", זו בדיוק הנקודה שרציתי להדגיש: "לסיכום החלק הזה, נזכיר שמדדי הסטטיסטיקות המתקדמות יותר אינפורמטיביות ולמעשה מחליפות את המדדים הפשוטים של נק'-ריב'-אס' בקבלת החלטות מקצועיות וכן שעלינו להבין את היתרונות והחסרונות של כל מדד ולדעת לשלב בין מדדים שונים על מנת לקבל החלטה מושכלת"

      1. אסף אני לרגע לא מבטל את חשיבות המדידה הנתונים ההסתברות והסטטיסטיקה. אני בעצמי משתמש בזה לא מעט על אף שאני לא מבין גדול בהסתברות. מה שאני טוען שאפשר להבין מן הדברים שלך ובדגש על אפשר וממש לא בהכרח מה שאתה אומר; האבסולוטיות שאפשר ללכת אליה וכאילו שכאשר מדברים בשפה המספרית אין שום הטיה או התרשמות סובייקטיבית. אני חושב שצורת חשיבה כזו היא מאוד מתעתעת ופשוט לא נכונה – זוהי דתיות שיכולה לקבע לא פחות מכל דת שהיא עצם הבאת נתונים לא הופכת את הפרשנות לפחות סובייקטיבית וישנם עוד פרמטרים רבים על מנת להצליח להיות באמת "מדעי".

        1. הדוגמא של זריקות לשלוש מדגימה באופן יפה, איך מדידה פשוטה עשויה לשנות את האופן שבו אנחנו מבינים את המשחק. כמובן שחלקים אחרים ממנו יותר מורכבים..בסופו של דבר המשחק סופר מסובך ואף מדד לא "יעשה את העבודה". החוכמה היא לדעת לשלב מדדים שונים באופן אינטיליגנטי (שילוב של מדע, אג'נדה וסוג של אומנות) וגם להתחשב בהתרשמות סובייקטיבית (לדוגמא אופי השחקן).

          כמובן שאני מסכים עם האמירה ש-"עצם הבאת נתונים לא הופכת את הפרשנות לפחות סובייקטיבית", מצד שני, התעלמות מנתונים והסתמכות על התרשמות סובייקטיבית באופי בלעדי גם לא טובה.

  3. אחלה פוסט, יופי של שיעור.

    מילה על סטטיסטיקה וסטטיסטיקאים.
    (לא באמת קשור למאמר, אבל בכל זאת)

    סטטיסטיקה היא כלי. הבעיה של הכלי היא שלפעמים (עד כדי בדרך כלל), המשתמשים בכלי (קְרִי – הסטטיסטיקאים) מתייחסים עליו (ולתוצאות) כמדע.
    זה משעשע בעיקר לנוכח העובדה שדווקא המדע (פיזיקה, לדוגמה) מבין שעצם המדידה, משנה את התוצאות.
    (אולי זו הסיבה שדדי בחר בהייזנברג כמייצגו? . . .)

    לדוגמה:
    בעידן בו היעילות הפכה לאחד מהמדדים המשמעותיים,
    ניתן לראות ששחקנים מסוימים (אמממ, לברון) בוחרים לא לקחת זריקות קשות כאשר נותרו שניות בודדות בסיומו של רבע. וזה למרות שלא לקחת זריקה שכזו פוגע בקבוצה (עדיף 5% לסל, על 100% ל-0 נק').
    הסיבה היא שזריקה שכזו, פוגעת ביעילות הנרשמת לשחקן בסיומו של במשחק.

    1. לכן צריך להיות ביקורתיים לגבי כל מדד ולהצליב כמה מדדים שונים כדי להגיע למסקנה יותר מבוססת… זה אחד מהמסרים העיקריים שניסיתי להעביר בהרצאה.

      אני מסכים שמדדים דוחפים את ה"נמדדים" להתאים את עצמם לפונקציית המטרה (לדוגמא, מבחני מיצ"ב \ פיזה במערכת החינוך, פרסום מאמרים דווקא בעיתונים מסויימים באקדמיה). לעיתים קובעי המדד מתכננים מראש להדגיש נושאים מסויימים כדי שה"נמדדים" יתאימו את עצמם אליו (שמעתי דוגמא על הכנסת פרמטר של עבודה בקבוצה לאחד מהמדדים במערכת החינוך כדי לעודד עבודה קבוצתית)

  4. מעניין מאוד. תודה רבה.
    אני חושב שהשימוש בסטטיסטיקות מתקדמות אכן שיפר את המשחק אבל עדיין אין כמו מראה עיניים כדי להתרשם משחקן.
    הרי הנתונים המספריים מושפעים מכל כל הרבה דברים שהם לא יכולים בסופו של דבר לתת את המדד ״הנקי״ ביותר.

    בסופו של דבר צריך את השחקן שמסוגל לייצר לעצמו ולאחרים מצבי קליעה שהכל תקוע.
    כמו שהרבה שחקנים חייבים את הקריירה שלהם למהפכת המספרים, ישנם גם כאלו שמקללים אותה (ד״ש מונטה אליס).

    שוב, תודה על המאמר.

  5. מאמר מרתק ומצויין כמה נקודות :
    1. הסנטרים של העבר לא יכולים להתקיים היום ואחת הסיבות העיקריות היה ההגנה האזורית, כמובן שמבחינה הגנתית הם חייבים להיות הרבה יותר ורסטיליים כמו שציינת, אבל תוריד את ההגנה האזורית ותראה איך כל עניין הטווח שוב משתנה.

    2. הבעיה בלהסתכל רק על הצד הסטטיסטי זה שהוא לא מספר את כל הסיפור של המשחק, ברגע שקולעים מתחת לסל באחוזים טובים 55-58% יש ייתרון משמעותי על זריקה מ3 שנכנסת ב40% אחוז למרות שמבחינה אפקטיבית ויעילות קליעה הזריקה מ3 יעילה יותר, סלים של סנטר מתחת לסל מאטים את היציאה להתקפה של הקבוצה הנגדית ומאפשרים לקחת ריבאונד התקפי. אותו עיקרון לשלושה מטר וחצי מאחורי הקשת שעדיפה לקבוצה הרבה יותר מאשר שחקן שקולע רק מקו ה3 גם אם באחוזים יותר גבוהיים, מכיוון שהיא פותחת נתיבי חדירה ומסירה לשחקנים האחרים.

    3. יש גם את העניין של האפקט הפסיכולגי נוסף וקובי ברייאנט דוגמה מצויינת לכך למרות היעילות הוא היה מרכז את ההגנה סביבו ומושך שניים שלושה שומרים דבר שהיה מאפשר קליעות חופשיות לאחרים וריבאונדים. או ששלושות מורידות לך מהר מאוד את האוויר מהמפרשים רק לראות את הפרצוף של היריבה שגולדן סטייט סוגרת 10 הפרש בדקה או פותחת ייתרון בלתי מחיק.

    1. 1. מסכים. למטרת שיעור (בעצם, גם במחקר) יש צורך בהנחות מסוימות ע"מ לפשט את הבעיה. בשיעור של 45 דק' לילדים, ההנחות האלה צריכות להיות מאוד פשוטות (לדוגמא, ההנחה של תקרת המשכורות היתה סופר פשטנית).

      2-3. גם מסכים. כמובן שאפשר לנסות להגדיר מדדים שיכמתו גם את האספקטים שציינת. ובכל מקרה, גם אחרי התחשבות במספר מדדים מורכבים, יש צורך באיש מקצוע שידע לשלב אותם עם אלמנטים אחרים (שעשויים להיות מוטים) כדי לקבל החלטה. אם זה היה פשוט, הקבוצות לא היו מעסיקות 4-5 אנשים שמתמחים במספרים. ואם המספרים היו כל הסיפור, אז לא היה צריך מנהלים ומאמנים. המספרים הם כלי עזר לקבלת החלטות..

    1. תודה! התחום הוא ביולוגיה תאית חישובית – חקר תהליכים דינמיים בתאים באמצעות שיטות חישוביות מגוונות. שאלת המחקר העיקרית הראשונה תתמקד בהבנת מנגנונים להתהוות של התנהגות קבוצתית בתאים במערכות שונות (מוות תאים קבוצתי, תנועת תאים בקבוצה, איתות סידן קבוצתי, התפתחות עוברית) דרך מנגוני תקשורת בין-תאית.

      אפשר לקרוא קצת על החזון המחקרי פה, http://www.nature.com/news/cell-biologists-should-specialize-not-hybridize-1.20277

      בקרוב אתחיל לגייס סטודנטים \ חוקרים מוכשרים מרקע כמותי (הנדסה, מדעי המחשב, פיזיקה,..) להצטרף למעבדה. לא יהיה צורך בידע ביולוגי מוקדם – הבעיות יוגדרו כבעיות חישוביות, והידע בביולוגיה ילמד תוך כדי תנועה. עניין בכדורסל יהיה בונוס 🙂

      1. אני מבין שאתה מגיע מהתחום של מדעי המחשב?
        מהן אותן שיטות חישוב שבהן אתה משתמש? כלומר איך אתה עוקב אחרי הדינמיקה בתא?

        1. נכון, במקור ממדעי המחשב, בחמש שנים האחרונות אני מבלה במחלקות לביולוגיה. הנתונים העיקריים הם סרטי מיקרוסקופיה (live cell imaging). השיטות החישוביות הן מתחומים של ראייה חישובית, למידת מכונה, ניתוח רשתות וניתוח סדרות עתיות. בדר"כ השלבים הבסיסיים לעקיבה אחרי דינמיקה בתא כוללים זיהוי ועקיבה (detection + tracking), למרות שזה לא תמיד המצב. החלקים המעניינים הם מה שמגיע אחרי כן..

          1. תודה, נשמע מעניין. זה היה די ברור מההצהרת כוונות שהבאת. 🙂
            מקווה שהחלק המעצבן הזה של גיוס כספים לא יהיה אבן נגף בדרך.

      2. תודה על המאמר המחכים ומגרה המחשבה.
        מציע לוודא מראש בחינה של שאלת היסוד: האם התנהגות קבוצתית היא מהלך קבוצתי או מהלך של אוסף של פרטים…

  6. אסף ברוך הבא לאב״ג! נראה לי שניפגש לקפה מתישהו.
    עוד לא הספקתי לקרוא את הכל, אין זמן כרגע, אבל זה מעניין מאוד.
    הבעיה העיקרית עם עודף הנתונים של העולם המודרני היא שאנחנו עין לנתח אותו. כלומר חסרה תיאוריה שתאפשר לנו להבין תהליכים שמסתתרים מאחורי הנתונים. לגבי כדורסל זה בולט. ה אני בול מאפשר להבין תהליכים, לאו דווקא לנבא את תוצאות הסדרה בין שתי קבוצות כלשהן.

    1. קפה – בשמחה 🙂 (רק צריך לדעת מי אתה לפני כן..הדוא"ל שלי הוא assafzar@gmail.com)

      די מסכים עם מה שאתה אומר. בלי קשר לכדורסל באופן ספציפי, במקרים מסויימים אפשר לנבא תוצאה גם מבלי להבין את התהליך (באמצעות למידת מכונה). כדי להצליח לקבל החלטות נכונות ולאפשר שינוי של התוצאה כדאי מאוד להבין את התהליך ותיאוריה יכולה מאוד לעזור בכך.

  7. יפה מאוד.
    אני חושב שהמקטרגים על רעיון האנליטיקס יגידו שזה אכן עובד במספרים גדולים, אבל כשזה מגיע לרמה הפרטנית, שם צריך לעבור לחוקים אחרים. קצת כמו בפיזיקה עם חוקי ניוטון שעובדים בכל מקום, עד שעושים זום אין.
    משחק 7 בין יוסטון לגולדן סטייט היה כמו בדיחה של אלוהים. מה היה הסיכוי שיוסטון יחטיאו 27 זריקות רצופות לשלוש? אם אני זוכר נכון זה היה 1 ל120,000. יש יותר סיכוי שהייתי מקבל 2 מכות ברק בזמן הזה.
    ועדיין, תמיד נראה שקבוצות האנליטיקס נופלות על אנומליות כאלו מוזרות, רק מכיוון שהן מסתמכות על הסטטיסטיקה שתבוא להציל אותן.

  8. מעולה אסף! אם הצלחת להעביר זאת בצורה נהירה (פתחתי גם את המצגת) להדיוט כמוני, בטוח הילדים הבינו. לא יודע אם אתה הולך לשפר את העולם במעבדה, אבל אולי בזכותך יגדלו לנו כמה מאמנים חדשים

  9. יופי של רעיון, ויופי של ביצוע, תודה רבה אסף. שלי עוד קטנים, אבל אשמור את המצגת כי זה ממש שיעור יפה.

  10. אסף, את האימייל שלי יש לך. המשך לכתוב כשיגרד לך. הרמה האינטלקטואלית של הגולשים ואנשי הצוות היא גבוהה בד"כ משאר אתרי הספורט, וזה המקום לכתבות יותר מחכימות, אם כי אתה יכול לכתוב גם על הבעייה סקרמנטו בבחירת דראפט מחורבנות. נראה במי יבחרו מחרתיים.

  11. תודה אסף. יש לנו כמה וכמה נקודות השקה מקצועיות בחיים, ולכן השאלה שלי היא לא למה לא משקללים את כל המדדים בדיפ לרנינג חביב (כי ברור שזה יגיע), אלא יותר איך מודדים ומשקללים את הפסיכולוגיה של המשחק.
    הרי בסוף יש שם בני אדם, ובני אדם מונעים מפסיכולוגיה עמוקה, בעיקר דווקא כשזה חשוב. איך קבוצה די אפורה, אך חזקה מנטלית כמו דטרויט של 2004 מפרקת קבוצה של כוכבים כמו הלייקרס? מהם מרכיבי האישיות שבונים ווינרים ולוזרים, ואיך מודדים אותם?
    ומכיוון שברור שפסיכולוגיה זה רק שם קוד לתהליכים ביולוגיים רחבים יותר, האם יבוא יום שבו נראה "רמות ביטוי דופאמין בזמן לחץ" למועמדים בדראפט?

    והכי חשוב – עם כל האהבה למספרים ומדדים, האם הם לא קצת פוגעים בתמימות ובכיף של פשוט כדורסל?

    1. כימות של פסיכולוגיה גדול עלי 😉

      הייתי רוצה להתייחס לחלק השני "עם כל האהבה למספרים ומדדים, האם הם לא קצת פוגעים בתמימות ובכיף של פשוט כדורסל?". מטרת ההרצאה היתה להפוך שיעור *מתמטיקה* לכייפי, אין שום טיעון לגבי האם מספרים \ מדדים הופכים את המשחק ליותר \ פחות אטרקטיבי. בעיני החלק הכי יפה הוא דווקא הפשטות, איך תובנה כמעט טריוויאלית לגבי שלשות שינתה כ"כ הרבה באופי המשחק (לדעתי האישית, לטובה).

      אפשר עכשיו לפתוח דיון לגבי השפעת האנאליטיקס לגבי ההנאה מהמשחק, אבל חשוב להבין שזו לא היתה מטרת השיעור שהכנתי.

  12. I enjoyed reading this. We share our love for basketball. I lived in Miami when LeBron was around
    I now live near Milwaukee where the Greek Freak is a GOD.
    …. We also played together at the Orchestra
    If you ever want to collaborate on an academic paper about basketball, it can be fun. My main research topic is on management and leadership
    Yaron Zoller

כתיבת תגובה

סגירת תפריט