שחקני ה3&D הטובים בליגה / רז סמואל

רז סמואל הוא מתכנת בן 22 מרעננה. כבר במאמרו הראשון הוא בחר להיכנס בעובי הקורה ולתקוף את המושג המעורפל של שחקן D&3. נקווה לראות עוד ניתוחים ממנו בהמשך.

***

הליגה עוברת מהפכה בעידן האנליטיקס. יותר שלשות, יותר מהר וניתוח הרבה יותר מעמיק של המשחק כדי להבין עבור כל מהלך אם הוא טוב או לא. בתוך כל זה תפקיד הסנטר הולך ומשתנה וזורח לו תפקיד חדש (שדריל מורי ויוסטון מיקסמו בטרייד על קאפלה) – 3&D. שחקנים שמאד טובים ב2 דברים על המגרש:
הגנה ושלשות. בפוסט הזה ננסה לבחון את המהפכה שהם עברו בשנים האחרונות וננסה לנתח מי הם כיום השחקנים הטובים ביותר בליגה בתפקיד הזה.

כיום, כשבליגה יש שחקני התקפה כל כך טובים כמו יאניס, הארדן ולברון כל מה שהחברה האלה צריכים זה שחקנים שייצרו להם ספייסינג. שיהיה להם את המרווח לעשות את מה שהם כל כך טובים בו. ואז, ברגע שההגנה חייבת להתכווץ כדי להפריע למהלך מגיעה המסירה החוצה לקלעי וכל מה שנותר לו זה לזרוק ולקלוע אותה. ולכן היכולת שלו לעשות את זה היא גורם מכריע בכך ש:

  • יהיה משחק מרווח – זו הנק' הקריטית כמו שהסברנו קודם.
  • כמות הנק' שיקלעו – בסוף בקצב המשחק של היום עוד כמה נק' בקליעה יכולות לעשות את ההבדל בין ניצחון להפסד.

אז אחרי שהבנו למה השחקנים האלו כל כך חשובים לליגה נגיע לחלק המעניין של איך למדוד את התוצאות.

דיסקליימר – כל הנתונים שאתם הולכים לראות מתבססים על נתונים משנת 2017 עד להיום. המטרה היא כדי שהחישובים יכילו כמות מספקת של מידע.

הפרמטר הראשון – קליעה:

נק' המפתח לשחקן אצלנו , הקליעה שלו. קצת הסבר על איך אחשב את המדד.

למדוד קליעה זה בעייתי, יש כל כך הרבה סוגי זריקות. יש שחקנים שמכורח הנסיבות נאלצים לזרוק זריקות שהן בעיקר קשות ויש שחקנים שנהנים מההפקר וזורקים יותר זורקים קלות. להשוות פשוט אחוזי שלשות זה כמו האמרה: להשוות תפוחים לתפוזים.
למשל, נסתכל על ג'יימס הארדן.  אחוזי השלשות שלו ב3 השנים האחרונות עומדים על 36.4.
לעומתו פי ג'יי טאקר קולע ב37.3%. מישהו היה בוחר בקליעה של פי ג'יי טאקר על פני הארדן? אם כן, הוא כנראה שיכור.
לכן, אנחנו נצטרך לקחת מדד יותר ספציפי ותהיו איתי, זה הולך להיות לא פשוט.

דבר ראשון, סוג הזריקה:

בגרף ניתן לראות את פילוח זריקות ה-3 בליגה לפי מרחק מהשומר וכמות כדרורים. ניתן לראות ש2/3 מהזריקות מגיעות מ2 מצבים:

  1. זריקות חופשיות לגמרי ללא כדרור.
  2. זריקות חופשיות (שומר במרחק 1.2 מ' עד 1.6 מ') ללא כדרור.

זה כבר נראית מגמה די ברורה אבל בואו נהיה יותר ספציפיים. הרי אנחנו לא רוצים להסתכל על כל שחקני הליגה אלא על סיווג יותר ספציפי של שחקנים. לשם כך נוסיף כמה חיתוכים על המידע:

  •  USG% – הפרמטר מראה את אחוז ההתקפות שמסתיימות אצל שחקן. מה שאנחנו רוצים להוציא הוא סופרסטארים למיניהם שיודעים לעשות הרבה יותר דברים מאשר סתם לקלוע. ממעבר על הרשימה כל מי שמעל USG של 25% בבירור הם שחקנים שעושים הרבה יותר מרק לעמוד ולצלוף ולכן קודם כל נוריד אותם.
  • AST% – השלמה למדד הUSG. USG בודק רק מבחינת כמות ההתקפות שהסתיימו בידיים של השחקן. אבל, יש גם שחקנים שמומחים במסירה כמו כריס פול, ג'ו אינגלס וכדומה. לכן כאן, נוציא את השחקנים שמוסרים מעל לממוצע.
  • מספר דקות  – כאן המטרה היא להימנע משחקנים לא רלוונטים שמשחקים מעט דקות.

נסתכל על הרשימה של כל השחקנים ששיחקו פחות מ1000 דקות סה"כ בשלוש העונות האחרונות:

שם שחקןדקות משחקתדירות זריקה ל-3סה"כ ניסיונות ל-3
קמרון ג'ונסון994.70.704224
גרנט וויליאמס967.20.44385
גרייסון אלן916.00.537190
דרעוס בייזלי911.60.435100
כריס בושה 889.70.408137
ניקולו מלי889.20.643173
סקן דומבויה752.40.41998
ג'ונה בולדן684.90.57398
לו דורט638.00.46273
ריאן ברקהוף633.80.780145
הנרי אלנסון604.00.416102
נאסיר ליטל571.20.39159
דיונטה בורטון525.60.39073
קלאן מרטין495.00.53096

נראה שמבערך 800 דקות שחקנים מתחילים לזרוק מעט ונהיים פחות רלוונטים למחקר.
בנוסף אני אוסיף פילטר של לפחות 120 זריקות כדי לוודא שבאמת אין לנו שחקנים שלא מתאימים.

  • אחוז השלשות של השחקן מסך הזריקות מהשדה (3PA-freq) – ההגדרה החשובה מבחינתנו היא של שחקן שהוא קודם כל קלעי ואז כל דבר אחר. לכן, נרצה לוודא שרוב הזריקות שלו מתבצעות מעבר לקשת השלוש. השאלה היא באיזה מס' נבחר. השחקן הממוצע בליגה זורק 37.5% מהזריקות שלו מטווח השלוש. אנחנו צריכים סינון שהוא יותר חזק כי שחקן במודל שלנו הוא יותר מהממוצע. נבחר ב45% מהזריקות. זאת נק' די שמרנית(דני גרין וקורבר למשל זורקים מעל 60% מהזריקות שלהם מהטווח הזה). אך כדי לתת צ'אנס לשחקנים שהם גם פחות מובהקים נבחר בנק' הזו.

והתוצאות:

מאד דומה. פה אנחנו מקבלים אפילו דומיננטיות יותר גבוהה של 2 סוגי הזריקות האלו עם 74%.
כעת, נותרו לנו עוד 2 סוגיות:

  1. האם באמת לקחת רק את הזריקות הנפוצות ביותר או שמא עדיין לקחת את כולם.
  2. במידה ולוקחים יותר מסוג זריקה אחד איך לעשות את ההשוואה בצורה נכונה.

לגבי 1- איזה סוג זריקות ניקח:

אז לשמחתנו 2 הזריקות המובילות הן אחוז מאד משמעותי מכמות הזריקות ולכן נבחר בהן. הסיבה המרכזית היא כמות המידע. מכיוון ששאר סוגי הזריקות האחרים נזרקים בכמות כל כך נמוכה כמות ההטעיות הסטטיסטיות בהן גדולה ולא נוכל להסתמך על זה. לכן נעדיף לעבוד עם איפה שנמצא רוב המידע.

לגבי 2 – איך נבצע השוואה בצורה נכונה:

הבעיה המרכזית כאן היא שיש הבדל באחוזים בין שתי סוגי הזריקות. זריקות שהן wide open נקלעות ב38% בממוצע בעוד שזריקות שהן open נקלעות ב35%. לכן, שחקנים שזורקים יותר זריקות פתוחות לגמרי יהיו ביתרון יחסי על שחקנים שזורקים זריקות open. הפתרון שאבחר בו הוא כזה. בחישוב אחוז הקליעה של שחקן אני אתעלם מכמות הפעמים שהוא זרק מכל טווח. מה שאתייחס אליו זה האחוז שהוא קלע מהטווח הזה.
לאחר שאדע את האחוזים מ2 סוגי הזריקות השונות, אני אעשה ממוצע עם עדיפות לזריקות שהן wide open על פני זריקות open בגלל שהן הזריקות היותר נפוצות, ולכן גם יותר חשובות.

אז קודם כל נוציא את היחס בין 2 סוגי הזריקות שהוא:

1.53 – כלומר על כל זריקת open יש 1.7 זריקות שהן wide open.

אז בעצם החישוב שלנו יהיה – ADJ-3P%=(wide_open% * 1.53 + open% *1 )/2.53

וזהו – כמה תוצאות לדוגמא :

שם שחקן3PA-freq%ADJ-3P
אל-פארוק אמינו0.52735.5
אלן קראב0.67040.3
אנתוני טוליבר0.79742.3
בן מקלמור 0.66140.2
ברוק לופז0.52832.5
ברין פורבס0.55042.4
עבדל נאדר0.46833.6
ברונו קבוקולו0.52731.4
באדי הילד0.50445.7

3PA-freq – תדירות הזריקות של השחקן שמגיעות מה3 (3PA/FGA)
ADJ-3P%– האחוז המנורמל מה3 על פי החישוב החדש.

הפרמטר השני – הגנה:

כאן זה גם לא עסק כל כך פשוט. כיום אין מדד שמודד הגנה בצורה מספיק טובה.
בנוסף, כאן אנחנו מחפשים שומרים טובים נטו, ללא הגבלות מסוימות כמו שיכולנו לייצר בחלק הראשון של הקליעה שבו הגדרנו ספציפית את סוגי הזריקות שהשחקן זורק.

המדד שאבחר בו הוא DRAPM. המדד לא חף מטעויות אבל אני חושב שעל דגימת זמן של 3 שנים גם כן הסטיות מצטמצמות.

הסבר קצר על המדד למי שלא מכיר:

DRAPM – defensive regularized adjusted plus minus מבית היוצר של ג'רמיאס אנגלמן הוא מדד משודרג לplus-minus הנורמטיבי שכולם מכירים. היתרון בו הוא שהוא מנורמל. כלומר, אם שיחקת עם שחקנים טובים רוב הזמן אז הפלוס מינוס שלך יקטן ואם שיחקת אם שחקנים רעים אז הוא יגדל. בכך, אנחנו יודעים למדוד את ההשפעה שלך בלי קשר לשחקנים שנמצאים איתך על הפרקט.
החישוב הוא מעניין, אבל כדי לא להאריך יתר על המידה נסתפק בזה כרגע.
החיסרון בו הוא שאין הסבר ברור ללמה שחקן מדורג גבוה או נמוך וקשה להסביר את התוצאות שהוא נותן.
אנחנו נשתמש במידע של ה3 שנים האחרונות כאן גם כן כדי שיהיה לנו מספיק data ולא ניפול להטעיות בגלל שהשתמשנו במאגר קטן מדי.

מה שאני כן אוהב במדד, זה שהוא לא מסתכל בכלל על הסטטיסטיקה שהשחקן ייצר בזמן שהוא היה על המגרש. הוא נטו מסתכל על ההפרש בתוצאה של המשחק. בכך אנחנו מקבלים מדד שממשקל באותה צורה חטיפה, חסימה או יציאה טובה לקלעי ודברים שלא נרשמים בסטטיסטיקה מקבלים כאן ביטוי.

נצרף את שני חלקי הפאזל ונקבל:

הקווים מציינים את הממוצעים בליגה ב2 הקטגוריות. מי שמעניין אותנו זה מי שנמצא בריבוע הימני למעלה. טוב בהגנה, וגם בקליעה. נקבל:

הצעד הבא – איך אנחנו הולכים לדרג את השחקנים?

שאלה טובה. יש לנו 2 סקאלות שונות לחלוטין ונרצה להבין מי השחקן הכי טוב על פי 2 המדדים. לדוגמא אם נסתכל על מה שקורה למעלה, האם סת' קרי או דני גרין טוב יותר על פי המדדים?


בהתחלה חשבתי על איך לבצע את הדירוג ועלו לי הבעיות הבאות:

  1. שני המדדים הם לא באותו הסקאלה – ולכן אי אפשר למדוד אותם על פי ממוצע ביניהם.
  2. אין אופציה לנרמל מדד אחד לשני – ניסיתי לקחת את אחד המדדים ולהעביר את הערכים שלו להיות באותו טווח ערכים כמו המדד הראשון. הבעיה שעולה כאן היא שהתפלגות הערכים היא שונה.
    נסביר את זה בעזרת דוגמא. קובינגטון, על פי המדד ההגנתי שלנו מוביל בהרבה על שאר השחקנים. ע"י החישוב הזה הערך ההגנתי שלו שווה ערך לקליעה של סת' קרי(מוביל בקליעה). נשים לב שהמרחק של קובינגטון משאר השחקנים הרבה יותר גבוהה מהמרחק של קרי משאר השחקנים ונקבל מכך שהערך ההגנתי של כל מי שמתחת לקובינגטון נפגע הרבה יותר ממי שמתחת לקרי. לכן, זו דוגמא לבעייתיות בשימוש בשיטה הזו.

בגלל הבעיות האלו, בחרתי לעבוד עם הדירוג הבא:

אני אדרג את השחקנים בכל אחת מהקטגוריות באופן עולה מהטוב ביותר עד לגרוע ביותר.
לאחר מכן, אני אקח את 2 הדירוגים ואעשה ביניהם ממוצע ולפי הסדר שלהם אקבע את הדירוגים.
היתרון במדד הזה הוא שהוא ממשקל את 2 המדדים באותו אופן ואין בו הטעיות של סקאלות שונות.
החיסרון הוא בכך ששחקנים שההפרש שלהם מהמקום הקודם גבוהה, לא מקבלים על זה עוד קרדיט (כמו קובינגטון בגרף שלנו).

והתוצאות:

שם שחקןDRAPM%ADJ-3P3PA-freqדרוג DRAPMדרוג 3Pממוצע דרוג
דני גרין1.5543.30.6595128.5
קייל קורבר1.0344.80.7601089
דאג מקדרמוט0.4546.50.49024313.5
דאנקן רובינסון0.4945.70.87422614
סת' קרי0.2352.10.54932116.5
סבי מיקאיליוק0.6041.80.691201919.5
וויין אלינגטון 0.6241.00.830192522
רוברט קובינגטון3.1638.10.66014322
ג'ו האריס0.0146.40.54642423
גארט טמפל1.2738.90.56493723
נמניה בייליצה0.3341.00.479302427
ווסלי מתיוס0.7638.60.609153927
פי ג'יי טאקר0.7738.20.721144228
מאטיס תייבול0.9437.80.609114930
מארווין וויליאמס0.3538.90.577283833
דמיאן דוטסון0.3438.50.500294034.5
אלן קראב0.0140.30.670413035.5
וינס קארטר0.1738.10.648334438.5
ג'סטין הולידיי0.0437.90.614394743

** לגבי העמודות – total_rank מהווה את הממוצע בין הדירוג ההגנתי לקליעה.
                         NORMALIZED_PCT – זה אחוזי הקליעה לשלוש.

  • המנצח הלא מפתיע הוא דני גרין! השם השני שלו זה 3&D.
  • עוד נק' ששווה לשים לב אליה זה המובילים בקטוגוריות הקליעה וההגנה. סת' קרי עם אחוזים מפלצתיים על פי המדד הזה שמגיעים ל52%! קובינגטון מוביל בפסגת הDRAPM עם 3.16.
  • וינס קרטר! בגיל 43, וכל מילה מיותרת.
  • דבר אחרון, דאנקן רובינסון שזורק 87% מהזריקות שלו מהשלוש. מה שנקרא, 3&d אמיתי.

*הנתונים נאספו מ:

https://stats.nba.com

http://nbashotcharts.com/ – DRAPM

עד לפעם הבאה!

לפוסט הזה יש 30 תגובות

  1. ממש מצוין, תודה רבה רז על ההשקעה וכל התוצאה.
    .
    נדמה לי שבחלק של ה-3 מצאת את הנוסחה המנצחת. יפה מאוד.
    .
    בחלק של ה-d, כרגיל, זה יותר קשה, גם בגלל הקושי ה"רגיל" במדידת הגנה, אולי בגלל ההסתמכות על מדד הגנתי בודד, ואולי בגלל ההסתמכות על מדד שבעצם מדגיש יותר את התוצאה הקבוצתית בהגנה מאשר את היכולת האישית שלו.
    .
    ניתן שלוש דוגמאות:
    .
    א. דני גרין – המספרים מסתדרים היטב עם מראה העיניים ועם ההיגיון.
    ב. קייל קורבר – שאיכשהו המדד ההגנתי שלו גבוה למרות שהוא לא ידוע כשחקן הגנה משובח.
    ג. טאקר – ש"אמור" להיות בצמרת הגבוהה ויצא די באמצע, כשהנתון ההגנתי שלו נמוך מזה של קורבר.
    .
    אם עוד נשאר לך קצת זמן וכח הייתי מנסה להבין איך אפשר לדייק את החלק ההגנתי קצת יותר, אולי באמצעות הוספת מדדים הגנתיים נוספים.
    .
    ושוב, פוסט מעולה!! תמשיך לכתוב לנו.

    1. אז העניין עם קורבר באמת מפתיע. אני גם חושב שכמו שאמרת המדד כאן נותן לו over credit וזה נשמע מוזר שהוא מעל לשחקן כמו טאקר.
      מה שמבאס באמת במדד שקשה להסביר אותו ולכן אנחנו נשארים כאן עם שאלה פתוחה.
      אנסה לחשוב איך אפשר לדייק את זה.
      תודה על הפידבק!

  2. תודה רבה רז. מושקע ביותר.
    .
    יבוא יום ואיזה גאון יצליח למצוא את לפצח את הנוסחה למגן טוב (כן אני יודע שזה מאמץ קבוצתי) עד אז נישאר עם הdrpm שבעונות מסויימות מראה שסטף מגן טוב מקליי.

  3. אני חושב שהתוצאות של דני גרין נפלאות, כי צריך להבין שהוא שיחק מול הקבוצות הכי טובות, מקבל משימות הגנה על הכוכבים הכי גדולים של הליגה, ועשה את זה בעונה שעברה כל הדרך עד לאליפות.
    מפתיע בהחלט לראות את הנתונים הגנתיים הטובים של קייל קורבר. גם סת' קרי כמו שאמרת יוצא תותח. כי הקליעה ממש מטורפת, וכל מי שנמצא ברביע הזה המשעות היא שההגנה שלו טובה – באמת כל הכבוד.
    ווינס קרטר – זה פשוט פנומן. להיות בטופ של הליגה שבני הפרמטרים הללו בגיל 43 – זה לא יאומן.

  4. תודה רז.
    גם אני עם התמהים על קייל קורבר בסמיכות מרובה מדי לדני גרין . . .
    מעניין איפה טרבור אריזה, ההגדרה ל D&3, היה נופל לפני כמה שנים, כשהוא עוד היה שווה משהו.

  5. גם אני חושב שהגדרת ההגנה היא משהו מאד בעיייתי. אתה רואה כאן לא מעט שחקני ספסל שמשחקים רוב הזמן מול שחקני ספסל. אז הDRAPM אמור לתפוס את זה אבל לדעתי הוא תופס את זה מאד חלקית.
    בכל אופן יופי של עבודה.
    אני רוצה לחדד לגבי דנקן רובינסון: זו אחוז הזריקות הגבוה ביותר לשלוש מסך כל הזריקות של השחקן בהיסטוריה לשחקן ששיחק מעל 1000 דקות. הוא עושה את זה בזמן שהוא קולע 13.3 נקודות למשחק שזה השני הכי גבוה לשחקן שזורק מעל 70% מהזריקות שלו ל-3 (אחרי ברטאנס של העונה עם 15.5).

  6. רז, NATE SILVER מ-"538" או NYLON CALCULUS ישמחו להכניס את הפוסט שלך באתרים שלהם שיש להם קהל עצום של קוראים, ואז במקרים מיחוחדים גופי מדיה כמו SI ב-CROSSOVER שלהם מכניסים את המאמר עם רשות. זה יכול לתת לך הובי חדש, או אפילו מקור הכנסה צדדי. כל מה שאתה צריך הוא תרגום טוב. לפני עשר שנים אני הייתי עוזר; עכשיו אני כבר לא טוב כמו שהייתי.
    מעניין ביותר וההערה של עידו בתגובה שלו על דנקן רובינסון מעניינת ביותר.

  7. אני לא יודע לאן תגובתי ברחה. רז, אני לא יודע אם שמעת על "538" של נייט סילבר או NYLON CALCULUS. שני האתרים היו שמחים להכניס פוסט כזה שזה בדיוקר במגרש המשחקים שלהם. מהם זה ממשיך הרבה פעמים ב-CROSSOVER של SI ועוד. זה יכול להיות עבורך הובי חדש ומקור הכנסה צדדי. אתה צריך רק תרגום טוב. אני הייתי מציע את עצמי לפני עשר שנים, אבל עתה זה כבר קצת מאוחר עבורי.
    תודה. וההערה של עידו על דנקן רובינסון מאד מעניינת.

    1. שמעתי עליהם, אני מאד אשמח אם הם ירצו כמובן.
      אני אנסה לשפר את המדד ההגנתי כמו שכתבו לי בשאר התגובות ואתרגם את זה גם לאנגלית.
      תודה רבה!
      ואצטרף אליך בנוגע לנק' של עידו – מרתקת.

  8. אני מהאנשים שמעדיפים ויכוח על הפילוסופיה של ה-D&3 ועדיין היה מעניין לקרוא.
    לא מפתיע אך עדיין מדהים לראות את הפער בדירוג ההגנתי של קובינגטון.

  9. בכל זאת הייתי מעדיף נרמול אחר של שילוב שני המדדים.
    אולי ניקוד מ-0 עד 100 של כל מדד, כש-0 זה הניקוד הנמוך ביותר של המדד ו-100 זה הגבוה (נגיד, ה-3.16 של קובינגטון במדד ההגנתי). בשיטה כזו הדומיננטיות של קובינגטון במדד הזה תקבל את המשקל הראוי לה. הרי כרגע אין שום משמעות להפרש שלך מהשחקן שלפניך או אחריך בדירוג (למשל המדד של קובינגטון כפול מזה של הבא אחריו ברשימת המובילים – זה פער עצום).

    ועוד משהו מעניין – מתוך רשימת המובילים, הרוב מופיעים בצמרת אחוזי השלוש. אין כמעט מובילים בתחום ההגנה שהשתחלו לרשימה הסופית (רק קובינגטון וגרין מבין השמינייה המובילה). אותי זה מלמד שזה מדד מאוד כאוטי ואולי לא נכון להשתמש בו – הרי אם נתת משקל שווה לשתי הקטגוריות – הגיוני שברשימה המשוקללת יהיה ייצוג דומה לצמרת של כל רשימה נפרדת.

    1. לגבי הנרמול:
      זה היה מה שעשיתי בהתחלה. הבעיה בשיטה הזו היא שההתפלגות של הערכים היא שונה. לדוגמא, הפער שקובינגטון מייצר מאחרים בהגנה הוא גדול יותר מאשר הפער שקרי מייצר מאחרים בקליעה. לכן, בשיטה הזו הקנס לשומרים יהיה גדול מהקנס שניתן לקלעים שנמצאים מתחתיו בדירוג. נניח נייחס את זה לסקאלת הציונים שהצעת (בין 0-100). אז הקלעי במקום השני יקבל 90 בעוד השומר במקום השני יקבל 80. כל זה יגרום להטעייה והעדפה של שחקני הגנה על פני קלעים, ורציתי להימנע מזה. בגלל זה העדפתי לעבוד עם ציון רגיל ואמנם "לדפוק" את קובינגטון, אבל לגרום לשוויוניות גדולה יותר עבור כל שאר השחקנים.

      לגבי הנק' השנייה:
      נק' מעניינת, אבל זה לא בהכרח מעיד על זה.
      כדי לייצר את הרשימה הסופית, עשיתי 2 פילטרים:
      שהשחקן קלעי טוב מהממוצע בליגה ושומר טוב מהממוצע בליגה.
      לכן, יכול להיות שהשומרים הטובים (חוץ מקובינגטון) פשוט בממוצע הם קלעים ברמה לא מספקת(פחות מהממוצע) ולכן לא נכנסים לקטגוריה.

      1. תודה על ההבהרה לחלק השני. מסבר את העניין היטב.
        עדיין אני לא מסכים איתך לגבי הנרמול. אם יש שחקן הגנה כל כך דומיננטי ביחס לשאר, הוא צריך לקבל על כך קרדיט. האחרים לא נפגעים מכך, משום שהם נמצאים כולם בערך באותה רמה (למשל – אם קובינגטון מקבל 100, אז אולי 10 שחקנים מקבלים 80, וביניהם אין הבדל גדול). גם בעניין הקליעה אין פה קיפוח: אם שחקן מגיע קרוב ל-100% (שזה הציון של קרי) – אז בסדר גמור והוא באמת קלעי טוב יותר (יחסית ל-100%) מאשר המגן השני בטיבו (שראחוק יותר מה-100% של קובינגטון).
        ברגע שאתה מנרמל את הציון בזה של השחקן המוביל – אתה בעצם אומר: "יש כאן 100% שרק אחד מכם הגיע אליו – בואו נראה כמה קרוב אליו כל אחד מכם הגיע". ניתן דוגמה של שני מבחנים בכיתה של 20 תלמידים. במבחן בחשבון תלמיד א' מקבל 100, ב' מקבל 20, ג' מקבל 19, ד' מקבל 18, וכו'…
        ואילו במבחן בעברית תלמיד א' מקבל 98, וכל השאר מקבלים 99 ו-100.
        ברור שתלמיד א' טוב מהאחרים (ממוצע 99), למרות שלפי השיטה שלך הוא המיקום הממוצע שלו הוא 10.5, שזה בטח לא המקום הראשון.

        1. אני מסכים איתך תחת הנחה אחת, ההנחה שקובינגטון וקרי קיבלו 100 במבחן הזה.
          כי תחת האנלוגיה שלך של מבחני חשבון ועברית אתה יוצא מנק' הנחה שהתלמיד שקיבל את הציון הגבוהה ביותר – בהכרח גם קיבל 100.
          נסתכל על הדוגמא:
          במבחן בחשבון היה לי תלמיד גאון – שהוציא במבחן קשה 100(רק 1).
          לעומת זאת, בעברית – אף אחד לא הצליח להצטיין באותה הצורה והציון המקסימלי היה 80.
          על פי השיטה היחסית – תלמיד חשבון שקיבל 75 יקנס בצורה חזקה יותר מאשר התלמיד בעברית ואני חושב שזה מה שקורה במדד הזה.
          וכאן בדיוק נכנסת השאלה המרכזית, כמה ה3.16 drapm של קובינגטון שווים לעומת ה52% של קרי? האם זה טוב יותר, פחות טוב או שווה.
          בגלל שלא ידעתי לתת תשובה מכרעת לשאלה הזו העדפתי ללכת על פתרון שמקטין את הבעיה הזו(לא פותר אותה במלואה) כי טעות בהנחה הזו יכול לגרום להטעיית נתונים גדולה.

  10. תודה על העבודה הקשה,יצא אחלה פוסט.

    אה ואני יכול להעיד שאתה שחקן הרבה יותר מגוון מd3 והיית נחתך גם כן בפרמטר של הusg..יצא לנו לשחק כמה פעמים בנווה זמר 😉😂

  11. פוסט נהדר! תודה.
    .
    2 הסנט שלי על קורבר, טאקר, ומדדי הגנה:
    .
    יש שחקני הגנה אדירים שסוחבים הגנות רעות על הגב (טאקר),
    ויש שחקני הגנה בינוניים מינוס (בלשון ההמעטה) שמשחקים בקבוצות הגנה אדירות (קורבר).
    יכול להיות ששימוש בתוספת קטנה של מקדם שלוקח בחשבון דקות משחק (16 לקורבר, 34 לטאקר) היה עוזר לפתור חלק מהאנומליה.

  12. אז קודם כל, זאת כתבה נפלאה נפלאה נפלאה, שהלוואי והיו יותר כאלה באתר.
    ספציפית אבל אני לא מסכים עם חלק מהמתודולוגיה. או אגיד זאת כך – כל כתבה כזאת שלא שמה את קליי תומפסון בצמרת היא בעייתית. אז נכון שהיוסג׳ שלו גבוה מדי, והוא לא עובר חלק מדרישות הסף, אבל למען האמת אני לא מבין למה. היוסג׳ שלו הוא יוסג׳ של מסיים ולא מתחיל (כלומר, יש לו מעט מאד כדרורים), והוא ללא ספק שחקן הגנה עצום.
    אז איפה אני חושב שיש הטיות? קודם כל, באחוז השלשות מתוך כל הזריקות (3pa freq). אני חושב שזה נכון, אבל רק בהתחשב במספר האמיתי של הזריקות גם כן. למשל (מבלי לבדוק), יתכן שהמספר של קליי תומפסון הוא רק 30% אבל אם יש לו איזה 5-6 זריקות למשחק מהטווח, אז האחוז כמעט ולא משנה.
    שנית ב ast%.הוצאת את אינגלס, וגם פה אני לא מבין למה. אז נכון, הוא יודע לעשות עוד דברים. אבל ברמה הפילוסופית, אני לא מבין למה העובדה שהוא יודע לעשות עוד דברים מבטלת את העובדה שהוא גם יופי של d&3.
    אגיד יותר מכך – נניח היית יכול לבודד רק את הזריקות ששחקן כמו ג׳יימס הארדן לוקח בלי כדרור (לא יודע כמה כאלה יש, אבל נניח 25% מסך הזריקות שלו) – הרי שאם המספרים האבסולוטיים של אותם 25% היו בצמרת של העמדה, אני חושב שזה רק הוגן לקחת את ה 25% האלה ולהשוות אותו, כי זה אומר שגם ברמת ה 3&d הוא טוב מאחרים.

    בקיצור, נדמה לי שהדבר שהכי היה מלמד ברמת ההתקפה (ה 3) על משהו, הוא לבודד את כל הקליעות עם אפס כדרורים בליגה, ולהתחיל משם את הבדיקה, בלי קשר לשאר הזריקות או האסיסטים של השחקנים, מכיוון שיש בידוד . אם נחזור לדוגמה שלנו (מבלי לבדוק), הרי שאם הארדן קולע 10 נקודות בזריקות ללא כדרור ב 40%, הרי ש 10 הנקודות ו 40% האלה, צריכים להיות חלק מהמשוואה, וגם הפרומיל של ה 3&d שיש בהארדן צריך להיות מחושב

    לגבי ההגנה, כבר דיברו. אף מדד הוא לא מושלם, אבל המדד בו בחרת סביר בהתחשב בנסיבות – למרות שכן, יש בו הטיות וחבל. יום אחד אולי אעמיק יותר במדדים הגנתיים כאלה ואחרים, אבל נדמה לי שצריך כאן ביג דאטה אמיתי, בשביל לבודד משתנים כאלה ואחרים.

    1. תודה רבה!
      1) לגבי קליי תומפסון – האמת כשהסתכלתי על אחוזי הUSG שלו הוא היה נכנס על הגבול. הוא עומד על איזור ה24% שבדקתי.
      העניין הוא, (שבאמת אני אוסיף את זה בהסברים כי לא רשמתי את זה) הוא שהוצאתי שחקנים שלא שיחקו העונה בשביל לא לקבל את כל השחקנים שפרשו ב3 העונות האחרונות. רציתי לשמור על עדכניות ולכן הוא לא נכנס. מעבר לזה, יש גם את השאלה באמת אם הוא צריך להיכנס בגלל שהוא יותר מזה, אני אגע בזה בנק' 3.
      2) לא בטוח שהבנתי את הנק' על 3pt freq – אבל החישוב כאן מבוצע על כל הזריקות של השחקן מהשלוש, ולא רק 2 סוגי הזריקות האלו.
      3) לגבי אינגלס והארדן ואיזה שחקנים לבחור – אז זו נק' ושאלה מעניינת. אני חושב שהתשובה כאן תלוייה במטרה. מה שאני חיפשתי למצוא זה את שחקני ה3&D הטובים ביותר מהשחקנים הפוטנציאלים לתפקיד. הרי נניח והיית רואה שג'יימס הארדן(או דוגמא יותר סבירה, פול ג'ורג') הוא שחקן ה3&D הטוב בליגה, זה לכאורה לא היה מידע שניתן להסיק ממנו משהו כי זה לא תפקיד שהוא ישחק בו לעולם בגלל סט היכולות שלו.
      הבעיה שהייתה נוצרת היא עומס. היית מקבל שחקנים כמו טייטיום, באטלר ופול ג'ורג' והיה קשה להתמקד בשחקנים הרלוונטים לתפקיד ששווה לדון עליהם.
      ולגבי ההגנה – מסכים, זה נושא מרתק לחקור 🙂

      1. אני מקבל בהחלט, וכאמור תודה.
        מה שהתכוונתי ב 3 point frequency הוא שהפריקוונסי פחות חשוב בעיניי מאשר המספר האמיתי. כלומר, אם שחקן זורק 50% מהזריקות מהשלוש אבל רק זורק 6 פעמים במשחק (3 מתוכם מהשלוש), זה עדיין פחות משחקן שזורק 20% בלבד מהזריקות לשלוש אבל זורק 24 פעמים במשחק (6 זריקות מהשלוש). ולכן, השני בהחלט צריך להיחשב כי המספרים שלו מספיקים בשביל להיות חלק ממדגם רציני.

        1. הבנתי, תודה על ההערה.
          זה מתקשר לנק' השלישית שכאן אני חושב שנקבל שחקנים שהם יותר מ3&D.
          בהנחה ואנחנו מעוניינים בכל השחקנים בלי קשר לאם הם עושים דברים נוספים או לא, אני מסכים שהיה שווה להכניס את זה.

  13. נהדר רז! תודה רבה על ההשקעה.
    .
    אומנם לא פרסמת, אבל בטח יצא לך לבדוק כחלק מהמחקר, האם יש שוני משמעותי בנושא התפלגות הדקות? האם שחקן שמשחק רק 18 דק' בממוצע בהכרח יהיה "יעיל" יותר משחקן שמשחק 36 או 6?

    1. היי תודה שחר!
      לשאלתך, אתה מתכוון שהדירוג שלו כ3&D גבוהה יותר?
      אם כן, אז הקורלציה מראה שככל שכמות הדקות הממוצעת עולה אז הדירוג או היעילות של השחקן עולה(לא קורלציה מושלמת, אבל הכיוון הוא לגמרי ככה).
      שזה גם הגיוני, בגלל שאז הוא שחקן טוב יותר והקבוצה נותנת לו יותר דקות.
      אני לא מצליח לשלוח פה את הגרף, אם תרצה אני יכול לשלוח לך במייל.

      1. תודה על התשובה. הייתי בטוח שזה ייתן יתרון לשחקנים שמשחקים דקות מוגבלות (בד"כ מול שחקנים מחליפים) אבל התשובה שלך עושה הרבה הגיון.
        שוב, תודה על המחקר!

כתיבת תגובה

סגירת תפריט