מחשב אחד לשלוט בכולם – מתכוננים למועמדים (8) – אלפאזירו ופביאנו קרואנה (חלק ב) / אינדיאני

מקסים וושייה לגראב (MVL) ישב מול לוח השחמט המהודר וניסה להבין מה לכל הרוחות הוא רואה. המשחק – הסיבוב השמיני בטורניר המועמדים 2020/1 והראשון מאז הופסק הטורניר בעקבות הקורונה. MVL הוביל את התחרות יחד עם יאן נפומניאשצ'י לפני המשחק הנוכחי. אלא שכבר במשחק הראשון שלו מאז נעצרה התחרות הוא נתקל בבעיה לא שגרתית וקשה מאוד – הוא הוביל בכמות עצומה של חומר. במהלך ה 18 של המשחק היו לו רץ ושלושה חיילים עודפים כשהוא משחק בשחור. באולפנים השונים ישבו מיטב המוחות וניסו כהרגלם להבין את העמדה. על פי רוב, פרשנים של המשחק מעדיפים לנתח את העמדה ללא עזרת המחשב ורק לאחר חשיבה לראות כיצד הוא מעריך את העמדה. אלא שגם המחשב, סטוקפיש, הראה ייתרון ברור ל MVL. לכאורה מצב שכל שחקן היה חותם עליו בעיניים עצומות. הבעיה היא שבמהלך ה  27 לתחילת המשחק MVL נשאר עם חצי שעה בלבד על השעון בעוד יריבו לא בזבז יותר מכמה שניות על כל מהלך ונשאר עם יותר מהזמן המקורי שלו (שעה ו 40 דקות), מה שמעיד על כך שהעמדה המתקדמת של הלוח לא הייתה זרה לו והוא הכין אותה מראש.

לפני תקופת המחשב לא היה שום ייתרון לפרשנים על פני השחקנים עצמם בהערכת העמדה. השחקנים על פי רוב היו חזקים יותר ושקועים במשחק כך שהיו יכולים לנתח ולהסביר אותו טוב יותר מאלה שסיקרו אותו מבחוץ. כניסת המחשב הובילה למצב בו כל שחקן מתחיל יודע מה המהלך הטוב בעמדה הרבה לפני היושבים ליד הלוח על ידי הצצה מהירה בהערכה של המחשב את העמדה. לתופעה הזאת יש כמה השלכות גדולות על צריכת המשחק אך זה כבר נושא לפעם אחרת. באותו משחק במועמדים, לעומת זאת, המצב התהפך חזרה: רק אדם אחד בכל העולם הבין מה באמת קורה על הלוח וידע שהוא מוביל למרות שהיה מופסד בהמון חומר ושיחק בצורה איטית באופן שאפילו המחשב לא הבין. אינסטינקטים שחמטאיים בני מאות השנים עליהם סמכו דורות של שחקנים (וגם מחשבים) עמדו בסימן שאלה.

באולפנים ישב שחמטאי שהכיר מקרוב את השחקן בכלים הלבנים – אלוף העולם מגנוס קרלסן. כשנשאל במהלך ניתוח המשחק מה לדעתו התחושות שעוברות על MVL הוא ענה בשלוש מילים קולעות: horror. Pure horror. כולם הבינו שהשחקן הצרפתי המוכשר לא שיחק מול שחקן אנושי באותו המשחק אלא נפל להכנה מדוקדקת שכללה ככל הנראה עזרה מאלפאזירו הלא צפוי. תכנון משחק מול יריב מחייב יכולת הבנה של אופן הראייה שלו את המשחק וסגנון ניתוח העמדות שלו. במשחק הזה MVL ידע שכל מהלך שהוא עושה יכול לפגוש תגובה שנוגדת כל היגיון ועדיין תוביל להפסד שלו. אפילו המחשבים בשחמט מראים באופן סיסטמתי את השתלשלות הדברים ואפשר לעקוב אחרי ההערכות שלהם לאורך זמן. MVL לא יכול היה להבין את היריב שעמד מולו היות ואת 27 המהלכים הראשונים במשחק הוא לא שיחק נגד שחקן אנושי. המשחק הזה, ששוחק ב 2021, היה אחד הדוגמאות המפוארות לשחמט אחר לגמרי שאנחנו הולכים לראות בעתיד הקרוב והרחוק. במשחק הזה הוא הוצג על ידי סגן אלוף העולם לשעבר פביאנו קרואנה.

נחזור 4 שנים אחורה. כשהמתכנתים של גוגל סיימו לעבוד על המחשב אלפאזירו הידע שלו כלל אך ורק את ידיעת החוקים הבסיסיים של המשחק. אם באותו הרגע הוא היה משחק מול שחקן בשר ודם הרמה שלו הייתה נמוכה מזאת של ילד בן 4 שרק עכשיו למד לשחק. אלא שאז הוא קיבל פקודה אחת בלבד – להתחיל לשחק מול עצמו. לאחר 9 שעות של משחקים ששיחק אך ורק לבדו, הוא ניגש לדו קרב בן 100 משחקים מול סטוקפיש 8 – המחשב החזק ביותר באותו הזמן. התוצאה: 28 ניצחונות לאלפאזירו, 0 הפסדים ו 72 תוצאות תיקו. תשע שעות בלבד, בלי שום ידע מקדים, לקחו לו להגיע לרמה הגבוהה ביותר של משחק שבמשך מאות שנים הציג לעולם דמויות אנושיות וממוכנות שניסו להגיע אל היכולת לשחק שחמט בשלמות. מאז, אלפאזירו ממשיך בקצב מסחרר לשחק משחקים מול עצמו, להסיק מסקנות ולהשאיר אבק לכל ניסיון להדביק אותו. מחשבים קלאסיים כדוגמת סטוקפיש מגיעים עד לרמה מסוימת וצריכים עדכונים שונים כדי להשתפר. אלאפזירו לעומתם ממשיך להשתפר ככל שעובר הזמן וללא שום עזרה הוא כבר נמצא בעולם משלו בו היחיד שיכול לנצח אותו זה הוא עצמו. השימוש בו, כאמור, הוא מסובך הרבה יותר מאשר בזה של חבריו. התוצאות שהוא מביא לא תלויות בניתוח העמדה הספציפית על הלוח ולא בשום ידע חיצוני שהוא קיבל. ההחלטות שלו נובעות מניסיון פרטי שלו, מה שהופך את היכולת "לחלץ" ממנו מהלכים שאפשר יהיה להשתמש בהם במשחק מסובכת הרבה יותר. בפעם הקודמת ראינו את אופן הפעולה של סטוקפיש, היתרונות והחסרונות שלו. היום נדון בקווים כלליים בצורת החשיבה של אלפאזירו ונגיע דרכה להבנה של סגנון המשחק פביאנו קרואנה, תיאורטיקן פתיחות מפחיד המכונה לא פעם "המחשב שהאנושי". בסוף, באופן קצת חריג, נראה את המשחק מול MVL כאשר המטרה תהיה אחת – להבין לא להבין. בניתוח המשחקים לאתר אני משתמש בסטוקפיש אלא שממש כמו אז הוא ממש לא משתכנע מהמהלכים של קרואנה כך שהמטרה שלי הפעם היא לא לנסות להסביר בקווים כלליים את המשחק אלא לגשש קצת באפילה המרהיבה שיצר קרואנה (כנראה בהשראתו) ולקבל הצצה אל מחוזות שחמט שמעט מאוד כפות רגליים דרכו בה.

ביום הולדתו ה 35 החליט פרינס לשנות את שמו לסמל לא ברור שאחד השמות שקיבל היה love symbol. האלבום הראשון שהוציא תחת השם הזה, כמו כמעט כל גוף היצירה הממוחשב והמטורלל שלו, היה, איך לומר, קרוב לשלמות.

מוזמנים להצטרף אליי אל תוך האימה:

שחמט, קזינו ופצצת האטום

סיפורנו מתחיל בתוך מוחו הקודח של – איך לא – גאון איטלקי אמריקאי העונה לשם אנריקו פרמי. המתמטיקאי-פיזיקאי שאחראי לכמה פריצות דרך גדולות בתורת הקוונטים חיפש דרכים להבין את דרך ההתנהגות של הניוטרון (אחד החלקיקים שמרכיבים את האטום) ולשם כך הוא השתמש בשיטה מתמטית לא מפותחת שמוכרת היום כ"מתודת מונטה קרלו". העבודה החשובה שלו, יחד עם שכלול השיטה על ידי המתמטיקאי הפולני-אמריקאי סטניסלב אולאם הובילה לכמה פריצות דרך חשובות שהיוו בסיס נרחב להבנת מבנה האטום וההתנהגות שלו, מה שהוביל לבניית הכור הגרעיני הראשון ובניית פצצת האטום בפרויקט מנהטן. מתודת מונטה קרלו הייתה אחד השלבים הראשונים בשינוי התפיסה בנוגע לבעיות מתמטיות מבוססות הסתברות והובילה למודל מתמטי פשוט יחסית שעומד בבסיס הרעיון של אלפאזירו ומחשבים רבים מבוססי הבינה המלאכותית.

על הרולטה – שיטת מונטה קרלו

נניח שאנחנו רוצים לדעת מהו הגובה הממוצע של כל האנשים בעולם. הדרך להגיע אל התוצאה היא אמנם פשוטה אבל מעייפת – עלינו לעבור כל אחד מבין יושבי כדור הארץ, למדוד את הגובה שלו ולעשות את החישוב המהיר יחסית (כנראה על ידי מחשב). הבעיה היא, כמובן, שמדובר בפתרון לא מעשי מסיבות מובנות – חוסר היכולת להגיע אל כל האנשים, גידול האוכלוסיה בזמן החישובים וגם חוסר ידע בנוגע למיקום של כל האנשים והכמות שלהם לא מאפשרת איסוף סיזיפי של כל הנתונים. המסקנה אם כן יכולה להיות שמדובר במשימה בלתי אפשרית ושאין באמת דרך לפתור את הבעיה. מצד שני אפשר לנסות לקחת "קבוצת ביקורת" מתוך אזורים שונים בעולם בתקווה שהממוצע ביניהם ייתן את התשובה הנכונה. אלא שגם כאן אפשר להיתקל בבעיות דומות לאלה שראינו קודם ואף יותר מכך – ייתכן שבקבוצה שלנו (שכנראה תהיה קטנה מאוד יחסית לאוכלוסיית כל העולם) תהיה כמות גדולה יותר של אנשים נמוכים או גבוהים שתשבש את ממצאי הבדיקה. איך נפתור את הבעיה? לשיטת מונטה קרלו יש תשובה פשוטה, מפתיעה ומרהיבה כאחד – רנדומליות.

ניקח באופן רנדומלי (בסוף הכתבה נוסיף כמה הערות על המושג) אדם כלשהו בעולם ונזין את הגובה שלו. בשלב הזה הנתון הבודד לא יכול להיות אינדיקציה בכלל לתשובה הסופית והחישוב יוביל אותנו אל מסקנה רחוקה מאוד מהתוצאה המתבקשת. אלא שאז נחזור שוב ושוב על אותה הפעולה וכך נמשיך לאגור עוד מידע ולקלוט באופן אקראי (כמעט) לגמרי נתונים, וככל שהם יצטברו נגיע לתוצאה מדויקת יותר. ככל שנמשיך את הפעולה שלנו נגלה באופן מפתיע אבל הגיוני שהתוצאות שיתקבלו ישתנו באופן קטן יותר ככל שכמות האנשים שנבחן תגדל. הרי אם כבר בחנו מיליון אנשים רנדומליים (בערך מאית האחוז מכלל אנשי העולם) ההשפעה של אדם גבוה שנוסיף לחישוב תהיה מינורית יותר. כך יוצא שהצלחנו ליצור מצב בו בחנו מעט מאוד מקרים ובכל זאת התקרבנו לתוצאה הרלוונטית. יהיו כמובן שינויים דרסטיים לאור העובדה שאקראיות יכולה להוביל במקרה למצב בו "פגענו" בכמה אנשים גבוהים או נמוכים ברצף אבל גודל השינויים יקטן ככל שנוסיף עוד פרטים, גם אם בסוף נגיע אל פלח קטן מאוד מהכלל שניסינו לבחון. השיטה נובעת מתוך הבנה שבחינה מראש של מושא מחקר גדול כמו כמות האנשים בעולם על ידי תכנון כזה או אחר תוביל דווקא ללא מעט אי דיוקים ומגמתיות אנושית טבעית. השיטה גורסת (והיא התבררה כמדויקת ביותר בהמון תחומים) שבחינת כמות גדולה של פרטים באופן רנדומלי עדיפה על ניתוח מעמיק של קבוצה מבוקרת. המודל המתמטי מראה שהשימוש בבחירה אקראית מובילה דווקא לחישוב שמתכנס אל תוצאה אחת מדויקת יותר. נשמע לכם מוכר? ככה בדיוק עובד אלפאזירו.

(דוגמה מפורסמת – חישוב π. מי שרוצה יכול ישר לעבור לכותרת הבאה)

π הוא קבוע מתמטי שמתאר את היחס בין היקף מעגל לקוטר שלו. הערך המספרי שלו הוא 3.14 בקירוב אבל מדובר במספר אם אינסוף ספרות אחרי הנקודה כך שכל חישוב שלו יהיה חלקי בלבד. ישנן שיטות שונות לחשב אותו כאשר במקרה שלנו אפשר יהיה לבחון דרכו את היעילות של שיטת מונטה קרלו. נשרטט ריבוע שאורך הצלע שלו היא מספר כלשהו (a) ובתוכו נשרטט עיגול שהקוטר שלו גם הוא a (בגיאומטריה הוא נקרא מעגל חסום על ידי ריבוע- תרשים 1). על פי חוקי הגיאומטריה אנחנו יודעים שהשטח של הריבוע הוא a^2 והשטח של המעגל הוא 4/(π*a^2). יוצא שאם נחלק את שטח העיגול בשטח הריבוע נקבל את המספר π. נכפיל את התוצאה ב 4 ונקבל את הערך של π. כעת ניגש למחשב. נבקש ממנו באופן רנדומלי לזרוק "חץ" לנקודה מסוימת בתוך הריבוע ונבקש ממנו תשובה פשוטה – האם הנקודה נמצאת בתוך העיגול או רק בתוך הריבוע. הדרך לעשות זאת פשוטה – המחשב יבדוק האם הנקודה שבחר רנדומלית נמצאת במרחק קטן מ a ממרכז המעגל (אז הוא בתוכו) או גדול מ a (אז הוא מחוץ לעיגול ובתוך הריבוע. נבקש מהמחשב לעשות זאת שוב ושוב ובסוף נבקש ממנו לסכום את כמות הנקודות. כמות הנקודות הכולל יהיה השטח של הריבוע ואילו כמות הנקודות שמרחקן מהמרכז קטן מ a יהיו שטח העיגול. בתחילת התהליך התשובה של המחשב תהיה לא רלוונטית היות ויכול להיות שבמקרה הוא "נפל" על כמות גדולה של נקודות מחוץ לעיגול או בתוכו. אלא שככל שהמחשב יוסיף נקודות הוא יגיע לתוצאה מדויקת יותר ויוכל לדייק יותר ויותר את התשובה שלו (תרשים). שימוש מושלם ברנדומליות כדי להשיג דיוק.

סימולציה של חישוב פאי. ככל שהתהליך מתקדם התשובה תהיה מדויקת יותר.

משוואה אחת בלבד

רואים את הנוסחה? היא כוללת אמנם כמה סימנים מפחידים אבל בפועל מדובר בנוסחה מתמטית פשוטה וקצרה ולמרבה התדהמה היא מכילה בדיוק כל מה שאלפאזירו היה צריך בשביל לנצח את סטוקפיש. לא נסביר אותה כאן אבל רק נגיד שהיא כוללת קבוע אחד, שני משתנים ועוד שני משתנים שנגזרים מהמשתנים הראשונים. זהו. המודל המתמטי והפשוט הזה עוזר לייצר את מה שנקרא "עץ מונטה קרלו" – עץ נתונים הדומה למינימקס שראינו בפעם הקודמת אבל הרבה יותר פשוט ויעיל ממנו ומבוסס על הרעיון של שיטת מונטה קרלו. הנוסחה הזאת הפכה את המחשב מכלי מסורבל עם שורות קוד אינסופיות שמסוגל לשחק רק משחקים בעלי כללים ברורים וללא משתנים אקראיים או חיצוניים לכלי אימתני שהשתלט לגמרי על משחקים כמו שחמט או גו ויודע גם לשחק משחקים כמו מונופול, קטאן, פוקר ומשחקי וידאו. בעיקרון כל אחד יכול לשבת בבית ולבנות לו אלפאזירו משל עצמו וללמד אותו לשחק סוליטר, לרמות בברידג' או לנצח בטאקי ושש בש. הוא דורש אמנם ציוד מתאים ויכולת לדעת להסביר למחשב את החוקים אבל הקוד שלו פשוט ביותר ואת רוב העבודה הוא עושה בעצמו. איך זה עובד?

נזין אל אלפאזירו עמדת שחמט ונבקש ממנו להעריך אותה. ראינו בפעם הקודמת שסטוקפיש יגש למשימה יתחיל לבדוק באובססיביות את כל ההסתעפויות הקיימות עד שיגיע למצב שהוא לא יכול להתקדם וייתן הערכה משלו. אלפאזירו לעומת זאת יבחר מהלך רנדומלי ויתחיל לשחק אותו עד הסוף. המשחק עצמו יהיה גם הוא רנדומלי לחלוטין ויוביל את המחשב בסוף לתוצאה – ניצחון, הפסד או תיקו. ברגע הזה הוא יחזור אל עמדת ההתחלה וישחק עוד משחק כשהפעם הוא מנתח מהלך אחר. גם אז הוא יגיע עד הסוף ויגיע לתוצאה כלשהי אותה הוא יזין כהערכה שלו בנוגע לאותו המהלך. כמובן שבמצב כזה אין שום סיכוי לדעת מהו המהלך הטוב ביותר משום שהמדגם כלל רק שתי הסתעפויות מתוך כמות עצומה והוא יהיה לא רלוונטי. אלא שכמו במקרה שראינו עם חישוב הגובה הממוצע בעולם העובדה שכמות האפשרויות גדולה לא רלוונטית ככל שבוחנים יותר ויותר אפשרויות באופן אקראי. למחשב לוקח חלקיקי שנייה כדי לסיים משחק היפותטי והוא חוזר על הפעולה במהירות עצומה וכך מתחיל לצבור עוד ועוד מידע על העמדה. כיצד הוא יודע איזה מהלך לבחון בכל רגע נתון? לשם כך בדיוק הוא משתמש בנוסחה שלעיל. הנוסחה היעילה הזאת מנחה אותו לשים לב לשני פרמטרים: מהלכים שלא נבחנו ועמדות שהוא העריך עד כה כחזקות יותר. הנוסחה משלבת בין השתיים ומייצרת איזון שיגרום למחשב מצד אחד להעמיק יותר בעמדות שהוא העריך כזוכות ומצד שני לא לזנוח מהלכים שהוא לא בדק אותם מספיק. הנוסחה הזאת היא מגע יד האדם היחיד באופן החשיבה של המחשב ובהסקת המסקנות שלו וכל השאר נתון לאיסוף המידע מהיר לאורך זמן שלא צריך "להעכב" על ניסיון להבין את העמדה, לבדוק מבנים של רגלים, כמות חומר, תיאוריות מסובכות של סיומים או כל תוספת אנושית אחרת. הוא ניגש למשחק חמוש בשני דברים בלבד – ידיעת החוקים והנחייה כיצד לדייק את החיפוש ומשחק מול עצמו מיליארדי משחקים עד שהוא נדרש לעצור ומציג את התוצאות שהשיג עד כה. ב 2017 הן היו חזקות להפליא. אנחנו ב 2022.

מילה על רנדומליות

חשבו על מספר כלשהו מ 1 עד 100. בקשה לגיטימית וידועה וגם שימושית לפעמים. ככל הנראה אם אשאל את השאלה הזאת אנשים שונים אקבל תשובות שונות שאין ביניהן שום קשר, מה שיכול לתת את התחושה שכל האנשים שביקשתי מהם לעשות זאת בחרו במספר רנדומלי. אלא שהאמת רחוקה מן המציאות. ייתכן בהחלט שביחס לאנשים אחרים הבחירה של אדם בודד תהיה אקראית לחלוטין אבל האמת היא שמהרגע שהוא התבקש לעשות זאת המח שלו התחיל לעבוד. קשה לעקוב אחרי מהלך המחשבה שהוביל דווקא לבחירת מספר זה או אחר אבל כל תשובה שתינתן תהיה נתונה להשפעה של גורמים שונים על המח, דברים שהוא רואה, ניסיון לא מודע להתחכם (חוסר רצון לבחור מספר עגול או יפה יותר ולא מעט משחקים של הפוך על הפוך) ועוד גורמים שונים.

דוגמה נוספת וקצת שונה: הטלת קובייה. במשחקים רבים משתמשים בקובייה ככלי להוספת אלמנט של אקראיות למשחקים שונים. אלא שמרגע שהוטלה הקובייה אפשר באופן תיאורטי לחשב בדיוק על איזו פאה היא תיפול לפי הכוח שהופעל עליה, מהירות הסיבוב, צורת האחיזה שלה ושחיקה שלה שנותנת ייתרון קטן מאוד לפאות מסוימות ועוד. ב"עולם האמיתי" המשתנים האלה לא רלוונטיים אבל בחשיבה הטהורה מדובר בתוצאה וודאית ממש כמו זריקת חפץ כלשהו מגובה וידיעה שהוא ייפול לקרקע.

אקראיות, אם כן, היא מושג חמקמק שהקיום שלו היה מוטל בספק והוא נתון למחלוקות רבות בתחומים שונים. המושג העסיק רבות פילוסופים בנוגע לשאלת הבחירה החופשית כמו גם פיזיקאים העוסקים במכניקת הקוונטים. בנוגע למחשב כדאי להעיר שבאופן עקרוני אין אפשרות לדרוש ממנו לבחור באופן אקראי. בשפות תכנות מסוימות ישנה אפשרות להשתמש במספר רנדומלי שהמחשב מוציא אבל בפועל מדובר פשוט בנוסחה מסובכת מספיק שגורמת למחשב להוציא בכל פעם מספר שלרוב הצרכים האנושיים יוכל להיחשב כרנדומלי אף שהוא תוצר של נוסחה. המטרה היא לא לייצר רנדומליות טהורה אלא לבחור שיטת עבודה שההשפעה שלה על התוצאה תהיה המינימלית ביותר.

חסרונות

צורת החשיבה הנקייה והלא-מסובכת של אלפאזירו היא כמובן יחסית. מדובר במודל פשוט אלא שהוא מצריך רכיבים מסויימים המותאמים למחשבי בינה מלאכותית שמנסים להידמות למבנה הפעילות של המוח האנושי. המעבר של תוכנה כזאת אל מחשב רגיל לא קורה באופן חלק ומוריד משמעותית מהכח של התוכנה. הגרסה הנגישה המפורסמת ביותר שמבוססת על אלפאזירו היא לילה צ'ס 0 (LeelaC0) אלא שבניגוד למודל האב היא עדיין מתקשה מול הגרסאות המעודכנות של סטוקפיש. אלפאזירו בנוי בעיקר על מהירות ואם החישוב שלו יהיה יחסית איטי הוא לא יכסה מספיק שטח בשביל לתת תוצאות טובות. בניגוד לסטוקפיש שבגרסאות המוקדמות שלו הוא עדיין חזק לאלפאזירו אין כמעט שום תועלת אם הוא לא עובד באופן מדויק. צריך גם לזכור שהתוכנה לא "עובדת" ישר והיא משתפרת ככל שעובר הזמן כך ששכפול שלה יחייב אותה להתחיל את כל התהליך מחדש. אין לי מידע בנוגע לנגישות של שחקני השחמט לאלפאזירו עצמו אבל אני מעריך שמדובר בעסק לא זול שלא כל אחד יכול להרשות לעצמו.

עולם חדש

סטף קרי הגיע לליגה הטובה בעולם כשהוא לא הכי חזק, לא הכי גבוה, לא הכי אתלטי ולא הכי מהיר. מה הוא עשה? הלך כמה צעדים אחורה וזרק. שוב. ושוב. ושוב. במקום להיאבק מול אחרים במגרש בו יש להם ייתרון עליו הוא פשוט החליט "לרמות" והוציא את עצמו מהמשחק, קולע ממרחק שאז היה מחוץ לתחום.

ההוגים של אלפאזירו ראו את שורות הקוד העצומות, הנוסחאות המורכבות והידע העצום והחליטו שאין בהם שום צורך. במקום להתחכם עוד יותר הם בנו את המחשב החדש על רעיון אחד ויחיד, נוסחה פשוטה וכמות עצומה של משחקים. אלפאזירו לא רק הצליח להיות טוב יותר אלא הוא עשה זאת ללא מודלים הסתברותיים ודרישה פדנטית לשים לב לכל מהלך. השינוי שהוא הביא למשחק היה קונצפטואלי ורק מתחיל לחלחל אל תוך המשחק המוכר לנו היום. בחלק הבא והאחרון (שיפורסם מחר) נגיע סוף סוף לקרואנה ונראה כמה רעיונות כלליים שאפשר להעריך בזהירות שמושפעים מכניסת המחשבים אל הענף והכניסה של אלפאזירו בפרט. למרות התוצאות הטובות היכולת להשתמש באלפאזירו בשביל לנתח משחקים מסובכת יותר ודורשת כניסה לתוך לתוך הראש ה"ריק" שלו. אלפאזירו לא עובד לפי עקרונות מסוימים בניגוד לסטוקפיש כך שחילוץ עקרונות מהמשחקים הרנדומליים ששיחק מול עצמו דומים לניסיון לפענח אינטואיציה של אנשים. זה אולי אפשרי אבל קשה בהרבה מניסיון להבין מהלך לוגי כלשהו.

אחרי הכל, אלפאזירו הוא בדיוק כמו כל גדולי הספורטאים לאורך ההיסטוריה. הוא ממש לא רוצה להיות הכי טוב. הוא רוצה לנצח.

לפוסט הזה יש 33 תגובות

          1. ברור. לא נורא, בשביל הספורטיביות והאוירה. חוצמזה אולי נצליח לגנוב משחק,
            אם דיקמבה ניצח את סיאטל ולוקה את פניקס פעם ב… זה אפשרי

  1. מדהים.
    ולחשוב שפביאנו זכר את כל ההסתעפויות הרלוונטיות עד מסע 27…
    לא סתם תאוריית הפתיחה נגמרת בדרך כלל הרבה יותר מוקדם.

  2. תודה אינדיאני, מצוין
    .
    חוץ מהנ"ל מה עושה את קרואנה לשחקן בטופ של הטופ? מה החוזקות והחולשות היחסיות שלו?

  3. תודה רבה
    נושא ממש מעניין ואתה מפשט ומעביר אותו בצורה נפלאה..
    הלב שלי קפץ לרגע בסרטון של גרישצ'וק,רובוטים תמיד ישארו בתודעה גורם מפחיד ולא צפוי

  4. תודה חברים. כל פעם מופתע ושמח מחדש לראות שיש קהל לנושאים האלה. העונג כולו שלי.
    הפוסט על קרואנה יעלה מחר, מנצל את מרווח הימים בין משחקי הגמר של ה nba

  5. נפלא. תודה.
    אתה בעצם אומר כאן שכמות גוברת על איכות… מסקנה קצת מבאסת, אבל נתמכת ע"י שנים של מלחמות וקרבות של המין האנושי.

    1. ממה שהבנתי, זו תוכנת בינה מלאכותית שיודעת לעשות עוד דברים (היא ניצחה את אלוף העולם גם בגו, למשל), שרצה על מחשב על של גוגל.
      כלומר בתיאוריה זו תוכנה שיכולה לרוץ על כל מחשב, אבל בפועל היא צריכה כוח חישובי רציני בשביל להצליח להגיע לרמות הגבוהות שלה.

      1. תודה,
        דרך אגב, בתחרות בנורבגיה עד הסיבוב הנוכחי התקיימו 16 משחקי ארמגדון שמתוכם לבן ניצח 14 פעמים ובפעמיים הנותרות היה תיקו. זה לא מראה שמשהו בשיטה של 10 דקות ללבן ו 7 לשחור קצת לא עובד?

        1. מעניין, לא שמתי לב לזה.
          כנראה שהבעיה היא לא בשיטה, כי אותו קצב היה בארמגדון בתחרות שנה שעברה, ושם המשחקים האלה נגמרו בתוצאות לטובת השחור:
          5 נצחונות ללבן, 5 לשחור, ו2 תיקו (שזה לטובת השחור).

כתיבת תגובה

סגירת תפריט