תוחלת

Expectation, Expected value

תוחלת היא מונח חשוב ומרכזי בתורת ההסתברות ובסטטיסטיקה. 

תוחלת היא מדד המבטא את מרכז ההתפלגות, והיא למעשה ממוצע משוקלל של ערכי ההתפלגות של משתנה מקרי. 

סימון:

E\left(X\right) \ , \ \mu

מקובל לסמן את התוחלת באות היוונית מיו.

הרעיון של תוחלת זהה בין אם מדברים על אוסף תצפיות כמו בסטטיסטיקה תיאורית ובין אם מדברים על התפלגות תיאורטית כמו בהסתברות. אך הנוסחה תהיה עם סימונים שונים. 

התוחלת של משתנה מקרי בדיד X


E\left(X\right)=\sum_{k}{\ k \cdot P(X=k)}

הסכום עובר על כל הערכים האפשריים של X.

פונקציית ההסתברות של X היא:

P(X=k)\ 

החישוב של התוחלת נעשה ע״י ממוצע משוקלל: משקללים את הערכים השונים בהתאם להסתברות לקבל אותם.

תוחלת מייצגת את מרכז ההתפלגות. במונחים פיזיקליים התוחלת היא מרכז הכובד/נקודת שווי המשקל של ההתפלגות.

למה ״תוחלת״?  מהמילה לייחל/לצפות. התוחלת היא הממוצע שנצפה לקבל בטווח הארוך. בכל פעם שמבצעים את הניסוי המקרי מתקבל ערך של המשתנה המקרי. עבור הרבה מאוד חזרות על הניסוי, השכיחות היחסית של כל ערך שואפת להסתברות של הערך. לכן התוחלת היא הממוצע בטווח הארוך, כלומר: הממוצע שנצפה לקבל אחרי הרבה מאוד חזרות על הניסוי (אינסוף). 

שימו לב: ישנם מקרים שבהם התוחלת לא קיימת. אם התוחלת קיימת וההתפלגות סימטרית, אז התוחלת נמצאת בציר הסימטריה.

התוחלת של משתנה מקרי רציף X


לחישוב תוחלת של משתנה מקרי רציף משתמשים באינטגרלים במקום בסכימה.

התוחלת של משתנה מקרי רציף X מחושבת באופן הבא:

E\left(X\right)=\int_{-\infty}^{\infty}xf\left(x\right)dx

כאשר פונקציית הצפיפות של X היא:

f(x)

תכונות התוחלת


עבור קבוע c:

E\left(c\right)=c

עבור קבוע b:

E\left(X+b\right)=E\left(X\right)+b

עבור קבוע a: 

E\left(aX\right)=aE\left(X\right)

תכונת הלינאריות של התוחלת (תכונות 2 ,3 ביחד): 

עבור כל משתנה מקרי X, וקבועים a,b מתקיים:   

E\left(aX+b\right)=aE\left(X\right)+b

שימו לב: aX+b הוא משתנה מקרי חדש הנוצר ע״י טרנספורמציה לינארית של X  .

דוגמאות נפוצות לטרנספורמציה לינארית:

  • שינוי יחידות מדידה (מס״מ לאינצ׳, ממעלות צלסיוס למעלות פרנהייט, מש״ח לדולר, וכו׳).
  • פקטור בציון במבחן (הוספת קבוע, או הוספת אחוזים = הכפלה בקבוע).
  • ״משחק״ המורכב מניסויים בלתי תלויים: הרווח במשחק הוא פרופורציונלי למספר ההצלחות וההפסד פרופורציונלי למספר הכישלונות. לכן, הרווח הכולל הוא טרנספורמציה לינארית של מספר ההצלחות.

:להלן טבלה עם הנוסחאות לתוחלת של התפלגויות בדידות נפוצות

תוחלת של סכום משתנים מקריים


תכונה חשובה ושימושית של התוחלת היא התכונה הבאה:

עבור n משתנים מקריים:

X_1\ ,\ X_2,\ldots,X_n

מתקיים:

{E(X}_1+X_2+\ldots+X_n)={E(X}_1)+E(X_2)+\ldots+E(X_n)

במילים פשוטות: תוחלת של סכום משתנים מקריים שווה תמיד לסכום התוחלות.

הקשר של התוחלת לשונות


השונות היא מדד המבטא את מידת הפיזור בהתפלגות, סביב התוחלת. 

אם נגדיר “מרחק” כריבוע ההפרש מהתוחלת, אזי השונות מייצגת ״מרחק אופייני״ (ממוצע משוקלל של ה״מרחקים״), ולכן ניתן לכתוב את השונות של משתנה מקרי כ״תוחלת של מרחקים מהתוחלת״ באופן הבא:

Var\left(X\right)=E\left[{(X-\mu)}^2\right]

השונות עצמה היא תוחלת של ריבועי הסטיות סביב התוחלת. 

הנוסחה של השונות כתוחלת ריבועי הסטיות מהתוחלת מבטאת את המשמעות של המדד, אך לצורך חישוב ידני עדיף להשתמש בנוסחת העבודה הבאה, המקצרת את תהליך החישוב.

הנוסחה מתאימה הן למשתנה מקרי בדיד והן למשתנה מקרי רציף.

נוסחת עבודה לחישוב שונות

Var\left(X\right)=E\left(X^2\right)-\left[E\left(X\right)\right]^2

אז בין אם אתם רוצים ללמוד על תוחלת, ובין אם אתם רוצים להעמיק את ההבנה שלכם בנושאים נוספים בהסתברות, הקורס שלנו כולל את כל מה שאתם צריכים כבסיס להצלחתכם.

הירשמו עכשיו וגלו את העוצמה של למידה מבוססת אנימציה!

ואגב, אם תזדקקו לעזרה, תוכלו תמיד לפנות אלינו.

לרכישת קורס אונליין