חיפוש מתקדם>>

,
תחום:כללי
מחלקה:תמיכה במשתמש
תאריך: 01-06-2001

 

מבחן t לקבוצות בלתי תלויות בא לבדוק האם ישנם הבדלים בין שתי קבוצות במשתנה תלוי כל שהוא ברמה אינטרוולית ומעלה. המשתנה הבלתי תלוי הוא משתנה נומינלי דיכוטומי (שתי קבוצות בלבד, כמו מין), או משתנה בעל יותר משתי ערכים שנחתך בנקודה מסוימת לשתי קבוצות (למשל, גבוהים מול נמוכים מנקודת החציון של משתנה הגובה). מטבע הדברים אנו מסתכלים על ההבדלים בממוצעים של המשתנה התלוי בין שתי הקבוצות כמייצגים את המדד המרכזי בכל קבוצה. לכאורה, אם ההבדלים מובהקים סטטיסטית, אנו נדחה את השערת האפס, ששתי הקבוצות לקוחות מאותה אוכלוסייה, ונקבל את ההשערה האלטרנטיבית, שהקבוצות לקוחות משתי אוכלוסיות הנחלקות בתכונה זו (בממוצע המשתנה התלוי).

אולם ההתייחסות לממוצע בלבד כמדד המאפיין את הקבוצות, הנו מטעה מאד. ייתכן והממוצע דומה בין הקבוצות (אינו שונה באופן מובהק), ועדיין יימצאו הבדלים חשובים בין הקבוצות, במדד סטטיסטי אחר - שונות, למשל. ייתכן וההבדל בשונויות בין הקבוצות הוא המאפיין את הקבוצות, והוא חשוב כמו ההבדל בממוצע, ואולי אף יותר.

לדוגמה: שני אגמים, שהגובה הממוצע של האחד 10 ס"מ ושל השני 3 מטר. במקרה זה ההבדלים בין האגמים יכולים להיות הבדלים בין חיים ומוות, באגם העמוק יותר ניתן לטבוע אך לא כן באגם הרדוד. אולם גם בשני אגמים שגובהם הממוצע 10 ס"מ, יתכן ומתברר לפתע, שבאגם אחד אנשים טובעים לעיתים, אך לא כן באגם השני. מסתבר שבכל זאת ישנם הבדלים:  האגם האחד, טווח העומק שלו בין 8 ל-12 ס"מ, מה שמקשה מאד על טביעה, והשני - בין 2 ס"מ ל-3 מטרים. כלומר - רוב האגם הוא רדוד מאד, אך ישנם כמה בורות מסוכנים. אם כך, למרות שממוצע עומק האגמים דומה, ההבדל בפיזור בין האגמים חשוב אף הוא, הבדל בין חיים ומוות!

שתי בעיות באגם השני לעומת הראשון אשר יקשו על חישובי  t-test  בין האגמים:

          א. הפיזור גדול יותר.

          ב. ההתפלגות לא נורמלית.

          רוב החוקרים מתעלמים מבעיית הפיזור. אם "המחשב" הראה הבדלים מובהקים בתוכנת t-test, הם ידווחו שההבדלים נמצאו מובהקים והשערתם אוששה. אך דבר זה אינו נכון לעשותו. יש להתייחס גם לסטיות התקן!

אם סטיית התקן גבוהה מאד, הדבר מקטין את אמינות הממוצע כמדד המייצג את הקבוצה, שהרי ערכים רבים סוטים מאד מהממוצע. לכן לא ניתן להשוותו אל הממוצע של הקבוצה השנייה. ואם ההתפלגות לא נורמלית יתכן ו-t אינו המדד הסטטיסטי המתאים (ויש להשתמש במדד נון-פרמטטרי). אמנם לעיתים גם כשהאוכלוסייה אינה מתפלגת נורמלית (למשל, במדידת משכורות), אנו משתמשים ב-t-test היות וישנה נטייה בהתפלגות דגימה (התפלגות כל המדגמים בגודל N) להתפלג נורמלית גם כשהאוכלוסייה אינה מתפלגת נורמלית (חוק הגבול המרכזי), אולם ברוב המקרים אנו מניחים התפלגות נורמלית של האוכלוסייה, ואם המדגם אינו מתפלג נורמלי, ייתכן שאינו מייצג היטב את האוכלוסייה.

לפעמים אין כלל הבדלים בין הממוצעים, ובכל זאת המדגמים אינם לקוחים מאותה אוכלוסייה. למשל, במדידת אינטליגנציה. IQ הנו מדד שבהגדרתו ממוצע הבנים והבנות זהה - 100 (בדורנו הממוצע גבוה יותר). האם זה אומר שאין הבדל בין בנים ובנות במדד זה? מתברר שיש, והוא משמעותי ביותר - אצל בנים סטיית התקן כ-16 נקודות ואצל בנות - כ-15. הדבר נובע מהבדלים "איכותיים", כלומר, ממרכיבי האינטליגנציה. למשל, בנות חזקות יותר ב"כושר מילולי", ובנים ב"תפיסה מרחבית".  אף שלכאורה ההבדלים בפיזור האינטליגנציה בין בנים ובנות קטנים, הרי מי שמבקר בגן של ילדים בעלי פיגור שכלי יופתע לראות שאחוז הבנים גבוה מאד לעומת הבנות. מדוע? כי בשתי קצוות ההתפלגות, ההבדלים בשכיחויות בולטים, והגאונים והמפגרים שונים בשכיחותם בין בנים לבנות!

במחשב, רוב התוכנות הסטטיסטיות לבחינת ההבדלים בין שתי קבוצות בלתי תלויות מציגות שני מבחני t - מבחן t המניח שהשונויות שוות בין הקבוצות, ומבחן t שאינו מניח שונויות שוות. במקרה הראשון, בנוסחת t יחולק ההפרש בין ממוצעי שתי הקבוצות בטעות התקן (סטיית תקן חלקי שורש N) של שתי הקבוצות יחד כקבוצה אחת (Pool), ובמקרה השני (Separate) המכנה יהיה איזה שהוא ממוצע משוקלל שמייצג את "טעות התקן של ההפרשים" (שורש של סכום השונויות לכל קבוצה חלקי גודל הקבוצה). בכל מקרה, ההתייחסות לאיזה t שנבחר תלויה במדד F  של Levine (שאף הוא ניתן בפלט התוכנה), הבוחן אם ישנם הבדלים בין סטיות התקן של הקבוצות.          

כאמור, אם F מובהק סטטיסטית, התשובה לשאלה אם ישנם הבדלים בין שתי הקבוצות היא ברורה, ולא כל-כך משנה שההבדלים הם בסטיות התקן ולא בממוצעים. לכן אין טעם להמשיך ולהסתכל על ההבדלים בין הממוצעים. אם כן, ההסתכלות הנכונה היא על השורה הראשונה של t (בתוכנות Spss או SAS), בהנחה (ובתקווה) שאין הבדלים בסטיות התקן בין המדגמים, אלא אם יש לנו מראש השערה על הבדלים בפיזור. השערה כזו היא נדירה בדרך-כלל. הבדלים בשונויות יכולים לנבע מחוסר הומוגניות בין המדגמים, דבר שפוגם במחקר.

צריך אם-כן לשים לב גם לשונויות. רבים הם החוקרים במדעי החברה המתעלמים מההבדלים בין השונויות ומדווחים רק על ההבדלים בין הממוצעים, דבר שלא נכון לעשותו.