חיפוש מתקדם>>

,
תחום:תוכנות
מחלקה:תמיכה במשתמש
תאריך: 07-01-2009

 

ישנן בעיות סטטיסטיות שלא ניתנות לפיתרון מיידי בתוכנות הסטטיסטיות הקונוונציונאליות כמו SAS או SPSS. במקרים אלו בדרך-כלל יש להשקיע זמן לא קצר בחיפוש הנוסחה המתאימה בספרי הסטטיסטיקה, ולחשבה בעזרת מחשבון אלקטרוני או תוכנת מחשבון.  למשל, ניתן לתקתק את הנתונים ב-Excel, לסכם אותם, לחשב ממוצעים, סטיות תקן, הפרשים וכל מה שצריך לנוסחה, לתקתק את הנוסחה לחישוב בתא מסוים ב-Excel עם הפניות לתאים המכילים פרמטרים מתאימים, לבחור ב-Alpha (או ב-Z) הרצוי, להשוות את התוצאה לטבלאות הסטטיסטיות המופיעות בספרי הסטטיסטיקה, לבדוק אם המדד הסטטיסטי מובהק דיו לפי אותה Alpha, ולקוות שלא טעינו באיזה שהוא שלב, והתוצאות שתומכות בהשערה כפי שקיווינו או לא תומכות, הן אכן אמיתיות ומדויקות.

 מעבר לטרחה הפיזית והשקעת הזמן בתהליך הנ"ל, צריך גם לחקור, להכיר ולהבין היטב את מרכיבי הנוסחה, את התהליך הדרוש, ולבחון את התוצאות אם הן סבירות או הגיוניות. לא כל חוקר במדעי החברה ואפילו הוא מומחה בתחומו מסוגל לכך. מה שמעניין את החוקר זה לא הכלי והדרך לפתרון הבעיה. החוקר מתעניין אך ורק בתוצאה – מובהק סטטיסטית או לא, יש רגלים להשערה או הכול עורבא פרח, וביתר דיוק – האם ייצא מזה מאמר מדעי בז'ורנל מכובד או לא...
 
הפיתרון לבעיה זו הוא לפעמים במקום בלתי צפוי, שאינו מיועד מלכתחילה לפתרון בעיות סטטיסטיות - אתר חיפוש כמו גוגל. גוגל יודע הכול, או כמעט הכול. השאלה היא רק ניסוח השאילתה באופן נכון. אף אם נניח שרפרטואר המילים הטכניות באנגלית שגור בפינו (לגבי איות – גוגל לעיתים קרובות עוזר לנו בזה), לא תמיד אנו יודעים אם הנוסחה מתאימה למדגמים תלויים או בלתי תלויים, לא תמיד שמים לב אם המשתנה התלוי מתפלג נורמאלי ואם זה בכלל חשוב לנושא, וכדומה.
 
לשם כך נבנו אתרי המחשבונים הסטטיסטיים. המחשבונים הסטטיסטיים חוסכים מאיתנו את הצורך להכיר במדויק את הנוסחה המתאימה לפתרון הבעיה, וחוסכים מאיתנו זמן רב בהצבת הנתונים, בחישובי ביניים שונים, ובעיון בטבלאות סטטיסטיות לבדיקת המובהקות הסטטיסטית.
 
המחשבונים הסטטיסטיים אינם מרוכזים באתר אחד ואינם כתובים באותו שטאנץ. לא לכל בעיה יש מחשבון סטטיסטי ולעיתים נגיע לאתר הנותן אך ורק את הנוסחה בתוספת תיאור מיגע או ממצה (תלוי במחבר) של איך עושים מה בעזרת מחשבון-כיס או תוכנת Excel לפתרון הבעיה. אולם כמעט לכל בעיה סטטיסטית ישנו איזה שהוא פיתרון ברחבי הרשת, צריך רק להגיע אליו.
 
להלן הצעה למספר אתרים הנותנים פתרונות סטטיסטיים מידיים לחוקר במדעי החברה:
 
1.      מציאת הבדל מובהק בין מתאמים במדגמים בלתי תלויים
 
למשל, ישנם שני מדגמים - בנים ובנות. חישבתי מתאמים בין ציון במתמטיקה ובספרות בכל מדגם לחוד וקיבלתי  r1=0.67 אצל הבנים    ו-r2=0.35  אצל הבנות. גודלי המדגם – N1=41 ,  ו-N2=43 בהתאמה. האם ההבדלים במתאמים בין הקבוצות מובהקים סטטיסטית?
נחפש בגוגל לדוגמא את המילים correlation differences independent samples.  
הפיתרון נמצא באתר - http://faculty.vassar.edu/lowry/rdiff.html
תחת הכותרת - Difference Between Two Correlation Coefficients
אם נתקתק שם את הנתונים הנ"ל ונקיש על Calculate נקבל Z=1.97, p=0.0244 חד-זנבי, או p=0.0488 דו זנבי. הבדלים אלו בין המתאמים אכן מובהקים סטטיסטית.
מי שמעוניין להתעמק בתהליך ולהבין את הנוסחה לחישוב הנ"ל מוזמן לעיין באתר –
http://faculty.chass.ncsu.edu/garson/PA765/correl.htm  וישנם עוד רבים וטובים (ליתר דיוק – מעל 8.5 מיליון דפים בנושא זה...)
 
2.     מציאת מובהקות של מתאם
 
אין צורך לחפש בספרי סטטיסטיקה או בטבלאות סטטיסטיות. האתר http://www.quantitativeskills.com/sisa/statistics/correl.htm נותן פיתרון לבעיה זו ולעוד כמה בעיות (בהמשך). נקיש ליד r1 מתאם כלשהוא, למשל 0.31, וליד N1 נקיש את גודל המדגם, למשל – 41. שאר התאים יישארו ריקים. במשטח מצד ימין תופיע התוצאה -
  t=2.03, p=0.024 חד צידי (למעשה התוצאה משקפת את מובהקות ההבדל בין המתאם הנוכחי לבין מתאם של 0.00). נקבל גם רווחי בר-סמך למרווחים של 80%, 90%, 95% ו-99%.
 
3.     מציאת הבדל מובהק בין מתאם של מדגם למתאם של אוכלוסייה
 
 למשל, המתאם בין ציונים במתמטיקה לאינטליגנציה במדגם בגודל 41 נבדקים הוא r=0.35 ובאוכלוסייה המתאם בין מתמטיקה לאינטליגנציה הוא r=0.67 האם המתאם במדגם שונה באופן מובהק מאשר באוכלוסייה?
האתר הנ"ל – http://www.quantitativeskills.com/sisa/statistics/correl.htm נותן פיתרון גם לבעיה זו. נציב ב-r1 את המתאם באוכלוסייה וב-r2 את המתאם במדגם. במקום המצוין N1 נציב את גודל המדגם - 41 (N2נשאיר ריק).
התוצאה: Z=2.74 p=0.003, כלומר – הבדלים מובהקים בהחלט.
 
4.     מציאת הבדל מובהק בין מתאמים במדגמים בלתי תלויים
 
בסעיף 1 לעיל ישנו פיתרון של לבעיה זו. האתר המוזכר בסעיף הקודם מאפשר אף הוא לתת פיתרון. בהתייחס לנתונים שבסעיף 1 לעיל נמלא את כל התאים:
r1=0.67, r2=0.35, N1=41, N2=43. נקיש על calculate והתוצאה:
r1-r2= 0.32; z= 1.96574, p=0.024, תוצאות זהות לאלו שבסעיף 1.
 
5.     מציאת הבדל מובהק בין מתאמים במדגמים תלויים במשולש מתאמים
 
האתר הנ"ל – http://www.quantitativeskills.com/sisa/statistics/correl.htm מאפשר לבדק הבדלים בין מתאמים במדגמים תלויים (באותו מדגם), במשולש מתאמים.
נניח מתאם בין ציונים במתמטיקה לספרות הוא r1=0.35 ובין מתמטיקה לאינטליגנציה הוא r2=0.67. בין ספרות לאינטליגנציה נמצא מתאם של r3=0.21.
נמלא את התאים r1, r2, r3 במתאמים הנ"ל וכן את גודל המדגם בתא האחרון  N2=41
נקבל r1-r2= -0.32;  t= -2.080, p=0.022; ,
r1-r3=  0.14;  t= 1.133, p=0.132          
וכן  -   r2-r3= 0.46;  t= 3.268,  p=0.001    במובהקות חד-צידית.
המסקנה – אין הבדל מובהק בין הקשרים של ספרות-מתמטיקה לבין ספרות-אינטליגנציה.
ישנם הבדלים מובהקים בין המתאמים מתמטיקה-ספרות למתמטיקה אינטליגנציה, ועוד יותר בין מתמטיקה-אינטליגנציה לספרות-אינטליגנציה.

 6.     חישוב מתאמים חלקיים

 באתר הנ"ל אם נסמן כנ"ל את שלושת המתאמים ולא נציב ערך בתא N2  (גודל מדגם) נקבל מתאמים חלקיים (partial correlation) בין כל זוג מתאמים כאשר השלישי קבוע. למשל: המתאם בין ציונים במתמטיקה לספרות הוא r1=0.35 ובין מתמטיקה לאינטליגנציה הוא r2=0.67. ובין ספרות לאינטליגנציה נמצא מתאם שלr3=0.21  
התוצאה:
  Simple (r(yx)): 0.35 Partial (r(yx.z)): 0.288
Simple (r(yz)): 0.67 Partial (r(yz.x)): 0.651
Simple (r(xz)): 0.21 Partial (r(xz.y)): -0.035
ובנוסף – אחוז השונות המוסברת
R-sq:      0.4947=0.1225+0.4242*0.8775
 
7.     מחשבון לחישוב גודל מדגם דרוש למציאת מובהקות של מתאם
 
באתר הנ"ל נסמן מתאם בודד נניח r1=0.35 ושאר התאים יישארו ריקים. נקבל טבלת alpha
מול power   המציינת לכל רמת מובהקות נדרשת (0.1, 0.05, 0.01, 0.001) ולכל רמת ביטחון (0.9, 0.8, 0.7, 0.6)  מה גודל המדגם הדרוש, ברמת מובהקות חד צידית. טבלה נוספת נקבל לגבי רמת מובהקות דו-צידית.
 
הסברים למחשבונים הנ"ל תמצאו בדף -
 
8.     מחשבון לחישוב גודל מדגם דרוש למציאת מובהקות ההבדלים בין פרופורציות
 
מחשבון לגודל מדגם הנחוץ לבדיקת הבדלים בין פרופורציות נמצא באתר http://statpages.org/proppowr.html
המחשבון מקבל את a הדרוש (בד"כ – 0.05) העוצמה (אחוז השינוי לאיתור – בד"כ 80) הפרופורציות של שתי הקבוצות (צ"ל שונות זו מזו, ויחס גדלי הקבוצות (בד"כ – 1)
 
9.  מחשבונים לחישוב גודל מדגם כללי הדרוש לקבלת מובהקות סטטיסטית
 
מחשבון לגודל מדגם דרוש תמצאו באתר http://www.surveysystem.com/sscalc.htm
באתר זה מחשבון נוסף המוצא רווח בר-סמך דרוש כשנתון גודל מדגם.
בד"כ אם ממוצע האוכלוסייה לא ידוע השאר ריק. מרווח הביטחון הוא באחוזים.
אתר נוסף לחישוב גודל מדגם: http://www.raosoft.com/samplesize.html
הסברים בגוף האתרים.
 
10. מחשבונים נוספים – ניתוח t  לקבוצות בלתי תלויות, העברה לציוני תקן, טרנספורמציות   של נתונים לפי נוסחאות נתונות
 
 

 11.       מחשבונים לניתוחי שונות חד ודו-כיווניים, ועוד

 
בשולי האתר הנ"ל בצד שמאל ישנם הפניות לפתרונות סטטיסטיים נוספים למשל – ניתוחי שונות 
ישנם גם ניתוחי שונות עם קו-ואריאנטים, ניתוחי פרופורציות, טבלאות שכיחויות, התפלגויות, ניתוחים קליניים (חי בריבוע), קורלציות ורגרסיות, ועוד, אולם את רוב הניתוחים ניתן לקבל בתוכנות הסטטיסטיות הסטנדרטיות ובנוחות יתר כאשר המדגמים גדולים.     
 
12.       מחשבון מדעי
 
ניתן להכניס ביטוי אריתמטי עם פונקציות שונות לפי רשימה
 
13.       מחשבונים סטטיסטיים נוספים
 
מכל הסוגים, מכל המינים...    http://www.danielsoper.com/statcalc
מחישובי מדדים מרכזיים ועד מקדמי הרגרסיה והתפלגות היפרגאומטרית... 
  1. עוד מחשבונים סטטיסטיים Z-A
            כמעט בכל נושא.
  1. תוכנת מחשבון סטטיסטי להורדה
זו תוכנת חינם לחישובים סטטיסטיים 
  1. הפניות למחשבונים שונים (לא בהכרח סטטיסטיים) 
מחשבוני זולו - http://www.zooloo.co.il/calc/TaxCalc.asp
אלו אינם מחשבונים סטטיסטיים, אלא מחשבונים שימושיים לצרכים שונים – פיננסיים, המרות מידות, ועוד.
מחשבוני מנאלי - http://www.manneli.com/Calculator/Calcompute.htm   
מחשבונים מכל הבא ליד, אבל גם כמה מדעיים, ואפילו הפנייה למחשבון לשרטוט התפלגות נורמאלית. 
  1.  מחשבונים מדעיים
כל מה שצריך במחשבון מדעי באתר - http://www.ecalc.com/calculator/scientific
תוכנת מחשבון מדעי להורדה מהאתר - http://www.wisecalc.com/
 
ישנם עוד הרבה מחשבונים סטטיסטיים כמו גם מחשבונים למטרות אחרות, ותקצר היריעה מלהציג את כולם. אם אין מענה לבעיה הסטטיסטית שלכם בתוכנות הסטטיסטיות הרגילות אל ייאוש. ניתן לחפש ברשת האינטרנט. ו-(כמעט) לכל בעיה סטטיסטית יימצא פיתרון ברשת.