Miary dyspersji

 

Wyślij formularz z plikiem

Statystyka zadania - oferta badań statystycznych

Analizy danych

Wykonuję analizy struktury, współzależności oraz dynamiki zjawisk. Badania wariancji, regresji liniowej i nieliniowej, korelacji, analiza rozkładu..

Testy statystyczne

Testowanie hipotez to
fundament większości
badań stanowiących
przedmiot statystyki.
Weryfikuję hipotezy
..

Oprogramowanie statystyczne

Używam wielu spośród znanych programów mi.n SttaisticaPL, Gretl, Statgraf, SPSS ,  i inne.

 
   

Wyślij do mnie formularz (klik Enter).

 

Możesz w nim załączyć dowolny plik tekstowy : doc (Word), .pdf (Acrobat Reader), txt , xls (Excel) lub inny.

Podaj też Twoje oczekiwania i adres email, na który mam odpowiedzieć.

Miary dyspersji

 

Miary dyspersji

 

Przykład

Robimy casting na sekretarkę i dwóm kandydatką cztery sprawdziany z maszynopisania, chcemy zobaczyć ile popełnią błędów.

 

nr. spr.

Brunetka

Blondynka

1

3

6

2

2

0

3

3

6

4

4

0

średnia

3bł.

3bł.

 

Często zbiorowości charakteryzujące się podobnym poziomem średniej wykazują pewne różnice. Wynika to z ich stopnia zróżnicowania względem badanej cechy. Duże zróżnicowanie utrudnia analizę w tym sensie, że wpływa na wzrost poziomu błędu jaki popełniamy np. w zakresie prognozowania. Im większa dyspersja, tym większy błąd prognozowania. Zbyt małe zróżnicowanie – zbiorowość mało interesująca z punktu widzenia statystycznego.

 

Podział miar zróżnicowania (dyspersji):

1)      Klasyczne

a.       Bezwzględne (odchylenie przeciętne, odchylenie standardowe)

b.      Względne (współczynnik zmienności dla odchylenia przeciętnego i standardowego)

2)      Pozycyjne

a.       Bezwzględne (obszar zmienności – rozstęp, odchylenie ćwiartkowe)

b.      Względne (współczynnik zmienności oparty o odchylenie ćwiartkowe)

 

Obszar zmienności

Miara ta nie jest zbyt często stosowana ponieważ bardzo sileni reaguje na wartości skrajne, nietypowe.

 

Klasyczne bezwzględne miary dyspersji:

Bazują one na różnicach absolutnych lub na kwadratach różnic pomiędzy poszczególnymi wartościami cechy a ich poziomem średnim.

Uwaga: dla każdego typu szeregów stosujemy odpowiedni typ średniej we wzorach na odchylenia.. W przypadku odchylenia standardowego symbol  zarezerwowany jest dla całej zbiorowości, dla próby stosujemy symbol

 

 

 

 

Miary

Szeregi szczegółowe

Szeregi rozdzielcze

punktowe

przedziałowe

Odchylenie przeciętne

Odchylenie standardowe

 

Pamiętamy, że

Częściej stosowane jest odchylenie standardowe. Matematycznie najlepszą interpretacje posiada kwadrat odchylenia standardowego (wariancja cechy x – tylko cechy mierzalnej). Nie ma większego sensu ekonomicznego kwadrat odchylenia standardowego.

Interpretacja odchylenia przeciętnego i standardowego jest podobna, o ile przeciętne jednostki miary (kg, zł, cm) różnią się od poszczególnych wartości cechy danej zbiorowości od średniego poziomu ( w góry i w dół).

Zwłaszcza odchylenie standardowe pozwala ustalić nam tzw. typowy klasyczny obszar zmienności cechy X: .

Te dwie miary są względem siebie alternatywne. W porównaniach struktury dwóch lub więcej zbiorowości posługujemy się miarami jedno imiennymi.. Do porównania stóp zróżnicowania dwóch lub więcej zbiorowości służą względne miary dyspersji zwane współczynnikami zmienności.

 

Współczynnik zmienności dla  - odchylenia przeciętnego

Współczynnik zmienności dla  - odchylenia standardowego

 

Czytamy te miary w ułamkach dziesiętnych lub w procentach, ale zawsze interpretujemy w procentach!

 

Uzupełnieniem miar dyspersji są rzadziej stosowane pozycyjne miary:

a.       Bezwzględna (odchylenie ćwiartkowe)

b.      Względna (współczynnik zmienności oparty o odchylenie ćwiartkowe)

bazujące na kwartylach.

 

Odchylenie ćwiartkowe

 

Współczynnik zmienności oparty o odchylenie ćwiartkowe

interpretujemy w procentach o ile średnie przeciętnie różnią się poszczególne wartości cechy od mediany.

 

Momenty

 

Wśród miar statystycznych zwłaszcza klasycznych pojawiają się pewne pojęcia matematyczne np. momenty. Wyróżniamy momenty zwykłe i momenty centralne

 

- moment k-tego rzędu

c – pewna stała

 

Rozważmy szczególne przypadki kiedy:

1)       wówczas gdy jeszcze  otrzymamy wzór postaci:

czyli gdy moment zwykły jest pierwszego rzędu dostajemy wzór na średnią arytmetyczną ważoną.

 

2)     

więc moment centralny drugiego rzędu to wariancja (kwadrat odchylenia standardowego)

3)      We wzorze na współczynnik asymetrii (patrz punkt dalej) w liczniku występuje moment stopnia trzeciego, gdzie

 

Zadanie:

20 dzieciom z klasy pierwszej pewnej szkoły podstawowej dano do rozwiązania zadanie wymagające ułożenia z zapałek zbioru figur geometrycznych. Czas rozwiązania tego zadania wynosił w minutach: 10, 12, 18, 18, 13, 11, 11, 13, 10, 14, 18, 15, 15, 12, 10, 10, 13, 16, 11, 10. Dla 30 uczniów z klasy drugiej uzyskano przy rozwiązywaniu tego samego zadania następujące wyniki: średnia arytmetyczna 10 min., odchylenie standardowe 2min. Która z klas uzyskała lepsze wyniki?

 

Zbadajmy najpierw klasę pierwszą, budując dla niej tabelę oraz  wyliczając dla niej średnią arytmetyczną, odchylenie standardowe oraz współczynnik zmienności dla tego odchylenia.

 

10

5

50

-3

9

45

11

3

33

-2

4

12

12

2

24

-1

1

2

13

3

39

0

0

0

14

1

14

1

1

1

15

2

30

2

4

8

16

1

16

3

9

9

18

3

54

5

25

75

suma

20

260

 

53

152

 

Obliczmy średnią

Obliczmy odchylenie standardowe

Ponieważ obliczyliśmy już zarówno średnią arytmetyczną jak i odchylenie standardowe dla klasy pierwszej więc możemy obliczyć współczynnik zmienności dla odchylenia standardowego

Obliczmy współczynnik zmienności dla odchylenia standardowego dla klasy drugiej. Mamy daną średnią arytmetyczną i odchylenie standardowe.

 

 

Umieśćmy teraz wszystkie te dane we wspólnej tabeli

Parametr

Klasa I

Klasa II

13min.

10min.

2,76min.

2min.

21,23%

20%

 

(interpretacja odchylenia standardowego – przeciętne odchylenie od średniej)

Reasumując w klasie drugiej czas rozwiązania odchylał się (różnił się) przeciętnie od średniej arytmetycznej o 2 min, co stanowi 20% średniej.

 

Zadanie:

W wyniku badań dotyczących czasu przygotowania się do sprawdzianu pisemnego ze statystyki oraz wyników tego sprawdzianu uzyskano następujące informacje:

Wynik punktowy

Czas przygotowania się w godz.

Suma

1

2

3

4

19 – 39

4

4

4

3

15

40 – 60

4

6

7

3

20

61 – 81

2

5

4

4

15

Suma

10

15

15

10

50

1)      Jakim przeciętnym wynikiem ze sprawdzianu charakteryzowały się osoby, które uczyły się do niego przez 3 godziny?

2)      Czy wszystkie badane osoby były bardziej zróżnicowane pod względem wyników sprawdzianu czy czasu poświęconego przygotowaniu do niego?

 

Ad1)

Oto szereg osób przygotowujących się przez 3 godziny

19 – 39

4

29

116

40 – 60

7

50

350

61 – 81

4

71

284

Suma

15

X

750

 

Obliczmy więc średnią arytmetyczną ważoną:

Osoby które przygotowywały się do egzaminu 3 godziny otrzymywały przeciętnie 50pkt.

 

Ad2)

Ażeby porównać stopy zróżnicowania dwóch lub więcej zbiorowości posługujemy się względnymi miarami dyspersji zwanymi współczynnikami zmienności.

Obliczmy średnie arytmetyczne, odchylenia standardowe oraz współczynniki zmienności.

a) ze względu na liczbę otrzymanych punktów

19 – 39

15

29

435

-21

441

6615

40 – 60

20

50

1000

0

0

0

61 – 81

15

71

1065

21

441

6615

suma

50

x

2500

x

x

13230

b) ze względu na czas przygotowania się

1

10

10

-1,5

2,25

22,5

2

15

30

-0,5

0,25

3,75

3

15

45

0,5

0,25

3,75

4

10

40

1,5

2,25

22,5

suma

50

125

x

X

52,5

Reasumując, ponieważ współczynnik zmienności dla odchylenia standardowego zbiorowości analizowanej pod względem czasu trwania nauki w godzinach jest większy od współczynnika odchylenia standardowego tej samej zbiorowości tyle tylko, że analizowanej pod względem wyniku sprawdzianu w punktach, więc wszystkie badane osoby są bardziej zróżnicowane pod względem czasu trwania nauki.

 

 

 
Jeżeli potrzebujesz pomocy w analizie danych, badaniu statystycznym lub wykonaniu testów wypełnij formularz

Dziś dostaniesz odpowiedz.

 

Powrót na główną Analiza danych