Przedziały ufności i testy statystyczne; testowanie hipotez

 

Wyślij formularz z plikiem

Statystyka zadania - oferta badań statystycznych

Analizy danych

Wykonuję analizy struktury, współzależności oraz dynamiki zjawisk. Badania wariancji, regresji liniowej i nieliniowej, korelacji, analiza rozkładu..

Testy statystyczne

Testowanie hipotez to
fundament większości
badań stanowiących
przedmiot statystyki.
Weryfikuję hipotezy
..

Oprogramowanie statystyczne

Używam wielu spośród znanych programów mi.n SttaisticaPL, Gretl, Statgraf, SPSS ,  i inne.

 
   

Wyślij do mnie formularz (klik Enter).

 

Możesz w nim załączyć dowolny plik tekstowy : doc (Word), .pdf (Acrobat Reader), txt , xls (Excel) lub inny.

Podaj też Twoje oczekiwania i adres email, na który mam odpowiedzieć.

Testowanie hipotez

 

Przedziały ufności i testy statystyczne dla zmiennych losowych ciągłych

 

 

Zostaną rozważone następujące przypadki z możliwości A i B:

 

A.   Pojedyncza próba

 

(a)  s - znane, próba mała

(b)  s - nieznane, próba mała

(c)  s - nieznane, próba duża

 

 

B.   Dwie próby

 

(a)     znane,

(b)    nieznane, ale równe

(c)    nieznane, ale różne

 

 

 

Dane liczbowe

 

 

Źródło: Główny Urząd Statystyczny/dane gospodarcze z lat 1999/2000

 

 

Począwszy od roku 1992 w Polsce ceny nośników energii, tj. gazu, energii elektrycznej, ciepła w postaci gorącej wody, paliw stałych i płynnych, wody komunalnej systematycznie rosną. Zgodnie z przewidywaniami tempo wzrostu cen tychże nośników jest wyższe niż tempo wzrostu cen pozostałych dóbr konsumpcyjnych. Chociaż koszty zakupu nośników energii w Polsce zbliżyły się już znacznie do kosztów pozyskania energii w wysokorozwiniętych krajach Europy Zachodniej, należy spodziewać się dalszych jej podwyżek.

 

CENY ZAKUPU NOŚNIKÓW ENERGII W PODSTAWOWYCH DZIAŁACH I GAŁĘZIACH 
WYSZCZEGÓLNIENIE Rok 1999 Rok 2000
ENERGIA ELEKTRYCZNA
zł / MWh zł / MWh
GÓRNICTWO I KOPALNICTWO 216,9 237,8
DZIAŁALNOŚĆ PRODUKCYJNA 133,6 155,4
PRODUKCJA ARTYKUŁÓW SPOŻYWCZYCH I NAPOJÓW 153,6 162,8
PRODUKCJA WYROBÓW TYTONIOWYCH 185,1 197,8
PRODUKCJA TKANIN 157 155,2
PRODUKCJA ODZIEŻY ORAZ FUTRZARSTWO 166,8 175,8
OBRÓBKA SKÓRY I PRODUKCJA WYROBÓW ZE SKÓRY 223,2 242,9
PRODUKCJA DREWNA I PRODUKTÓW Z DREWNA ORAZ ZE SŁOMY I WIKLINY 212,8 224,5
PRODUKCJA CELULOZOWO-PAPIERNICZA 186,3 184,3
DZIAŁALNOŚĆ WYDAWNICZA I POLIGRAFICZNA 138,2 148,4
PRODUKCJA KOKSU,PRZETWORÓWROPY NAFTOWEJ I POCHODNYCH 192,3 199,7
WYTWARZANIE PRODUKTÓW KOKSOWANIA WĘGLA 140,6 147,7
WYTWARZANIE PRODUKTÓW RAFINACJI ROPY NAFTOWEJ 137 150,7
PRODUKCJA CHEMIKALIÓW I WYROBÓW CHEMICZNYCH 144,7 146,8
PRODUKCJA WYROBÓW Z GUMY I TWORZYW SZTUCZNYCH 138,1 146,1
PRODUKCJA WYROBÓW Z POZOSTAŁYCH SUROWCÓW NIEMETALICZNYCH 168,8 184,1
PRODUKCJA METALI 148,1 161,2
 PRDUKCJA WYROBÓW Z METALI(BEZ MASZYN I URZĄDZEŃ) 130,6 141,2
PRODUKCJA MASZYN I URZĄDZEŃ 193,5 194,8
PRODUKCJA MASZYN BIUROWYCH I KOMPUTERÓW 186,8 198
PRODUKCJA MASZYN I APARATURY ELEKTRYCZNEJ 180,1 203,9
PRODUKCJA SPRZĘTU I APARATURY RADIOWEJ,TELEWIZYJNEJ I KOMUNIKACYJNEJ 162,7 170,2
PRODUKCJA POJAZDÓW MECHANICZNYCH PRZYCZEP I NACZEP 151,5 161,3
PRODUKCJA POZOSTAŁEGO SPRZĘTU TRANSPORTOWEGO 172,6 189,4
PRODUKCJA MEBLI;POZOSTAŁA DZIAŁALNOŚĆ PRODUKCYJNA 170,2 178,2
ZAGOSPODAROWANIE ODPADÓW 200,8 217,1
ZAOPATRYWANIE W ENERGIĘ ELEKTRYCZNĄ GAZ I WODĘ 177,2 184,5
BUDOWNICTWO 133,7 140
TRANSPORT,SKŁADOWWANIE I ŁĄCZNOŚĆ ORAZ HANDEL I NAPRAWY 190,2 187,8

 

Aby badać dane z obu lat urealnię dane z 2000 roku biorąc pod uwagę inflację, która jak podaje GUS w 2000 roku wyniosła 10,4%.

 

Dane z 2000 roku urealniam dzieląc przez 1,104:

 

CENY ZAKUPU NOŚNIKÓW ENERGII W PODSTAWOWYCH DZIAŁACH I GAŁĘZIACH 
WYSZCZEGÓLNIENIE Rok 1999 Rok 2000
ENERGIA ELEKTRYCZNA
zł / MWh zł / MWh
GÓRNICTWO I KOPALNICTWO 216,9 215,4
DZIAŁALNOŚĆ PRODUKCYJNA 133,6 140,8
PRODUKCJA ARTYKUŁÓW SPOŻYWCZYCH I NAPOJÓW 153,6 147,5
PRODUKCJA WYROBÓW TYTONIOWYCH 185,1 179,2
PRODUKCJA TKANIN 157 140,6
PRODUKCJA ODZIEŻY ORAZ FUTRZARSTWO 166,8 159,2
OBRÓBKA SKÓRY I PRODUKCJA WYROBÓW ZE SKÓRY 223,2 220
PRODUKCJA DREWNA I PRODUKTÓW Z DREWNA ORAZ ZE SŁOMY I WIKLINY 212,8 203,4
PRODUKCJA CELULOZOWO-PAPIERNICZA 186,3 166,9
DZIAŁALNOŚĆ WYDAWNICZA I POLIGRAFICZNA 138,2 134,4
PRODUKCJA KOKSU,PRZETWORÓWROPY NAFTOWEJ I POCHODNYCH 192,3 180,9
WYTWARZANIE PRODUKTÓW KOKSOWANIA WĘGLA 140,6 133,8
WYTWARZANIE PRODUKTÓW RAFINACJI ROPY NAFTOWEJ 137 136,5
PRODUKCJA CHEMIKALIÓW I WYROBÓW CHEMICZNYCH 144,7 133
PRODUKCJA WYROBÓW Z GUMY I TWORZYW SZTUCZNYCH 138,1 132,3
PRODUKCJA WYROBÓW Z POZOSTAŁYCH SUROWCÓW NIEMETALICZNYCH 168,8 166,8
PRODUKCJA METALI 148,1 146
 PRDUKCJA WYROBÓW Z METALI(BEZ MASZYN I URZĄDZEŃ) 130,6 127,9
PRODUKCJA MASZYN I URZĄDZEŃ 193,5 176,4
PRODUKCJA MASZYN BIUROWYCH I KOMPUTERÓW 186,8 179,3
PRODUKCJA MASZYN I APARATURY ELEKTRYCZNEJ 180,1 184,7
PRODUKCJA SPRZĘTU I APARATURY RADIOWEJ,TELEWIZYJNEJ I KOMUNIKACYJNEJ 162,7 154,2
PRODUKCJA POJAZDÓW MECHANICZNYCH PRZYCZEP I NACZEP 151,5 146,1
PRODUKCJA POZOSTAŁEGO SPRZĘTU TRANSPORTOWEGO 172,6 171,6
PRODUKCJA MEBLI;POZOSTAŁA DZIAŁALNOŚĆ PRODUKCYJNA 170,2 161,4
ZAGOSPODAROWANIE ODPADÓW 200,8 196,6
ZAOPATRYWANIE W ENERGIĘ ELEKTRYCZNĄ GAZ I WODĘ 177,2 167,1
BUDOWNICTWO 133,7 126,8
TRANSPORT,SKŁADOWWANIE I ŁĄCZNOŚĆ ORAZ HANDEL I NAPRAWY 190,2 170,1

 

Wykres liniowy danych

 

Charakterystyki liczbowe:

 

 

Rok 1999

Rok 2000

Średnia

168,7241

162,0315

Błąd standardowy

4,999925

4,845336

Mediana

168,8

161,413

Odchylenie standardowe

26,92542

26,09293

Wariancja próbki

724,9783

680,8411

Kurtoza

-0,87285

-0,38881

Skośność

0,318551

0,575798

Zakres

92,6

93,20652

Minimum

130,6

126,8116

Maksimum

223,2

220,0181

Suma

4893

4698,913

Licznik

29

29

Największy(1)

223,2

220,0181

Najmniejszy(1)

130,6

126,8116

 

 

 

 

 

Histogramy zmiennych

 

 

 

 

 

 

Wykres pudełkowy rok2000:

 

 

 

 

Wykres pudełkowy rok1999:

 

 

 

 

 

 

Problem (a)

 

Przedział ufności (s - znane, próba mała)

Znajduję przedziały ufności dla średniej przy różnych poziomach istotności alfa:

 

 

n =

średnia

sigma

alfa

1- alfa/2

ualfa

L,1alfa

śr - L1

śr + L1

dł.  prz

29

168,72

25

0,05

0,975

1,96

9,09907

159,625

177,82

18,198

29

168,72

25

0,1

0,95

1,64

7,61351

161,111

176,34

15,227

29

168,72

25

0,01

0,995

2,58

11,9773

156,747

180,7

23,955

 

 

Hipoteza zerowa(s - znane, próba mała)

Sprawdzamy hipotezę H0 mówiącą że średnia jest statystycznie równa zadanej średniej:

 

n =

29

29

29

29

29

mo, 0 =

166

167

168

169

170

sigma =

25

25

25

25

25

alfa =

0,05

0,05

0,05

0,05

0,1

1- alfa/2 =

0,975

0,975

0,975

0,975

0,95

ualfa =

1,96

1,96

1,96

1,96

1,64

średnia =

168,72

168,72

168,72

168,72

168,72

u =

0,5448276

0,34483

0,1448

-0,0552

-0,2552

H0

nie odrz

nie odrz

nie odrz

nie odrz

nie odrz

 

W żadnym z przypadków Hipotezy Ho nie odrzucamy, gdyż wartość obliczonej statystyki nie znalazła się w obszarze  krytycznym .

Możemy uznać, iż średnie m0 są statystycznie równe średniej tej zmiennej na zadanych poziomach istotności.

 

 

 

 

 

Problem (b)

Przedziały  ufności dla średniej (s - nieznane, próba mała)

Obliczam przedziały ufności dla różnych poziomów istotności:

 

n =

29

29

29

średnia =

168,72

168,72

168,72

od. stand.=

26,93

26,93

26,93

alfa =

0,01

0,05

0,1

t,alfa

2,76

2,05

1,70

L,2alfa =

13,816

10,242

8,506

śr - L2 =

154,908

158,482

160,219

śr + L2 =

182,540

178,966

177,230

27,632

20,484

17,011

 

 

Hipoteza zerowa(s - nieznane, próba mała)

Sprawdzamy hipotezę H0 mówiącą że średnia jest statystycznie równa zadanej średniej:

 

n =

29

29

29

mi,0 =

160

160

160

średnia =

168,72

168,72

168,72

od. stand.=

26,93

26,93

26,93

alfa =

0,01

0,05

0,1

t,alfa

2,7633

2,0484

1,7011

t =

1,715

1,715

1,715

 

Na poziomach istotności 0,01 oraz 0,05 przyjmujemy hipotezę Ho mówiącą, iż średnia statystycznie jest równa 160 natomiast już przy poziomie istotności 0,1 hipotezę Ho musimy odrzucić.

 

 

 

 

 

  

 

 

 

Problem (d)

 

Wyznaczę przedziały ufności wariancji dla różnych poziomów istotności alfa=0,1 (0,05 i 0,01)

 

n =

29

29

29

od. stand.=

26,93

26,93

26,93

SSX =

20299,4

20299,4

20299,4

alfa =

0,1

0,05

0,01

alfa/2 =

0,05

0,025

0,005

1-alfa/2 =

0,95

0,975

0,995

chi,alfa/2 =

41,3372

44,4608

50,9936

chi,1-alfa/2=

16,9279

15,3079

12,4613

L =

508,60716

472,874

412,29465

P =

1241,997

1373,44

1687,1758

 

 

 

A.   Dwie próby

 

Zakładam normalność rozkładu badanych zmiennych:

 

 

Sprawdzanie równości wariancji testem F

 

Test F: z dwiema próbami dla wariancji
     
  Rok1999 Rok2000
Średnia 168,72414 162,0315
Wariancja 724,97833 680,8411
Obserwacje 29 29
df 28 28
F 1,0648275  
P(F<=f) jednostronny 0,4345914  
Test F jednostronny 1,8820785  

 

Ponieważ F< Test F (kwatyl rozkładu normalnego) nie ma podstaw do odrzucenia hipotezy ho mówiącej o równości wariancji obu zmiennych.

 

 

 

 

Problem (a)

Oszacuję przedział ufności dla różnicy średnich ( s - znane, próba mała):

 

 

2003

2005

n

29

29

średnie

168,72

162,03

wariancje

625

600

sw

6,50

 

alfa

0,05

 

1-alfa

0,95

 

kwantyl N(0, 1)

1,644

 

różnica śred

6,693

 

L4

10,685

 

lewa strona

-3,992

 

prawa strona

17,378

 

 

 

 

Problem (b)

Oszacuję przedział ufności dla różnicy średnich ( s - nieznane, próba mała):

 

Średnia

168,72414

162,0315

Odchylenie standardowe

26,925422

26,09293

Wariancje

724,97833

680,8411

SSX

20299,393

19063,55

h

56

 

sw2

8,267

 

sw

2,88

 

alfa

0,05

 

t,alfa

2,0032394

 

L5

5,7596902

 

lewa strona

0,9329635

 

prawa strona

12,452344

 

 

 

 

 

Test t: z dwiema próbami zakładający równe wariancje.

Testuję czy różnica średnich jest różna od zera:

 

 

Rok 1999

Rok 2000

Średnia

168,72414

162,0315

Wariancja

724,97833

680,8411

Obserwacje

29

29

Wariancja sumaryczna

702,90972

 

Różnica średnich wg hipotezy

0

 

df

56

 

t Stat

0,9612416

 

P(T<=t) jednostronny

0,1702815

 

Test T jednostronny

1,6725221

 

P(T<=t) dwustronny

0,340563

 

Test t dwustronny

2,0032394

 

 

Hipoteza nie odrzucona czyli różnica między średnimi  statystycznie nie różni się od zera.

 

 

 

Problem (c)

Test t: z dwiema próbami zakładający nierówne wariancje

 

 

Rok 1999

Rok 2000

Średnia

167,95714

162,0315

Wariancja

734,13735

680,8411

Obserwacje

28

29

Różnica średnich wg hipotezy

0

 

df

55

 

t Stat

0,8405699

 

P(T<=t) jednostronny

0,2021142

 

Test T jednostronny

1,6730337

 

P(T<=t) dwustronny

0,4042284

 

Test t dwustronny

2,0040443

 

 

Hipoteza Ho nieodrzucona.

 

 

 

 

 
Jeżeli potrzebujesz pomocy w analizie danych, badaniu statystycznym lub wykonaniu testów wypełnij formularz

Dziś dostaniesz odpowiedz.

 

Powrót na główną Analiza danych