Przedziały ufności i
testy statystyczne dla zmiennych losowych ciągłych
Zostaną
rozważone następujące przypadki z możliwości A i B:
A.
Pojedyncza próba
(a)
s
- znane, próba mała
(b)
s
- nieznane, próba mała
(c)
s
- nieznane, próba duża
B.
Dwie
próby
(a)
znane,
(b)
nieznane,
ale równe
(c)
nieznane,
ale różne
Dane liczbowe
Źródło: Główny
Urząd Statystyczny/dane gospodarcze z lat 1999/2000
Począwszy od roku 1992 w
Polsce ceny nośników energii, tj. gazu, energii elektrycznej, ciepła w postaci
gorącej wody, paliw stałych i płynnych, wody komunalnej systematycznie rosną.
Zgodnie z przewidywaniami tempo wzrostu cen tychże nośników jest wyższe niż
tempo wzrostu cen pozostałych dóbr konsumpcyjnych. Chociaż koszty zakupu
nośników energii w Polsce zbliżyły się już znacznie do kosztów pozyskania
energii w wysokorozwiniętych krajach Europy Zachodniej, należy spodziewać się
dalszych jej podwyżek.
CENY ZAKUPU NOŚNIKÓW ENERGII W
PODSTAWOWYCH DZIAŁACH I GAŁĘZIACH |
WYSZCZEGÓLNIENIE |
Rok 1999 |
Rok 2000 |
ENERGIA ELEKTRYCZNA |
zł / MWh |
zł / MWh |
GÓRNICTWO I KOPALNICTWO |
216,9 |
237,8 |
DZIAŁALNOŚĆ PRODUKCYJNA |
133,6 |
155,4 |
PRODUKCJA ARTYKUŁÓW SPOŻYWCZYCH I NAPOJÓW |
153,6 |
162,8 |
PRODUKCJA WYROBÓW TYTONIOWYCH |
185,1 |
197,8 |
PRODUKCJA TKANIN |
157 |
155,2 |
PRODUKCJA ODZIEŻY ORAZ FUTRZARSTWO |
166,8 |
175,8 |
OBRÓBKA SKÓRY I PRODUKCJA WYROBÓW ZE
SKÓRY |
223,2 |
242,9 |
PRODUKCJA DREWNA I PRODUKTÓW Z DREWNA
ORAZ ZE SŁOMY I WIKLINY |
212,8 |
224,5 |
PRODUKCJA CELULOZOWO-PAPIERNICZA |
186,3 |
184,3 |
DZIAŁALNOŚĆ WYDAWNICZA I POLIGRAFICZNA |
138,2 |
148,4 |
PRODUKCJA KOKSU,PRZETWORÓWROPY NAFTOWEJ I
POCHODNYCH |
192,3 |
199,7 |
WYTWARZANIE PRODUKTÓW KOKSOWANIA WĘGLA |
140,6 |
147,7 |
WYTWARZANIE PRODUKTÓW RAFINACJI ROPY
NAFTOWEJ |
137 |
150,7 |
PRODUKCJA CHEMIKALIÓW I WYROBÓW
CHEMICZNYCH |
144,7 |
146,8 |
PRODUKCJA WYROBÓW Z GUMY I TWORZYW
SZTUCZNYCH |
138,1 |
146,1 |
PRODUKCJA WYROBÓW Z POZOSTAŁYCH SUROWCÓW
NIEMETALICZNYCH |
168,8 |
184,1 |
PRODUKCJA METALI |
148,1 |
161,2 |
PRDUKCJA WYROBÓW Z METALI(BEZ MASZYN I
URZĄDZEŃ) |
130,6 |
141,2 |
PRODUKCJA MASZYN I URZĄDZEŃ |
193,5 |
194,8 |
PRODUKCJA MASZYN BIUROWYCH I KOMPUTERÓW |
186,8 |
198 |
PRODUKCJA MASZYN I APARATURY ELEKTRYCZNEJ |
180,1 |
203,9 |
PRODUKCJA SPRZĘTU I APARATURY
RADIOWEJ,TELEWIZYJNEJ I KOMUNIKACYJNEJ |
162,7 |
170,2 |
PRODUKCJA POJAZDÓW MECHANICZNYCH PRZYCZEP
I NACZEP |
151,5 |
161,3 |
PRODUKCJA POZOSTAŁEGO SPRZĘTU
TRANSPORTOWEGO |
172,6 |
189,4 |
PRODUKCJA MEBLI;POZOSTAŁA DZIAŁALNOŚĆ
PRODUKCYJNA |
170,2 |
178,2 |
ZAGOSPODAROWANIE ODPADÓW |
200,8 |
217,1 |
ZAOPATRYWANIE W ENERGIĘ ELEKTRYCZNĄ GAZ I
WODĘ |
177,2 |
184,5 |
BUDOWNICTWO |
133,7 |
140 |
TRANSPORT,SKŁADOWWANIE I ŁĄCZNOŚĆ ORAZ
HANDEL I NAPRAWY |
190,2 |
187,8 |
Aby badać dane
z obu lat urealnię dane z 2000 roku biorąc pod uwagę inflację, która jak podaje
GUS w 2000 roku wyniosła 10,4%.
Dane z 2000
roku urealniam dzieląc przez 1,104:
CENY ZAKUPU NOŚNIKÓW ENERGII W
PODSTAWOWYCH DZIAŁACH I GAŁĘZIACH |
WYSZCZEGÓLNIENIE |
Rok 1999 |
Rok 2000 |
ENERGIA ELEKTRYCZNA |
zł / MWh |
zł / MWh |
GÓRNICTWO I KOPALNICTWO |
216,9 |
215,4 |
DZIAŁALNOŚĆ PRODUKCYJNA |
133,6 |
140,8 |
PRODUKCJA ARTYKUŁÓW SPOŻYWCZYCH I NAPOJÓW |
153,6 |
147,5 |
PRODUKCJA WYROBÓW TYTONIOWYCH |
185,1 |
179,2 |
PRODUKCJA TKANIN |
157 |
140,6 |
PRODUKCJA ODZIEŻY ORAZ FUTRZARSTWO |
166,8 |
159,2 |
OBRÓBKA SKÓRY I PRODUKCJA WYROBÓW ZE
SKÓRY |
223,2 |
220 |
PRODUKCJA DREWNA I PRODUKTÓW Z DREWNA
ORAZ ZE SŁOMY I WIKLINY |
212,8 |
203,4 |
PRODUKCJA CELULOZOWO-PAPIERNICZA |
186,3 |
166,9 |
DZIAŁALNOŚĆ WYDAWNICZA I POLIGRAFICZNA |
138,2 |
134,4 |
PRODUKCJA KOKSU,PRZETWORÓWROPY NAFTOWEJ I
POCHODNYCH |
192,3 |
180,9 |
WYTWARZANIE PRODUKTÓW KOKSOWANIA WĘGLA |
140,6 |
133,8 |
WYTWARZANIE PRODUKTÓW RAFINACJI ROPY
NAFTOWEJ |
137 |
136,5 |
PRODUKCJA CHEMIKALIÓW I WYROBÓW
CHEMICZNYCH |
144,7 |
133 |
PRODUKCJA WYROBÓW Z GUMY I TWORZYW
SZTUCZNYCH |
138,1 |
132,3 |
PRODUKCJA WYROBÓW Z POZOSTAŁYCH SUROWCÓW
NIEMETALICZNYCH |
168,8 |
166,8 |
PRODUKCJA METALI |
148,1 |
146 |
PRDUKCJA WYROBÓW Z METALI(BEZ MASZYN I
URZĄDZEŃ) |
130,6 |
127,9 |
PRODUKCJA MASZYN I URZĄDZEŃ |
193,5 |
176,4 |
PRODUKCJA MASZYN BIUROWYCH I KOMPUTERÓW |
186,8 |
179,3 |
PRODUKCJA MASZYN I APARATURY ELEKTRYCZNEJ |
180,1 |
184,7 |
PRODUKCJA SPRZĘTU I APARATURY
RADIOWEJ,TELEWIZYJNEJ I KOMUNIKACYJNEJ |
162,7 |
154,2 |
PRODUKCJA POJAZDÓW MECHANICZNYCH PRZYCZEP
I NACZEP |
151,5 |
146,1 |
PRODUKCJA POZOSTAŁEGO SPRZĘTU
TRANSPORTOWEGO |
172,6 |
171,6 |
PRODUKCJA MEBLI;POZOSTAŁA DZIAŁALNOŚĆ
PRODUKCYJNA |
170,2 |
161,4 |
ZAGOSPODAROWANIE ODPADÓW |
200,8 |
196,6 |
ZAOPATRYWANIE W ENERGIĘ ELEKTRYCZNĄ GAZ I
WODĘ |
177,2 |
167,1 |
BUDOWNICTWO |
133,7 |
126,8 |
TRANSPORT,SKŁADOWWANIE I ŁĄCZNOŚĆ ORAZ
HANDEL I NAPRAWY |
190,2 |
170,1 |
Wykres liniowy danych
Charakterystyki
liczbowe:
|
Rok 1999 |
Rok 2000 |
Średnia |
168,7241 |
162,0315 |
Błąd standardowy |
4,999925 |
4,845336 |
Mediana |
168,8 |
161,413 |
Odchylenie standardowe |
26,92542 |
26,09293 |
Wariancja próbki |
724,9783 |
680,8411 |
Kurtoza |
-0,87285 |
-0,38881 |
Skośność |
0,318551 |
0,575798 |
Zakres |
92,6 |
93,20652 |
Minimum |
130,6 |
126,8116 |
Maksimum |
223,2 |
220,0181 |
Suma |
4893 |
4698,913 |
Licznik |
29 |
29 |
Największy(1) |
223,2 |
220,0181 |
Najmniejszy(1) |
130,6 |
126,8116 |
Histogramy
zmiennych
Wykres
pudełkowy rok2000:
Wykres
pudełkowy rok1999:
Problem (a)
Przedział ufności (s
- znane, próba mała)
Znajduję
przedziały ufności dla średniej przy różnych poziomach istotności alfa:
n = |
średnia
|
sigma
|
alfa |
1- alfa/2 |
ualfa |
L,1alfa
|
śr - L1
|
śr + L1
|
dł. prz |
29 |
168,72 |
25 |
0,05 |
0,975 |
1,96 |
9,09907 |
159,625 |
177,82 |
18,198 |
29 |
168,72 |
25 |
0,1 |
0,95 |
1,64 |
7,61351 |
161,111 |
176,34 |
15,227 |
29 |
168,72 |
25 |
0,01 |
0,995 |
2,58 |
11,9773 |
156,747 |
180,7 |
23,955 |
Hipoteza
zerowa(s
- znane, próba mała)
Sprawdzamy
hipotezę H0 mówiącą że średnia jest statystycznie równa zadanej średniej:
n = |
29 |
29 |
29 |
29 |
29 |
mo, 0 = |
166 |
167 |
168 |
169 |
170 |
sigma = |
25 |
25 |
25 |
25 |
25 |
alfa = |
0,05 |
0,05 |
0,05 |
0,05 |
0,1 |
1- alfa/2 = |
0,975 |
0,975 |
0,975 |
0,975 |
0,95 |
ualfa = |
1,96 |
1,96 |
1,96 |
1,96 |
1,64 |
średnia
= |
168,72 |
168,72 |
168,72 |
168,72 |
168,72 |
u = |
0,5448276 |
0,34483 |
0,1448 |
-0,0552 |
-0,2552 |
H0 |
nie odrz |
nie odrz |
nie odrz |
nie odrz |
nie odrz |
W żadnym z
przypadków Hipotezy Ho nie odrzucamy, gdyż wartość obliczonej statystyki nie
znalazła się w obszarze krytycznym .
Możemy uznać,
iż średnie m0 są statystycznie równe średniej tej zmiennej na zadanych poziomach
istotności.
Problem (b)
Przedziały ufności dla średniej (s
- nieznane, próba mała)
Obliczam
przedziały ufności dla różnych poziomów istotności:
n = |
29 |
29 |
29 |
średnia = |
168,72 |
168,72 |
168,72 |
od. stand.= |
26,93 |
26,93 |
26,93 |
alfa = |
0,01 |
0,05 |
0,1 |
t,alfa |
2,76 |
2,05 |
1,70 |
L,2alfa = |
13,816 |
10,242 |
8,506 |
śr - L2 = |
154,908 |
158,482 |
160,219 |
śr + L2 = |
182,540 |
178,966 |
177,230 |
dł |
27,632 |
20,484 |
17,011 |
Hipoteza
zerowa(s
- nieznane, próba mała)
Sprawdzamy
hipotezę H0 mówiącą że średnia jest statystycznie równa zadanej średniej:
n = |
29 |
29 |
29 |
mi,0 = |
160 |
160 |
160 |
średnia = |
168,72 |
168,72 |
168,72 |
od.
stand.= |
26,93 |
26,93 |
26,93 |
alfa = |
0,01 |
0,05 |
0,1 |
t,alfa |
2,7633 |
2,0484 |
1,7011 |
t = |
1,715 |
1,715 |
1,715 |
Na poziomach
istotności 0,01 oraz 0,05 przyjmujemy hipotezę Ho mówiącą, iż średnia
statystycznie jest równa 160 natomiast już przy poziomie istotności 0,1 hipotezę
Ho musimy odrzucić.
Problem (d)
Wyznaczę
przedziały ufności wariancji dla różnych poziomów istotności alfa=0,1 (0,05 i
0,01)
n = |
29 |
29 |
29 |
od. stand.= |
26,93 |
26,93 |
26,93 |
SSX = |
20299,4 |
20299,4 |
20299,4 |
alfa
= |
0,1 |
0,05 |
0,01 |
alfa/2 = |
0,05 |
0,025 |
0,005 |
1-alfa/2 = |
0,95 |
0,975 |
0,995 |
chi,alfa/2 = |
41,3372 |
44,4608 |
50,9936 |
chi,1-alfa/2= |
16,9279 |
15,3079 |
12,4613 |
L = |
508,60716 |
472,874 |
412,29465 |
P = |
1241,997 |
1373,44 |
1687,1758 |
A.
Dwie próby
Zakładam
normalność rozkładu badanych zmiennych:
Sprawdzanie
równości wariancji testem F
Test F: z dwiema próbami dla wariancji |
|
|
|
|
Rok1999 |
Rok2000 |
Średnia |
168,72414 |
162,0315 |
Wariancja |
724,97833 |
680,8411 |
Obserwacje |
29 |
29 |
df |
28 |
28 |
F |
1,0648275 |
|
P(F<=f) jednostronny |
0,4345914 |
|
Test F jednostronny |
1,8820785 |
|
Ponieważ F<
Test F (kwatyl rozkładu normalnego) nie ma podstaw do odrzucenia hipotezy ho
mówiącej o równości wariancji obu zmiennych.
Problem (a)
Oszacuję
przedział ufności dla różnicy średnich (
s - znane, próba
mała):
|
2003 |
2005 |
n |
29 |
29 |
średnie |
168,72 |
162,03 |
wariancje |
625 |
600 |
sw |
6,50 |
|
alfa |
0,05 |
|
1-alfa |
0,95 |
|
kwantyl N(0, 1) |
1,644 |
|
różnica śred |
6,693 |
|
L4 |
10,685 |
|
lewa strona |
-3,992 |
|
prawa strona |
17,378 |
|
Problem (b)
Oszacuję
przedział ufności dla różnicy średnich (
s - nieznane, próba
mała):
Średnia |
168,72414 |
162,0315 |
Odchylenie standardowe |
26,925422 |
26,09293 |
Wariancje |
724,97833 |
680,8411 |
SSX |
20299,393 |
19063,55 |
h |
56 |
|
sw2 |
8,267 |
|
sw |
2,88 |
|
alfa |
0,05 |
|
t,alfa |
2,0032394 |
|
L5 |
5,7596902 |
|
lewa strona |
0,9329635 |
|
prawa strona |
12,452344 |
|
Test t: z
dwiema próbami zakładający równe wariancje.
Testuję czy
różnica średnich jest różna od zera:
|
Rok
1999 |
Rok
2000 |
Średnia |
168,72414 |
162,0315 |
Wariancja |
724,97833 |
680,8411 |
Obserwacje |
29 |
29 |
Wariancja sumaryczna |
702,90972 |
|
Różnica średnich wg hipotezy |
0 |
|
df |
56 |
|
t Stat |
0,9612416 |
|
P(T<=t) jednostronny |
0,1702815 |
|
Test T jednostronny |
1,6725221 |
|
P(T<=t) dwustronny |
0,340563 |
|
Test t dwustronny |
2,0032394 |
|
Hipoteza nie
odrzucona czyli różnica między średnimi statystycznie nie różni się od zera.
Problem (c)
Test t: z
dwiema próbami zakładający nierówne wariancje
|
Rok
1999 |
Rok
2000 |
Średnia |
167,95714 |
162,0315 |
Wariancja |
734,13735 |
680,8411 |
Obserwacje |
28 |
29 |
Różnica średnich wg hipotezy |
0 |
|
df |
55 |
|
t Stat |
0,8405699 |
|
P(T<=t) jednostronny |
0,2021142 |
|
Test T jednostronny |
1,6730337 |
|
P(T<=t) dwustronny |
0,4042284 |
|
Test t dwustronny |
2,0040443 |
|
Hipoteza Ho
nieodrzucona.
|
|