This PDF 1.4 document has been generated by Microsoft® Word 2016 / 3-Heights(TM) PDF Security Shell 4.8.25.2 (http://www.pdf-tools.com), and has been sent on pdf-archive.com on 06/10/2017 at 12:51, from IP address 109.173.x.x.
The current document download page has been viewed 358 times.
File size: 2.54 MB (18 pages).
Privacy: public file
SS Ogr I stop.
I. PRZYKŁADY
2017/2018
Zmienne losowe skokowe
PRZYKŁAD 1. a) Wyznaczyć i narysować dystrybuantę zmiennej skokowej X, której rozkład
prawdopodobieństwa jest podany w tabeli:
xi
p i P( X x i )
ad. a) Rozwiązanie
• Sprawdzamy warunek rozkładu:
0
0,1
p1
1
0,2
p2
2
0,5
p3
3
0,2
p4
pi p1 p2 p3 p4 0,1 0,2 0,5 0,2 1 .
• Obliczamy wartości dystrybuanty w punktach skokowych, korzystając z F(x) = P(X < x).
F(0) = P(X < 0) = 0
F(2) = P(X < 2) = p1 + p2 = 0,1+0,2 = 0,3
F(+ ) = 1 (z właściwości dystrybuanty)
F(1) = P(X < 1) = p1 = 0,1
F(3) = P(X < 3) = p1 + p2 +p3 = 0,3+0,5 = 0,8
• Tworzymy tabelę dystrybuanty
x≤0
0
x
F(x)
0 < x ≤1
0,1
p1
1 < x ≤2
0,3
p1+ p2
2 < x ≤3
0,8
p1+ p2+ p3
x>3
1
p1+ p2+ p3+p4
b) Obliczyć następujące prawdopodobieństwa dwoma sposobami, korzystając z obu funkcji.
• z tabeli dystrybuanty (druga tabela)
1)
2)
P(0 X 2) F(2) F(0) (p1 p2 ) 0 0,3 0 0,3
P(0 X 2) F(2) F(0) P(X 2) 0,3 0,5 0,8
0, 3
3)
P(X 1,5) F(1,5) 0,3
• z tabeli rozkładu prawdopodobieństwa (pierwsza tabela)
1) P(0 X 2) P(X 0) P(X 1) = p1 + p2 = 0,1 + 0,2 =0,3
2) P(0 X 2) P(X 0) P(X 1) P(X 2) = p1 + p2 + p3 = 0,1 + 0,2 + 0,5 = 0,8
3) P(X 1,5) P(X 0) P(X 1) 0,3
Wykres funkcji rozkładu prawdopodobieństwa
Wykres dystrybuanty
PRZYKŁAD 2. a) Wyznaczyć funkcję rozkładu prawdopodobieństwa zmiennej skokowej X,
której dystrybuanta jest postaci:
x
(-, -2 > (-2, 1> (1, 3> (3, + )
F(x)
0
0,2
0,6
1
p1
p1+ p2 p1+ p2+ p3
b) Obliczyć E(X), D2(X), D(X). Podać nazwy parametrów.
1
I. PRZYKŁADY
SS Ogr I stop.
2017/2018
Zmienne losowe skokowe
c) Obliczyć wartość oczekiwaną i wariancję zmiennej losowej Y = 5X + 10.
Rozwiązanie
Ad. a) Tworzymy tabelę rozkładu prawdopodobieństwa
-2
p1
xi
pi
1
p2
3
p3
p1 = 0,2 (odczytujemy z tabeli dystrybuanty)
p2 = (p1+ p2) – p1 = 0,6 – 0,2 = 0,4;
p3 = (p1+ p2+ p3) – (p1+ p2) = 1 – 0,6 = 0,4
Po obliczeniach należy sprawdzić warunek rozkładu p i 0,2 0,4 0,4 1 .
Odp. a) Tabela rozkładu prawdopodobieństwa jest postaci
n
E(X) x i pi (2) 0,2 1 0,4 3 0,4 1,2
Ad. b) Wartość oczekiwana:
Wariancja:
D 2 (X)
xi -2 1
3
pi 0,2 0,4 0,4
i 1
2
2
x i pi [E(X)] (2)2 0,2 12 0,4 32 0,4 [1,2]2 4,8 1,44 3,36
Odchylenie standardowe: D(X) D 2 (X) 3,36 1,83
Ad. c) Korzystamy z właściwości parametrów. Czyli
E(Y) = E(5X + 10) = E(5X) + E(10) = 5E(X) + 10 = 51,2 + 10 = 16
D2(Y) = D2(5X + 10) = D2(5X) + D2(10) = 25D2(X) +0 = 253,36 = 84.
Przykład 3. Z partii sadzeniaków o sile kiełkowania 90% pobrano losowo 5 bulw. Jakie jest
prawdopodobieństwo tego, że a) nie wykiełkuje żadna bulwa, b) wykiełkuje co najmniej jedna bulwa.
Obliczyć wartość przeciętną, wariancję i odchylenie standardowe liczby bulw, które wykiełkują wśród pięciu
wylosowanych.
UWAGA: To jest rozkład dwumianowy
Rozwiązanie:
Parametry:
n=5
Ad.a)
Sukces – bulwa wykiełkuje,
Porażka – bulwa nie wykiełkuje
p = 0,9
q = 1 – p = 0,1
5
P(X 0) 0,90 0,15 0,00001
0
Ad.b) I sposób:
P(X 1) = P(X =1) +P(X = 2) + P(X = 3) + P(X = 4) +.P(X = 5) =
5
5
5
5
5
= 0,91 0,14 + 0,92 0,13 + 0,93 0,12 + 0,94 0,11 + 0,95 0,10 = 0,99999
1
2
3
4
5
Ad.b) II sposób: P(X 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 – 0,00001 = 0,99999
Charakterystyki rozkładu:
E(X) np 5 0,9 4,5 ( 4)
wartość przeciętna
Interpretacja przyrodnicza: przeciętnie cztery bulwy wykiełkują wśród każdych 5 wylosowanych
z tej partii sadzeniaków.
D2 (X) npq 5 0,9 0,1 0,45
wariancja
D(X) npq 0,45 0,67
odchylenie standardowe
2
II. PRZYKŁADY
SS Ogr I stop.
2017/2018
Zmienne losowe ciągłe
Przykład 1. Niech zmienna losowa X ma rozkład jednostajny na przedziale [1; 5].
a) Obliczyć i zinterpretować P(1 X 3).
Ad. a)
I sposób:
b) Obliczyć i zinterpretować E(X), D2(X), D(X)
dystrybuanta
dla x 1
0
x 1
F( x )
dla 1 x 5
4
1
dla x 5
P(1 X 3) = F(3) – F(1) = 24 0 12 0,5
Wskazujemy wynik na wykresie dystrybuanty
F(x)
1
0,5
F(3) – F(1)
0
II sposób:
1
3
5
x
funkcja gęstości
0
f (x) 1 1
b a
4
0
dla
x 1
dla
1 x 5
dla
x5
P(1 X 3) = (3 1) 14 12
Wskazujemy wynik na wykresie funkcji gęstości
P(1 X 3)
f(x)
1
4
0
III sposób:
1
3
5
x
(tylko dla zainteresowanych)
3
3
3
3
1
1
1
1
P(1 X 3) f ( x )dx 1dx 1 dx 1 x | 3 1 1
4
4
4
4 4
2
1
II. PRZYKŁADY
SS Ogr I stop.
I sposób:
Ad. b)
E(X) – wartość oczekiwana
(b a ) 2 (5 1) 2 16 4
12
12
12 3
4
3
.
D(X) D2 (X)
2
3
3
D 2 ( X)
D2(X) – wariancja
D(X) – odchylenie standardowe
II sposób:
2017/2018
Zmienne losowe ciągłe
ze wzorów dla rozkładu jednostajnego
a b 1 5
E(X)
3
2
2
z ogólnych wzorów dla zmiennych ciągłych (tylko dla zainteresowanych)
1
5
5
1
5
1
2
1 3
E(X) x f ( x )dx x 0 dx x 1 dx x 0 dx x8 | 25
8
8
4
1
5
5
1
5
1
3
1 124 31
E(X 2 ) x 2 f ( x )dx x 2 0 dx x 2 1 dx x 2 0 dx x12 | 125
12
12
12
3
4
D 2 (X) E(X 2 ) [E(X)]2 31 32 31 27 4
3
3
3
D(X) – liczy się jak wcześniej.
Przykład 2. Na odcinek [0, 1] rzucamy losowo punkt. Niech X jest zmienną losową opisującą
odległość tego punktu od danego końca przedziału. Przyjmując, że X ma rozkład jednostajny na
przedziale [0, 1], wyznaczyć P(X 1 ) .
3
dla
0
x a
x dla
dystrybuanta: F( x)
b a
1
dla
a=0 b=1
Odp.
x0
0 x 1
x 1
P(X 1 ) P(X 1 ) F( 1 ) 1
3
3
3
3
Przykład 3. Wiedząc, że U N(0, 1), obliczyć P(U < 1,18). Wynik wskazać na wykresie funkcji
gęstości rozkładu normalnego.
-----------------------------------------------------------------------------------------------------------------------Korzystamy z tablic dystrybuanty rozkładu normalnego standardowego F(u). Na przykład:
u
.00
.01
…
.08
.09
0.0
.5000
.5040
…
.5319
.5359
0.1
.5398
.5438
…
.5714
.5753
…
…
…
…
…
…
1.1
.8643
.8665
…
.8810
.8830
1.2
.8849
.8869
…
.8997
.9015
…
…
…
…
…
…
2
II. PRZYKŁADY
SS Ogr I stop.
2017/2018
Zmienne losowe ciągłe
Odp. P(U < 1,18) = F(1,18) = 0,8810
1,18
Przykład 4.
Masa (w dag) 100 owoców pewnej odmiany agrestu jest zmienną losową o rozkładzie normalnym
z parametrami:
= 45 [dag] i 2 = 121 [dag]2.
Jakie jest prawdopodobieństwo tego, że masa wybranych losowo 100 owoców tej odmiany będzie
zawierać się w przedziale (30 dag; 50 dag). Wynik wskazać na wykresach gęstości i dystrybuanty
rozkładu N(0; 1).
---------------------------------------------------------------a) Założenia:
cecha (X) – masa 100 owoców pewnej odmiany
X ~ N(45; 11)
gdyż
b) Obliczenia
P(30 < X < 50) = P(
2 121 11
30 X 50
30 45
50 45
) = P(
U
) = P(1,36 U 0,45) =
11
11
= F(0,45) – F(-1,36) = 0,6736 – 0,0869 = 0,5867
Odczyt z tablicy dystrybuanty rozkładu normalnego standaryzowanego N(0; 1)
F(-1,36) = 1- F(1,36) = 1 – 0,9131 = 0,0869
c) Interpretacja graficzna
F(0,45) – F(-1,36) = 0,6736 – 0,0869 = 0,5867
P(1,36 U 0,45) = 0,5867
3
SS Ogr I stop.
III. PRZYKŁADY
Statystyka opisowa jednowymiarowa (jedna cecha)
2017/2018
Przykład 1.
Przeprowadzono pewne doświadczenie i uzyskano następujące obserwacje:
5
3
8
7
6
10
8
Obliczyć i zinterpretować poznane charakterystyki próby.
Rozwiązanie:
liczebność próby
n=7
7
suma obserwacji
suma kwadratów obserwacji
średnia arytmetyczna
wariancja z próby
odchylenie standardowe
rozstęp
współczynnik zmienności
xi x1 x 2 ... x 7 47
i 1
7
2
2
2
2
x i x1 x 2 ... x 7 347
i 1
x 47 6,7143
7
S2 1 [347 7 (6,7143) 2 ] = 5,2379
6
S 5,2381 2,29
R = 10 – 3 = 7
w
2,29
100% 34%
6,7143
Interpretacja współczynnika zmienności:
Współczynnik zmienności wynosi 34% (w > 15%), co świadczy o tym, że średnia arytmetyczna x jest złym
reprezentantem próby (jest bardzo duża zmienność cechy w próbie).
Przykład 2 (szereg rozdzielczy punktowy)
Obserwowano liczbę kwiatostanów na roślinie fasoli odmiany Piękny Jaś. Obserwacje pogrupowano
w szereg rozdzielczy (poniżej). Wyznaczono charakterystyki próby: x 43,46 oraz S 3,32 .
a) Obliczyć współczynnik zmienności i podać interpretację wymienionych charakterystyk. b) Obliczyć
częstości względne i wyrazić je w procentach. Określić, ile procent roślin w próbie ma mniej niż 39
kwiatostanów; c) Narysować histogram częstości (%).
Liczba
Liczba
f
~
~
pi 100%
kwiatostanów
roślin
pi i
n
xi
fi
37
2
2/90
2,22%
38
5
5/90
5,56%
39
7
.
.
40
6
.
.
41
8
.
.
42
7
.
.
43
8
.
.
44
9
.
.
45
10
.
.
46
12
12/90
13,33%
47
6
.
.
48
4
.
.
49
4
.
.
50
2
2/90
2,22%
Sumy:
n = 90
1
100%
UWAGA: należy dokończyć obliczenia w tabeli.
Ad. a) Średnia z próby
( 43)
x 43,46
Interpretacja średniej: Oznacza to, że w wylosowanej próbie roślin badanej odmiany fasoli średnio 43
kwiatostany występują na roślinie.
1
SS Ogr I stop.
III. PRZYKŁADY
Statystyka opisowa jednowymiarowa (jedna cecha)
2017/2018
S 10,9924 3,32
Odchylenie standardowe
3,32
100 % 7,6%
43,46
Interpretacja: Wyznaczony współczynnik zmienności w jest większy niż 5% ale mniejszy niż 10%, co
oznacza że średnia arytmetyczna dobrze charakteryzuje próbę.
Współczynnik zmienności:
w
Ad. b)
2,22% + 5,56% = 7,78% (zobacz ostatnia kolumna w tabeli)
Odp. W badanej próbie 7,78% roślin fasoli ma mniej niż 39 kwiatostanów.
Histogram częstości (%)
Ad. c)
Przykład 3 (szereg rozdzielczy z klasami)
Badano wysokość [m] 69 drzew śliwy lubaszki. Obserwacje pogrupowano w szereg rozdzielczy (poniżej).
a) Przedstawić graficznie rozkład empiryczny cechy w postaci histogramu i diagramu częstości.
b) Wiedząc, że x 5,84 [m] oraz S 0,87 [m], wyznaczyć końce przedziału zmienności postaci [ x -S; x +S]
i obliczyć ile obserwacji z próby (zgodnie z regułą trzech sigm) znajduje się w tym przedziale.
Szereg rozdzielczy
Wysokość drzewa [m]
klasy
4,0 – 4,5
4,5 – 5,0
5,0 – 5,5
5,5 – 6,0
6,0 – 6,5
6,5 – 7,0
7,0 – 7,5
Sumy:
Ad. b)
Liczba
drzew
fi
5
7
12
17
11
9
8
n = 69
Ad. a)
f
~
pi i
n
5/69
7/69
12/69
17/69
11/69
9/69
8/69
1
x = 5,84 [m]; S = 0,87 [m];
n = 69
[x S; x S] [5,84 0,87; 5,84 0,87] [4,97; 6,71]
68% z 69
0,68* 69 47
Odp.
Zgodnie z regułą trzech sigm, około 47 badanych drzew śliwy miało wysokość nie mniejszą niż 4,97 [m]
i nie większą niż 6,71 [m].
2
IV PRZYKŁADY
Korelacja i regresja liniowa (dwie cechy)
SS Ogr I stop.
2017/2018
Przykład 4
Badano zależność między długością pędów żyta (X) a długością kłosa (Y). Wylosowano 10 roślin
i otrzymano następujące pomiary (w cm):
Dł. pędów xi
Dł. kłosa yi
a)
b)
c)
d)
e)
f)
g)
130 175 170 125 145 145 150 155 160 175
6,0 10,0 9,5 5,0 5,5 6,5 7,0 7,5 8,0 9,0
Obliczyć i zinterpretować współczynnik korelacji między badanymi cechami.
Narysować diagram korelacyjny.
Wyznaczyć równanie regresji liniowej długości kłosa żyta (Y) względem długości pędów (X).
Zinterpretować współczynnik regresji b1.
Zinterpretować współczynnik determinacji R2.
Określić przewidywaną średnią długość kłosa, gdy długość pędu żyta wynosi 128 cm .
Narysować wykres regresji liniowej na tle diagramu korelacyjnego.
Obliczenia wstępne:
n = 10
xi 130 175 ... 175 1530
yi 6 10 ... 9 74
2
2
2
2
xi 130 175 ... 175 236850
xi yi 130 6 175 10 ... 175 9 11577,5
2
2
2
2
yi 6 10 ... 9 574
Wyznaczenie charakterystyk:
x 153 [cm]
S2x 306,67 [cm]2
S x = 17,51 [cm]
y 7,4 [cm]
S2y 2,93 [cm]2
S y = 1,713 [cm]
kowariancja z próby
n
11577,5 10 153 7,4
28,39
Sxy 1 [ xi yi n x y] =
n 1
9
i 1
ad. a) Współczynnik korelacji
r
28,39
= 0,95
17,51 1,713
Interpretacja współczynnika korelacji
Współczynnik korelacji r = 0,95 jest dodatni, co świadczy o dodatniej korelacji między cechami.
Zatem, im większa jest długość pędów żyta (X), tym większa jest średnia długość kłosa (Y).
Ponadto, spełnia on warunek | r | 0,9 , więc korelacja miedzy długością pędów żyta a długością kłosa jest
bardzo silna.
Ad. b)
Ułożenie punktów empirycznych (w elipsie
nachylonej w prawo) na wykresie wskazuje na
zależność liniową dodatnią miedzy cechami.
3
IV PRZYKŁADY
Korelacja i regresja liniowa (dwie cechy)
SS Ogr I stop.
2017/2018
Ad. c) Wyznaczamy równanie regresji liniowej
b1
S xy
S 2x
28,39
0,0926
306,67
Równanie regresji liniowej:
b0 y b1x 7,4 0,0926 153 6,76
y 6,76 0,0926 x
Interpretacja przyrodnicza współczynnika regresji b1
Ad. d)
Współczynnik regresji b1 = 0,0926 informuje, że jeśli długość pędów żyta (X) wzrośnie o 1 cm (o
jednostkę), to średnia długość kłosa (Y) wzrośnie o 0,09 cm.
Ad. e)
Współczynnik determinacji R2
R 2 (100%) r 2 100% (0,95)2100% 90,25%
Interpretacja współczynnika determinacji R2
Zmienność długości kłosa (Y) w ponad 90% została wyjaśniona zmiennością długości pędów (X) poprzez
przyjęte równanie regresji.
Inaczej, w ponad 90% wyznaczony model regresji jest dopasowany do danych.
Tylko ok. 10% informacji o zmienności cechy Y (długości kłosa) nie zostało wyjaśnione zmiennością cechy
X (długości pędów żyta).
Ad. f)
yˆ x 128 6,76 0,0926 128 5,09
Prognoza
Gdy długość pędu żyta będzie wynosić 128 [cm], to zgodnie z przyjętym modelem regresji, prognozowana
przeciętna długość kłosa będzie równa 5,09 [cm].
Ad. g)
Wykres prostej regresji
xi
yˆ i
128 165
5,09 8,52
4
SS Ogr Przyklady z wykladow.pdf (PDF, 2.54 MB)
Use the permanent link to the download page to share your document on Facebook, Twitter, LinkedIn, or directly with a contact by e-Mail, Messenger, Whatsapp, Line..
Use the short link to share your document on Twitter or by text message (SMS)
Copy the following HTML code to share your document on a Website or Blog