• Ei tuloksia

Mat-2.091 Sovellettu todennäköisyyslasku 7. harjoitukset/Ratkaisut Aiheet: Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut Avainsanat:

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Mat-2.091 Sovellettu todennäköisyyslasku 7. harjoitukset/Ratkaisut Aiheet: Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut Avainsanat:"

Copied!
11
0
0

Kokoteksti

(1)

7. harjoitukset/Ratkaisut

Aiheet: Kaksiulotteinen normaalijakauma Mitta-asteikot

Havaintoaineiston kuvaaminen ja otostunnusluvut Avainsanat:

Ehdollinen jakauma, Ehdollinen odotusarvo, Ehdollinen varianssi, Kaksiulotteinen normaali- jakauma, Korrelaatio, Kovarianssi, Odotusarvo, Regressiofunktio, Tiheysfunktio, Varianssi, Yhteisjakauma

Intervalliasteikko, Järjestysasteikko, Laatueroasteikko, Nominaaliasteikko, Ordinaaliasteikko, Suhdeasteikko, Välimatka-asteikko

Aritmeettinen keskiarvo, Frekvenssi, Frekvenssijakauma, Geometrinen keskiarvo,

Harmoninen keskiarvo, Histogrammi, Järjestystunnusluvut, Keskiarvo, Luokiteltu frekvenssi- jakauma, Maksimi, Mediaani, Minimi, Otoshajonta, Otosvarianssi, Pylväsdiagrammi, Vaihtelu- väli, Vaihteluvälin pituus

1. Oletetaan, että satunnaismuuttujat X ja Y noudattavat 2-ulotteista normaalijakaumaa parametrein

E(X) = 1 E(Y) = –1

Var(X) = D2(X) = 9 Var(Y) = D2(Y) = 4 Cor(X, Y) = 0.5

(a) Määrää muuttujien X ja Y kovarianssi.

(b) Määrää muuttujan X regressiofunktio muuttujan Y suhteen ja muuttujan Y regressiofunktio muuttujan X suhteen sekä vastaavat ehdolliset varianssit.

(c) Määrää kohdan (b) regressiofunktioita vastaavien suorien leikkauspiste ja vertaa sitä muuttujien X ja Y odotusarvojen vastaavaan pisteeseen. Mitä havaitset?

Ratkaisu:

Lasketaan ensin muuttujien X ja Y standardipoikkeamat:

D(X) = 3 D(Y) = 2

(a) Muuttujien X ja Y kovarianssi:

Cov(X, Y) = Cor(X, Y)×D(X)×D(Y) = 0.5×3×2 = 3

(2)

(b) Muuttujan X regressiofunktio muuttujan Y suhteen on suora, jonka kulmakerroin on Cor(X, Y)×D(X)/D(Y) = 0.5×3/2 = 0.75

Tämän suoran yhtälö on x – 1 = 0.75×(y + 1)

Muuttujan X ehdollinen varianssi muuttujan Y suhteen:

(1 – Cor(X, Y)2)×D2(X) = (1 – 0.52)×9 = 6.75

Muuttujan Y regressiofunktio muuttujan X suhteen on suora, jonka kulmakerroin on Cor(X, Y)×D(Y)/D(X) = 0.5×2/3 = 1/3

Tämän suoran yhtälö on y + 1 = (1/3)×(x – 1)

Muuttujan Y ehdollinen varianssi muuttujan X suhteen:

(1 – Cor(X, Y)2)×D2(Y) = (1 – 0.52)×4 = 3

(c) Suorien leikkauspiste on muuttujien X ja Y odotusarvojen määräämä piste (1, –1).

2. (a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat 2-ulotteista normaalijakaumaa parametrein

E(X) = 0 E(Y) = 1

Var(X) = D2(X) = 1 Var(Y) = D2(Y) = 4 Cov(X, Y) = –1

Määrää muuttujien X ja Y korrelaatio ja muuttujan X regressiofunktio muuttujan Y suhteen ja muuttujan Y regressiofunktio muuttujan X suhteen sekä vastaavat ehdolliset varianssit.

(b) Olkoon muuttujan X regressiosuora muuttujan Y suhteen 8 14

3 3

y= − x+

ja muuttujan Y regressiosuora muuttujan X suhteen

3 7

2 2

y= − x+

Määrää muuttujien X ja Y odotusarvot.

(3)

Ratkaisu:

(a) Lasketaan ensin muuttujien X ja Y standardipoikkeamat:

D(X) = 1

D(Y) = 2

Muuttujien X ja Y korrelaatio:

Cor(X, Y) = Cov(X, Y)/(D(X)×D(Y)) = –1/(1×2) = –0.5

Muuttujan X regressiofunktio muuttujan Y suhteen on suora, jonka kulmakerroin on Cor(X, Y)×D(X)/D(Y) = –0.5×1/2 = –1/4

Tämän suoran yhtälö:

x = (–1/4)×(y – 1) Vastaava ehdollinen varianssi:

(1 – Cor(X, Y)2)×D2(X) = (1 – (–0.5)2)×1 = 0.75

Muuttujan Y regressiofunktio muuttujan X suhteen on suora, jonka kulmakerroin on Cor(X, Y)×D(Y)/D(X) = –0.5×2/1 = –1

Tämän suoran yhtälö:

y – 1 = –x

Vastaava ehdollinen varianssi:

(1 – Cor(X, Y)2)×D2(Y) = (1 – (–0.5)2)×4 = 3

(b) Suorat leikkaavat pisteessä (1, 2), joten E(X) = 1

E(Y) = 2

(4)

3. Alla on lueteltu joukko muuttujia.

1. Mansikoiden C-vitamiinipitoisuus; mg/100 g 2. Alvarin aukiolta löydetyn kasvin laji

3. Paine, joka vaaditaan teräksisen säiliön murtumiseen; kg/cm2 4. Henkilöiden reaktio väitteeseen

”Suomen on liityttävä NATO:on”

mitattuna asteikolla täysin eri mieltä, yhden tekevää, täysin samaa mieltä 5. Jokereiden sijoitus jääkiekkoliigassa; 1, 2, …

6. Teekkarin koulutusohjelma 7. Teekkarin älykkyysosamäärä; piste

8. Teekkarin pistemäärä kurssin 1. välikokeessa; 0 – 30 9. Lentokoneen nopeus; km/h

(a) Mitä mitta-asteikkoja muuttujat noudattavat?

(b) Mitkä muuttujista ovat kvalitatiivisia ja mitkä kvantitatiivisia?

(c) Mitkä muuttujista ovat diskreettejä ja mitkä jatkuvia?

Ratkaisu:

(a) Laatueroasteikollisia muuttujia: 2, 6 Järjestysasteikollisia muuttujia: 4, 5, 7, 8 Suhdeasteikollisia muuttujia: 1, 3, 9 (b) Kvalitatiivisia muuttujia: 2, (4), (5), 6

Kvantitatiivisia muuttujia: 1, 3, (4), (5), 7, 8, 9

Suluilla on merkitty kvalitatiivisten ja kvantitatiivisten muuttujien välimaastossa olevat järjestysasteikolliset muuttujat.

(c) Diskreettejä muuttujia: 2, 4 , 5, 6, 7, 8 Jatkuvia muuttujia: 1, 3, 9

(5)

4. Erään talon asukkailla on seuraavat kuukausitulot (€/kk):

20100 19400 10100 23000 24200 25100 8200 8900 10300 26000 11400 12900 13200 14300 15800 16100 17200 18900 5200 10100 12300 14000 15100 16000 11100 10800 9100 7200 4300 38000 51100 9600 10900 12000 13200 15100

Määrää aineistosta seuraavat tunnusluvut:

(a) minimi, maksimi

(b) vaihteluväli, vaihteluvälin pituus (c) mediaani

Ratkaisu:

Määrättävät tunnusluvut ovat kaikki järjestystunnuslukuja tai niihin perustuvia tunnuslukuja.

Järjestystunnuslukujen määräämistä varten havainnot on järjestettävä suuruusjärjestykseen:

4300 5200 7200 8200 8900 9100 9600 10100 10100

10300 10800 10900 11100 11400 12000 12300 12900 13200 13200 14000 14300 15100 15100 15800 16000 16100 17200 18900 19400 20100 23000 24200 25100 26000 38000 51100 (a) Minimi ja maksimi: Min = 4300, Max = 51100

(b) Vaihteluväli:

(Min, Max) = (4300, 51100) Vaihteluvälin pituus:

Max – Min = 51100 – 4300 = 46800

(c) Etsitään havaintojen mediaani eli tunnusluku Md.

Mediaani jakaa havaintoaineiston kahteen yhtä suureen osaan siten, että puolet niistä havaintoarvoista, jotka eivät ole yhtä suuria kuin mediaani, ovat mediaania pienempiä, ja puolet niistä havaintoarvoista, jotka eivät ole yhtä suuria kuin mediaani, ovat

mediaania suurempia:

(i) Jos otoskoko n on pariton, niin mediaaniksi valitaan havaintoarvo, joka löytyy paikasta

(n + 1)/2.

(ii) Jos otoskoko n on parillinen, mediaaniksi valitaan kahden keskimmäisen havainnon aritmeettinen keskiarvo.

(6)

Havaintojen lukumäärä on tässä parillinen, joten Md = Q2 = (13200 + 13200)/2 = 13200

5. Muodosta tehtävän 4 aineistosta luokiteltu frekvenssijakauma, jonka luokat ovat:

4000 – 12000

12001 – 28000

28001 – 60000.

Määrää myös tätä frekvenssijakaumaa vastaavan histogrammikuvion suorakaiteiden korkeudet, kun luokkaa 4000 – 12000 vastaavan suorakaiteen korkeudeksi on valittu 15 ruutua ruudullisella paperilla. Hahmottele myös ko. histogrammikuvio paperille. Missä luokassa on jakauman moodi?

Ratkaisu:

Histogrammi muodostuu suorakaiteista, joiden pinta-alat suhtautuvat toisiinsa kuten vastaavat

luokkafrekvenssit (tai suhteelliset luokkafrekvenssit).

Luokka Luokkafrekvenss i

Suorakaiteen korkeus

4000 – 12000 15 15

12001 – 28000 19 19/2 = 9.5

28001 – 60000 2 2/4 = 0.5

(1) Valitaan luokkaväliin 4000-12000 liittyvän suorakaiteen korkeudeksi 15 ruutua.

(2) Luokkaväli 12001-28000 on n. kaksi kertaa pitempi kuin luokkaväli 4000-12000.

Siksi luokkaan 12001-28000 liittyvän suorakaiteen korkeus saadaan jakamalla frekvenssi 19 luvulla 2.

(3) Luokkaväli 28001-60000 on n. neljä kertaa pitempi kuin luokkaväli 4000-12000.

Siksi luokkaan 18001-60000 liittyvän suorakaiteen korkeus saadaan jakamalla frekvenssi 2 luvulla 4.

(7)

Alla oleva kuvio esittää yo. luokiteltua frekvenssijakaumaa vastaavaa histogrammia.

Huomautuksia:

(i) Histogrammissa suorakaiteiden pinta-alat – eivät siis korkeudet – ovat suhteessa luokkafrekvensseihin.

(ii) Oikea laatu pystyakselille on frekvenssi/€ :

Vaaka-akselin laatu: €

Pystyakselin laatu: frekvenssi/€

Suorakaiteen pinta-ala: € × frekvenssi/€ = frekvenssi

(iii) Histogrammissa suorakaiteiden korkeudet ovat suhteessa luokkafrekvensseihin vain, jos luokitus on tasavälinen.

Jakauman moodi on luokassa 4000-12000, koska siinä histogrammi saavuttaa maksiminsa.

Huomaa, että moodi ei ole luokassa 12001-28000, vaikka sen frekvenssi on suurin.

15

10

5

0 4000 12000 28000 60000

f/€

(8)

6. Määrää tehtävän 4 aineiston kahden ensimmäisen sarakkeen 8 luvusta aritmeettinen keskiarvo, otosvarianssi ja otoshajonta.

Ratkaisu:

Laskutoimitukset voidaan tehdä kahdella eri tavalla.

Alla olevan taulukon muodostamisessa on käytetty apuna MS Excel -ohjelmaa.

Tulokset:

Aritmeettinen keskiarvo = 15561

Otosvarianssi = 81171587

Otoshajonta = 9010

Jos ko. tunnuslukujen laskemiseksi laaditaan tietokoneohjelma, laskutoimitukset voidaan järjestää laskutavassa 2 niin, että havainnot käydään läpi vain kerran, kun taas laskutavassa 1 havainnot on käytävä läpi kaksi kertaa. Sen sijaan laskutavan 1 kaavat ovat numeerisesti stabiilimpia.

Palkka

i x x-Ka (x-Ka)^2 x^2

1 20100 7137.5 50943906.25 404010000 2 26000 13037.5 169976406.3 676000000 3 5200 -7762.5 60256406.25 27040000 4 7200 -5762.5 33206406.25 51840000 5 19400 6437.5 41441406.25 376360000 6 11400 -1562.5 2441406.25 129960000 7 10100 -2862.5 8193906.25 102010000 8 4300 -8662.5 75038906.25 18490000 Summa 103700 0 441498750 1785710000

Ka = 12962.5

Tapa 1: Var = 63071250 Hajonta = 7941.741 Tapa 2: Var = 63071250

(9)

Kaavat tehtävään 6

Laskutapaan 1 liittyvät kaavat:

( )

1 2 2

1 2

1

1 1

n i i

n

x i

i

x x

x x

n

s x x

n

s s

=

=

=

= −

=

Laskutapaan 2 liittyvät kaavat:

1

2 2 2

1 2

1

1 1

n i i

n

x i

i

x x

x x

n

s x nx

n

s s

=

=

=

 

= −  − 

=

Tehtävissä 7 ja 8 osoitetaan, että aritmeettinen keskiarvo ei ole aina käypä tunnusluku.

7. Olet ottanut 10000 euron lainan, jota ei saa lyhentää kahden ensimmäisen vuoden aikana.

Lainasopimuksen mukaan korko on 1. vuotena 10 % ja 2. vuotena 20 %, jolloin takaisin maksettava lainapääoma kasvaa kahdessa vuodessa x % (laske x).

Oletetaan, että lainasopimusta muutetaan niin, että korkona käytetään koko ajan samaa korkoa, mutta tämä vakiona pidettävä korko valitaan niin, että takaisin maksettava laina- pääoma ei kasva enempää kuin alkuperäisen sopimuksen mukaan.

(a) Totea, että x/2 %

ei ole uuden sopimuksen vakiokorko.

(b) Totea, että oikea vakiokorko saadaan laskutoimituksella

(

1.1 1.2 1 100× − ×

)

%

Huomautus: Laskutoimituksessa sovelletaan geometrisen keskiarvon kaavaa:

Positiivisten lukujen x1 , x1 , … , xn geometrinen keskiarvo on G = n x x1 2"xn

Ratkaisu:

Lainapääoma 1. vuoden lopussa: (1 + 0.1)×10000 = 11000 Lainapääoma 2. vuoden lopussa: (1 + 0.2)×11000 = 13200 Lainapääoma on kasvanut kahdessa vuodessa 32 %. Siis x = 32 %.

(10)

(a) x/2 % = 16 % 16 %:n korolla:

Lainapääoma 1. vuoden lopussa: (1 + 0.16)×10000 = 11600 Lainapääoma 2. vuoden lopussa: (1 + 0.16)×11600 = 13456 Lainapääoma on kasvanut kahdessa vuodessa 34.56 % ≠ 32 %.

(b)

(

1.1 1.2 1× − ≈

)

14.89%

14.89 %:n korolla:

Lainapääoma 1. vuoden lopussa: (1 + 0.1489)×10000 = 11489 Lainapääoma 2. vuoden lopussa: (1 + 0.1489)×11600 = 13200 Lainapääoma on kasvanut kahdessa vuodessa 32 %.

8. Paikkakuntien A ja B välimatka on 120 km. Henkilö ajaa A:sta B:hen keskinopeudella 60 km/h ja B:stä A:han keskinopeudella 120 km/h.

(a) Totea, että keskinopeus edestakaisella matkalla ei ole (60+120)/2 = 90 km/h

(b) Totea, että oikea keskinopeus saadaan laskutoimituksella 1

1 1 1

2 60 120

 + 

 

 

Huomautus: Laskutoimituksessa sovelletaan harmonisen keskiarvon kaavaa:

Positiivisten lukujen x1 , x1 , … , xn harmoninen keskiarvo on

1

1 1 n 1

i i

H

n = x

=

Ratkaisu:

A:n ja B:n välimatka: 120 km Ajoaika A:sta B:hen (60 km/h): 120/60 = 2 h Ajoaika B:sta A:han (120 km/h: 120/120 = 1 h Matka edestakaisin: 240 km

(11)

(a) 90 km/h ≠ 80 km/h.

(b) 1

1 1 1

2 60 120

 + 

 

 

= 80 km/h

Viittaukset

LIITTYVÄT TIEDOSTOT

Diskreetti jakauma, Ehdollinen jakauma, Ehdollinen odotusarvo, Jatkuva jakauma, Kertymä- funktio, Korrelaatio, Korreloituneisuus, Kovarianssi, Odotusarvo, Pistetodennäköisyysfunktio,

Diskreetti jakauma, Ehdollinen jakauma, Ehdollinen odotusarvo, Jatkuva jakauma, Kertymä- funktio, Korrelaatio, Korreloituneisuus, Kovarianssi, Odotusarvo, Pistetodennäköisyysfunktio,

Harmoninen keskiarvo, Histogrammi, Järjestystunnusluvut, Keskiarvo, Luokiteltu frekvenssi- jakauma, Maksimi, Mediaani, Minimi, Otoshajonta, Otosvarianssi, Pylväsdiagrammi, Vaihtelu-

Aritmeettinen keskiarvo, Bernoulli-jakauma, Bernoulli-koe, χ 2 -jakauma, Frekvenssi, Harhaton estimaattori, Normaalijakauma, Odotusarvo, Otantajakauma, Otos, Otoskoko,

Kuinka suuri otos kuntalaisten joukosta on poimittava, jotta saataisiin 99 %:n varmuus siitä, että otoksesta laskettu kannattajien suhteellinen osuus ei poikkea enempää kuin 0.5 %-

Tämä tapahtuu testaamalla nollahypoteesia, että nopanheiton tulos noudattaa diskreettiä tasaista jakaumaa.. (b) Tutki χ 2 -testin avulla, kuinka todennäköistä on se, että A ja

Kuinka suuri otoskoon pitää vähintään olla, jotta halutun mittainen luottamusväli peittäi- si odotusarvon 99%:n varmuudella.. (Pituus voidaan tässä olettaa

1. Suuresta tavaraerästä poimitaan umpimähkään 20 kpl:n otos, joka tarkastetaan. Erä hy- lätään, jos otoksessa on kaksi tai useampia viallisia, muuten hyväksytään.