Generelle retningslinjer

Dette gjelder alle oppgaver:

Oppgave 1 [\(20\%\)]

Denne oppgaven er basert på oppgave 1a og b, eksamen i TMA4240 desember 2016.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksDes16b.pdf

En bedrift produserer elektriske komponenter. Komponentene kan ha to typer feil: type A og type B. Vi velger tilfeldig ut en komponent fra produksjonen og definerer to hendelser: \(A\) = “komponenten har en feil av type A”, og \(B\) = “komponenten har en feil av type B”. La \(A'\) og \(B'\) være de tilhørende komplementære hendelsene til henholdsvis \(A\) og \(B\).

Det er kjent at \(\mathrm{P}(B) = 0.09\), \(\mathrm{P}(A|B) = 0.5\) og \(\mathrm{P}(A|B') = 0.01\).

1A [\(3\%\)]

Hva er sannsynligheten for at komponenten har både en type A og en type B feil, dvs. verdien til \(\mathrm{P}(A \cap B)\)?

  1. 0.001
  2. 0.045
  3. 0.046
  4. 0.090

1B [\(3\%\)]

Hva er sannsynligheten for at komponenten har en feil av type A, dvs. verdien til \(\mathrm{P}(A)\)?

  1. 0.046
  2. 0.054
  3. 0.500
  4. 0.510

1C [\(4\%\)]

Gitt at komponenten har en feil av type A, hva er sannsynligheten for at komponenten har en feil av type B, dvs. verdien til \(\mathrm{P}(B|A)\)?

  1. 0.088
  2. 0.092
  3. 0.500
  4. 0.831


Vi er nå kun interessert i om en komponent er feilfri eller ikke. I resten av oppgaven antar vi at sannsynligheten for at en tilfeldig valgt komponent er feilfri er 0.9. Vi velger tilfeldig ut 20 komponenter fra produksjonen, og undersøker om komponentene er feilfrie. La \(X\) være en stokastisk variabel som angir antall feilfrie komponenter blant de 20 komponentene.

1D [\(5\%\)]

Hvilken fordeling har \(X\)?

1E [\(2.5\%\)]

Hva er sannsynligheten for at akkurat 19 komponenter er feilfrie? Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.

1F [\(2.5\%\)]

Hva er sannsynligheten for at flere enn 15 komponenter er feilfrie? Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.


Oppgave 2 [\(20\%\)]

Denne oppgaven er basert på oppgave 1, eksamen i TMA4245 august 2019.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksAug19b.pdf

La \(X\) være en stokastisk variabel med punktsannsynlighet \(p(x) = \mathrm{P}(X = x)\) som vist i tabellen:

\[ \begin{array} \text{x} & -1 & 0 & 1 \\ p(x) & 0.3 & 0.6 & k \end{array} \]

2A [\(4\%\)]

Hvilken verdi må \(k\) ha for at \(p(x)\) skal være en gyldig sannsynlighetsfordeling?

2B [\(6\%\)]

La \(F(x)\) betegne den kumulative fordelingsfunksjonen til \(X\). Regn ut verdien til \(F(0.6)-F(-1.7)\).

2C [\(3\%\)]

Regn ut forventningsverdien til \(X\). Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.

2D [\(7\%\)]

Regn ut variansen til \(X\). Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.


Oppgave 3 [\(10\%\)]

Denne oppgaven er basert på oppgave 2, eksamen i TMA4245 august 2019.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksAug19b.pdf

Anta at levetiden \(T\), målt i timer (behøver ikke være et heltall), til en tilfeldig valgt elektronisk komponent er eksponentialfordelt med sannsynlighetstetthet \[ f(t) = \begin{cases} \frac{1}{\beta} e^{-t/\beta}, & \text{ for } t \geq 0, \\ 0, & \text{ for } t < 0, \end{cases} \] der \(\beta = 30\).

3A [\(3 \%\)]

Hva er verdien til \(\mathrm{P}(T < 20)\)?

  1. 0.469
  2. 0.487
  3. 0.503
  4. 0.513

3B [\(3 \%\)]

Hva er verdien til \(\mathrm{P}(T < 20 \cup T > 40)\)?

  1. 0.241
  2. 0.250
  3. 0.733
  4. 0.750

3C [\(4 \%\)]

Hva er verdien til medianen til \(T\), dvs. \(k\) slik at \(\mathrm{P}(T \leq k) = 0.5\)?

  1. 9.031
  2. 20.794
  3. 30.000
  4. 36.119

Oppgave 4 [\(15\%\)]

Denne oppgaven er basert på oppgave 3c, eksamen i TMA4245 juni 2015.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksJun15b.pdf

En farmasøytisk fabrikk produserer en medisin i flytende form som selges på flasker med gitt innhold. Denne medisinen inneholder en viktig komponent som krever at det foretas en fortløpende kvalitetskontroll. Dette gjøres ved at det for hver produksjonsserie tas ut et tilfeldig utvalg flasker hvor innholdet analyseres. Hver gang en serie prøver analyseres, analyseres også en kontrolløsning med kjent konsentrasjon 0.10 mg/l. Dette gjøres for å sikre at analysemetoden er riktig kalibrert. Siden analysemetoden ikke er helt presis, vil målt konsentrasjon variere. Utfallet av analysen av kontrolløsningen kan regnes som en normalfordelt stokastisk variabel \(X\) med forventningsverdi \(\mu = 0.10\) mg/l og varians \(\sigma^2\), der \(\sigma^2\) er variansen til målefeilen ved analysemetoden.

For å estimere \(\sigma^2\) skal vi benytte måleresultatene \(x_1, x_2, \ldots , x_n\), fra \(n\) uavhengige analyser av kontrolløsningen. Vi kan dermed betrakte \(x_1, x_2, \ldots , x_n\) som utfall fra \(n\) uavhengige stokastiske variabler \(X_1, X_2, \ldots , X_n\), hvor hver \(X_i\), \(i = 1, \ldots, n\), har en normalfordeling med forventningsverdi \(\mu = 0.10\) mg/l og varians \(\sigma^2\).

Vi ser på tre ulike estimatorer for \(\sigma^2\):

  1. \(\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \mu)^2\)

  2. \(S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2\)

  3. \(\tilde{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2\)

4A [5%]

For situasjonen der forventningsverdien \(\mu\) er kjent, hvilken av de tre estimatorene er sannsynlighetsmaksimeringsestimatoren for \(\sigma^2\)? Du skal ikke vise utledning, men argumenter for hvorfor det ikke kan være de to andre alternativene enn det alternativet du velger.

4B [5%]

Hvilke(n) av de tre estimatorene er forventningsrette?

(Du kan bruke at \(\sum_{i=1}^n (X_i - \mu)^2 / \sigma^2\) og \(\sum_{i=1}^n (X_i - \bar{X})^2/ \sigma^2\) er \(\chi^2\)-fordelte med henholdsvis \(n\) og \(n-1\) frihetsgrader.)

  1. Alle
  2. Bare \(\hat{\sigma}^2\)
  3. Bare \(S^2\)
  4. Bare \(\hat{\sigma}^2\) og \(S^2\)

4C [5%]

Hvilken av de tre estimatorene vil du foretrekke?


Oppgave 5 [\(10\%\)]

Denne oppgaven er basert på oppgave 1c og 1d, eksamen i TMA4240/45 august 2012.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksAug12b.pdf

La \(X\) angi lengden av et tilfeldig spydkast for en spydkaster. Det antas at kastlengden \(X\) er en normalfordelt stokastisk variabel med forventningsverdi \(\mu\) og standardavvik \(\sigma\). (Vi ser i denne oppgaven bort fra at et spydkast kan bli underkjent, for eksempel ved at utøveren trår på eller over tilløpsstreken.)

I en konkurranse har spydkasteren totalt seks forsøk. Det lengste av de seks kastene blir spydkasterens sluttresultat. Det antas at de seks forsøkene er uavhengige.

Resultatet av de fem første kastene (målt i meter) til spydkasteren ble

86.8, 84.4, 88.3, 90.6 og 85.4.

5A [2.5%]

Regn ut empirisk middelverdi (gjennomsnittet) for de fem kastene. Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.

5B [2.5%]

Regn ut empirisk standardavvik for de fem kastene. Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.

5C [5%]

Benytt de gitte observasjonene og regn ut et \(95\%\) intervallestimat for spydkasterens siste kast i konkurransen. Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse for nedre og øvre grense. Er dette et konfidensintervall eller et prediksjonsintervall?


Oppgave 6 [\(10\%\)]

Denne oppgaven er basert på oppgave 2a, eksamen i TMA4245 mai 2019.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksMai19b.pdf

Et borettslag med 17 husstander, der alle har elbil, tilbyr lading av elbil til beboerne sine. Anta at årlig strømforbruk \(X_1, X_2, \ldots , X_{17}\) til hver av husstandene er uavhengige og normalfordelte med ukjent forventningsverdi \(\mu\) kilowattimer og ukjent standardavvik \(\sigma\) kilowattimer. Borettslaget har tidligere gått ut fra at forventet strømforbruk til en tilfeldig valgt husstand er 3000 kilowattimer. De mistenker at det reelle strømforbruket er høyere, og har derfor leid inn et konsulentselskap til å undersøke dette.

Konsulentselskapet har samlet inn strømforbrukene \(x_1, x_2, \ldots , x_{17}\) fra de 17 husstandene. Hustandene brukte i gjennomsnitt \(\bar{x} = \frac{1}{17} \sum_{i=1}^{17}x_i = 3200\) kilowattimer i året med et empirisk standardavvik på \(s = \sqrt{ \frac{1}{16} \sum_{i=1}^{17}(x_i-\bar{x})^2} = 300\) kilowattimer til lading av elbil.

6A [2.5%]

Formuler boretslagets spørsmål som en hypotesetest.

6A [7.5%]

Utfør hypotesetesten du har spesifisert med et signifikansnivå \(\alpha = 0.05\). Vil borettslaget basert på resultatet av hypotesetesten konkludere med at strømforbruket er høyere enn 3000 kilowattimer?


Oppgave 7 [\(15\%\)]

Denne oppgaven er basert på oppgave 2, eksamen i TMA4245 mai 2016.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksMai16b.pdf

Firmaet SkaffData prøver ut en ny sensor som skal gi billige data på gjennomstrømning av vann i rør. De prøver ut sensoren i en realistisk situasjon. I tillegg til målingene sensoren gir, \((y_1, y_2, \ldots , y_n)\), måler de også tilhørende sann gjennomstrømning, \((x_1, x_2, \ldots , x_n)\), for \(n = 1000\) uavhengige tidsperioder. Figur 1 viser histogrammet over sann gjennomstrømning, og figur 2 viser sensormålt gjennomstrømning (\(y\)) plottet mot sann gjennomstrømning (\(x\)).

Ta utgangspunkt i figur 1 og figur 2 når du svarer på spørsmålene under.

Figur 1: Histogram for observasjoner av sann gjennomstrømming x_1, x_2, \ldots, x_{1000}.

Figur 1: Histogram for observasjoner av sann gjennomstrømming \(x_1, x_2, \ldots, x_{1000}\).

Figur 2: Sensormålt gjennomstrømning y_i plottet mot sann gjennomstrømning x_i for i = 1, 2, \ldots, 1000. Den heltrukne linjen er y = x.

Figur 2: Sensormålt gjennomstrømning \(y_i\) plottet mot sann gjennomstrømning \(x_i\) for \(i = 1, 2, \ldots, 1000\). Den heltrukne linjen er \(y = x\).



7A [\(3\%\)]

Anta at både forventningsverdi og standardavvik til sann gjennomstrømning er heltall. Finn forventningsverdi og standardavvik til sann gjennomstrømning \(X\).

7B [\(3\%\)]

Er korrelasjonen mellom sann gjennomstrømning \(X\) og sensormålt gjennomstrømning \(Y\) positiv, negativ eller omtrent null?


En enkel lineær regresjonsmodell er definert som \(Y_i = a + b x_i + \epsilon_i\), for \(i = 1, 2, \ldots , n\), der \(Y_i\) er responsen vi er interessert i, \(a\) og \(b\) er regresjonskoeffisientene, \(x_i\) er en forklaringsvariabel som antas kjent, og støyleddene \(\epsilon_i\) blir antatt uavhengige identisk normalfordelte med forventningsverdi 0 og varians \(\sigma^2\).

7C [\(2\%\)]

Dersom man tilpasser en enkel lineær regresjonsmodell til dataene i figur 2, hva blir de omtrentlig estimatene for \(a\) og \(b\)?

7D [\(3\%\)]

Basert på dine anslag for \(a\) og \(b\), hva er predikert sensormålt gjennomstrømning \(y_0\) for en sann gjennomstrømning på \(x_0 = 4\)?

7E [\(4\%\)]

Diskuter om antakelsene i den enkle lineære regresjonsmodellen er rimelige for dataene vist i figur 2.