Merk at dette kun er et forslag til løsning på eksempeleksamen. Andre gyldige arguementer og formuleringer av riktige svar (untatt flervalgsoppgavene) vil også gi full uttelling. Dersom du trenger hjelp med utregning av tallsvar så kan du følge lenken til det originale løsningsforslaget til den eksamenen oppgaven er hentet fra.

Oppgave 1 [\(20\%\)]

Denne oppgaven er basert på oppgave 1a og b, eksamen i TMA4240 desember 2016.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksDes16b.pdf

En bedrift produserer elektriske komponenter. Komponentene kan ha to typer feil: type A og type B. Vi velger tilfeldig ut en komponent fra produksjonen og definerer to hendelser: \(A\) = “komponenten har en feil av type A”, og \(B\) = “komponenten har en feil av type B”. La \(A'\) og \(B'\) være de tilhørende komplementære hendelsene til henholdsvis \(A\) og \(B\).

Det er kjent at \(\mathrm{P}(B) = 0.09\), \(\mathrm{P}(A|B) = 0.5\) og \(\mathrm{P}(A|B') = 0.01\).

1A [\(3\%\)]

Hva er sannsynligheten for at komponenten har både en type A og en type B feil, dvs. verdien til \(\mathrm{P}(A \cap B)\)?

  1. 0.001
  2. 0.045
  3. 0.046
  4. 0.090

1B [\(3\%\)]

Hva er sannsynligheten for at komponenten har en feil av type A, dvs. verdien til \(\mathrm{P}(A)\)?

  1. 0.046
  2. 0.054
  3. 0.500
  4. 0.510

1C [\(4\%\)]

Gitt at komponenten har en feil av type A, hva er sannsynligheten for at komponenten har en feil av type B, dvs. verdien til \(\mathrm{P}(B|A)\)?

  1. 0.088
  2. 0.092
  3. 0.500
  4. 0.831


Vi er nå kun interessert i om en komponent er feilfri eller ikke. I resten av oppgaven antar vi at sannsynligheten for at en tilfeldig valgt komponent er feilfri er 0.9. Vi velger tilfeldig ut 20 komponenter fra produksjonen, og undersøker om komponentene er feilfrie. La \(X\) være en stokastisk variabel som angir antall feilfrie komponenter blant de 20 komponentene.

1D [\(5\%\)]

Hvilken fordeling har \(X\)?


  • Binomialfordeling med n = 20 forsøk og suksessanssynlighet p = 0.9 [2%]. Dette er fordi 1) vi har 20 uavhengige forsøk [1%], 2) hvert forsøk er suksess eller fiasko [1%], og 3) suksessansynlighet p er den samme i hvert forsøk [1%].

1E [\(2.5\%\)]

Hva er sannsynligheten for at akkurat 19 komponenter er feilfrie? Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.


  • P(X = 19) = 0.270.

1F [\(2.5\%\)]

Hva er sannsynligheten for at flere enn 15 komponenter er feilfrie? Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.


  • P(X > 15) = 0.957.

Se utregninger i det fullstendige løsningsforslaget for denne eksamenen:

https://www.math.ntnu.no/emner/TMA4240/eksamen/lsf/eksDes16l.pdf


Oppgave 2 [\(20\%\)]

Denne oppgaven er basert på oppgave 1, eksamen i TMA4245 august 2019.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksAug19b.pdf

La \(X\) være en stokastisk variabel med punktsannsynlighet \(p(x) = \mathrm{P}(X = x)\) som vist i tabellen:

\[ \begin{array} \text{x} & -1 & 0 & 1 \\ p(x) & 0.3 & 0.6 & k \end{array} \]

2A [\(4\%\)]

Hvilken verdi må \(k\) ha for at \(p(x)\) skal være en gyldig sannsynlighetsfordeling?


  • k = 0.1 [2%]. Det er fordi summen over alle punktsannsynligheter skal være lik 1 [2%]

2B [\(6\%\)]

La \(F(x)\) betegne den kumulative fordelingsfunksjonen til \(X\). Regn ut verdien til \(F(0.6)-F(-1.7)\).


  • F(0.6)-F(-1.7) = 0.9 [3%]. Dette er fordi F(-1.7) = P(X <= -1.7) = 0 [1%], og F(0.6) = P(X <= 0.6) = P(X = -1) + P(X = 0) = 0.9 [2%].

2C [\(3\%\)]

Regn ut forventningsverdien til \(X\). Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.


  • E(X) = - 0.200

2D [\(7\%\)]

Regn ut variansen til \(X\). Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.


  • Var(X) = 0.360

Se utregninger i det fullstendige løsningsforslaget for denne eksamenen:

https://www.math.ntnu.no/emner/TMA4240/eksamen/lsf/eksAug19l.pdf


Oppgave 3 [\(10\%\)]

Denne oppgaven er basert på oppgave 2, eksamen i TMA4245 august 2019.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksAug19b.pdf

Anta at levetiden \(T\), målt i timer (behøver ikke være et heltall), til en tilfeldig valgt elektronisk komponent er eksponentialfordelt med sannsynlighetstetthet \[ f(t) = \begin{cases} \frac{1}{\beta} e^{-t/\beta}, & \text{ for } t \geq 0, \\ 0, & \text{ for } t < 0, \end{cases} \] der \(\beta = 30\).

3A [\(3 \%\)]

Hva er verdien til \(\mathrm{P}(T < 20)\)?

  1. 0.469
  2. 0.487
  3. 0.503
  4. 0.513

3B [\(3 \%\)]

Hva er verdien til \(\mathrm{P}(T < 20 \cup T > 40)\)?

  1. 0.241
  2. 0.250
  3. 0.733
  4. 0.750

3C [\(4 \%\)]

Hva er verdien til medianen til \(T\), dvs. \(k\) slik at \(\mathrm{P}(T \leq k) = 0.5\)?

  1. 9.031
  2. 20.794
  3. 30.000
  4. 36.119

Se utregninger i det fullstendige løsningsforslaget for denne eksamenen:

https://www.math.ntnu.no/emner/TMA4240/eksamen/lsf/eksAug19l.pdf


Oppgave 4 [\(15\%\)]

Denne oppgaven er basert på oppgave 3c, eksamen i TMA4245 juni 2015.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksJun15b.pdf

En farmasøytisk fabrikk produserer en medisin i flytende form som selges på flasker med gitt innhold. Denne medisinen inneholder en viktig komponent som krever at det foretas en fortløpende kvalitetskontroll. Dette gjøres ved at det for hver produksjonsserie tas ut et tilfeldig utvalg flasker hvor innholdet analyseres. Hver gang en serie prøver analyseres, analyseres også en kontrolløsning med kjent konsentrasjon 0.10 mg/l. Dette gjøres for å sikre at analysemetoden er riktig kalibrert. Siden analysemetoden ikke er helt presis, vil målt konsentrasjon variere. Utfallet av analysen av kontrolløsningen kan regnes som en normalfordelt stokastisk variabel \(X\) med forventningsverdi \(\mu = 0.10\) mg/l og varians \(\sigma^2\), der \(\sigma^2\) er variansen til målefeilen ved analysemetoden.

For å estimere \(\sigma^2\) skal vi benytte måleresultatene \(x_1, x_2, \ldots , x_n\), fra \(n\) uavhengige analyser av kontrolløsningen. Vi kan dermed betrakte \(x_1, x_2, \ldots , x_n\) som utfall fra \(n\) uavhengige stokastiske variabler \(X_1, X_2, \ldots , X_n\), hvor hver \(X_i\), \(i = 1, \ldots, n\), har en normalfordeling med forventningsverdi \(\mu = 0.10\) mg/l og varians \(\sigma^2\).

Vi ser på tre ulike estimatorer for \(\sigma^2\):

  1. \(\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \mu)^2\)

  2. \(S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2\)

  3. \(\tilde{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2\)

4A [5%]

For situasjonen der forventningsverdien \(\mu\) er kjent, hvilken av de tre estimatorene er sannsynlighetsmaksimeringsestimatoren for \(\sigma^2\)? Du skal ikke vise utledning, men argumenter for hvorfor det ikke kan være de to andre alternativene enn det alternativet du velger.


  • Det er 1. (hat(sigma^2)) som er sannsynlighetsmaksimeringsestimatoren for sigma^2 når forventningsverdien er kjent [3%]. Det er ikke 3. fordi det er sannsynlighetsmaksimeringsestimatoren når forventningsverdien ikke er kjent [1%], og det kan ikke være 2. fordi den kjente forventningsverdien inngår ikke [1%].

4B [5%]

Hvilke(n) av de tre estimatorene er forventningsrette?

(Du kan bruke at \(\sum_{i=1}^n (X_i - \mu)^2 / \sigma^2\) og \(\sum_{i=1}^n (X_i - \bar{X})^2/ \sigma^2\) er \(\chi^2\)-fordelte med henholdsvis \(n\) og \(n-1\) frihetsgrader.)

  1. Alle
  2. Bare \(\hat{\sigma}^2\)
  3. Bare \(S^2\)
  4. Bare \(\hat{\sigma}^2\) og \(S^2\)

4C [5%]

Hvilken av de tre estimatorene vil du foretrekke?


  • Vi foretrekker en av de to forventningsrette (nr 1 og nr 2) [2%]. Av disse vil vi foretrekke den med lavest varians. Variansen til den første estimatoren er lavest, så vi foretrekker denne. [3%]

Se utregninger i det fullstendige løsningsforslaget for denne eksamenen:

https://www.math.ntnu.no/emner/TMA4240/eksamen/lsf/eksJun15l.pdf


Oppgave 5 [\(10\%\)]

Denne oppgaven er basert på oppgave 1c og 1d, eksamen i TMA4240/45 august 2012.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksAug12b.pdf

La \(X\) angi lengden av et tilfeldig spydkast for en spydkaster. Det antas at kastlengden \(X\) er en normalfordelt stokastisk variabel med forventningsverdi \(\mu\) og standardavvik \(\sigma\). (Vi ser i denne oppgaven bort fra at et spydkast kan bli underkjent, for eksempel ved at utøveren trår på eller over tilløpsstreken.)

I en konkurranse har spydkasteren totalt seks forsøk. Det lengste av de seks kastene blir spydkasterens sluttresultat. Det antas at de seks forsøkene er uavhengige.

Resultatet av de fem første kastene (målt i meter) til spydkasteren ble

86.8, 84.4, 88.3, 90.6 og 85.4.

5A [2.5%]

Regn ut empirisk middelverdi (gjennomsnittet) for de fem kastene. Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.

  • 87.100 meter

5B [2.5%]

Regn ut empirisk standardavvik for de fem kastene. Du skal oppgi tallsvar avrundet til tre desimaler uten begrunnelse.

  • 2.447 meter

5C [5%]

Benytt de gitte observasjonene og regn ut et \(95\%\) intervallestimat for spydkasterens siste kast i konkurransen. Du skal oppgi tallsvar avrundet til to desimaler uten begrunnelse for nedre og øvre grense. Er dette et konfidensintervall eller et prediksjonsintervall?

  • Intervallestimatet er [79.66, 94.54] [3%]. Dette er et prediksjonsintervall fordi det er et intervallestimat for en ny observasjon fra populasjonen der man må ta høyde for usikkerheten som kommer både fra estimering av parameterene til populasjonen og variasjonen mellom individer i populasjonen gitt kjente parametere [2%].

Se utregninger i det fullstendige løsningsforslaget for denne eksamenen:

https://www.math.ntnu.no/emner/TMA4240/eksamen/lsf/eksAug12l.pdf


Oppgave 6 [\(10\%\)]

Denne oppgaven er basert på oppgave 2a, eksamen i TMA4245 mai 2019.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksMai19b.pdf

Et borettslag med 17 husstander, der alle har elbil, tilbyr lading av elbil til beboerne sine. Anta at årlig strømforbruk \(X_1, X_2, \ldots , X_{17}\) til hver av husstandene er uavhengige og normalfordelte med ukjent forventningsverdi \(\mu\) kilowattimer og ukjent standardavvik \(\sigma\) kilowattimer. Borettslaget har tidligere gått ut fra at forventet strømforbruk til en tilfeldig valgt husstand er 3000 kilowattimer. De mistenker at det reelle strømforbruket er høyere, og har derfor leid inn et konsulentselskap til å undersøke dette.

Konsulentselskapet har samlet inn strømforbrukene \(x_1, x_2, \ldots , x_{17}\) fra de 17 husstandene. Hustandene brukte i gjennomsnitt \(\bar{x} = \frac{1}{17} \sum_{i=1}^{17}x_i = 3200\) kilowattimer i året med et empirisk standardavvik på \(s = \sqrt{ \frac{1}{16} \sum_{i=1}^{17}(x_i-\bar{x})^2} = 300\) kilowattimer til lading av elbil.

6A [2.5%]

Formuler boretslagets spørsmål som en hypotesetest.


  • Vi ønsker å teste H0: u = 3000 mot H1: u > 3000.

6B [7.5%]

Utfør hypotesetesten du har spesifisert med et signifikansnivå \(\alpha = 0.05\). Vil borettslaget basert på resultatet av hypotesetesten konkludere med at strømforbruket er høyere enn 3000 kilowattimer?


  • For å utføre testen bruker jeg testobservatoren (gjennomsnitt - forventningsverdi)/(empirisk standardavvik delt på sqrt(n)) som har en t-fordeling med 16 frihetsgrader under nullhypotesen [2.5%]. Jeg forkaster nullhypotesen dersom jeg observerer t > 1.745 [2.5%]. Basert på observasjonene fra konsulentselskapet får jeg t = 2.749 og forkaster dermed nullhypotesen. Ja, borettslaget vil konkludere med at strømforbruket er høyere enn 3000 kilowattimer [2.5%].

Se utregninger i det fullstendige løsningsforslaget for denne eksamenen:

https://www.math.ntnu.no/emner/TMA4240/eksamen/lsf/eksMai19l.pdf


Oppgave 7 [\(15\%\)]

Denne oppgaven er basert på oppgave 2, eksamen i TMA4245 mai 2016.

https://www.math.ntnu.no/emner/TMA4240/eksamen/oppg/eksMai16b.pdf

Firmaet SkaffData prøver ut en ny sensor som skal gi billige data på gjennomstrømning av vann i rør. De prøver ut sensoren i en realistisk situasjon. I tillegg til målingene sensoren gir, \((y_1, y_2, \ldots , y_n)\), måler de også tilhørende sann gjennomstrømning, \((x_1, x_2, \ldots , x_n)\), for \(n = 1000\) uavhengige tidsperioder. Figur 1 viser histogrammet over sann gjennomstrømning, og figur 2 viser sensormålt gjennomstrømning (\(y\)) plottet mot sann gjennomstrømning (\(x\)).

Ta utgangspunkt i figur 1 og figur 2 når du svarer på spørsmålene under.

Figur 1: Histogram for observasjoner av sann gjennomstrømming x_1, x_2, \ldots, x_{1000}.

Figur 1: Histogram for observasjoner av sann gjennomstrømming \(x_1, x_2, \ldots, x_{1000}\).

Figur 2: Sensormålt gjennomstrømning y_i plottet mot sann gjennomstrømning x_i for i = 1, 2, \ldots, 1000. Den heltrukne linjen er y = x.

Figur 2: Sensormålt gjennomstrømning \(y_i\) plottet mot sann gjennomstrømning \(x_i\) for \(i = 1, 2, \ldots, 1000\). Den heltrukne linjen er \(y = x\).



7A [\(3\%\)]

Anta at både forventningsverdi og standardavvik til sann gjennomstrømning er heltall. Finn forventningsverdi og standardavvik til sann gjennomstrømning \(X\).

  • Forventningsverdien er omtrent 5 fordi fra figur 1 ser jeg at fordelingen er omtrent symmetrisk om 5 [1%]. Standardavvik er 2 fordi fra figur 1 ser jeg at omtrent 95% av verdiene ligger mellom 1 og 9 og for en (omtrent) normalfordelt variabel ligger 95% av sannsynligheten mellom +/-1.96 standardavvik [2%].

7B [\(3\%\)]

Er korrelasjonen mellom sann gjennomstrømning \(X\) og sensormålt gjennomstrømning \(Y\) positiv, negativ eller omtrent null?

  • Det er en klar positiv lineær sammenheng mellom \(X\) og \(Y\) derfor må korrelasjon være positiv


En enkel lineær regresjonsmodell er definert som \(Y_i = a + b x_i + \epsilon_i\), for \(i = 1, 2, \ldots , n\), der \(Y_i\) er responsen vi er interessert i, \(a\) og \(b\) er regresjonskoeffisientene, \(x_i\) er en forklaringsvariabel som antas kjent, og støyleddene \(\epsilon_i\) blir antatt uavhengige identisk normalfordelte med forventningsverdi 0 og varians \(\sigma^2\).

7C [\(2\%\)]

Dersom man tilpasser en enkel lineær regresjonsmodell til dataene i figur 2, hva blir de omtrentlig estimatene for \(a\) og \(b\)?

  • Linjen y=x ser ut til å passe veldig bra så omtrentlige estimater er a = 0 og b = 1.

7D [\(3\%\)]

Basert på dine anslag for \(a\) og \(b\), hva er predikert sensormålt gjennomstrømning \(y_0\) for en sann gjennomstrømning på \(x_0 = 4\)?

  • Prediksjon bruker bare a+bx [1%]. Slik at predikert verdi blir y_0 = x_0 = 4 [2%].

7E [\(4\%\)]

Diskuter om antakelsene i den enkle lineære regresjonsmodellen er rimelige for dataene vist i figur 2.

  • Antagelsen om lineær modell for forventningsverdi virker rimelig [1%], normalfordeling til støyen virker rimelig [1%], forventningsverdien til støyen er 0 virker rimelig [1%], og konstant varians virker IKKE rimelig [1%]. (Slik at antagelsene totalt sett er ikke OK).

Se utregninger i det fullstendige løsningsforslaget for denne eksamenen:

http://www.math.ntnu.no/emner/TMA4240/eksamen/lsf/eksMai16l.pdf