Loading web-font TeX/Math/Italic

Velkommen til dette forløb om sandsynlighedsregning og binomialfordelingen. I forløbet skal vi arbejde med tilfældigheder, bolde i forskellige farver, terningekast mm. I skal arbejde både praktisk og teoretisk, suppleret med små videoer, hvor teorien bliver forklaret. 

Gennem simuleringer og eksperimentelt arbejde vil du blive klogere på tilfældighed og sandsynlighed, og du vil lære at løse forskellige typer af opgaver med sandsynlighedsregning. Du vil også lære om binomialfordelingen, som handler om forsøg med præcis to udfald: Succes eller fiasko.

Undervejs vil I også møde lidt af programmeringskoden bag simuleringerne og få lov til at eksperimentere med de indgående variable.

Vi starter med at møde Bastian, som elsker baseball… Velkommen til!

Projektet er en del af Dataekspeditioner.dk, som huses af Datalogisk Institut på Københavns Universitet og finansieres af Novo Nordisk Fonden.

Relevante faglige mål (med udgangspunkt i læreplanens § 2.1.):

  • Operere med tal og repræsentationer af tal samt kritisk vurdere resultater af sådanne operationer
  • håndtere formler, kunne opstille og redegøre for symbolholdige beskrivelser af variabelsammenhænge og kunne anvende symbolholdigt sprog til at løse problemer med matematisk indhold
  • anvende statistiske og sandsynlighedsteoretiske modeller til beskrivelse af data fra andre fagområder, foretage simuleringer, gennemføre hypotesetest, bestemme konfidensintervaller, kunne stille spørgsmål ud fra modellen og have blik for, hvilke svar der kan forventes, samt være i stand til at formulere konklusioner i et klart sprog
  • anvende matematiske værktøjsprogrammer til eksperimenter og begrebsudvikling samt symbolbehandling og problemløsning
  • demonstrere viden om matematikanvendelse inden for udvalgte områder, herunder viden om anvendelse i behandling af en mere kompleks problemstilling
  • demonstrere viden om matematikkens udvikling i samspil med den historiske, videnskabelige og kulturelle udvikling
  • beherske mindstekrav omfattende grundlæggende matematiske færdigheder og kompetencer inden for kernestoffet

Afsnit 1 - Eksperimentel indledning

Bastian brænder for baseball! Han basker med battet og beder bare om Succes!

Bastians yndlingsfarve er orange, så for ham er Orange = Succes!

  • Tryk på Start for at baske med battet, og se hvad der sker!
  • Tryk på Pause for at observere hyppigheden af de to farver bolde.
  • Kan I gætte, hvilken farve den næste bold har? Får Bastian Succes eller Fiasko i næste bask?
  • Tryk Genstart for at begynde forfra.
  • Er der et mønster?

Overvej undervejs følgende spørgsmål:

  1. Hvad er jeres bedste gæt på hyppigheden af Succes?
  2. Hvor mange bolde basker Bastian i hvert spil?

Når du er færdig med at spille, så tryk på Mark as complete-knappen for at komme videre til tjekspørgsmålene.

Afsnit 2 - Mød koden bag programmet!

I det foregående modul har vi eksperimenteret med boldkast og undersøgt begreberne

hyppighed og frekvens

Eksperimenterne kaldes også en simulering af data.

Vi lærte også om den teoretiske sandsynlighed og om begrebet en binomialfordelt stokastisk variabel, samt mødte begrebet en binomialmodelX \sim (n,p).

Vi lærte, at antallet af succeser i en række kast med en bold er binomialfordelt med antalsparameter n og sandsynlighedsparameter p.

I dette modul skal vi ved hjælp af flere simuleringer undersøge parametrene n og p lidt nærmere, og derved forhåbentlig nærme os en forståelse af binomialfordelingen.

Afsnit 3 - Sandsynlighedsfunktion

På den sidste tabel i Afsnit 2 gættede I forhåbentlig på, at n var 10 og p var 0,5.

Vi fortsætter med at gentage dette binomialforsøg, hvor n = 10 og p=0,5, dvs X \sim b(10,0.5).

Ét forsøg er altså 10 kast og i hvert af de 10 kast er der 50% chance for at få en orange bold (Succes).

Vi gentager nu dette forsøg flere gange. Antallet af gentagelser kalder vi for m.

  1. Tryk på m=1, og diskuter, hvad der sker – dels på søjlediagrammet, dels i tabellen til højre.
  2. Hvad viser akserne i diagrammet?
  3. Hvad viser kolonnerne i tabellen?
  4. Tryk på m=1 flere gange, og diskuter, hvad der sker. Hvor mange bolde kastes, hvor mange orange bolde er der i hvert forsøg, osv.
  5. Efter 5 tryk låser knappen m=10 op. Fortsæt med at trykke på knapperne, og diskuter, hvad der sker. Hvorfor får I ikke det samme resultat hver gang?
  6. For m=1000: Prøv at formulere en sætning eller to, der forklarer både søjlediagrammet og tabellen.
  7. Hvad sker der med søjlediagrammet, når m vokser – er der en form for mønster?

Afsnit 4 - Kumulerede sandsynligheder

Sandsynlighedsfunktion eller punktsandsynlighed

Som vi har lært, er P(X=4) sandsynligheden for at få præcis 4 succeser ud af n = 10 forsøg. Dette kaldes for en punktsandsynlighed.

Kumuleret sandsynlighed

Ud fra punktsandsynlighederne kan vi beregne de såkaldte kumulerede sandsynligheder

Vi antager fortsat, at n=10 og  p=0.5

1. Sandsynligheden for at få højst 2 succeser beregnes som summen af punktsandsynlighederne for 0, 1 og 2:

P(X \le 2) = P(X = 0) +  P(X = 1) + P(X = 2)=0.00098+0.00977+0.04395=0.05469

2. Sandsynligheden for at få mindst 8 succes’er:

P(X \ge 8) = P(X = 8) +  P(X = 9) + P(X = 10) = 0.05469     eller:      P(X \ge 8) =  1 – P(X \le 7) = 0.05469

3. Sandsynligheden for at få mindst 2 og højst 4 succes’er:

P(2 \le X \le 4) = P(X = 2) +  P(X = 3) + P(X = 4)=0.366

CAS-kommandoer, kumulerede sandsynligheder

TI-Nspire

P(X \le r) = binomcdf(n,p,r)

P(X \ge r) = binomcdf(n,p,r,n)

P(r1 \le X \le r2) = binomcdf(n,p,r1,r2)

Maple: 1. with(Gym);   2. Som ovenfor, blot med bincdf i stedet for binomcdf.

NB “binomcdf” eller “bincdf” står for “Binomial Cumulative Probability Distributional Function”.

Afsnit 5 - Normalfordelingsapproksimation


Simulering

Vi ser her søjlediagrammet med de forventede (blå) og simulerede (grønne) værdier for 1000 gentagelser af Bastians kast med 10 bolde.

  1. Tryk på Start, og diskuter med din sidemakker, hvad der sker.
  2. Hvilke værdier har parametrene pn og m?
  3. Hvad sker der, hver gang man trykker på Start?

I et binomialfordelt datasæt (de blå søjler) kan data kun antage hel-tallige værdier, nemlig et bestemt antal succeser pr. hændelse. Den slags data kaldes diskrete.

Den røde, klokkeformede kurve på figuren kaldes en Normalfordeling.

I et normalfordelt datasæt  (den røde kurve) kan der forekomme alle mulige forskellige tal, også decimaltal. Den slags data kaldes kontinuerte.

Normalfordelingsapproksimation

En normalfordeling er symmetrisk omkring middelværdien. Det er binomialfordelingen ikke altid. Hvis p er meget lille eller meget stor, bliver binomialfordelingen skæv og er derfor vanskelig af approksimere med en normalfordeling. Man bruger tommelfingerreglen, at når både n \times p \gt 5 og n \times (1 – p) \gt 5, kan man bruge approksimationen, det vil sige at de binomialfordelte data (de blå søjler) tilnærmelsesvist ligner normalfordelte data (den røde kurve).

Opgave 1

En stokastisk variabel X er binomialfordelt X \sim b(40,0.1).

Kan normalfordelingsapproksimationen benyttes i dette tilfælde?

Middelværdi og spredning 

Vi husker, at formlerne for middelværdi og spredning er:

Middelværdi: \mu = n \times p.

Spredning: \sigma = \sqrt{n  \times p \times (1 – p)}

I vores eksempel – X \sim b(10,0.5) – er middelværdien:  \mu = n \times p = 10 \times 0.5 = 5

– og spredningen er: \sigma = \sqrt{n  \times p \times (1 – p)} = \sqrt{10  \times 0.5 \times (1 – 0.5)} \approx 1.58.

Opgave 2

Beregn \mu-2\cdot\sigma og \mu+2\cdot\sigma, og sammenlign med figuren ovenfor. Ligger markeringerne nogenlunde korrekt placeret under x-aksen?

Facit

Opgave 1: Nej, fordi n \times p = 4.

Opgave 2: \mu-2\cdot\sigma = 1.84\mu+2\cdot\sigma=8.16. Ja.

Afslutning

Konklusion

Du har i dette forløb lært om sandsynlighedsregning og binomialfordelingen gennem simuleringer og opgaver. Du har også snuset lidt til programmering og computational thinking.

Du har lært om følgende begreber fra læreplanen for Matematik B (STX):

  • Udfald, hyppighed og frekvens
  • Teoretisk/forventet sandsynlighed i modsætning til observeret sandsynlighed
  • Symmetrisk og asymmetrisk sandsynlighedsfelt
  • Stokastisk variabel
  • Binomialmodel:  X \sim (n,p) 
  • Antalsparameter (n) og sandsynlighedsparameter (p)
  • Middelværdi og spredning
  • Sandsynlighedsfunktion: P(X = r) = K(n,r) \times p^r \times (1 – p)^{n-r},
  • Store Tals Lov
  • Normalfordelingsapproksimation
  • Normale og exceptionelle udfald. 

Derudover skal du på matematik B også kende til binomialtest og konfidensintervaller, som dog ikke indgår i dette forløb.

Tak fordi du fulgte med. 🙂

Leave a Reply

Your email address will not be published. Required fields are marked *