Oppgave 1. Sannsynligheten for spiring av hvetefrø er 0,9. Hva er sannsynligheten for at av fire frø som er sådd, vil minst tre spire?

Løsning. La arrangementet EN– fra 4 frø vil minst 3 frø spire; begivenhet I– fra 4 frø vil 3 frø spire; begivenhet MED– fra 4 frø vil 4 frø spire. Ved teoremet om addisjon av sannsynligheter

Sannsynligheter
Og
vi bestemmer ved Bernoullis formel, brukt i følgende tilfelle. La serien holdes P uavhengige tester, under hver av disse er sannsynligheten for at hendelsen inntreffer konstant og lik R, og sannsynligheten for at denne hendelsen ikke inntreffer er lik
. Da er sannsynligheten for at hendelsen EN V P tester vises nøyaktig ganger, beregnet ved hjelp av Bernoullis formel

,

Hvor
– antall kombinasjoner av P elementer av . Deretter

Påkrevd sannsynlighet

Oppgave 2. Sannsynligheten for spiring av hvetefrø er 0,9. Finn sannsynligheten for at av 400 frø som er sådd, vil 350 frø spire.

Løsning. Beregn nødvendig sannsynlighet
å bruke Bernoullis formel er vanskelig på grunn av tungvintheten i beregningene. Derfor bruker vi en omtrentlig formel som uttrykker Laplaces lokale teorem:

,

Hvor
Og
.

Fra problemforholdene. Deretter

.

Fra tabell 1 i vedleggene finner vi. Den nødvendige sannsynligheten er lik

Oppgave 3. Hvetefrø inneholder 0,02 % ugress. Hva er sannsynligheten for at hvis 10 000 frø velges tilfeldig, vil 6 ugressfrø bli funnet?

Løsning. Anvendelse av Laplaces lokale teorem på grunn av lav sannsynlighet
fører til et betydelig avvik av sannsynligheten fra den eksakte verdien
. Derfor til små verdier Rå beregne
bruke den asymptotiske Poisson-formelen

, Hvor .

Denne formelen brukes når
, og desto mindre R og mer P, jo mer nøyaktig blir resultatet.

I henhold til forholdene for problemet
;
. Deretter

Oppgave 4. Spirehastigheten til hvetefrø er 90%. Finn sannsynligheten for at av 500 frø sådd, vil fra 400 til 440 frø spire.

Løsning. Hvis sannsynligheten for at en hendelse inntreffer EN i hver P testene er konstante og like R, deretter sannsynligheten
at arrangementet EN i slike tester vil det ikke være mindre en gang og ikke mer ganger bestemt av Laplaces integralsetning ved følgende formel:

, Hvor

,
.

Funksjon
kalt Laplace-funksjonen. Vedleggene (tabell 2) gir verdiene til denne funksjonen for
. På
funksjon
. På negative verdier X på grunn av merkeligheten til Laplace-funksjonen
. Ved å bruke Laplace-funksjonen har vi:

I henhold til forholdene for oppgaven. Ved å bruke formlene ovenfor finner vi
Og :

Oppgave 5. Fordelingsloven for en diskret tilfeldig variabel er gitt X:

    1. Finn: 1) matematisk forventning; 2) dispersjon; 3) standardavvik.

Løsning. 1) Hvis loven om distribusjon av diskret tilfeldig variabel gitt etter tabell

    1. Der den første linjen inneholder verdiene til den tilfeldige variabelen x, og den andre linjen inneholder sannsynlighetene for disse verdiene, beregnes den matematiske forventningen ved hjelp av formelen

2) Varians
diskret tilfeldig variabel X kalt forventet verdi kvadratet på avviket til en tilfeldig variabel fra dens matematiske forventning, dvs.

Denne verdien karakteriserer den gjennomsnittlige forventede verdien av kvadratavviket X fra
. Fra den siste formelen vi har

Forskjell
kan finnes på en annen måte, basert på dens følgende egenskap: dispersjon
lik forskjellen mellom den matematiske forventningen til kvadratet til den tilfeldige variabelen X og kvadratet av dens matematiske forventning
, det er

Å beregne
la oss utarbeide følgende lov om fordeling av mengden
:

3) For spredningsegenskaper mulige verdier av en tilfeldig variabel rundt dens middelverdi, introduseres standardavviket
tilfeldig variabel X, lik kvadratroten av variansen
, det er

.

Fra denne formelen har vi:

Oppgave 6. Kontinuerlig tilfeldig variabel X gitt av den kumulative fordelingsfunksjonen

Finn: 1) differensialfordelingsfunksjon
; 2) matematisk forventning
; 3) varians
.

Løsning. 1) Differensialfordelingsfunksjon
kontinuerlig tilfeldig variabel X kalles den deriverte av den kumulative fordelingsfunksjonen
, det er

.

Den søkte differensialfunksjonen har følgende form:

2) Hvis en kontinuerlig tilfeldig variabel X gitt av funksjonen
, så bestemmes dens matematiske forventning av formelen

Siden funksjonen

og kl
er lik null, så fra den siste formelen vi har

.

3) Varians
vi bestemmer med formelen

Oppgave 7. Lengden på delen er en normalfordelt tilfeldig variabel med en matematisk forventning på 40 mm og et standardavvik på 3 mm. Finn: 1) sannsynligheten for at lengden på en vilkårlig tatt del vil være mer enn 34 mm og mindre enn 43 mm; 2) sannsynligheten for at lengden på delen vil avvike fra dens matematiske forventning med ikke mer enn 1,5 mm.

Løsning. 1) La X– lengden på delen. Hvis den tilfeldige variabelen X gitt av en differensialfunksjon
, da sannsynligheten for at X vil ta verdier som tilhører segmentet
, bestemmes av formelen

.

Sannsynlighet for strenge ulikheter
bestemmes av samme formel. Hvis den tilfeldige variabelen X fordeles etter normalloven, da

, (1)

Hvor
– Laplace-funksjon,
.

I problemet. Deretter

2) I henhold til forholdene for problemet, hvor
. Bytter vi inn i (1), har vi

. (2)

Fra formel (2) har vi.

Den matematiske forventningen til en tilfeldig variabel X er middelverdien.

1. M(C) = C

2. M(CX) = CM(X), Hvor C= konst

3. M(X ± Y) = M(X) ± M(Y)

4. Hvis tilfeldige variabler X Og Y er uavhengige, da M(XY) = M(X) M(Y)

Spredning

Variansen til en tilfeldig variabel X kalles

D(X) = S(x – M(X)) 2 p = M(X 2 ) – M 2 (X).

Dispersjon er et mål på avviket til verdiene til en tilfeldig variabel fra dens middelverdi.

1. D(C) = 0

2. D(X + C) = D(X)

3. D(CX) = C 2 D(X), Hvor C= konst

4. For uavhengige tilfeldige variabler

D(X ± Y) = D(X) + D(Y)

5. D(X ± Y) = D(X) + D(Y) ± 2Cov(x, y)

Kvadratrot fra variansen til den tilfeldige variabelen kalles X standardavviket .

@Oppgave 3: La den tilfeldige variabelen X ta bare to verdier (0 eller 1) med sannsynligheter q, s, Hvor p + q = 1. Finn den matematiske forventningen og variansen.

Løsning:

M(X) = 1 p + 0 q = p; D(X) = (1 – p) 2 p + (0 – p) 2 q = pq.

@Oppgave 4: Forventning og varians for en tilfeldig variabel X er lik 8. Finn den matematiske forventningen og variansen til tilfeldige variabler: a) X – 4; b) 3X – 4.

Løsning: M(X – 4) = M(X) – 4 = 8 – 4 = 4; D(X – 4) = D(X) = 8; M(3X – 4) = 3M(X) – 4 = 20; D(3X – 4) = 9D(X) = 72.

@Oppgave 5: Hele familiene har følgende fordeling etter antall barn:

x i x 1 x 2
p i 0,1 s 2 0,4 0,35

Definere x 1, x 2 Og s 2, hvis det er kjent det M(X) = 2; D(X) = 0,9.

Løsning: Sannsynlighet p 2 er lik p 2 = 1 – 0,1 – 0,4 – 0,35 = 0,15. De ukjente x er funnet fra ligningene: M(X) = x 1 ·0,1 + x 2 ·0,15 + 2·0,4 + 3·0,35 = 2; D(X) = ·0,1 + ·0,15 + 4·0,4 + 9·0,35 – 4 = 0,9. x 1 = 0; x 2 = 1.

Populasjon og utvalg. Parameterestimat

Selektiv observasjon

Statistisk observasjon kan organiseres kontinuerlig eller ikke kontinuerlig. Kontinuerlig observasjon innebærer å undersøke alle enheter av befolkningen som studeres (generell befolkning). Befolkning er et sett med fysiske eller juridiske enheter, som forskeren studerer i henhold til sin oppgave. Dette er ofte ikke økonomisk forsvarlig og noen ganger umulig. I denne forbindelse studeres bare en del av befolkningen generelt - utvalgspopulasjon .

Resultatene oppnådd fra en utvalgspopulasjon kan utvides til den generelle populasjonen hvis følgende prinsipper følges:



1. Utvalgspopulasjonen skal bestemmes tilfeldig.

2. Antall enheter i utvalgspopulasjonen må være tilstrekkelig.

3. Må oppgis representativitet ( representativitet) av utvalget. Et representativt utvalg er en mindre, men nøyaktig modell av populasjonen den er ment å reflektere.

Prøvetyper

Følgende typer prøver brukes i praksis:

a) strengt tilfeldig, b) mekanisk, c) typisk, d) seriell, e) kombinert.

Riktig tilfeldig prøvetaking

faktisk tilfeldig utvalg utvalget av enheter i utvalgspopulasjonen utføres tilfeldig, for eksempel ved loddtrekning eller ved bruk av en tilfeldig tallgenerator.

Prøver kan gjentas eller ikke gjentas. Ved resampling returneres en enhet som er samplet og beholder en lik mulighet til å bli samplet på nytt. Ved ikke-repetitiv prøvetaking vil ikke en populasjonsenhet som inngår i utvalget delta i utvalget i fremtiden.

Feil som er iboende i prøvetakingsobservasjon, som oppstår på grunn av at prøvepopulasjonen ikke fullstendig reproduserer den generelle populasjonen, kalles standard feil . De representerer den gjennomsnittlige kvadratforskjellen mellom verdiene til indikatorene hentet fra utvalget og de tilsvarende verdiene til indikatorene for den generelle befolkningen.

Beregningsformlene for standardfeilen for tilfeldig gjentatt prøvetaking er som følger: , og for tilfeldig ikke-repeterende prøvetaking som følger: , der S 2 er variansen til utvalgspopulasjonen, n/N – prøveandel, n, N- antall enheter i utvalget og generell populasjon. På n = N standardfeil m = 0.

Mekanisk prøvetaking

mekanisk prøvetaking Populasjonen er delt inn i like intervaller og en enhet velges tilfeldig fra hvert intervall.

For eksempel, med en samplingsfrekvens på 2 %, velges hver 50. enhet fra populasjonslisten.

Standardfeilen for mekanisk prøvetaking er definert som feilen ved en virkelig tilfeldig ikke-repetitiv prøvetaking.

Typisk prøve

typisk prøve den generelle befolkningen er delt inn i homogene typiske grupper, deretter velges enheter tilfeldig fra hver gruppe.

Et typisk utvalg brukes når det gjelder en heterogen populasjon. En typisk prøve gir mer nøyaktige resultater, fordi representativitet er sikret.

For eksempel er lærere, som en generell befolkning, delt inn i grupper iht følgende tegn: kjønn, erfaring, kvalifikasjoner, utdanning, urban og bygdeskoler etc.

Standardfeil i et typisk utvalg er definert som feil i et virkelig tilfeldig utvalg, med den eneste forskjellen det S 2 erstattes av gjennomsnittet av avvikene innen gruppe.

Seriell prøvetaking

seriell prøvetaking den generelle befolkningen deles inn i separate grupper (serier), deretter blir tilfeldig utvalgte grupper utsatt for kontinuerlig observasjon.

Standardfeilene til en serieprøve er definert som feilene til en virkelig tilfeldig prøve, med den eneste forskjellen at S 2 erstattes av gjennomsnittet av avvikene mellom grupper.

Kombinert prøve

Kombinert prøve er en kombinasjon av to eller flere prøvetyper.

Poeng estimat

Det endelige målet med prøveobservasjon er å finne egenskapene til populasjonen. Siden dette ikke kan gjøres direkte, utvides egenskapene til utvalgspopulasjonen til den generelle populasjonen.

Den grunnleggende muligheten for å bestemme det aritmetiske gjennomsnittet av populasjonen fra dataene til gjennomsnittsutvalget er bevist Chebyshevs teorem. Med ubegrenset forstørrelse n Sannsynligheten for at forskjellen mellom utvalgsgjennomsnittet og det generelle gjennomsnittet vil være vilkårlig liten, har en tendens til 1.

Dette betyr at egenskapene til befolkningen med en nøyaktighet på . Denne vurderingen kalles punkt .

Intervall estimering

Grunnlaget for intervallestimering er sentral grense teorem.

Intervall estimering lar oss svare på spørsmålet: innen hvilket intervall og med hvilken sannsynlighet er den ukjente, ønskede verdien av populasjonsparameteren lokalisert?

Vanligvis snakker vi om tillitssannsynlighet s = 1 a, som det vil være i intervallet D< < + D, где D = t cr m > 0 marginal feil prøver, en - Signifikansnivå (sannsynlighet for at ulikheten vil være falsk), t cr- kritisk verdi, som avhenger av verdiene n og a. For et lite utvalg n< 30 t cr spesifiseres ved hjelp av den kritiske verdien av Student t-fordelingen for en tosidig test med n– 1 frihetsgrad med signifikansnivå a ( t cr(n – 1, a) er funnet fra tabellen "Kritiske verdier av Students t-fordeling", vedlegg 2). For n > 30, t cr er en kvantil av normalfordelingsloven ( t cr er funnet fra verditabellen til Laplace-funksjonen F(t) = (1 a)/2 som argument). Ved p = 0,954 den kritiske verdien t cr= 2 ved p = 0,997 kritisk verdi t cr= 3. Dette betyr at marginalfeilen vanligvis er 2-3 ganger større enn standardfeilen.

Dermed er essensen av prøvetakingsmetoden at det, basert på statistiske data for en viss liten del av befolkningen, er mulig å finne et intervall der, med en konfidenssannsynlighet s den ønskede egenskapen til den generelle befolkningen er funnet ( gjennomsnittlig antall arbeidere, gjennomsnittlig poengsum, gjennomsnittlig avkastning, standardavvik osv.).

@Oppgave 1. For å bestemme hastigheten på oppgjør med kreditorer til aksjeselskaper i forretningsbank Det ble foretatt et tilfeldig utvalg på 100 betalingsdokumenter, hvor gjennomsnittlig tid for overføring og mottak av penger viste seg å være 22 dager (= 22) med et standardavvik på 6 dager (S = 6). Med sannsynlighet s= 0,954 bestemmer den maksimale feilen for prøvegjennomsnittet og konfidensintervallet gjennomsnittlig varighet oppgjør av foretak i dette selskapet.

Løsning: Marginalfeil på utvalgsgjennomsnittet iht(1)lik D= 2· 0,6 = 1,2, og konfidensintervallet er definert som (22 – 1,2; 22 + 1,2), dvs. (20,8; 23,2).

§6.5 Korrelasjon og regresjon

Den matematiske forventningen (gjennomsnittsverdien) til en tilfeldig variabel X gitt på et diskret sannsynlighetsrom er tallet m =M[X]=∑x i p i hvis serien konvergerer absolutt.

Formålet med tjenesten. Bruke den elektroniske tjenesten matematisk forventning, varians og standardavvik beregnes(se eksempel). I tillegg tegnes en graf over fordelingsfunksjonen F(X).

Egenskaper til den matematiske forventningen til en tilfeldig variabel

  1. Forventet verdi konstant verdi lik seg selv: M[C]=C, C er en konstant;
  2. M=C M[X]
  3. Den matematiske forventningen til summen av tilfeldige variabler er lik summen av deres matematiske forventninger: M=M[X]+M[Y]
  4. Den matematiske forventningen til produktet av uavhengige tilfeldige variabler er lik produktet av deres matematiske forventninger: M=M[X] M[Y] , hvis X og Y er uavhengige.

Dispersjonsegenskaper

  1. Variansen til en konstant verdi er null: D(c)=0.
  2. Konstantfaktoren kan tas ut under spredningstegnet ved å kvadrere det: D(k*X)= k 2 D(X).
  3. Hvis de tilfeldige variablene X og Y er uavhengige, så er variansen av summen lik summen av variansene: D(X+Y)=D(X)+D(Y).
  4. Hvis de tilfeldige variablene X og Y er avhengige: D(X+Y)=DX+DY+2(X-M[X])(Y-M[Y])
  5. Følgende beregningsformel er gyldig for spredning:
    D(X)=M(X 2)-(M(X)) 2

Eksempel. De matematiske forventningene og variansene til to uavhengige stokastiske variabler X og Y er kjent: M(x)=8, M(Y)=7, D(X)=9, D(Y)=6. Finn den matematiske forventningen og variansen til den tilfeldige variabelen Z=9X-8Y+7.
Løsning. Basert på egenskapene til matematisk forventning: M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23.
Basert på egenskapene til spredning: D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345

Algoritme for beregning av matematisk forventning

Egenskaper til diskrete tilfeldige variabler: alle verdiene deres kan omnummereres naturlige tall; hver verdi er assosiert med en sannsynlighet som ikke er null.
  1. Vi multipliserer parene ett og ett: x i med p i .
  2. Legg til produktet av hvert par x i p i.
    For eksempel, for n = 4: m = ∑x i p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4
Distribusjonsfunksjon av en diskret tilfeldig variabel trinnvis øker den brått på de punktene med positive sannsynligheter.

Eksempel nr. 1.

x i 1 3 4 7 9
p i 0.1 0.2 0.1 0.3 0.3

Vi finner den matematiske forventningen ved å bruke formelen m = ∑x i p i .
Forventning M[X].
M[x] = 1*0,1 + 3*0,2 + 4*0,1 + 7*0,3 + 9*0,3 = 5,9
Vi finner variansen ved å bruke formelen d = ∑x 2 i p i - M[x] 2 .
Varians D[X].
D[X] = 1 2 *0,1 + 3 2 *0,2 + 4 2 *0,1 + 7 2 *0,3 + 9 2 *0,3 - 5,9 2 = 7,69
Standardavvik σ(x).
σ = sqrt(D[X]) = sqrt(7,69) = 2,78

Eksempel nr. 2. En diskret tilfeldig variabel har følgende distribusjonsserie:

X -10 -5 0 5 10
R EN 0,32 2en 0,41 0,03
Finn verdien av a, den matematiske forventningen og standardavviket til denne tilfeldige variabelen.

Løsning. Verdien av a er funnet fra relasjonen: Σp i = 1
Σpi = a + 0,32 + 2 a + 0,41 + 0,03 = 0,76 + 3 a = 1
0,76 + 3 a = 1 eller 0,24=3 a , hvorfra a = 0,08

Eksempel nr. 3. Bestem fordelingsloven til en diskret tilfeldig variabel hvis variansen er kjent, og x 1 x 1 = 6; x 2 = 9; x 3 = x; x 4 = 15
p1 = 0,3; p2=0,3; p3 = 0,1; p4 = 0,3
d(x)=12,96

Løsning.
Her må du lage en formel for å finne variansen d(x):
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
hvor forventningen m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
For våre data
m(x)=6*0,3+9*0,3+x 3 *0,1+15*0,3=9+0,1x 3
12,96 = 6 2 0,3+9 2 0,3+x 3 2 0,1+15 2 0,3-(9+0,1x 3) 2
eller -9/100 (x 2 -20x+96)=0
Følgelig må vi finne røttene til ligningen, og det vil være to av dem.
x 3 = 8, x 3 = 12
Velg den som tilfredsstiller betingelsen x 1 x 3 =12

Fordelingsloven for en diskret tilfeldig variabel
x 1 = 6; x 2 = 9; x 3 = 12; x 4 = 15
p1 = 0,3; p2=0,3; p3 = 0,1; p4 = 0,3

Sannsynlighetsteori er en spesiell gren av matematikk som bare studeres av studenter ved høyere utdanningsinstitusjoner. Liker du beregninger og formler? Er du ikke redd for utsiktene til å bli kjent med normalfordelingen, ensembleentropien, matematisk forventning og spredning av en diskret tilfeldig variabel? Da vil dette emnet være veldig interessant for deg. La oss bli kjent med flere av de viktigste grunnleggende konseptene i denne vitenskapsgrenen.

La oss huske det grunnleggende

Selv om du husker de enkleste konseptene for sannsynlighetsteori, ikke forsøm de første avsnittene i artikkelen. Poenget er at uten en klar forståelse av det grunnleggende, vil du ikke kunne jobbe med formlene som er diskutert nedenfor.

Så en tilfeldig hendelse oppstår, noe eksperiment. Som et resultat av handlingene vi tar, kan vi få flere utfall – noen av dem forekommer oftere, andre sjeldnere. Sannsynligheten for en hendelse er forholdet mellom antall faktisk oppnådde utfall av en type og det totale antallet mulige. Bare ved å kjenne den klassiske definisjonen av dette konseptet kan du begynne å studere den matematiske forventningen og spredningen av kontinuerlige tilfeldige variabler.

Gjennomsnitt

Tilbake på skolen, under mattetimene, begynte du å jobbe med det aritmetiske gjennomsnittet. Dette konseptet er mye brukt i sannsynlighetsteori, og kan derfor ikke ignoreres. Det viktigste for oss for øyeblikket er at vi vil møte det i formlene for den matematiske forventningen og spredningen av en tilfeldig variabel.

Vi har en tallrekke og ønsker å finne det aritmetiske gjennomsnittet. Alt som kreves av oss er å summere alt tilgjengelig og dele på antall elementer i sekvensen. La oss ha tall fra 1 til 9. Summen av elementene vil være lik 45, og vi deler denne verdien på 9. Svar: - 5.

Spredning

I vitenskapelige termer er spredning det gjennomsnittlige kvadratet av avvik av de oppnådde verdiene til en karakteristikk fra det aritmetiske gjennomsnittet. Det er merket med én stor latinsk bokstav D. Hva trengs for å beregne det? For hvert element i sekvensen beregner vi forskjellen mellom det eksisterende tallet og det aritmetiske gjennomsnittet og kvadrerer det. Det vil være nøyaktig så mange verdier som det kan være utfall for arrangementet vi vurderer. Deretter summerer vi alt mottatt og deler på antall elementer i sekvensen. Hvis vi har fem mulige utfall, så del på fem.

Dispersjon har også egenskaper som må huskes for å kunne brukes når man løser problemer. For eksempel, når en tilfeldig variabel øker med X ganger, øker variansen med X ganger i andre (dvs. X*X). Den er aldri mindre enn null og er ikke avhengig av å skifte verdier opp eller ned med like store mengder. I tillegg, for uavhengige forsøk, er variansen av summen lik summen av variansene.

Nå må vi definitivt vurdere eksempler på variansen til en diskret tilfeldig variabel og den matematiske forventningen.

La oss si at vi kjørte 21 eksperimenter og fikk 7 forskjellige utfall. Vi observerte hver av dem henholdsvis 1, 2, 2, 3, 4, 4 og 5 ganger. Hva vil variansen være lik?

La oss først regne ut det aritmetiske gjennomsnittet: summen av elementene er selvfølgelig 21. Del den på 7, og få 3. Trekk nå 3 fra hvert tall i den opprinnelige sekvensen, kvadrer hver verdi og legg sammen resultatene. Resultatet er 12. Nå trenger vi bare å dele tallet på antall elementer, og det ser ut til at det er alt. Men det er en hake! La oss diskutere det.

Avhengighet av antall eksperimenter

Det viser seg at ved beregning av varians kan nevneren inneholde ett av to tall: enten N eller N-1. Her er N antall utførte eksperimenter eller antall elementer i sekvensen (som i hovedsak er det samme). Hva er dette avhengig av?

Hvis antall tester er målt i hundrevis, må vi sette N i nevneren Hvis i enheter, så N-1. Forskere bestemte seg for å tegne grensen ganske symbolsk: i dag går den gjennom tallet 30. Hvis vi utførte mindre enn 30 eksperimenter, vil vi dele mengden med N-1, og hvis mer, så med N.

Oppgave

La oss gå tilbake til vårt eksempel på å løse problemet med varians og matematisk forventning. Vi fikk et mellomtall 12, som måtte deles på N eller N-1. Siden vi utførte 21 eksperimenter, som er mindre enn 30, vil vi velge det andre alternativet. Så svaret er: variansen er 12/2 = 2.

Forventet verdi

La oss gå videre til det andre konseptet, som vi må vurdere i denne artikkelen. Den matematiske forventningen er resultatet av å legge til alle mulige utfall multiplisert med de tilsvarende sannsynlighetene. Det er viktig å forstå at den oppnådde verdien, så vel som resultatet av å beregne variansen, kun oppnås én gang for hele problemet, uansett hvor mange utfall som vurderes i det.

Formelen for matematisk forventning er ganske enkel: vi tar utfallet, multipliserer det med sannsynligheten, legger til det samme for det andre, tredje resultatet osv. Alt relatert til dette konseptet er ikke vanskelig å beregne. For eksempel er summen av de forventede verdiene lik den forventede verdien av summen. Det samme gjelder for arbeidet. Ikke hver mengde i sannsynlighetsteori lar deg utføre slike enkle operasjoner. La oss ta oppgaven og regne ut betydningen av to begreper vi har studert samtidig. Dessuten ble vi distrahert av teori – det er på tide å øve.

Et eksempel til

Vi kjørte 50 forsøk og fikk 10 typer utfall - tall fra 0 til 9 - som vises i forskjellige prosenter. Disse er henholdsvis: 2 %, 10 %, 4 %, 14 %, 2 %, 18 %, 6 %, 16 %, 10 %, 18 %. Husk at for å oppnå sannsynligheter, må du dele prosentverdiene med 100. Dermed får vi 0,02; 0,1 osv. La oss presentere et eksempel på løsning av problemet for variansen til en tilfeldig variabel og den matematiske forventningen.

Vi beregner det aritmetiske gjennomsnittet ved å bruke formelen som vi husker fra barneskolen: 50/10 = 5.

La oss nå konvertere sannsynlighetene til antall utfall "i stykker" for å gjøre det lettere å telle. Vi får 1, 5, 2, 7, 1, 9, 3, 8, 5 og 9. Fra hver oppnådd verdi trekker vi det aritmetiske gjennomsnittet, hvoretter vi kvadrerer hvert av de oppnådde resultatene. Se hvordan du gjør dette ved å bruke det første elementet som eksempel: 1 - 5 = (-4). Neste: (-4) * (-4) = 16. For andre verdier, gjør disse operasjonene selv. Hvis du gjorde alt riktig, vil du få 90 etter å ha lagt dem sammen.

La oss fortsette å beregne variansen og forventet verdi ved å dele 90 på N. Hvorfor velger vi N i stedet for N-1? Riktig, fordi antall utførte eksperimenter overstiger 30. Altså: 90/10 = 9. Vi fikk variansen. Hvis du får et annet nummer, fortvil ikke. Mest sannsynlig har du gjort en enkel feil i beregningene. Dobbeltsjekk det du skrev, så faller nok alt på plass.

Husk til slutt formelen for matematisk forventning. Vi vil ikke gi alle beregningene, vi vil bare skrive et svar som du kan sjekke med etter å ha fullført alle nødvendige prosedyrer. Forventet verdi vil være 5,48. La oss bare huske hvordan du utfører operasjoner, ved å bruke de første elementene som et eksempel: 0*0,02 + 1*0,1... og så videre. Som du kan se, multipliserer vi ganske enkelt utfallsverdien med sannsynligheten.

Avvik

Et annet konsept som er nært knyttet til spredning og matematisk forventning er standardavvik. Det er enten betegnet med de latinske bokstavene sd, eller med den greske små bokstaven "sigma". Dette konseptet viser hvor mye verdiene i gjennomsnitt avviker fra den sentrale funksjonen. For å finne verdien må du beregne kvadratroten av variansen.

Hvis du plotter en normalfordelingsgraf og ønsker å se kvadratavviket direkte på den, kan dette gjøres i flere trinn. Ta halvparten av bildet til venstre eller høyre for modusen (sentral verdi), tegn en vinkelrett på den horisontale aksen slik at arealene til de resulterende figurene er like. Størrelsen på segmentet mellom midten av fordelingen og den resulterende projeksjonen på den horisontale aksen vil representere standardavviket.

Programvare

Som det fremgår av beskrivelsene av formlene og eksemplene som presenteres, er beregning av varians og matematisk forventning ikke den enkleste fremgangsmåten fra et aritmetisk synspunkt. For ikke å kaste bort tid, er det fornuftig å bruke programmet som brukes i høyere utdanningsinstitusjoner - det kalles "R". Den har funksjoner som lar deg beregne verdier for mange konsepter fra statistikk og sannsynlighetsteori.

For eksempel spesifiserer du en vektor med verdier. Dette gjøres som følger: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Endelig

Spredning og matematisk forventning er uten hvilke det er vanskelig å beregne noe i fremtiden. I hovedløpet av forelesninger ved universiteter diskuteres de allerede i de første månedene av å studere emnet. Det er nettopp på grunn av manglende forståelse for disse enkle begrepene og manglende evne til å beregne dem at mange studenter umiddelbart begynner å falle bak i programmet og senere får dårlige karakterer på slutten av økten, noe som fratar dem stipend.

Øv i minst en uke, en halv time om dagen, på å løse oppgaver som ligner på de som er presentert i denne artikkelen. Deretter, på en hvilken som helst test i sannsynlighetsteori, vil du kunne takle eksemplene uten uvedkommende tips og jukseark.

Som allerede kjent karakteriserer fordelingsloven fullstendig en tilfeldig variabel. Imidlertid er distribusjonsloven ofte ukjent og man må begrense seg til mindre informasjon. Noen ganger er det enda mer lønnsomt å bruke tall som beskriver den tilfeldige variabelen totalt; slike numre kalles numeriske kjennetegn ved en tilfeldig variabel. En av de viktige numeriske egenskapene er den matematiske forventningen.

Den matematiske forventningen, som vil bli vist nedenfor, er omtrent lik gjennomsnittsverdien til den tilfeldige variabelen. For å løse mange problemer er det nok å kjenne den matematiske forventningen. For eksempel, hvis det er kjent at den matematiske forventningen til antall poeng scoret av den første skytteren er større enn for den andre, så scorer den første skytteren i gjennomsnitt flere poeng enn den andre, og skyter derfor bedre enn den andre. Selv om den matematiske forventningen gir mye mindre informasjon om en tilfeldig variabel enn loven om dens distribusjon, er kunnskap om den matematiske forventningen tilstrekkelig for å løse problemer som den ovenfor og mange andre.

§ 2. Matematisk forventning til en diskret stokastisk variabel

Matematisk forventning En diskret tilfeldig variabel er summen av produktene av alle mulige verdier og deres sannsynligheter.

La den tilfeldige variabelen X kan bare ta verdier X 1 , X 2 , ..., X P , hvis sannsynligheter er lik R 1 , R 2 , . . ., R P . Så den matematiske forventningen M(X) tilfeldig variabel X bestemmes av likhet

M(X) = X 1 R 1 + X 2 R 2 + … + x n s n .

Hvis en diskret tilfeldig variabel X tar et tellbart sett med mulige verdier, da

M(X)=

Dessuten eksisterer den matematiske forventningen hvis serien på høyre side av likheten konvergerer absolutt.

Kommentar. Av definisjonen følger det at den matematiske forventningen til en diskret tilfeldig variabel er en ikke-tilfeldig (konstant) størrelse. Vi anbefaler at du husker denne uttalelsen, siden den vil bli brukt mange ganger senere. Det skal senere vises at den matematiske forventningen til en kontinuerlig tilfeldig variabel også er en konstant verdi.

Eksempel 1. Finn den matematiske forventningen til en tilfeldig variabel X, å kjenne loven om distribusjonen:

Løsning. Den nødvendige matematiske forventningen er lik summen av produktene av alle mulige verdier av den tilfeldige variabelen og deres sannsynligheter:

M(X)= 3* 0, 1+ 5* 0, 6+ 2* 0, 3= 3, 9.

Eksempel 2. Finn den matematiske forventningen til antall forekomster av en hendelse EN i en rettssak, hvis sannsynligheten for hendelsen EN lik R.

Løsning. Tilfeldig verdi X - antall forekomster av hendelsen EN i en test - kan bare ta to verdier: X 1 = 1 (begivenhet EN skjedde) med sannsynlighet R Og X 2 = 0 (begivenhet EN ikke skjedde) med sannsynlighet q= 1 -R. Den nødvendige matematiske forventningen

M(X)= 1* s+ 0* q= s

Så, den matematiske forventningen til antall forekomster av en hendelse i ett forsøk er lik sannsynligheten for denne hendelsen. Dette resultatet vil bli brukt nedenfor.

§ 3. Probabilistisk betydning av matematisk forventning

La det produseres P tester der den tilfeldige variabelen X akseptert T 1 ganger verdi X 1 , T 2 ganger verdi X 2 ,...,m k ganger verdi x k , og T 1 + T 2 + …+t Til = s. Deretter summen av alle verdiene tatt X, lik

X 1 T 1 + X 2 T 2 + ... + X Til T Til .

La oss finne det aritmetiske gjennomsnittet alle verdier akseptert av en tilfeldig variabel, som vi deler den funnet summen for med det totale antallet tester:

= (X 1 T 1 + X 2 T 2 + ... + X Til T Til)/P,

= X 1 (m 1 / n) + X 2 (m 2 / n) + ... + X Til (T Til /P). (*)

Merker at holdningen m 1 / n- relativ frekvens W 1 verdier X 1 , m 2 / n - relativ frekvens W 2 verdier X 2 osv., skriver vi relasjonen (*) slik:

=X 1 W 1 + x 2 W 2 + .. . + X Til W k . (**)

La oss anta at antallet tester er ganske stort. Da er den relative frekvensen omtrent lik sannsynligheten for at hendelsen inntreffer (dette vil bli bevist i kapittel IX, § 6):

W 1 s 1 , W 2 s 2 , …, W k s k .

Ved å erstatte de relative frekvensene med de tilsvarende sannsynlighetene i forhold (**), får vi

x 1 s 1 + X 2 R 2 + … + X Til R Til .

Høyresiden av denne omtrentlige likheten er M(X). Så,

M(X).

Den sannsynlige betydningen av det oppnådde resultatet er som følger: matematisk forventning er omtrent lik(jo mer nøyaktig, jo større antall tester) det aritmetiske gjennomsnittet av de observerte verdiene til en tilfeldig variabel.

Merknad 1. Det er lett å forstå at den matematiske forventningen er større enn den minste og mindre enn størst mulig verdi. Med andre ord, på talllinjen er mulige verdier plassert til venstre og høyre for den matematiske forventningen. Slik sett preger den matematiske forventningen plasseringen av fordelingen og kalles derfor ofte distribusjonssenter.

Dette begrepet er lånt fra mekanikk: hvis massene R 1 , R 2 , ..., R P ligger ved abscissepunktene x 1 , X 2 , ..., X n, og
deretter abscissen til tyngdepunktet

x c =
.

Vurderer
=
M (X) Og
vi får M(X)= x Med .

Så den matematiske forventningen er abscissen til tyngdepunktet til et system av materielle punkter, hvis abscisse er lik de mulige verdiene til den tilfeldige variabelen, og massene er lik sannsynlighetene deres.

Merknad 2. Opprinnelsen til begrepet "matematisk forventning" er assosiert med den første perioden med fremveksten av sannsynlighetsteori (XVI - XVII århundrer), da omfanget av dets anvendelse var begrenset til gambling. Spilleren var interessert i gjennomsnittsverdien av den forventede gevinsten, eller, med andre ord, den matematiske forventningen om å vinne.