Grunnleggende numeriske egenskaper ved diskrete og kontinuerlige tilfeldige variabler: matematisk forventning, spredning og standardavvik. Deres egenskaper og eksempler.

Fordelingsloven (fordelingsfunksjon og distribusjonsserie eller sannsynlighetstetthet) beskriver fullstendig oppførselen til en tilfeldig variabel. Men i en rekke problemer er det nok å kjenne til noen numeriske egenskaper ved verdien som studeres (for eksempel dens gjennomsnittlige verdi og mulig avvik fra den) for å svare på spørsmålet som stilles. La oss vurdere de viktigste numeriske egenskapene til diskrete tilfeldige variabler.

Definisjon 7.1.Matematisk forventning En diskret tilfeldig variabel er summen av produktene av dens mulige verdier og deres tilsvarende sannsynligheter:

M(X) = X 1 R 1 + X 2 R 2 + … + x p p p.(7.1)

Hvis antallet mulige verdier for en tilfeldig variabel er uendelig, så hvis den resulterende serien konvergerer absolutt.

Merknad 1. Den matematiske forventningen kalles noen ganger vektlagt gjennomsnitt, siden det er omtrent lik det aritmetiske gjennomsnittet av de observerte verdiene til den tilfeldige variabelen over et stort antall eksperimenter.

Notat 2. Fra definisjonen av matematisk forventning følger det at verdien ikke er mindre enn den minste mulige verdien av en tilfeldig variabel og ikke mer enn den største.

Merknad 3. Den matematiske forventningen til en diskret tilfeldig variabel er ikke tilfeldig(konstant. Vi skal se senere at det samme gjelder for kontinuerlige tilfeldige variabler.

Eksempel 1. Finn den matematiske forventningen til en tilfeldig variabel X- antall standarddeler blant tre valgt fra et parti på 10 deler, inkludert 2 defekte. La oss lage en distribusjonsserie for X. Av problemforholdene følger det at X kan ta verdier 1, 2, 3. Deretter

Eksempel 2. Bestem den matematiske forventningen til en tilfeldig variabel X- antall myntkast før første opptreden av våpenskjoldet. Denne mengden kan ta på seg et uendelig antall verdier (settet med mulige verdier er settet med naturlige tall). Distribusjonsserien har formen:

X P
R 0,5 (0,5) 2 (0,5)P

+ (ved beregning ble formelen for summen av en uendelig avtagende geometrisk progresjon brukt to ganger: , hvorfra ).

Egenskaper for matematisk forventning.

1) Den matematiske forventningen til en konstant er lik konstanten selv:

M(MED) = MED.(7.2)

Bevis. Hvis vi vurderer MED som en diskret tilfeldig variabel som bare tar én verdi MED med sannsynlighet R= 1, da M(MED) = MED?1 = MED.

2) Konstantfaktoren kan tas ut av tegnet på den matematiske forventningen:

M(CX) = CM(X). (7.3)

Bevis. Hvis den tilfeldige variabelen X gitt av distribusjonsserier


Deretter M(CX) = Cx 1 R 1 + Cx 2 R 2 + … + Cx p p p = MED(X 1 R 1 + X 2 R 2 + … + x p r p) = CM(X).

Definisjon 7.2. To tilfeldige variabler kalles uavhengig, hvis distribusjonsloven til en av dem ikke avhenger av hvilke verdier den andre har tatt. Ellers de tilfeldige variablene avhengig.

Definisjon 7.3. La oss ringe produkt av uavhengige tilfeldige variabler X Og Y tilfeldig variabel XY, hvis mulige verdier er lik produktene av alle mulige verdier X for alle mulige verdier Y, og de tilsvarende sannsynlighetene er lik produktene av sannsynlighetene til faktorene.

3) Den matematiske forventningen til produktet av to uavhengige tilfeldige variabler er lik produktet av deres matematiske forventninger:

M(XY) = M(X)M(Y). (7.4)

Bevis. For å forenkle beregningene begrenser vi oss til tilfellet når X Og Y ta bare to mulige verdier:

Derfor, M(XY) = x 1 y 1 ?s 1 g 1 + x 2 y 1 ?s 2 g 1 + x 1 y 2 ?s 1 g 2 + x 2 y 2 ?s 2 g 2 = y 1 g 1 (x 1 s 1 + x 2 s 2) + + y 2 g 2 (x 1 s 1 + x 2 s 2) = (y 1 g 1 + y 2 g 2) (x 1 s 1 + x 2 s 2) = M(X)?M(Y).

Merknad 1. Du kan på samme måte bevise denne egenskapen for et større antall mulige verdier av faktorene.

Notat 2. Egenskap 3 er sant for produktet av et hvilket som helst antall uavhengige tilfeldige variabler, som er bevist ved matematisk induksjon.

Definisjon 7.4. La oss definere summen av tilfeldige variabler X Og Y som en tilfeldig variabel X+Y, hvis mulige verdier er lik summen av hver mulig verdi X med alle mulige verdier Y; sannsynlighetene for slike summer er lik produktene av sannsynlighetene til vilkårene (for avhengige tilfeldige variabler - produktene av sannsynligheten for ett ledd ved den betingede sannsynligheten for den andre).

4) Den matematiske forventningen til summen av to tilfeldige variabler (avhengig eller uavhengig) er lik summen av de matematiske forventningene til begrepene:

M (X+Y) = M (X) + M (Y). (7.5)

Bevis.

La oss igjen vurdere de tilfeldige variablene definert av distribusjonsserien gitt i beviset på egenskap 3. Deretter de mulige verdiene X+Y er X 1 + 1 , X 1 + 2 , X 2 + 1 , X 2 + 2. La oss betegne deres sannsynligheter henholdsvis som R 11 , R 12 , R 21 og R 22. Vi finner M(X+Y) = (x 1 + y 1)s 11 + (x 1 + y 2)s 12 + (x 2 + y 1)s 21 + (x 2 + y 2)s 22 =

= x 1 (s 11 + s 12) + x 2 (s 21 + s 22) + y 1 (s 11 + s 21) + y 2 (s 12 + s 22).

La oss bevise det R 11 + R 22 = R 1 . Faktisk hendelsen som X+Y vil ta verdier X 1 + 1 eller X 1 + 2 og sannsynligheten for dette er R 11 + R 22 sammenfaller med hendelsen som X = X 1 (sannsynligheten er R 1). Det er bevist på lignende måte som s 21 + s 22 = R 2 , s 11 + s 21 = g 1 , s 12 + s 22 = g 2. Midler,

M(X+Y) = x 1 s 1 + x 2 s 2 + y 1 g 1 + y 2 g 2 = M (X) + M (Y).

Kommentar. Fra egenskap 4 følger det at summen av et hvilket som helst antall tilfeldige variabler er lik summen av de matematiske forventningene til leddene.

Eksempel. Finn den matematiske forventningen til summen av antall poeng oppnådd når du kaster fem terninger.

La oss finne den matematiske forventningen til antall poeng som kastes når du kaster én terning:

M(X 1) = (1 + 2 + 3 + 4 + 5 + 6) Det samme tallet er lik den matematiske forventningen til antall poeng som kastes på en terning. Derfor, av eiendom 4 M(X)=

Spredning.

For å ha en ide om oppførselen til en tilfeldig variabel, er det ikke nok å bare vite dens matematiske forventning. Tenk på to tilfeldige variabler: X Og Y, spesifisert av skjemaets distribusjonsserie

X
R 0,1 0,8 0,1
Y
s 0,5 0,5

Vi finner M(X) = 49?0,1 + 50?0,8 + 51?0,1 = 50, M(Y) = 0?0,5 + 100?0,5 = 50. Som du kan se, er de matematiske forventningene til begge mengdene like, men hvis for HM(X) beskriver godt oppførselen til en tilfeldig variabel, som er dens mest sannsynlige mulige verdi (og de gjenværende verdiene skiller seg ikke mye fra 50), så verdiene Y vesentlig fjernet fra M(Y). Derfor, sammen med den matematiske forventningen, er det ønskelig å vite hvor mye verdiene til en tilfeldig variabel avviker fra den. For å karakterisere denne indikatoren brukes dispersjon.

Definisjon 7.5.Spredning (spredning) av en tilfeldig variabel er den matematiske forventningen til kvadratet av dens avvik fra dens matematiske forventning:

D(X) = M (X-M(X))². (7,6)

La oss finne variansen til den tilfeldige variabelen X(antall standarddeler blant de utvalgte) i eksempel 1 i denne forelesningen. La oss beregne det kvadrerte avviket for hver mulig verdi fra den matematiske forventningen:

(1 - 2,4) 2 = 1,96; (2 - 2,4) 2 = 0,16; (3 - 2,4) 2 = 0,36. Derfor,

Merknad 1. Ved bestemmelse av spredning er det ikke avviket fra selve gjennomsnittet som vurderes, men kvadratet. Dette gjøres for at avvik av ulike fortegn ikke skal oppheve hverandre.

Notat 2. Fra definisjonen av spredning følger det at denne mengden kun har ikke-negative verdier.

Merknad 3. Det er en formel for beregning av varians som er mer praktisk for beregninger, hvis gyldighet er bevist i følgende teorem:

Teorem 7.1.D(X) = M(X²) - M²( X). (7.7)

Bevis.

Bruker hva M(X) er en konstant verdi, og egenskapene til den matematiske forventningen transformerer vi formel (7.6) til formen:

D(X) = M(X-M(X))² = M(X² - 2 X?M(X) + M²( X)) = M(X²) - 2 M(X)?M(X) + M²( X) =

= M(X²) - 2 M²( X) + M²( X) = M(X²) - M²( X), som var det som måtte bevises.

Eksempel. La oss beregne variansene til tilfeldige variabler X Og Y diskutert i begynnelsen av denne delen. M(X) = (49 2 ?0,1 + 50 2 ?0,8 + 51 2 ?0,1) - 50 2 = 2500,2 - 2500 = 0,2.

M(Y) = (0 2 ?0,5 + 100²?0,5) - 50² = 5000 - 2500 = 2500. Så variansen til den andre tilfeldige variabelen er flere tusen ganger større enn variansen til den første. Så selv uten å kjenne til distribusjonslovene for disse mengdene, basert på de kjente spredningsverdiene kan vi si at X avviker lite fra sin matematiske forventning, mens for Y dette avviket er ganske betydelig.

Egenskaper for spredning.

1) Varians av en konstant verdi MED lik null:

D (C) = 0. (7.8)

Bevis. D(C) = M((C-M(C))²) = M((C-C)²) = M(0) = 0.

2) Konstantfaktoren kan tas ut av spredningstegnet ved å kvadrere det:

D(CX) = C² D(X). (7.9)

Bevis. D(CX) = M((CX-M(CX))²) = M((CX-CM(X))²) = M(C²( X-M(X))²) =

= C² D(X).

3) Variansen av summen av to uavhengige tilfeldige variabler er lik summen av deres varians:

D(X+Y) = D(X) + D(Y). (7.10)

Bevis. D(X+Y) = M(X² + 2 XY + Y²) - ( M(X) + M(Y))² = M(X²) + 2 M(X)M(Y) +

+ M(Y²) - M²( X) - 2M(X)M(Y) - M²( Y) = (M(X²) - M²( X)) + (M(Y²) - M²( Y)) = D(X) + D(Y).

Konsekvens 1. Variansen av summen av flere gjensidig uavhengige tilfeldige variabler er lik summen av deres varians.

Konsekvens 2. Variansen av summen av en konstant og en tilfeldig variabel er lik variansen til den tilfeldige variabelen.

4) Variansen av forskjellen mellom to uavhengige tilfeldige variabler er lik summen av deres varians:

D(X-Y) = D(X) + D(Y). (7.11)

Bevis. D(X-Y) = D(X) + D(-Y) = D(X) + (-1)² D(Y) = D(X) + D(X).

Variansen gir gjennomsnittsverdien av det kvadrerte avviket til en tilfeldig variabel fra gjennomsnittet; For å evaluere selve avviket brukes en verdi som kalles standardavviket.

Definisjon 7.6.Standardavvikσ tilfeldig variabel X kalles kvadratroten av variansen:

Eksempel. I forrige eksempel, standardavvikene X Og Y er like hhv

Hver enkelt verdi er fullstendig bestemt av dens fordelingsfunksjon. For å løse praktiske problemer er det også nok å kjenne til flere numeriske egenskaper, takket være hvilke det blir mulig å presentere hovedtrekkene til en tilfeldig variabel i en kort form.

Disse mengdene inkluderer primært forventet verdi Og spredning .

Forventet verdi— gjennomsnittsverdien av en tilfeldig variabel i sannsynlighetsteori. Angitt som .

På den enkleste måten, den matematiske forventningen til en tilfeldig variabel X(w), finn hvordan integrertLebesgue i forhold til sannsynlighetsmålet R opprinnelig sannsynlighetsrom

Du kan også finne den matematiske forventningen til en verdi som Lebesgue integral fra X etter sannsynlighetsfordeling R X mengder X:

hvor er settet med alle mulige verdier X.

Matematisk forventning til funksjoner fra en tilfeldig variabel X funnet gjennom distribusjon R X. For eksempel, Hvis X- en tilfeldig variabel med verdier i og f(x)- entydig Borelsfunksjon X , Det:

Hvis F(x)- distribusjonsfunksjon X, da er den matematiske forventningen representabel integrertLebesgue - Stieltjes (eller Riemann - Stieltjes):

i dette tilfellet integrerbarhet X I form av ( * ) tilsvarer endeligheten til integralet

I spesifikke tilfeller, hvis X har en diskret fordeling med sannsynlige verdier x k, k=1, 2, . , og sannsynligheter, da

Hvis X har en absolutt kontinuerlig fordeling med sannsynlighetstetthet p(x), Det

i dette tilfellet er eksistensen av en matematisk forventning ekvivalent med den absolutte konvergensen til den tilsvarende serien eller integralet.

Egenskaper til den matematiske forventningen til en tilfeldig variabel.

  • Den matematiske forventningen til en konstant verdi er lik denne verdien:

C- konstant;

  • M=C.M[X]
  • Den matematiske forventningen til summen av tilfeldig tatt verdier er lik summen av deres matematiske forventninger:

  • Den matematiske forventningen til produktet av uavhengige tilfeldig tatt variabler = produktet av deres matematiske forventninger:

M=M[X]+M[Y]

Hvis X Og Y uavhengig.

hvis serien konvergerer:

Algoritme for beregning av matematisk forventning.

Egenskaper til diskrete tilfeldige variabler: alle verdiene deres kan omnummereres med naturlige tall; tilordne hver verdi en ikke-null sannsynlighet.

1. Multipliser parene ett etter ett: x ip i.

2. Legg til produktet av hvert par x i p i.

For eksempel, For n = 4 :

Distribusjonsfunksjon av en diskret tilfeldig variabel trinnvis øker den brått på de punktene hvis sannsynlighet har et positivt fortegn.

Eksempel: Finn den matematiske forventningen ved å bruke formelen.

Tilfeldige variabler, i tillegg til distribusjonslover, kan også beskrives numeriske egenskaper .

Matematisk forventning M (x) av en tilfeldig variabel kalles dens middelverdi.

Den matematiske forventningen til en diskret tilfeldig variabel beregnes ved hjelp av formelen

Hvor tilfeldige variabelverdier, s Jeg- deres sannsynligheter.

La oss vurdere egenskapene til matematisk forventning:

1. Den matematiske forventningen til en konstant er lik konstanten selv

2. Hvis en tilfeldig variabel multipliseres med et visst tall k, vil den matematiske forventningen multipliseres med det samme tallet

M (kx) = kM (x)

3. Den matematiske forventningen til summen av tilfeldige variabler er lik summen av deres matematiske forventninger

M (x 1 + x 2 + … + x n) = M (x 1) + M (x 2) +…+ M (x n)

4. M (x 1 - x 2) = M (x 1) - M (x 2)

5. For uavhengige tilfeldige variabler x 1, x 2, … x n, er den matematiske forventningen til produktet lik produktet av deres matematiske forventninger

M (x 1, x 2, ... x n) = M (x 1) M (x 2) ... M (x n)

6. M (x - M (x)) = M (x) - M (M (x)) = M (x) - M (x) = 0

La oss beregne den matematiske forventningen til den tilfeldige variabelen fra eksempel 11.

M(x) = = .

Eksempel 12. La de tilfeldige variablene x 1, x 2 spesifiseres tilsvarende av distribusjonslovene:

x 1 Tabell 2

x 2 Tabell 3

La oss beregne M (x 1) og M (x 2)

M (x 1) = (- 0,1) 0,1 + (- 0,01) 0,2 + 0 0,4 + 0,01 0,2 + 0,1 0,1 = 0

M (x 2) = (- 20) 0,3 + (- 10) 0,1 + 0 0,2 + 10 0,1 + 20 0,3 = 0

De matematiske forventningene til begge tilfeldige variabler er de samme - de er lik null. Imidlertid er arten av deres distribusjon annerledes. Hvis verdiene til x 1 avviker lite fra deres matematiske forventninger, avviker verdiene til x 2 i stor grad fra deres matematiske forventninger, og sannsynlighetene for slike avvik er ikke små. Disse eksemplene viser at det er umulig å fastslå ut fra gjennomsnittsverdien hvilke avvik fra den som forekommer, både mindre og større. Så med samme gjennomsnittlige årsnedbør i to områder kan man ikke si at disse områdene er like gunstige for jordbruksarbeid. På samme måte, basert på gjennomsnittslønnsindikatoren, er det ikke mulig å bedømme andelen høyt- og lavtlønnede arbeidere. Derfor introduseres en numerisk karakteristikk - spredning D(x) , som karakteriserer graden av avvik for en tilfeldig variabel fra dens gjennomsnittsverdi:

D (x) = M (x - M (x))2. (2)

Dispersjon er den matematiske forventningen til det kvadrerte avviket til en tilfeldig variabel fra den matematiske forventningen. For en diskret tilfeldig variabel beregnes variansen ved å bruke formelen:

D(x)= = (3)

Fra definisjonen av dispersjon følger det at D (x) 0.

Dispersjonsegenskaper:

1. Variansen til konstanten er null

2. Hvis en tilfeldig variabel multipliseres med et visst tall k, vil variansen bli multiplisert med kvadratet av dette tallet

D (kx) = k 2 D (x)

3. D (x) = M (x 2) – M 2 (x)

4. For parvise uavhengige tilfeldige variable x 1 , x 2 , … x n er variansen til summen lik summen av variansene.

D (x 1 + x 2 + … + x n) = D (x 1) + D (x 2) +...+ D (x n)

La oss beregne variansen for den tilfeldige variabelen fra eksempel 11.

Matematisk forventning M (x) = 1. Derfor, i henhold til formel (3) har vi:

D (x) = (0 – 1) 2 1/4 + (1 – 1) 2 1/2 + (2 – 1) 2 1/4 =1 1/4 +1 1/4= 1/2

Merk at det er lettere å beregne varians hvis du bruker egenskap 3:

D (x) = M (x 2) – M 2 (x).

La oss beregne variansene for de tilfeldige variablene x 1 , x 2 fra eksempel 12 ved å bruke denne formelen. De matematiske forventningene til begge tilfeldige variabler er null.

D (x 1) = 0,01 0,1 + 0,0001 0,2 + 0,0001 0,2 + 0,01 0,1 = 0,001 + 0,00002 + 0,00002 + 0,001 = 0,00204

D (x 2) = (-20) 2 0,3 + (-10) 2 0,1 + 10 2 0,1 + 20 2 0,3 = 240 +20 = 260

Jo nærmere variansverdien er null, jo mindre er spredningen av den tilfeldige variabelen i forhold til middelverdien.

Mengden kalles standardavvik. Tilfeldig variabel modus x diskret type Md Verdien av en tilfeldig variabel som har høyest sannsynlighet kalles.

Tilfeldig variabel modus x kontinuerlig type Md, er et reelt tall definert som maksimumspunktet for sf(x).

Median av en tilfeldig variabel x kontinuerlig type Mn er et reelt tall som tilfredsstiller ligningen

Den matematiske forventningen er gjennomsnittsverdien av en tilfeldig variabel.

Den matematiske forventningen til en diskret tilfeldig variabel er summen av produktene av alle dens mulige verdier og deres sannsynligheter:

Eksempel.

X -4 6 10
р 0,2 0,3 0,5


Løsning: Den matematiske forventningen er lik summen av produktene av alle mulige verdier av X og deres sannsynligheter:

M (X) = 4*0,2 + 6*0,3 +10*0,5 = 6.


For å beregne den matematiske forventningen er det praktisk å utføre beregninger i Excel (spesielt når det er mye data), foreslår vi å bruke en ferdig mal ().

Et eksempel for å løse det selv (du kan bruke en kalkulator).
Finn den matematiske forventningen til en diskret tilfeldig variabel X gitt av fordelingsloven:

X 0,21 0,54 0,61
р 0,1 0,5 0,4

Den matematiske forventningen har følgende egenskaper.

Egenskap 1. Den matematiske forventningen til en konstant verdi er lik konstanten selv: M(C)=C.

Egenskap 2. Konstantfaktoren kan tas ut som tegn på den matematiske forventningen: M(CX)=CM(X).

Egenskap 3. Den matematiske forventningen til produktet av gjensidig uavhengige stokastiske variabler er lik produktet av de matematiske forventningene til faktorene: M (X1X2 ...Xn) = M (X1) M (X2)*. ..*M (Xn)

Egenskap 4. Den matematiske forventningen til summen av tilfeldige variabler er lik summen av de matematiske forventningene til leddene: M(Xg + X2+...+Xn) = M(Xg)+M(X2)+... +M(Xn).

Oppgave 189. Finn den matematiske forventningen til den stokastiske variabelen Z hvis de matematiske forventningene til X og Y er kjent: Z = X+2Y, M(X) = 5, M(Y) = 3;

Løsning: Ved å bruke egenskapene til den matematiske forventningen (den matematiske forventningen til summen er lik summen av de matematiske forventningene til leddene; konstantfaktoren kan tas ut av tegnet til den matematiske forventningen), får vi M(Z) )=M(X + 2Y)=M(X) + M(2Y)=M (X) + 2M(Y)= 5 + 2*3 = 11.

190. Bruk egenskapene til matematisk forventning, bevis at: a) M(X - Y) = M(X) - M (Y); b) den matematiske forventningen til avviket X-M(X) er lik null.

191. En diskret tilfeldig variabel X tar tre mulige verdier: x1= 4 Med sannsynlighet p1 = 0,5; xЗ = 6 Med sannsynlighet P2 = 0,3 og x3 med sannsynlighet p3. Finn: x3 og p3, vel vitende om at M(X)=8.

192. En liste over mulige verdier for en diskret tilfeldig variabel X er gitt: x1 = -1, x2 = 0, x3= 1; de matematiske forventningene til denne verdien og dens kvadrat er også kjent: M(X) = 0,1 , M(X^2) = 0,9. Finn sannsynlighetene p1, p2, p3 som tilsvarer de mulige verdiene til xi

194. En batch på 10 deler inneholder tre ikke-standarddeler. To deler ble valgt tilfeldig. Finn den matematiske forventningen til en diskret tilfeldig variabel X - antall ikke-standarddeler blant to utvalgte.

196. Finn den matematiske forventningen til en diskret tilfeldig variabel X-antall av slike kast med fem terninger, i hver av disse vil ett poeng vises på to terninger, hvis det totale antallet kast er tjue.



Den matematiske forventningen til en binomialfordeling er lik antall forsøk multiplisert med sannsynligheten for at en hendelse skal skje i en prøvelse:

Den matematiske forventningen til en tilfeldig variabel X er middelverdien.

1. M(C) = C

2. M(CX) = CM(X), Hvor C= konst

3. M(X ± Y) = M(X) ± M(Y)

4. Hvis tilfeldige variabler X Og Y er uavhengige, da M(XY) = M(X) M(Y)

Spredning

Variansen til en tilfeldig variabel X kalles

D(X) = S(x – M(X)) 2 p = M(X 2 ) – M 2 (X).

Dispersjon er et mål på avviket til verdiene til en tilfeldig variabel fra dens middelverdi.

1. D(C) = 0

2. D(X + C) = D(X)

3. D(CX) = C 2 D(X), Hvor C= konst

4. For uavhengige tilfeldige variabler

D(X ± Y) = D(X) + D(Y)

5. D(X ± Y) = D(X) + D(Y) ± 2Cov(x, y)

Kvadratroten av variansen til en tilfeldig variabel X kalles standardavviket .

@Oppgave 3: La den tilfeldige variabelen X ta bare to verdier (0 eller 1) med sannsynligheter q, s, Hvor p + q = 1. Finn den matematiske forventningen og variansen.

Løsning:

M(X) = 1 p + 0 q = p; D(X) = (1 – p) 2 p + (0 – p) 2 q = pq.

@Oppgave 4: Forventning og varians for en tilfeldig variabel X er lik 8. Finn den matematiske forventningen og variansen til tilfeldige variabler: a) X – 4; b) 3X – 4.

Løsning: M(X – 4) = M(X) – 4 = 8 – 4 = 4; D(X – 4) = D(X) = 8; M(3X – 4) = 3M(X) – 4 = 20; D(3X – 4) = 9D(X) = 72.

@Oppgave 5: Hele familiene har følgende fordeling etter antall barn:

x i x 1 x 2
p i 0,1 s2 0,4 0,35

Definere x 1, x 2 Og s2, hvis det er kjent det M(X) = 2; D(X) = 0,9.

Løsning: Sannsynlighet p 2 er lik p 2 = 1 – 0,1 – 0,4 – 0,35 = 0,15. De ukjente x er funnet fra ligningene: M(X) = x 1 ·0,1 + x 2 ·0,15 + 2·0,4 + 3·0,35 = 2; D(X) = ·0,1 + ·0,15 + 4·0,4 + 9·0,35 – 4 = 0,9. x 1 = 0; x 2 = 1.

Populasjon og utvalg. Parameterestimat

Selektiv observasjon

Statistisk observasjon kan organiseres kontinuerlig eller ikke kontinuerlig. Kontinuerlig observasjon innebærer å undersøke alle enheter av befolkningen som studeres (generell befolkning). Befolkning dette er et sett med enkeltpersoner eller juridiske enheter som forskeren studerer i henhold til sin oppgave. Dette er ofte ikke økonomisk forsvarlig og noen ganger umulig. I denne forbindelse studeres bare en del av befolkningen generelt - utvalgspopulasjon .

Resultatene oppnådd fra en utvalgspopulasjon kan utvides til den generelle populasjonen hvis følgende prinsipper følges:



1. Utvalgspopulasjonen skal bestemmes tilfeldig.

2. Antall enheter i utvalgspopulasjonen må være tilstrekkelig.

3. Må oppgis representativitet ( representativitet) av utvalget. Et representativt utvalg er en mindre, men nøyaktig modell av populasjonen den er ment å reflektere.

Prøvetyper

Følgende typer prøver brukes i praksis:

a) strengt tilfeldig, b) mekanisk, c) typisk, d) seriell, e) kombinert.

Riktig tilfeldig prøvetaking

faktisk tilfeldig utvalg utvalget av enheter i utvalgspopulasjonen utføres tilfeldig, for eksempel ved loddtrekning eller ved bruk av en tilfeldig tallgenerator.

Prøver kan gjentas eller ikke gjentas. Ved resampling returneres en enhet som er samplet og beholder en lik mulighet til å bli samplet på nytt. Ved ikke-repetitiv prøvetaking vil ikke en populasjonsenhet som inngår i utvalget delta i utvalget i fremtiden.

Feil som er iboende i prøvetakingsobservasjon, som oppstår på grunn av at prøvepopulasjonen ikke fullstendig reproduserer den generelle populasjonen, kalles standard feil . De representerer den gjennomsnittlige kvadratforskjellen mellom verdiene til indikatorene hentet fra utvalget og de tilsvarende verdiene til indikatorene for den generelle befolkningen.

Beregningsformlene for standardfeilen for tilfeldig gjentatt prøvetaking er som følger: , og for tilfeldig ikke-repeterende prøvetaking som følger: , der S 2 er variansen til utvalgspopulasjonen, n/N – prøveandel, n, N- antall enheter i utvalget og generell populasjon. På n = N standard feil m = 0.

Mekanisk prøvetaking

mekanisk prøvetaking Populasjonen er delt inn i like intervaller og en enhet velges tilfeldig fra hvert intervall.

For eksempel, med en samplingsfrekvens på 2 %, velges hver 50. enhet fra populasjonslisten.

Standardfeilen for mekanisk prøvetaking er definert som feilen ved en virkelig tilfeldig ikke-repetitiv prøvetaking.

Typisk prøve

typisk prøve den generelle befolkningen er delt inn i homogene typiske grupper, deretter velges enheter tilfeldig fra hver gruppe.

Et typisk utvalg brukes når det gjelder en heterogen populasjon. Et typisk utvalg gir mer nøyaktige resultater fordi det sikrer representativitet.

For eksempel er lærere, som en generell befolkning, delt inn i grupper etter følgende kriterier: kjønn, erfaring, kvalifikasjoner, utdanning, by- og landskoler, etc.

Standardfeil i et typisk utvalg er definert som feil i et virkelig tilfeldig utvalg, med den eneste forskjellen det S 2 erstattes av gjennomsnittet av avvikene innen gruppe.

Seriell prøvetaking

seriell prøvetaking den generelle befolkningen deles inn i separate grupper (serier), deretter blir tilfeldig utvalgte grupper utsatt for kontinuerlig observasjon.

Standardfeilene til en serieprøve er definert som feilene til en virkelig tilfeldig prøve, med den eneste forskjellen at S 2 erstattes av gjennomsnittet av avvikene mellom grupper.

Kombinert prøve

Kombinert prøve er en kombinasjon av to eller flere prøvetyper.

Poeng estimat

Det endelige målet med prøveobservasjon er å finne egenskapene til populasjonen. Siden dette ikke kan gjøres direkte, utvides egenskapene til utvalgspopulasjonen til den generelle populasjonen.

Den grunnleggende muligheten for å bestemme det aritmetiske gjennomsnittet av populasjonen fra dataene til gjennomsnittsutvalget er bevist Chebyshevs teorem. Med ubegrenset forstørrelse n Sannsynligheten for at forskjellen mellom utvalgsgjennomsnittet og det generelle gjennomsnittet vil være vilkårlig liten, har en tendens til 1.

Dette betyr at egenskapene til befolkningen med en nøyaktighet på . Denne vurderingen kalles punkt .

Intervall estimering

Grunnlaget for intervallestimering er sentral grense teorem.

Intervall estimering lar oss svare på spørsmålet: innen hvilket intervall og med hvilken sannsynlighet er den ukjente, ønskede verdien av populasjonsparameteren lokalisert?

Vanligvis snakker vi om tillitssannsynlighet s = 1 a, som det vil være i intervallet D< < + D, где D = t cr m > 0 marginal feil prøver, en - Signifikansnivå (sannsynlighet for at ulikheten vil være falsk), t cr- kritisk verdi, som avhenger av verdiene n og a. For et lite utvalg n< 30 t cr spesifiseres ved hjelp av den kritiske verdien av Student t-fordelingen for en tosidig test med n– 1 frihetsgrad med signifikansnivå a ( t cr(n – 1, a) er funnet fra tabellen "Kritiske verdier av Students t-fordeling", vedlegg 2). For n > 30, t cr er en kvantil av normalfordelingsloven ( t cr er funnet fra verditabellen til Laplace-funksjonen F(t) = (1 a)/2 som argument). Ved p = 0,954 den kritiske verdien t cr= 2 ved p = 0,997 kritisk verdi t cr= 3. Dette betyr at marginalfeilen vanligvis er 2-3 ganger større enn standardfeilen.

Dermed er essensen av prøvetakingsmetoden at det, basert på statistiske data fra en viss liten del av befolkningen, er mulig å finne et intervall der det med en konfidenssannsynlighet s den ønskede egenskapen til den generelle befolkningen er funnet (gjennomsnittlig antall arbeidere, gjennomsnittlig poengsum, gjennomsnittlig avkastning, standardavvik, etc.).

@Oppgave 1. For å bestemme hastigheten på oppgjør med kreditorer til selskapsforetak, utførte en forretningsbank et tilfeldig utvalg av 100 betalingsdokumenter, hvor gjennomsnittlig tid for overføring og mottak av penger viste seg å være 22 dager (= 22) med et standardavvik på 6 dager (S = 6). Med sannsynlighet s= 0,954 bestemmer den maksimale feilen til prøvegjennomsnittet og konfidensintervallet for den gjennomsnittlige varigheten av oppgjørene til foretakene i dette selskapet.

Løsning: Marginal feil av prøvegjennomsnitt iht(1)lik D= 2· 0,6 = 1,2, og konfidensintervallet er definert som (22 – 1,2; 22 + 1,2), dvs. (20,8; 23,2).

§6.5 Korrelasjon og regresjon