1. Statistica matematică. Introducere

Statistica matematică este o disciplină care se aplică în toate domeniile cunoașterii științifice.

Metodele statistice sunt concepute pentru a înțelege „natura numerică” a realității (Nisbett, et al., 1987).

Definiția conceptului

Statistică matematică este o ramură a matematicii dedicată metodelor de analiză a datelor, în principal de natură probabilistică. Ea este angajată în sistematizare, prelucrare și utilizaredate statistice pentru teoretic și practicconcluzii ice.

Date statistice se referă la informații despre numărul de obiecte din orice colecție mai mult sau mai puțin extinsă care au anumite caracteristici. Este important să înțelegem aici că statisticile se ocupă în mod specific de numărul de obiecte, și nu de caracteristicile lor descriptive.

Scopul analizei statistice este de a studia proprietățile unei variabile aleatorii. Pentru a face acest lucru, este necesar să se măsoare valorile variabilei aleatoare studiate de mai multe ori. Grupul de valori rezultat este considerat ca eşantion dintr-un ipotetic populatie.

Eșantionul este procesat statistic, iar după aceea se ia o decizie. Este important de menționat că, datorită condiției inițiale de incertitudine, soluția acceptată are întotdeauna caracterul unei „enunțuri neclare”. Cu alte cuvinte, procesarea statistică se ocupă mai degrabă de probabilități decât de afirmații precise.

Principalul lucru în metoda statistică este să numărați numărul de obiecte incluse în diferite grupuri. Obiectele sunt colectate într-un grup în funcție de o anumită caracteristică comună și apoi se ia în considerare distribuția acestor obiecte în grup în funcție de expresia cantitativă a acestei caracteristici. În statistică, este adesea folosită metoda de analiză prin eșantionare, adică. Nu se analizează întregul grup de obiecte, ci un eșantion mic - mai multe obiecte luate dintr-un grup mare. Teoria probabilității este utilizată pe scară largă în evaluarea statistică a observațiilor și în tragerea concluziilor.

Subiectul principal al statisticii matematice este calculul statistician (fie ca cititorul să ne ierte pentru tautologie), care sunt criterii de evaluare a fiabilității ipotezelor, ipotezelor sau concluziilor a priori bazate pe esența datelor empirice.

O altă definiție este „Statisticile sunt instrucțiuni prin care se calculează un anumit număr dintr-un eșantion - valoarea statisticii pentru un eșantion dat”[Sachs, 1976]. Pot fi luate în considerare media și varianța eșantionului, raportul dintre variațiile a două eșantioane sau orice alte funcții ale eșantionului precum statisticienii.

Calculul „statisticilor” este o reprezentare „un număr” a unui proces stocastic (probabilistic) complex.

Repartizarea elevilor

Statisticile sunt, de asemenea, variabile aleatorii. Distribuțiile de statistici (distribuții de test) stau la baza criteriilor care sunt construite pe aceste statistici. De exemplu, W. Gosset, lucrând la fabrica de bere Guinness și publicând sub pseudonimul „Student”, în 1908 a dovedit proprietățile foarte utile ale distribuției raportului diferenței dintre media eșantionului și media populației () la eroarea standard a mediei populației, sau t -statistici ( Repartizarea elevilor ):

. (5.7)

Se abordează distribuția Student în formă în anumite condiții normal.

Celelalte două distribuții importante ale statisticilor eșantionului suntc 2 -distributieŞi F -distributie, utilizat pe scară largă într-o serie de ramuri ale statisticii pentru a testa ipotezele statistice.

Aşa, articol statistica matematică este un formal cantitativ partea obiectelor studiate, indiferent de natura specifică a obiectelor studiate în sine.

Din acest motiv, exemplele date aici sunt despre grupuri de date, despre numere și nu despre lucruri specifice măsurabile. Și, prin urmare, folosind calculele eșantion oferite aici, puteți calcula datele obținute la o varietate de obiecte.

Principalul lucru este să alegeți o metodă de prelucrare statistică potrivită pentru datele dvs..

În funcție de rezultatele specifice ale observațiilor, statistica matematică este împărțită în mai multe secțiuni.

Secţiuni de statistică matematică

        Statistica numerelor.

        Analiza statistică multivariată.

        Analiza funcțiilor (proceselor) și a seriilor de timp.

        Statistica obiectelor de natură nenumerică.

În știința modernă, se crede că orice domeniu de cercetare nu poate fi o știință adevărată până când matematica nu o pătrunde. În acest sens, statistica matematică este reprezentantul autorizat al matematicii în orice altă știință și oferă o abordare științifică a cercetării. Putem spune că abordarea științifică începe acolo unde apar statisticile matematice în studiu. Acesta este motivul pentru care statistica matematică este atât de importantă pentru orice cercetător modern.

Dacă vrei să fii un adevărat cercetător modern, studiază și aplică statisticile matematice în munca ta!

Statisticile apar neapărat acolo unde există o tranziție de la o singură observație la una multiplă. Dacă aveți o mulțime de observații, măsurători și date, atunci nu puteți face fără statistici matematice.

Statisticile matematice sunt împărțite înteoretice și aplicate.

Statistica teoretică dovedește natura științifică și corectitudinea statisticii în sine.

Statistică matematică teoretică - știința care studiază metode dezvăluirea tiparelor inerente populațiilor mari de obiecte omogene pe baza eșantionării acestora.

Această ramură a statisticii este tratată de matematicieni și le place să folosească dovezile lor matematice teoretice pentru a ne convinge că statistica în sine este științifică și poate fi de încredere. Problema este că numai alți matematicieni pot înțelege aceste dovezi, iar pentru oamenii obișnuiți care au nevoie să folosească statisticile matematice, aceste dovezi nu sunt încă accesibile și sunt complet inutile!

Concluzie: Dacă nu sunteți matematician, atunci nu vă pierdeți energia în înțelegerea calculelor teoretice privind statistica matematică. Studiați metodele statistice reale, nu justificările lor matematice.

Statistici aplicate învață utilizatorii să lucreze cu orice date și să obțină rezultate generalizate. Nu contează ce fel de date sunt, ceea ce contează este cât de mult aveți la dispoziție. În plus, statisticile aplicate ne vor spune cât de mult putem avea încredere că rezultatele obținute reflectă starea reală a lucrurilor.

Diferite discipline în statistica aplicată utilizează seturi diferite de metode specifice. Prin urmare, se disting următoarele secțiuni de statistică aplicată: biologică, psihologică, economică și altele. Ele diferă unele de altele prin setul de exemple și tehnici, precum și prin metodele lor de calcul preferate.

Următorul este un exemplu al diferențelor dintre aplicarea statisticii aplicate pentru diferite discipline. Astfel, studiul statistic al regimului debitelor de apă turbulente se realizează pe baza teoriei proceselor aleatorii staţionare. Cu toate acestea, aplicarea aceleiași teorii la analiza seriilor temporale economice poate duce la erori grosolane datorită faptului că ipoteza că distribuția probabilității rămâne neschimbată în acest caz este, de regulă, complet inacceptabilă. Prin urmare, aceste discipline diferite vor necesita metode statistice diferite.

Deci, orice om de știință modern ar trebui să folosească statisticile matematice în cercetările sale. Chiar și omul de știință care lucrează în domenii care sunt foarte departe de matematică. Și trebuie să fie capabil să aplice statistici aplicate datelor sale, chiar și fără să știe.

© Sazonov V.F., 2009.

Ed. a II-a, rev. - M.: 2009.- 472 p.

Fundamentele teoriei probabilităților și statisticii matematice sunt prezentate sub formă de exemple și probleme cu soluții. Cartea introduce cititorul și în metodele statistice aplicate. Pentru a înțelege materialul, este suficientă cunoașterea principiilor analizei matematice. Sunt incluse un număr mare de imagini, întrebări de test și exemple numerice. Pentru studenții care studiază statistica matematică, cercetătorii și practicienii (economiști, sociologi, biologi) care aplică metode statistice.

Format: pdf

Dimensiune: 10,7 MB

Urmăriți, descărcați:drive.google

CUPRINS
Prefață 3
Pentru cititor 5
Partea I: Probabilitate și modelare statistică 7
Capitolul 1. Caracteristicile variabilelor aleatoare 7
§ 1. Funcții de distribuție și densitate 7
§ 2. Așteptări și variații 10
§ 3. Independenta variabilelor aleatoare 12
§ 4. Căutarea pacienților 13
Probleme 14
Soluții la probleme 15
Răspunsuri la întrebări 18
Capitolul 2. Senzori cu numere aleatorii 19
§ 1. Senzori fizici 19
§ 2. Tabelele numerelor aleatoare 20
§ 3. Senzori matematici 21
§ 4. Aleatorie și complexitate 22
§ 5. Experimentul „Eșecuri” 24
§6. Teoreme de existență și calculator 26
Probleme 26
Rezolvarea problemelor 27
Răspunsuri la întrebări 29
Capitolul 3. Metoda Monte Carlo 30
§ 1. Calculul integralelor 30
§ 2. „Regula celor trei sigma” 31
§ 3. Integrale multiple 32
§ 4. O bilă înscrisă într-un cub fc-dimensional 35
§ 5. Uniformitatea Weyl 36
§ 6. Paradoxul primului număr 37
Probleme 38
Rezolvarea problemelor 39
Răspunsuri la întrebări 41
Capitolul 4. Senzori indicativi și normali 42
§ 1. Metoda funcției inverse 42
§ 2. Distribuțiile valorilor extreme 43
§ 3. Senzor index fără logaritmi 45
§ 4. Senzor exponențial rapid 46
§ 5. Numere aleatoare normale 50
§ 6. Cea mai bună alegere 52
Probleme 54
Rezolvarea problemelor 54
Răspunsuri la întrebări 57
Capitolul 5. Senzori discreti și continui 58
§ 1. Modelarea mărimilor discrete 58
§ 2. Statistici ordinale și amestecuri 60
§ 3. Metoda lui Neumann (metoda eliminării) 64
§ 4. Exemplu din teoria jocurilor 66
Probleme 67
Soluții la probleme 68
Răspunsuri la întrebările 69
Partea a II-a. Estimarea parametrilor 71
Capitolul 6. Compararea evaluărilor 72
§ 1. Model statistic 72
§ 2. Nepărtinire și consecvență 73
§ 3. Funcții de risc 76
§ 4. Estimarea Minimax în schema Bernoulli 78
Probleme 79
Rezolvarea problemelor 80
Răspunsuri la întrebări 83
Capitolul 7. Normalitatea asimptotică 84
§ 1. Distributie Cauchy 84
§ 2. Mediana eșantionului 86
§ 3. Cuantile eșantion 87
§ 4. Eficiență relativă 89
§ 5. Legi stabile 91
Probleme 93
Rezolvarea problemelor 94
Răspunsuri la întrebările 98
Capitolul 8. Distribuții simetrice 99
§ 1. Clasificarea metodelor statistice 99
§ 2. Medie tăiată 100
§ 3. Mediana lui Walsh înseamnă 102
§ 4. Robustitate 103
Probleme 106
Rezolvarea problemelor 106
Răspunsuri la întrebările 109
Capitolul 9. Metode de obţinere a estimărilor software
§ 1. Lucrare de probabilitate 110
§ 2. Metoda momentelor 112
§ 3. Inegalitatea informațională 114
§ 4. Metoda maximei probabilități 116
§ 5. Metoda lui Newton și estimări într-o etapă 119
§ 6. Metoda de spațiere 122
Probleme 123
Rezolvarea problemelor 124
Răspunsuri la întrebările 127
Capitolul 10. Suficiența 129
§ 1. Statistici suficiente 129
§ 2. Criteriul de factorizare 130
§ 3. Familia exponenţială 132
§ 4. Îmbunătățirea estimărilor imparțiale 133
§ 5. Mingi în cutii 134
Probleme 140
Rezolvarea problemelor 141
Răspunsuri la întrebările 144
Capitolul 11. Intervale de încredere 145
§ 1. Factorul de încredere 145
§ 2. Intervale în modelul normal 146
§ 3. Metode de construire a intervalelor 151
Probleme 155
Rezolvarea problemelor 156
Răspunsuri la întrebările 158
Partea a III-a. Testarea ipotezelor 159
Capitolul 12. Criteriile de consimțământ 160
§ 1. Criteriul statistic 160
§ 2. Verificarea uniformității 161
§ 3. Testul exponenţialităţii 164
§ 4. Testarea normalității 167
§ 5. Entropia 170
Probleme 175
Rezolvarea problemelor 175
Răspunsuri la întrebările 178
Capitolul 13. Alternative 180
§ 1. Erori de primul şi al doilea fel 180
§ 2. Criteriul optim Neyman-Pearson 183
§ 3. Analiza secvenţială 187
§ 4. Ruperea jucătorului 190
§ 5. Oprirea optimă a unei plimbări 193
Probleme 195
Rezolvarea problemelor 195
Răspunsuri la întrebările 197
Partea a IV-a. Omogenitatea probelor 199
Capitolul 14. Două mostre independente 200
§ 1. Alternative la omogenitate 200
§ 2. Alegerea corectă a modelului 201
§ 3. Criteriul Smirnov 202
§ 4. Criteriul Rosenblatt 203
§ 5. Testul sumei rangului Wilcoxon 204
§ 6. Principiul reflecției 209
Probleme 214
Rezolvarea problemelor 215
Răspunsuri la întrebările 217
Capitolul 15. Observații repetate pereche 219
§ 1. Rafinamentul modelului 219
§ 2. Criteriul semnelor 220
§ 3. Wilcoxon a semnat testul de rang 222
§ 4. Observații dependente 227
§ 5. Criteriul seriei 229
Probleme 231
Rezolvarea problemelor 232
Răspunsuri la întrebările 236
Capitolul 16. Mostre independente multiple 237
§ 1. Modelul cu un singur factor 237
§ 2. Criteriul Kruskal-Wallis 237
§ 3. Criteriul Jonckheere 245
§ 4. Mersul in avion si in spatiu 248
Probleme 253
Rezolvarea problemelor 254
Răspunsuri la întrebările 257
Capitolul 17. Observații multiple 259
§ 1. Modelul cu doi factori 259
§ 2. Criteriul Friedman 260
§ 3. Criteriul paginii 263
§ 4. Biletul norocos și întoarcerea rătăcirii 265
Probleme 269
Rezolvarea problemelor 270
Răspunsuri la întrebările 271
Capitolul 18: Date grupate 273
§ 1. Conjectura simplă 273
§ 2. Ipoteza complexă 276
§ 3. Verificarea omogenităţii 280
Probleme 282
Rezolvarea problemelor 282
Răspunsuri la întrebările 286
Partea V. Analiza datelor multivariate 287
Capitolul 19. Clasificare 288
§ 1. Normalizare, distante si clase 289
§ 2. Metode euristice 291
§ 3. Proceduri ierarhice 294
§ 4. Algoritmi rapizi 297
§ 5. Funcționale de calitate a partiției 299
§ 6. Număr necunoscut de clase 307
§ 7. Compararea metodelor 309
§ 8. Prezentarea rezultatelor 311
§ 9. Căutare în profunzime 311
Probleme 313
Rezolvarea problemelor 313
Răspunsuri la întrebările 315
Capitolul 20. Corelația 317
§ 1. Geometria componentelor principale 317
§ 2. Elipsoid de împrăștiere 322
§ 3. Calculul componentelor principale 324
§ 4. Scalare liniară 326
§ 5. Scalarea diferenţelor individuale 332
§ 6. Metode neliniare pentru reducerea dimensionalității 337
§ 7. Corelația rangului 343
§ 8. Corelații multiple și parțiale 347
§ 9. Tabelele de situație 350
Probleme 352
Rezolvarea problemelor 353
Răspunsuri la întrebările 356
Capitolul 21. Regresia 357
§ 1. Montarea unei linii 357
§ 2. Modelul de regresie liniară 360
§ 3. Proprietățile statistice ale estimărilor celor mai mici pătrate 363
§ 4. Conjectura generală liniară 368
§ 5. Cele mai mici pătrate ponderate 372
§ 6. Paradoxurile regresiei 376
Probleme 382
Rezolvarea problemelor 383
Răspunsuri la întrebările 386
Partea a VI-a. Generalizări și completări 387
Capitolul 22. Netezirea nucleului 388
§ 1. Estimarea densitatii 388
§ 2. Regresie neparametrică 392
Capitolul 23. Modele cu deplasări multivariate 399
§ 1. Strategia de construire a criteriilor 399
§ 2. Model cu un eșantion 399
§ 3. Modelul cu două mostre 406
Capitolul 24. Problemă la scară cu două eșantioane 411
§ 1. Medianele sunt cunoscute sau egale cu 411
§ 2. Medianele sunt necunoscute și inegale 414
Capitolul 25. Clasele 417
§ 1. L-estime 417
§ 2. M-estima 419
§ 3. D-estime 423
§ 4. Funcția de influență 426
Capitolul 26. Podul Brownian 428
§ 1. Mișcarea browniană 428
§ 2. Proces empiric 429
§ 3. Funcționale diferențiabile 430
Aplicație. Câteva informații din teoria probabilităților și algebra liniară 435
Secțiunea 1. Axiomatica teoriei probabilităților 435
Secțiunea 2. Așteptări și variații 435
Secțiunea 3. Formula de convoluție 437
Secțiunea 4. Inegalități de probabilitate 437
Secțiunea 5. Convergența variabilelor aleatoare și a vectorilor 438
Secțiunea 6. Teoreme limită 439
Secțiunea 7. Așteptări matematice condiționate 440
Secțiunea 8. Transformarea aleatorie a densității vectoriale. . 441
Secțiunea 9. Funcții caracteristice și distribuție normală multivariată 442
Secțiunea 10. Elemente de calcul matriceal 444
Tabelele 449
Literatura 456
Denumiri și abrevieri 460
Index de subiect 462

În fața dumneavoastră, dragă cititor, este rezultatul gândurilor autorului asupra conținutului cursului inițial de statistică matematică. Această carte este, în primul rând, o mulțime de exemple și probleme distractive culese din diverse surse. Sarcinile sunt destinate stăpânirii active a conceptelor și dezvoltării abilităților cititorului în prelucrarea calificată a datelor statistice. Pentru a le rezolva, este suficient să cunoașteți elementele de analiză matematică și teoria probabilității (în anexă sunt date scurte informații despre teoria probabilităților și algebra liniară).
Accentul se pune pe prezentarea vizuală a materialului și explicația informală a acestuia. Teoremele, de regulă, sunt date fără dovezi (cu referire la sursele în care pot fi găsite). Scopul nostru este atât de a lumina cele mai importante idei practic de statistică matematică, cât și de a introduce cititorul în metodele aplicate.
Prima parte a cărții (capitolele 1-5) poate servi ca o introducere în teoria probabilității. O caracteristică specială a acestei părți este abordarea stăpânirii conceptelor de teoria probabilităților prin rezolvarea unui număr de probleme legate de domeniul modelării statistice (simulând aleatorietatea pe un computer). Materialul său este disponibil în principal elevilor de liceu și elevilor din primul an.
Partea a doua și a treia (capitolele 6-13) sunt dedicate, respectiv, estimării parametrilor modelelor statistice și testării ipotezelor. Ele pot fi utile în special pentru studenții care se pregătesc pentru examenul de statistică matematică.
Partea a patra și a cincea (capitolele 14-21) sunt destinate în primul rând persoanelor care doresc să aplice metode statistice pentru a analiza datele experimentale.
În cele din urmă, partea a șasea (capitolele 22-26) include o serie de subiecte mai specializate care rezumă și completează conținutul capitolelor anterioare.
Materialul adunat în carte a fost folosit în mod repetat la cursurile de statistică matematică de la Facultatea de Mecanică și Matematică a Universității de Stat din Moscova. M. V. Lomonosov.
Autorul își va considera lucrarea utilă dacă, după ce a răsfoit cartea, cititorul nu își pierde interesul pentru ea, ci dorește să o citească
cu teoria si aplicatiile statisticii atat din aceasta cat si din alte manuale.
Când lucram la carte, modelul pentru autor a fost populara serie de cărți pentru școlari de Ya I. Perelman. Mi-am dorit, dacă se poate, să folosesc o formă plină de viață de prezentare și un stil caracteristic acestei serii.

VARIABILELE ALEATORII ŞI LEGILE DISTRIBUŢIEI LOR.

Aleatoriu Ei numesc o cantitate care ia valori în funcție de o combinație de circumstanțe aleatorii. Distinge discret și aleatoriu continuu cantități.

Discret O cantitate este numită dacă ia un set numărabil de valori. ( Exemplu: numărul de pacienți la o programare la medic, numărul de litere de pe o pagină, numărul de molecule dintr-un volum dat).

Continuu este o cantitate care poate lua valori într-un anumit interval. ( Exemplu: temperatura aerului, greutatea corporală, înălțimea umană etc.)

Legea distribuției O variabilă aleatorie este un set de valori posibile ale acestei variabile și, corespunzătoare acestor valori, probabilități (sau frecvențe de apariție).

EXEMPLU:

x x 1 x 2 x 3 x 4 ... x n
p p 1 p 2 p 3 p 4 ... p n
x x 1 x 2 x 3 x 4 ... x n
m m 1 m 2 m 3 m 4 ... m n

CARACTERISTICI NUMERICE ALE VARIABILELE ALEATORII.

În multe cazuri, împreună cu distribuția unei variabile aleatoare sau în locul acesteia, informațiile despre aceste mărimi pot fi furnizate prin parametri numerici numiți caracteristicile numerice ale unei variabile aleatorii . Cele mai frecvente dintre ele:

1 .Aşteptare - (valoarea medie) a unei variabile aleatoare este suma produselor tuturor valorilor sale posibile și probabilitățile acestor valori:

2 .Dispersia variabila aleatoare:


3 .Abaterea standard :

Regula „TREI SIGME” - dacă o variabilă aleatoare este distribuită conform unei legi normale, atunci abaterea acestei valori de la valoarea medie în valoare absolută nu depășește de trei ori abaterea standard

LEGEA GAUSS – LEGEA DISTRIBUȚIEI NORMALE

Adesea există cantități distribuite legea normală (legea lui Gauss). Caracteristica principală : este legea limitatoare la care se apropie alte legi ale distributiei.

O variabilă aleatoare este distribuită conform legii normale dacă aceasta densitatea de probabilitate are forma:



M(X)- așteptarea matematică a unei variabile aleatoare;

s- abaterea standard.

Densitatea de probabilitate(funcția de distribuție) arată cum se modifică probabilitatea atribuită unui interval dx variabilă aleatoare, în funcție de valoarea variabilei în sine:


CONCEPTE DE BAZĂ ALE STATISTICII MATEMATICE

Statistică matematică- o ramură a matematicii aplicate adiacentă direct teoriei probabilităților. Principala diferență dintre statistica matematică și teoria probabilității este că statistica matematică nu ia în considerare acțiunile privind legile de distribuție și caracteristicile numerice ale variabilelor aleatoare, ci metodele aproximative pentru găsirea acestor legi și caracteristicile numerice bazate pe rezultatele experimentelor.

Concepte de bază statisticile matematice sunt:

1. Populația generală;

2. eşantion;

3. serie de variații;

4. modă;

5. median;

6. percentila,

7. poligon de frecvență,

8. histogramă.

Populația- o populație statistică mare din care se selectează o parte din obiectele de cercetare

(Exemplu:întreaga populație a regiunii, studenții universitari ai unui oraș dat etc.)

Eșantion (populație eșantion)- un set de obiecte selectate din populația generală.

Seria de variații- distribuția statistică constând din variante (valori ale unei variabile aleatoare) și frecvențele corespunzătoare acestora.

Exemplu:

X, kg
m

x- valoarea unei variabile aleatoare (masa fetelor de 10 ani);

m- frecvența de apariție.

Modă– valoarea variabilei aleatoare care corespunde cu cea mai mare frecvență de apariție. (În exemplul de mai sus, moda corespunde valorii 24 kg, este mai frecventă decât altele: m = 20).

Median– valoarea unei variabile aleatoare care împarte distribuția în jumătate: jumătate dintre valori sunt situate în dreapta medianei, jumătate (nu mai mult) - în stânga.

Exemplu:

1, 1, 1, 1, 1. 1, 2, 2, 2, 3 , 3, 4, 4, 5, 5, 5, 5, 6, 6, 7 , 7, 7, 7, 7, 7, 8, 8, 8, 8, 8 , 8, 9, 9, 9, 10, 10, 10, 10, 10, 10

În exemplu observăm 40 de valori ale variabilei aleatoare. Toate valorile sunt aranjate în ordine crescătoare, ținând cont de frecvența apariției lor. Puteți vedea că în dreapta valorii evidențiate 7 sunt 20 (jumătate) din cele 40 de valori. Prin urmare, 7 este mediana.

Pentru a caracteriza împrăștierea, vom găsi valori nu mai mari de 25 și 75% din rezultatele măsurătorii. Aceste valori se numesc 25 și 75 percentile . Dacă mediana împarte distribuția la jumătate, atunci percentilele 25 și 75 sunt tăiate cu un sfert. (Apropo, mediana în sine poate fi considerată a 50-a percentila.) După cum se poate vedea din exemplu, a 25-a și a 75-a percentile sunt egale cu 3 și, respectiv, 8.

Utilizare discret (punct) distribuția statistică și continuu (interval) distribuție statistică.

Pentru claritate, distribuțiile statistice sunt reprezentate grafic în formular gama de frecvente sau - histogramelor .

Poligon de frecvență- o linie întreruptă, ale cărei segmente conectează puncte cu coordonate ( x 1,m 1), (x2,m2), ..., sau pentru poligon de frecvență relativă – cu coordonate ( x 1,р * 1), (x 2,r * 2), ...(Fig.1).


m m i /n f(x)

Fig.1 Fig.2

Histograma de frecventa- un set de dreptunghiuri adiacente construite pe o linie dreaptă (Fig. 2), bazele dreptunghiurilor sunt aceleași și egale dx , iar înălțimile sunt egale cu raportul de frecvență la dx , sau p* La dx (densitatea probabilității).

Exemplu:

x, kg 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4
m

Poligon de frecvență

Se numește raportul dintre frecvența relativă și lățimea intervalului densitatea de probabilitate f(x)=m i / n dx = p* i / dx

Un exemplu de construire a unei histograme .

Să folosim datele din exemplul anterior.

1. Calculul numărului de intervale de clasă

Unde n - numărul de observații. În cazul nostru n = 100 . Prin urmare:

2. Calculul lățimii intervalului dx :

,

3. Întocmirea unei serii de intervale:

dx 2.7-2.9 2.9-3.1 3.1-3.3 3.3-3.5 3.5-3.7 3.7-3.9 3.9-4.1 4.1-4.3 4.3-4.5
m
f(x) 0.3 0.75 1.25 0.85 0.55 0.6 0.4 0.25 0.05

Histogramă

Statistica matematică este una dintre principalele ramuri ale științei matematicii și este o ramură care studiază metode și reguli de prelucrare a anumitor date. Cu alte cuvinte, explorează modalități de a descoperi modele care sunt caracteristice populațiilor mari de obiecte identice, pe baza eșantionării acestora.

Obiectivul acestei secțiuni este de a construi metode de evaluare a probabilității sau de luare a unei anumite decizii cu privire la natura evenimentelor în curs de dezvoltare, pe baza rezultatelor obținute. Tabelele, diagramele și câmpurile de corelare sunt folosite pentru a descrie datele. rar folosit.

Statisticile matematice sunt folosite în diverse domenii ale științei. De exemplu, pentru economie este important să procesăm informații despre seturi omogene de fenomene și obiecte. Pot fi produse produse de industrie, personal, date de profit etc. În funcție de natura matematică a rezultatelor observației, putem distinge statistici de numere, analiza funcțiilor și obiectelor de natură nenumerică, analiza multidimensională. În plus, sunt luate în considerare probleme generale și specifice (legate de recuperarea dependențelor, utilizarea clasificărilor și cercetarea selectivă).

Autorii unor manuale cred că teoria statisticii matematice este doar o secțiune a teoriei probabilității, altele - că este o știință independentă cu propriile sale scopuri, obiective și metode. Cu toate acestea, în orice caz, utilizarea sa este foarte extinsă.

Astfel, statistica matematică este cel mai clar aplicabilă în psihologie. Utilizarea acestuia va permite unui specialist să justifice corect găsirea relației dintre date, să le generalizeze, să evite multe erori logice și multe altele. Trebuie remarcat faptul că deseori este pur și simplu imposibil să măsurați un anumit fenomen psihologic sau o trăsătură de personalitate fără proceduri computaționale. Acest lucru sugerează că bazele acestei științe sunt necesare. Cu alte cuvinte, poate fi numită sursa și baza teoriei probabilităților.

Metoda de cercetare, care se bazează pe luarea în considerare a datelor statistice, este utilizată în alte domenii. Cu toate acestea, trebuie remarcat imediat că caracteristicile sale, atunci când sunt aplicate obiectelor de diferite naturi de origine, sunt întotdeauna unice. Prin urmare, nu are sens să combine știința fizică într-o singură știință. Caracteristicile generale ale acestei metode se rezumă la numărarea unui anumit număr de obiecte care sunt incluse într-un anumit grup, precum și la studierea distribuției caracteristicilor cantitative și la aplicarea teoriei probabilităților pentru a obține anumite concluzii.

Elementele de statistică matematică sunt utilizate în domenii precum fizica, astronomia etc. Aici, pot fi luate în considerare valorile caracteristicilor și parametrilor, ipotezele despre coincidența oricăror caracteristici în două eșantioane, simetria distribuției și multe altele. .

Statistica matematică joacă un rol major în realizarea cercetării lor. Scopul lor este cel mai adesea să construiască metode adecvate de estimare și să testeze ipoteze. În prezent, tehnologia computerelor este de mare importanță în această știință. Ele permit nu numai simplificarea semnificativă a procesului de calcul, ci și crearea de eșantioane pentru multiplicare sau atunci când se studiază caracterul adecvat al rezultatelor obținute în practică.

În general, metodele statisticii matematice ajută la tragerea a două concluzii: fie să accepte judecata dorită cu privire la natura sau proprietățile datelor studiate și relațiile dintre acestea, fie să se demonstreze că rezultatele obținute nu sunt suficiente pentru a trage concluzii.

„Unii oameni cred că au întotdeauna dreptate. Astfel de oameni nu puteau fi nici oameni de știință buni și nici nu au vreun interes pentru statistică... Cazul a fost adus cu picioarele pe pământ, unde a devenit parte din lumea științei.” (Diamand S.)

„Șansa este doar măsura ignoranței noastre. Fenomenele întâmplătoare, dacă le definim, vor fi acelea ale căror legi nu le cunoaștem.” (A. Poincaré „Știință și ipoteză”)

„Mulțumesc Domnului. Nu este cazul
Mereu la egalitate cu imuabilul...
Șansa conduce adesea evenimentul,
Generează atât bucurie, cât și durere.
Și viața ne pune o sarcină înaintea noastră:
Cum să înțelegi rolul întâmplării"
(din cartea „Matematica studiază aleatorietatea” de B.A. Kordemsky)

Lumea în sine este naturală - așa considerăm și studiem adesea legile fizicii, chimiei etc., și totuși nimic nu se întâmplă fără intervenția întâmplării, care apare sub influența unor relații cauzale instabile, laterale, care schimbă cursul un fenomen sau o experiență când se repetă. Un „efect aleatoriu” este creat cu regularitatea inerentă a „predeterminarii ascunse”, adică. șansa are nevoie de un rezultat natural.

Matematicienii consideră evenimente aleatorii doar în dilema „a fi sau a nu fi” - dacă se va întâmpla sau nu.

Definiţie. Ramura matematicii aplicate în care sunt studiate caracteristicile cantitative ale evenimentelor sau fenomenelor aleatoare de masă se numește statistici matematice.

Definiţie. Se numește combinația de elemente de teoria probabilității și statistică matematică stocastice.

Definiţie. Stochastică- aceasta este ramura matematicii care a luat naștere și se dezvoltă în strânsă legătură cu activitățile practice ale omului. Astăzi, elementele de stocastică sunt incluse în matematică pentru toată lumea, devenind un aspect nou, important al educației matematice și generale.

Definiţie. Statistică matematică– știința metodelor matematice de sistematizare, prelucrare și utilizare a datelor statistice pentru concluzii științifice și practice.

Să vorbim despre asta mai detaliat.

Viziunea general acceptată acum este că statistica matematică este știința metodelor generale de procesare a rezultatelor experimentale. În rezolvarea acestor probleme, ce trebuie să aibă un experiment pentru ca judecățile făcute pe baza lui să fie corecte? Statistica matematică devine, în parte, știința designului experimental.

Sensul cuvântului „statistică” a suferit modificări semnificative în ultimele două secole, scriu celebrii oameni de știință moderni Hodges și Lehman, „cuvântul „statistică” are aceeași rădăcină ca și cuvântul „stat” (stat) și inițial a însemnat arta. și știința managementului: primii profesori de statistică din universități Germania secolului al XVIII-lea s-ar numi astăzi oameni de științe sociale. Deoarece deciziile guvernamentale se bazează într-o oarecare măsură pe date despre populație, industrie etc. statisticienii, firesc, au început să fie interesați de astfel de date și, treptat, cuvântul „statistică” a început să însemne colectarea de date despre populație, despre stat, apoi colectarea și prelucrarea datelor în general. Nu are rost să extragem date decât dacă ceva util vine din ele, iar statisticienii se implică în mod natural în interpretarea datelor.

Statisticianul modern studiază metode prin care se pot face inferențe despre o populație din datele obținute de obicei dintr-un eșantion al „populației”.

Definiţie. Statistician– persoană care se ocupă de știința metodelor matematice de sistematizare, prelucrare și utilizare a datelor statistice pentru concluzii științifice și practice.

Statistica matematică a apărut în secolul al XVII-lea și s-a dezvoltat în paralel cu teoria probabilității. Dezvoltarea ulterioară a statisticii matematice (a doua jumătate a secolului al XIX-lea și începutul secolului al XX-lea) se datorează, în primul rând, lui P.L. Cebyshev, A.A. Markov, A.M. Lyapunov, K. Gauss, A. Quetelet, F. Galton, K. Pearson și alții În al 20-lea, cea mai semnificativă contribuție la statistica matematică a fost făcută de A.N. Kolmogorov, V.I. Romanovsky, E.E. Slutsky, N.V. Smirnov, B.V. Gnedenko, precum și studentul englez, R. Fisher, E. Purson și oamenii de știință americani (Y. Neumann, A. Wald).

Probleme de statistică matematică și semnificația erorii în lumea științei

Stabilirea tiparelor la care sunt supuse fenomenele aleatoare de masă se bazează pe studiul datelor statistice din rezultate observaționale folosind metodele teoriei probabilităților.

Prima sarcină a statisticii matematice este de a indica modalități de culegere și grupare a informațiilor statistice obținute ca urmare a observațiilor sau ca urmare a experimentelor special concepute.

A doua sarcină a statisticii matematice este de a dezvolta metode de analiză a datelor statistice în funcție de obiectivele studiului.

Statistica matematică modernă dezvoltă metode pentru determinarea numărului de teste necesare înainte de începerea unui studiu (planificarea experimentului) și în timpul studiului (analiza secvențială). Poate fi definită ca știința luării deciziilor în condiții de incertitudine.

Pe scurt, putem spune că sarcina statisticii matematice este de a crea metode de colectare și prelucrare a datelor statistice.

Când se studiază un fenomen aleatoriu de masă, se presupune că toate testele sunt efectuate în aceleași condiții, adică grupul de factori principali care pot fi luați în considerare (măsurabil) și au un impact semnificativ asupra rezultatului testului păstrează aceleași valori pe cât posibil.

Factorii aleatori distorsionează rezultatul care ar fi fost obținut dacă ar fi fost prezenți doar factorii principali, făcându-l aleatoriu. Abaterea rezultatului fiecărei încercări de la cel adevărat se numește eroare de observare, care este o variabilă aleatorie. Este necesar să se facă distincția între erorile sistematice și aleatorii.

Un experiment științific este la fel de de neconceput fără eroare ca un ocean fără sare. Orice flux de fapte care se adaugă la cunoștințele noastre aduce un fel de eroare. Potrivit unei zicale binecunoscute în viață, majoritatea oamenilor nu pot fi siguri de nimic, în afară de moarte și taxe, iar omul de știință adaugă: „Și erorile experienței”.

Un statistician este un „ogăr” care vânează erori. Instrument statistic pentru detectarea erorilor.

Cuvântul „eroare” nu înseamnă o simplă „calcul greșit”. Consecințele unei erori de calcul sunt o sursă mică și relativ neinteresantă de eroare experimentală.

Într-adevăr, instrumentele noastre se sparg; ochii și urechile noastre ne pot înșela; măsurătorile noastre nu sunt niciodată complet precise, uneori chiar și calculele noastre aritmetice sunt eronate. O eroare experimentală este ceva mai semnificativ decât o bandă de măsură inexactă sau o iluzie optică. Și din moment ce cea mai importantă sarcină a statisticilor este de a ajuta oamenii de știință să analizeze eroarea unui experiment, trebuie să încercăm să înțelegem ce este cu adevărat o eroare.

Indiferent de problema la care lucrează un om de știință, cu siguranță se va dovedi a fi mai complexă decât și-ar dori. Să presupunem că măsoară precipitațiile radioactive la diferite latitudini. Rezultatele vor depinde de altitudinea unde sunt colectate probele, de cantitatea de precipitații locale și de altitudinea ciclonilor pe o zonă mai largă.

Eroarea experimentală este o parte integrantă a oricărui experiment cu adevărat științific.

Același rezultat poate fi eroare și informații în funcție de problemă și punct de vedere. Dacă un biolog dorește să investigheze modul în care schimbările în nutriție afectează creșterea, atunci prezența unei constituții înrudite este o sursă de eroare; dacă studiază relația dintre ereditate și creștere, sursa erorii va fi diferențele de nutriție. Dacă un fizician dorește să studieze relația dintre conductibilitatea electrică și temperatură, diferențele de densitate a materialului conductor sunt o sursă de eroare; dacă studiază relația dintre această densitate și conductibilitatea electrică, schimbările de temperatură vor fi o sursă de eroare.

Această utilizare a cuvântului eroare poate părea dubioasă și ar putea fi de preferat să spunem că efectele obținute sunt confundate de influențe „neintenționate” sau „indezirabile”. Proiectăm un experiment pentru a studia influențele cunoscute, dar factorii aleatori pe care nu îi putem prezice sau analiza deformează rezultatele prin adăugarea propriilor efecte.

Diferența dintre efectele planificate și efectele datorate unor cauze aleatoare este ca diferența dintre mișcările unei nave pe mare, care navighează de-a lungul unui anumit curs și o navă care derivă fără țintă sub dorința vântului și a curenților în schimbare. Mișcarea celui de-al doilea vas poate fi numită mișcare aleatorie. Este posibil ca această navă să ajungă într-un anumit port, dar este mai probabil să nu ajungă într-un loc anume.

Statisticienii folosesc cuvântul „aleatoriu” pentru a desemna un fenomen al cărui rezultat în momentul următor este complet imposibil de prezis.

Eroarea cauzată de efectele prevăzute în experiment este uneori mai sistematică decât întâmplătoare.

Eroarea sistematică este mai înșelătoare decât eroarea aleatorie. Interferența provenită de la un alt post de radio poate crea un acompaniament muzical sistematic pe care uneori îl puteți prezice dacă cunoașteți melodia. Dar acest „acompaniament” poate fi motivul pentru care putem face o judecată incorectă asupra cuvintelor sau muzicii programului pe care încercăm să-l auzim.

Cu toate acestea, descoperirea unei erori sistematice ne duce adesea pe urmele unei noi descoperiri. Cunoașterea modului în care apar erorile aleatorii ne ajută să detectăm erorile sistematice și, prin urmare, să le eliminăm.

Aceeași natură a raționamentului este comună în treburile noastre de zi cu zi. Cât de des observăm: „Acesta nu este un accident!” Ori de câte ori putem spune asta, suntem pe calea descoperirii.

De exemplu, A.L. Chizhevsky, analizând procese istorice: mortalitate crescută, epidemii, izbucniri de războaie, mari mișcări ale popoarelor, schimbări climatice bruște etc. a descoperit relația dintre aceste procese nelegate și perioadele de activitate solară, care au cicluri: 11 ani, 33 de ani.

Definiţie. Sub eroare sistematică este înțeles ca o eroare care se repetă și aceeași pentru toate testele. De obicei, este asociat cu desfășurarea necorespunzătoare a experimentului.

Definiţie. Sub greșeli aleatorii se referă la erori care apar sub influența unor factori aleatori și variază aleatoriu de la experiment la experiment.

De obicei, distribuția erorilor aleatoare este simetrică față de zero, din care rezultă o concluzie importantă: în absența erorilor sistematice, adevăratul rezultat al testului este așteptarea matematică a unei variabile aleatoare, a cărei valoare specifică este fixată în fiecare test.

Obiectele de studiu în statistica matematică pot fi caracteristici calitative sau cantitative ale fenomenului sau procesului studiat.

În cazul unei caracteristici calitative, se numără numărul de apariții ale acestei caracteristici în seria de experimente luată în considerare; acest număr reprezintă variabila aleatoare (discretă) studiată. Exemple de atribute de calitate includ defecte ale unei piese finite, date demografice etc. Dacă caracteristica este cantitativă, atunci în experiment se fac măsurători directe sau indirecte prin comparație cu un standard - o unitate de măsură - folosind diverse instrumente de măsură. De exemplu, dacă există un lot de piese, atunci standardul piesei poate servi ca semn calitativ, iar dimensiunea controlată a piesei poate servi ca semn cantitativ.

Definiții de bază

O parte semnificativă a statisticilor matematice este asociată cu necesitatea de a descrie o colecție mare de obiecte.

Definiţie. Se numește întregul set de obiecte de studiat populatia generala.

Populația generală poate fi întreaga populație a țării, producția lunară a unei plante, populația de pești care trăiesc într-un anumit rezervor etc.

Dar populația nu este doar un set. Dacă setul de obiecte care ne interesează este prea numeros, sau obiectele sunt greu accesibile, sau există alte motive care nu ne permit să studiem toate obiectele, apelăm la studierea unei părți a obiectelor.

Definiţie. Se numește acea parte a obiectelor care a fost supusă inspecției, cercetării etc populația eșantionului sau doar prelevarea de probe.

Definiţie. Numărul de elemente din populație și eșantion se numește lor volumele.

Cum să ne asigurăm că eșantionul reprezintă cel mai bine întregul, de ex. ar fi reprezentativ?

Dacă întregul, adică dacă populația ne este puțin sau complet necunoscută, nu putem oferi nimic mai bun decât o selecție pur aleatorie. O mai mare conștientizare vă permite să acționați mai bine, dar totuși, la un moment dat, se instalează ignoranța și, ca urmare, alegerea întâmplătoare.

Dar cum să faci o alegere pur aleatorie? De regulă, selecția are loc în funcție de caracteristici ușor de observat, de dragul cărora se efectuează cercetări.

Încălcarea principiilor selecției aleatorii a dus la erori grave. Un sondaj realizat de revista americană Literary Review cu privire la rezultatul alegerilor prezidențiale din 1936 a devenit faimos pentru eșecul acestuia. Candidații la aceste alegeri au fost F.D. Roosevelt și A.M. Landon.

Cine a câștigat?

Editorii au folosit cărțile telefonice ca populație generală. După ce a selectat aleatoriu 4 milioane de adrese, ea a trimis cărți poștale întrebând despre atitudinile față de candidații la președinție din întreaga țară. După ce a cheltuit o sumă importantă pentru corespondență și procesarea cărților poștale, revista a anunțat că Landon va câștiga viitoarele alegeri prezidențiale cu o zdrobire. Rezultatul alegerilor a fost opusul acestei prognoze.

Aici s-au făcut două greșeli deodată. În primul rând, cărțile telefonice nu oferă un eșantion reprezentativ al populației SUA - în mare parte șefi de gospodării bogați. În al doilea rând, nu toți oamenii au trimis răspunsuri, ci în mare parte din partea reprezentanților lumii de afaceri, care l-au susținut pe Landon.

În același timp, sociologii J. Gallan și E. Warner au prezis corect victoria lui F.D. Roosevelt, bazat doar pe patru mii de chestionare. Motivul acestui succes nu a fost doar eșantionarea corectă. Au ținut cont de faptul că societatea este împărțită în grupuri sociale mai omogene în raport cu candidații la președinție. Prin urmare, proba din strat poate fi relativ mică, cu același rezultat de precizie. În cele din urmă, Roosevelt, care a fost un susținător al reformelor pentru secțiunile mai puțin bogate ale populației, a câștigat.

Având rezultatele sondajului pe straturi, este posibil să se caracterizeze societatea în ansamblu.

Ce sunt mostrele?

Acestea sunt serii de numere.

Să ne oprim mai în detaliu asupra conceptelor de bază care caracterizează seria de mostre.

Din populația generală a fost extras un eșantion de mărime n > n 1, unde n 1 este de câte ori a fost observată apariția lui x 1, n 2 - x 2 etc.

Valorile observate ale lui x i se numesc variante, iar succesiunea de variante scrise în ordine crescătoare se numește serie de variații. Numerele de observații n i se numesc frecvențe și n i /n - frecvențe relative (sau frecvențe).

Definiţie. Sunt numite diferite valori ale unei variabile aleatorii opțiuni.

Definiţie. Seria de variații este o serie aranjată în ordine crescătoare (sau descrescătoare) de opțiuni cu frecvențele (frecvențele) corespunzătoare.

La studierea seriei de variații, împreună cu conceptele de frecvență, se folosește conceptul de frecvență acumulată. Frecvențele (frecvențele) acumulate pentru fiecare interval sunt găsite prin însumarea secvenţială a frecvenţelor tuturor intervalelor anterioare.

Definiţie. Acumularea de frecvențe sau frecvențe se numește cumul. Puteți cumula frecvențe și intervale.

Caracteristicile unei serii pot fi cantitative și calitative.

Caracteristici cantitative (variaționale).- Acestea sunt caracteristici care pot fi exprimate în numere. Ele sunt împărțite în discrete și continue.

Caracteristici calitative (atributive).– acestea sunt caracteristici care nu sunt exprimate în cifre.

Variabile continue sunt variabile care sunt exprimate ca numere reale.

Variabile discrete sunt variabile care pot fi exprimate doar ca numere întregi.

Probele sunt caracterizate tendinte centrale: medie, mod și mediană. Valoarea medie a unui eșantion este media aritmetică a tuturor valorilor sale. Modul de eșantionare este acele valori care apar cel mai des. Mediana eșantionului este numărul care „împarte” în jumătate din populația ordonată a tuturor valorilor din eșantion.

Seria de variații poate fi discretă sau continuă.

Sarcină

Probă dată: 1,3; 1,8; 1,2; 3,0; 2.1; 5; 2,4; 1,2; 3,2;1,2; 4; 2.4.

Aceasta este o serie de opțiuni. Aranjând aceste opțiuni în ordine crescătoare, obținem o serie de variații: 1.2; 1,2; 1,2; 1,3; 1,8; 2.1; 2,4; 2,4; 3,0; 3,2; 4; 5.

Valoarea medie a acestei serii este 2,4.

Mediana seriei este 2,25.

Modul seriei este –1,2.

Să definim aceste concepte.

Definiţie. Mediana seriei de variații Se numește valoarea variabilei aleatoare care se încadrează la mijlocul seriei de variații (Me).

Mediana unei serii ordonate de numere cu un număr impar de termeni este numărul scris în mijloc, iar mediana unei serii ordonate de numere cu un număr par de termeni este media aritmetică a celor două numere scrise în mijloc. Mediana unei serii arbitrare de numere este mediana seriei ordonate corespunzătoare.

Definiţie. Seria de variații de modă Ei apelează la opțiunea (valoarea variabilei aleatoare) căreia îi corespunde cea mai mare frecvență (Mo), adică. care apare mai des decât altele.

Definiţie. Valoarea medie aritmetică a seriei de variații este rezultatul împărțirii sumei valorilor unei variabile statistice la numărul acestor valori, adică la numărul de termeni.

Regula pentru găsirea mediei aritmetice a unui eșantion:

  1. înmulțiți fiecare opțiune cu frecvența ei (multiplicitatea);
  2. adunați toate produsele rezultate;
  3. împărțiți suma găsită la suma tuturor frecvențelor.

Definiţie. Interval de rând se numește diferența dintre R=x max -x min, adică. cele mai mari și cele mai mici valori ale acestor opțiuni.

Să verificăm dacă am găsit corect valoarea medie a acestei serii, mediană și mod, pe baza definițiilor.

Am numărat numărul de termeni, sunt 12 dintre ei - un număr par de termeni, ceea ce înseamnă că trebuie să găsim media aritmetică a celor două numere scrise în mijloc, adică a 6-a și a 7-a opțiune. (2,1+2,4)\2=2,25 – mediană.

Modă. Moda este 1.2, pentru că doar acest număr apare de 3 ori, iar restul apar de mai puțin de 3 ori.

Găsim media aritmetică astfel:

(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4

Să facem o masă

Astfel de tabele se numesc tabele de frecvență. În ele, numerele din a doua linie sunt frecvențe; ele arată cât de des apar anumite valori în eșantion.

Definiţie. Frecvența relativă valorile eșantionului este raportul dintre frecvența sa și numărul tuturor valorilor eșantionului.

Frecvențele relative sunt altfel numite frecvențe. Frecvențele și frecvențele se numesc scale. Să găsim intervalul seriei: R=5-1,2=3,8; Gama seriei este de 3,8.

Mâncare de gândit

Media aritmetică este o valoare convențională. In realitate nu exista. În realitate există o sumă totală. Prin urmare, media aritmetică nu este o caracteristică a unei singure observații; caracterizează seria în ansamblu.

Valoarea medie poate fi interpretat ca centrul de dispersie al valorilor caracteristicii observate, adică valoare în jurul căreia toate valorile observate fluctuează, iar suma algebrică a abaterilor de la medie este întotdeauna zero, adică suma abaterilor de la medie în sus sau în jos este egală.

Media aritmetică este o cantitate abstractă (generalizatoare). Chiar și atunci când se specifică o serie de numere naturale, valoarea medie poate fi exprimată ca o fracție. Exemplu: scorul mediu la test este 3,81.

Valoarea medie se găseşte nu numai pentru cantităţi omogene. Randamentul mediu de cereale pe toată țara (porumb - 50-60 cenți la hectar și hrișcă - 5-6 cenți la hectar, secară, grâu etc.), consumul mediu de alimente, venitul național mediu pe cap de locuitor, oferta medie de locuințe, locuința medie ponderată costul, intensitatea medie a forței de muncă pentru construcția clădirii etc. - acestea sunt caracteristicile statului ca sistem economic unic național, acestea sunt așa-numitele medii de sistem.

În statistică, astfel de caracteristici precum mod și mediană. Se numesc medii structurale, deoarece valorile acestor caracteristici sunt determinate de structura generală a seriei de date.

Uneori, o serie poate avea două moduri, alteori o serie poate să nu aibă niciun mod.

Modă este cel mai acceptabil indicator la identificarea ambalajului unui anumit produs, care este preferat de cumpărători; prețuri pentru mărfuri de un anumit tip, comune pe piață; ca dimensiunea pantofilor, hainelor, care este cea mai mare cerere; un sport în care preferă să se angajeze majoritatea populației unei țări, oraș, sat, școală etc.

În construcție, există 8 opțiuni pentru plăci în lățime și sunt mai des utilizate 3 tipuri: 1 m, 1,2 m și 1,5 m în lungime, există 33 de opțiuni pentru plăci, dar cele mai des sunt plăcile cu o lungime de 4,8 m folosit; 5,7 m și 6,0 m, moda plăcii se găsește cel mai des printre aceste 3 dimensiuni. Același lucru se poate spune despre mărcile de ferestre.

Modul unei serii de date este găsit atunci când se dorește identificarea unui indicator tipic.

Modul poate fi exprimat în numere și cuvinte din punct de vedere statistic, modul este un extrem de frecvență.

Median vă permite să luați în considerare informații despre o serie de date care sunt date de media aritmetică și invers.