Statistica matematică este o metodologie care vă permite să luați decizii informate în fața unor condiții incerte. Studiul metodelor de colectare și sistematizare a datelor, procesarea rezultatelor finale ale experimentelor și experimentelor cu caracter aleatoriu în masă și descoperirea oricăror modele este ceea ce face această ramură a matematicii. Luați în considerare conceptele de bază ale statisticii matematice.
Diferența cu teoria probabilității
Metodele statisticii matematice se intersectează îndeaproape cu teoria probabilității. Ambele ramuri ale matematicii se ocupă cu studiul a numeroase fenomene aleatorii. Cele două discipline sunt legate prin teoreme limită. Cu toate acestea, există o mare diferență între aceste științe. Dacă teoria probabilității determină caracteristicile unui proces din lumea reală pe baza unui model matematic, atunci statistica matematică face opusul - stabilește proprietățile modelului lape baza informațiilor observate.
Pași
Aplicarea statisticilor matematice poate fi efectuată numai în legătură cu evenimente sau procese aleatorii sau, mai degrabă, cu datele obținute din observarea lor. Și asta se întâmplă în mai multe etape. În primul rând, datele experimentelor și experimentelor sunt supuse unei anumite procesări. Sunt comandate pentru claritate și ușurință de analiză. Apoi se face o estimare exactă sau aproximativă a parametrilor necesari procesului aleatoriu observat. Acestea pot fi:
- evaluarea probabilității unui eveniment (probabilitatea acestuia este inițial necunoscută);
- studiarea comportamentului unei funcții de distribuție nedefinită;
- estimare de așteptare;
- estimarea variației
- etc.
A treia etapă este verificarea oricăror ipoteze stabilite înainte de analiză, adică obținerea unui răspuns la întrebarea cum rezultatele experimentelor corespund calculelor teoretice. De fapt, aceasta este etapa principală a statisticii matematice. Un exemplu ar fi să luăm în considerare dacă comportamentul unui proces aleatoriu observat se află în distribuția normală.
Populație
Conceptele de bază ale statisticii matematice includ populațiile generale și eșantionul. Această disciplină se ocupă de studiul unui set de anumite obiecte cu privire la o anumită proprietate. Un exemplu este munca unui taximetrist. Luați în considerare aceste variabile aleatoare:
- încărcare sau numărul de clienți: pe zi, înainte de prânz, după prânz, …;
- timp mediu de călătorie;
- numărul de aplicații primite sau atașarea acestora la cartierele orașului și multe altele.
De remarcat, de asemenea, este posibil să se studieze un set de procese aleatoare similare, care va fi, de asemenea, o variabilă aleatoare care poate fi observată.
Deci, în metodele statisticii matematice, întregul set de obiecte studiate sau rezultatele diferitelor observații care sunt efectuate în aceleași condiții asupra unui obiect dat se numește populație generală. Cu alte cuvinte, matematic mai strict, este o variabilă aleatoare care este definită în spațiul evenimentelor elementare, cu o clasă de submulțimi desemnate în ea, ale căror elemente au o probabilitate cunoscută.
Populație eșantion
Există cazuri când este imposibil sau nepractic din anumite motive (cost, timp) să se efectueze un studiu continuu pentru a studia fiecare obiect. De exemplu, deschiderea fiecărui borcan de gem sigilat pentru a-i verifica calitatea este o decizie dubioasă, iar încercarea de a estima traiectoria fiecărei molecule de aer într-un metru cub este imposibilă. În astfel de cazuri, se folosește metoda observației selective: un anumit număr de obiecte sunt selectate (de obicei aleatoriu) din populația generală și sunt supuse analizei lor.
Aceste concepte pot părea complicate la început. Prin urmare, pentru a înțelege pe deplin subiectul, trebuie să studiați manualul lui V. E. Gmurman „Teoria probabilității și statistica matematică”. Astfel, un set sau eșantion de eșantionare este o serie de obiecte selectate la întâmplare din setul general. În termeni matematici stricti, aceasta este o succesiune de variabile aleatoare independente, distribuite uniform, pentru fiecare dintre acestea distribuția coincide cu cea indicată pentru variabila aleatoare generală.
Concepte de bază
Să luăm în considerare pe scurt o serie de alte concepte de bază ale statisticii matematice. Numărul de obiecte din populația generală sau eșantion se numește volum. Valorile eșantionului care sunt obținute în timpul experimentului se numesc realizarea eșantionului. Pentru ca o estimare a populației generale bazată pe un eșantion să fie fiabilă, este important să existe un așa-zis eșantion reprezentativ sau reprezentativ. Aceasta înseamnă că eșantionul trebuie să reprezinte pe deplin populația. Acest lucru poate fi realizat numai dacă toate elementele populației au o probabilitate egală de a fi în eșantion.
Eșantioanele fac diferența între returnare și non-retur. În primul caz, în conținutul eșantionului, elementul repetat este returnat la mulțimea generală, în al doilea caz, nu este. De obicei, în practică, se utilizează eșantionarea fără înlocuiri. De asemenea, trebuie menționat că dimensiunea populației generale depășește întotdeauna semnificativ dimensiunea eșantionului. Existamulte opțiuni pentru procesul de eșantionare:
- simple - articolele sunt selectate aleatoriu pe rând;
- typed - populația generală este împărțită în tipuri și se face o alegere din fiecare; un exemplu este un sondaj asupra rezidenților: bărbați și femei separat;
- mecanic - de exemplu, selectați fiecare al 10-lea element;
- serial - selecția se face în serii de elemente.
Distribuție statistică
După Gmurman, teoria probabilității și statistica matematică sunt discipline extrem de importante în lumea științifică, mai ales în partea ei practică. Luați în considerare distribuția statistică a eșantionului.
Să presupunem că avem un grup de studenți care au fost testați la matematică. Ca rezultat, avem un set de estimări: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - acesta este materialul nostru statistic principal.
În primul rând, trebuie să-l sortăm sau să facem o operație de clasare: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - și astfel obținem o serie variațională. Numărul de repetări ale fiecăreia dintre evaluări se numește frecvența evaluării, iar raportul lor la dimensiunea eșantionului se numește frecvență relativă. Să facem un tabel cu distribuția statistică a eșantionului sau doar o serie statistică:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
sau
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Să avem o variabilă aleatoare pe care vom efectua o serie de experimente și să vedem ce valoare ia această variabilă. Să presupunem că a luat valoarea a1 - m1 de ori; a2 - m2 de ori etc. Mărimea acestui eșantion va fi m1 + … + mk=m. Setul ai, unde i variază de la 1 la k, este o serie statistică.
Distribuție pe intervale
În cartea lui VE Gmurman „Teoria probabilității și statistica matematică” este prezentată și o serie statistică pe intervale. Compilarea sa este posibilă atunci când valoarea caracteristicii studiate este continuă într-un anumit interval, iar numărul de valori este mare. Luați în considerare un grup de studenți, sau mai degrabă, înălțimea lor: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 173, 173, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 de elevi în total. Evident, înălțimea unei persoane este o valoare continuă. Trebuie să definim pasul de interval. Pentru aceasta, se folosește formula Sturges.
h= | max - min | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
Astfel, valoarea lui 6 poate fi luată ca mărime a intervalului. De asemenea, trebuie spus că valoarea 1+log2m este formula pentrudeterminarea numărului de intervale (desigur, cu rotunjire). Astfel, conform formulelor, se obțin 6 intervale, fiecare având dimensiunea de 6. Iar prima valoare a intervalului inițial va fi numărul determinat de formula: min - h / 2=156 - 6/2=153. Să facem un tabel care să conțină intervale și numărul de elevi a căror creștere a scăzut într-un anumit interval.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Desigur, asta nu este tot, pentru că există mult mai multe formule în statistica matematică. Am luat în considerare doar câteva concepte de bază.
Program de distribuție
Conceptele de bază ale statisticii matematice includ și o reprezentare grafică a distribuției, care se distinge prin claritate. Există două tipuri de grafice: poligon și histogramă. Primul este utilizat pentru o serie statistică discretă. Și pentru distribuție continuă, respectiv, a doua.