Distribuție Pearson: definiție, aplicare

Cuprins:

Distribuție Pearson: definiție, aplicare
Distribuție Pearson: definiție, aplicare
Anonim

Care este legea distribuției lui Pearson? Răspunsul la această întrebare largă nu poate fi simplu și concis. Sistemul Pearson a fost conceput inițial pentru a modela observațiile vizibile distorsionate. La acea vreme, se știa bine cum să reglați un model teoretic pentru a se potrivi cu primii doi cumulanți sau momente ale datelor observate: orice distribuție de probabilitate poate fi extinsă direct pentru a forma un grup de scale de locație.

Ipoteza lui Pearson despre distribuția normală a criteriilor

Cu excepția cazurilor patologice, scala de localizare poate fi făcută pentru a se potrivi cu media observată (primul cumulant) și varianța (al doilea cumulant) într-o manieră arbitrară. Cu toate acestea, nu se știa cum să se construiască distribuții de probabilitate în care asimetria (al treilea cumul standardizat) și curtoza (al patrulea cumulant standardizat) să poată fi controlate la fel de liber. Această nevoie a devenit evidentă atunci când s-a încercat să se potrivească modelele teoretice cunoscute la datele observate,care a arătat asimetrie.

În videoclipul de mai jos puteți vedea analiza distribuției chi a lui Pearson.

Image
Image

Istorie

În lucrarea sa originală, Pearson a identificat patru tipuri de distribuții (numerotate de la I la IV) în plus față de distribuția normală (care a fost cunoscută inițial ca tipul V). Clasificarea depinde dacă distribuțiile sunt susținute pe un interval limitat, pe o semiaxă sau pe întreaga linie reală și dacă au fost potențial deformate sau neapărat simetrice.

În a doua lucrare au fost corectate două omisiuni: el a redefinit distribuția de tip V (inițial era doar distribuția normală, dar acum cu gamma inversă) și a introdus distribuția de tip VI. Împreună, primele două articole acoperă cele cinci tipuri principale ale sistemului Pearson (I, III, IV, V și VI). În a treia lucrare, Pearson (1916) a introdus subtipuri suplimentare.

Funcții de distribuție Pearson
Funcții de distribuție Pearson

Îmbunătățiți conceptul

Rind a inventat o modalitate simplă de a vizualiza spațiul parametrilor sistemului Pearson (sau distribuția criteriilor), pe care l-a adoptat ulterior. Astăzi, mulți matematicieni și statisticieni folosesc această metodă. Tipurile de distribuții Pearson sunt caracterizate de două mărimi, numite de obicei β1 și β2. Primul este pătratul asimetriei. Al doilea este kurtosis tradițional, sau al patrulea moment standardizat: β2=γ2 + 3.

Metodele matematice moderne definesc curtoza γ2 ca cumulante în loc de momente, deci pentru o stare normalădistribuție avem γ2=0 și β2=3. Aici merită să urmăriți precedentul istoric și să folosiți β2. Diagrama din dreapta arată ce tip este o anumită distribuție Pearson (notată cu punct (β1, β2).

Statistica Pearson
Statistica Pearson

Multe dintre distribuțiile deformate și/sau non-mezokurtice pe care le cunoaștem astăzi nu erau încă cunoscute la începutul anilor 1890. Ceea ce este acum cunoscut sub numele de distribuție beta a fost folosit de Thomas Bayes ca parametru posterior al distribuției Bernoulli în lucrarea sa din 1763 despre probabilitatea inversă.

Distribuția beta a devenit proeminentă datorită prezenței sale în sistemul Pearson și a fost cunoscută până în anii 1940 ca distribuție Pearson de tip I. Distribuția de tip II este un caz special de tip I, dar de obicei nu mai este evidențiată.

Distribuția Gamma a apărut din propria sa lucrare și a fost cunoscută sub numele de Distribuție normală Pearson de tip III înainte de a-și dobândi numele modern în anii 1930 și 1940. O lucrare din 1895 a unui om de știință a prezentat distribuția de tip IV, care conține distribuția t a lui Student, ca un caz special, care precede utilizarea ulterioară de către William Seely Gosset cu câțiva ani. Lucrarea sa din 1901 a prezentat o distribuție cu gamma inversă (tip V) și prime beta (tip VI).

O altă opinie

Conform lui Ord, Pearson a dezvoltat forma de bază a ecuației (1) pe baza formulei pentru derivata logaritmului funcției de densitate a distribuției normale (care dă o împărțire liniară la patraticăstructura). Mulți specialiști sunt încă angajați în testarea ipotezei despre distribuția criteriilor Pearson. Și își dovedește eficacitatea.

Distribuție alternativă Pearson
Distribuție alternativă Pearson

Cine a fost Karl Pearson

Karl Pearson a fost un matematician și biostatistician englez. El este creditat cu crearea disciplinei statisticii matematice. În 1911 a fondat primul departament de statistică din lume la University College London și a adus contribuții semnificative în domeniile biometriei și meteorologiei. Pearson a fost, de asemenea, un susținător al darwinismului social și al eugeniei. A fost protejatul și biograful lui Sir Francis G alton.

Biometrie

Karl Pearson a jucat un rol esențial în crearea școlii de biometrie, care a fost o teorie competitivă pentru a descrie evoluția și moștenirea populațiilor la începutul secolului al XX-lea. Seria sa de optsprezece lucrări „Contribuții matematice la teoria evoluției” l-a stabilit drept fondatorul școlii biometrice a moștenirii. De fapt, Pearson și-a dedicat o mare parte din timpul său în perioada 1893-1904 dezvoltarea metodelor statistice pentru biometrie. Aceste metode, care sunt utilizate pe scară largă astăzi pentru analiza statistică, includ testul chi-pătrat, abaterea standard, coeficienții de corelație și regresie.

Coeficientul de corelație al lui Pearson
Coeficientul de corelație al lui Pearson

Chestiunea eredității

Legea eredității lui Pearson a afirmat că plasma germinativă este formată din elemente moștenite de la părinți, precum și de la strămoși mai îndepărtați, proporția cărora varia în funcție de diferite caracteristici. Karl Pearson era un adept al lui G alton și, deși lorlucrările diferă în anumite privințe, Pearson a folosit o cantitate semnificativă din conceptele statistice ale profesorului său în formularea unei școli biometrice pentru moștenire, cum ar fi legea regresiei.

Distribuția Pearson
Distribuția Pearson

Caracteristici școlii

Școala biometrică, spre deosebire de mendeliani, nu s-a concentrat pe furnizarea unui mecanism de moștenire, ci pe furnizarea unei descriere matematică care nu era de natură cauzală. În timp ce G alton a propus o teorie discontinuă a evoluției în care speciile s-ar schimba în s alturi mari, mai degrabă decât mici modificări care s-au acumulat în timp, Pearson a subliniat defectele acestui argument și și-a folosit de fapt ideile pentru a dezvolta o teorie continuă a evoluției. Mendelienii au preferat teoria evoluției discontinue.

În timp ce G alton s-a concentrat în principal pe aplicarea metodelor statistice la studiul eredității, Pearson și colegul său Weldon și-au extins raționamentul în acest domeniu, variație, corelații ale selecției naturale și sexuale.

Distribuție tipică
Distribuție tipică

O privire asupra evoluției

Pentru Pearson, teoria evoluției nu a fost menită să identifice mecanismul biologic care explică tiparele de moștenire, în timp ce abordarea mendeliană a declarat gena ca fiind mecanismul moștenirii.

Pearson l-a criticat pe Bateson și pe alți biologi pentru că nu au adoptat metode biometrice în studiul lor asupra evoluției. El a condamnat oamenii de știință care nu s-au concentrat asupravaliditatea statistică a teoriilor lor, afirmând:

„Înainte de a putea accepta [orice cauză a schimbării progresive] ca factor, nu trebuie doar să-i arătăm plauzibilitatea, ci, dacă este posibil, să-i demonstrăm capacitatea cantitativă.”

Biologii au cedat în fața „speculațiilor aproape metafizice despre cauzele eredității” care au înlocuit procesul de colectare a datelor experimentale, care le-ar putea permite oamenilor de știință să restrângă potențialele teorii.

punte statistică
punte statistică

Legile naturii

Pentru Pearson, legile naturii au fost utile pentru a face predicții precise și pentru a rezuma tendințele datelor observate. Motivul a fost experiența „că o anumită secvență s-a întâmplat și s-a repetat în trecut.”

Astfel, identificarea unui anumit mecanism al geneticii nu a fost un efort demn pentru biologi, care ar trebui să se concentreze în schimb pe descrierile matematice ale datelor empirice. Acest lucru a dus parțial la o dispută amară între biometriști și mendeliani, inclusiv Bateson.

După ce acesta din urmă a respins unul dintre manuscrisele lui Pearson care descrie o nouă teorie a variației descendenților sau a homotipiei, Pearson și Weldon au fondat compania Biometrika în 1902. Deși abordarea biometrică a moștenirii și-a pierdut în cele din urmă perspectiva mendeliană, metodele pe care le-au dezvoltat la acea vreme sunt vitale pentru studiul biologiei și evoluției în prezent.

Recomandat: