Rozdelenia v matematickej štatistike sú charakterizované mnohými štatistickými parametrami. Odhad neznámych parametrov distribúcie na základe rôznych údajov vzorky umožňuje zostaviť distribúcie náhodnej premennej.

Nájdite štatistický odhad neznámeho distribučného parametra – nájdite funkciu pozorovaných náhodných premenných, ktorá dá približnú hodnotu odhadovaného parametra.

Štatistické odhady možno klasifikovať ako nezaujaté, neobjektívne, efektívne a konzistentné.

Definícia 1

Nestranný odhad-- štatistický odhad $Q^*$, ktorý má pre akúkoľvek hodnotu veľkosti vzorky matematické očakávanie rovné odhadovanému parametru, tj.

Definícia 2

Skreslený odhad-- štatistický odhad $Q^*$, ktorý má pre akúkoľvek hodnotu veľkosti vzorky matematické očakávanie, ktoré sa nerovná odhadovanému parametru, tj.

Definícia 4

Dôsledné hodnotenie-- štatistické hodnotenie, v ktorom pri veľkosti vzorky smerujúcej k nekonečnu má pravdepodobnosť tendenciu k odhadovanému parametru $Q.$

Definícia 5

Dôsledné hodnotenie-- štatistický odhad, v ktorom, keďže veľkosť vzorky má tendenciu k nekonečnu, rozptyl nezaujatého odhadu má tendenciu k nule.

Všeobecné a vzorové priemery

Definícia 6

Všeobecný priemer-- priemerný aritmetické hodnoty populačný variant.

Definícia 7

Ukážkový priemer- možnosť aritmetického priemeru hodnôt vzorová populácia.

Hodnoty všeobecného a vzorového priemeru možno nájsť pomocou nasledujúcich vzorcov:

  1. Ak hodnoty možnosti $x_1,\ x_2,\bodky,x_k$ majú frekvenciu $n_1,\ n_2,\bodky ,n_k$, potom
  1. Ak sú hodnoty možnosti $x_1,\ x_2,\bodky,x_k$ odlišné, potom

S týmto pojmom je spojený pojem odchýlka od priemeru. Táto hodnota sa zistí pomocou nasledujúceho vzorca:

Priemerná odchýlka má nasledujúce vlastnosti:

    $\sum(n_i\left(x_i-\overline(x)\right)=0)$

    Priemerná odchýlka je nulová.

Všeobecné, vzorové a opravené odchýlky

Ďalším z hlavných parametrov je koncept všeobecného a výberového rozptylu:

Všeobecná odchýlka:

Vzorový rozptyl:

Všeobecné a vzorové štandardné odchýlky sú tiež spojené s týmito pojmami:

Na odhad všeobecného rozptylu sa zaviedol koncept opraveného rozptylu:

Zavádza sa aj koncept opravenej štandardnej odchýlky:

Príklad riešenia problému

Príklad 1

Populáciu definuje nasledujúca distribučná tabuľka:

Obrázok 1.

Nájdite pre ňu všeobecný priemer, všeobecný rozptyl, všeobecnú smerodajnú odchýlku, opravený rozptyl a opravenú smerodajnú odchýlku.

Na vyriešenie tohto problému najprv vytvoríme výpočtovú tabuľku:

Obrázok 2

Hodnota $\overline(x_в)$ (priemer vzorky) sa zistí podľa vzorca:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(87)(30)=2,9\]

Nájdite všeobecný rozptyl pomocou vzorca:

Všeobecná štandardná odchýlka:

\[(\sigma )_в=\sqrt(D_в)\približne 1,42\]

Opravený rozptyl:

\[(S^2=\frac(n)(n-1)D)_в=\frac(30)(29)\cdot 2,023\približne 2,09\]

Opravená štandardná odchýlka.

Distribúcia náhodnej premennej (distribúcia populácie) je zvyčajne charakterizovaná množstvom číselných charakteristík:

  • pre normálne rozdelenie N(a, σ) je matematické očakávanie a a smerodajná odchýlka σ;
  • pre rovnomerné rozdelenie R(a,b) sú hranice intervalu, v ktorom sa pozorujú hodnoty tejto náhodnej premennej.
Takéto číselné charakteristiky, zvyčajne neznáme, sa nazývajú parametre populácie . Odhad parametrov - zodpovedajúca číselná charakteristika vypočítaná zo vzorky. Odhady parametrov populácie spadajú do dvoch tried: bod A interval.

Keď je skóre určené jedným číslom, volá sa bodový odhad. Bodový odhad, ako funkcia vzorky, je náhodná premenná a mení sa od vzorky k vzorke s opakovanými experimentmi.
Bodové odhady majú požiadavky, ktoré musia spĺňať, aby boli „benígne“ v akomkoľvek zmysle. Toto nevysídlený, efektívnosť A bohatstvo.

Intervalové odhady sú určené dvoma číslami - koncami intervalu, ktorý pokrýva odhadovaný parameter. Na rozdiel od bodových odhadov, ktoré nedávajú predstavu o tom, ako ďaleko od nich môže byť odhadovaný parameter, intervalové odhady nám umožňujú určiť presnosť a spoľahlivosť odhadov.

Ako bodové odhady matematického očakávania, disperzie a štandardnej odchýlky sa používajú charakteristiky vzorky, v tomto poradí, priemer vzorky, rozptyl vzorky a štandardná odchýlka vzorky.

Vlastnosť nestranného odhadu.
Žiaducou požiadavkou na posúdenie je absencia systematickej chyby, t.j. pri opakovanom použití namiesto parametra θ jeho odhadu je priemerná hodnota aproximačnej chyby nulová - to je vlastnosť nestranného odhadu.

Definícia. Odhad sa nazýva nestranný, ak sa jeho matematické očakávanie rovná skutočnej hodnote odhadovaného parametra:

Aritmetický priemer vzorky je nezaujatý odhad matematického očakávania a rozptylu vzorky - neobjektívny odhad všeobecného rozptylu D. Nezaujatý odhad všeobecného rozptylu je odhad

Vlastnosť konzistentnosti hodnotenia.
Druhá požiadavka na odhad – jeho konzistentnosť – znamená, že odhad sa zlepšuje s rastúcou veľkosťou vzorky.

Definícia. stupeň sa nazýva konzistentný, ak v pravdepodobnosti konverguje k odhadovanému parametru θ ako n→∞.


Konvergencia v pravdepodobnosti znamená, že pri veľkej veľkosti vzorky je pravdepodobnosť veľkých odchýlok odhadu od skutočný význam malý

Vlastnosť efektívneho odhadu.
Tretia požiadavka vám umožňuje vybrať si najlepšie hodnotenie z niekoľkých odhadov toho istého parametra.

Definícia. Nezaujatý odhad je účinný, ak má najmenší rozptyl medzi všetkými nezaujatými odhadmi.

Znamená to, že efektívne hodnotenie má minimálny rozptyl vzhľadom na skutočnú hodnotu parametra. Všimnite si, že nie vždy existuje efektívny odhad, ale z dvoch odhadov je zvyčajne možné vybrať ten efektívnejší, t.j. s menším rozptylom. Napríklad pre neznámy parameter a normálnej populácie N(a,σ) možno ako nezaujatý odhad brať ako aritmetický priemer vzorky, tak aj medián vzorky. Ale rozptyl mediánu vzorky je približne 1,6-krát väčší ako rozptyl aritmetického priemeru. Preto je efektívnejší odhad výberový aritmetický priemer.

Príklad č.1. Nájdite neskreslený odhad rozptylu meraní niektorej náhodnej veličiny pomocou jedného zariadenia (bez systematických chýb), ktorého výsledky merania (v mm): 13,15,17.
Riešenie. Tabuľka na výpočet ukazovateľov.

X|x - x priem |(x - x priemer) 2
13 2 4
15 0 0
17 2 4
45 4 8

Jednoduchý aritmetický priemer(nezaujatý odhad matematického očakávania)


Disperzia- charakterizuje mieru rozptylu okolo svojej priemernej hodnoty (miera rozptylu, t.j. odchýlka od priemeru - skreslený odhad).


Nestranný odhad rozptylu- konzistentný odhad rozptylu (opravený rozptyl).

Príklad č.2. Nájdite neskreslený odhad matematického očakávania meraní určitej náhodnej veličiny jedným zariadením (bez systematických chýb), ktorého výsledky merania (v mm): 4,5,8,9,11.
Riešenie. m = (4+5+8+9+11)/5 = 7,4

Príklad č.3. Nájdite korigovaný rozptyl S2 pre veľkosť vzorky n = 10, ak je rozptyl vzorky D = 180.
Riešenie. S2 = n*D/(n-1) = 10*180/(10-1) = 200

) problémy matematickej štatistiky.

Predpokladajme, že existuje parametrická rodina rozdelení pravdepodobnosti (pre jednoduchosť budeme uvažovať rozdelenie náhodných premenných a prípad jedného parametra). Tu je číselný parameter, ktorého hodnota nie je známa. Je potrebné ho odhadnúť na základe dostupnej vzorky hodnôt generovaných týmto rozdelením.

Existujú dva hlavné typy hodnotenia: bodové odhady A intervaly spoľahlivosti.

Bodový odhad

Bodový odhad je typ štatistického odhadu, pri ktorom je hodnota neznámeho parametra aproximovaná samostatným číslom. To znamená, že je potrebné špecifikovať funkciu vzorky (štatistiky)

,

ktorých hodnota sa bude považovať za aproximáciu neznámej skutočnej hodnoty.

Medzi bežné metódy konštrukcie bodových odhadov parametrov patria: metóda maximálnej pravdepodobnosti, metóda momentov, kvantilová metóda.

Nasledujú niektoré vlastnosti, ktoré bodové odhady môžu alebo nemusia mať.

Bohatstvo

Jednou z najzrejmejších požiadaviek na bodový odhad je, že sa dá očakávať, že ide o primerane dobrú aproximáciu skutočnej hodnoty parametra, ak je dostatočne veľké hodnoty veľkosť vzorky. To znamená, že odhad by mal konvergovať k skutočnej hodnote pri . Táto vlastnosť hodnotenia sa nazýva bohatstvo. Pretože hovoríme o o náhodných premenných, pre ktoré existujú odlišné typy konvergencia, potom môže byť táto vlastnosť presne formulovaná rôznymi spôsobmi:

Keď sa len používa výraz bohatstvo, vtedy väčšinou máme na mysli slabú konzistenciu, t.j. konvergencia v pravdepodobnosti.

Podmienka konzistencie je prakticky povinná pre všetky odhady používané v praxi. Odhady porúch sa používajú veľmi zriedkavo.

Nezaujatosť a asymptotická nezaujatosť

Odhad parametra sa nazýva nezaujatý, ak sa jeho matematické očakávanie rovná skutočnej hodnote odhadovaného parametra:

.

Slabší stav je asymptotický nezaujatý, čo znamená, že matematické očakávanie odhadu konverguje k skutočnej hodnote parametra, keď sa veľkosť vzorky zvyšuje:

.

Nezaujatosť je odporúčaná vlastnosť pre odhady. Jeho význam však netreba preceňovať. Najčastejšie existujú nestranné odhady parametrov a potom sa snažia brať do úvahy len ich. Môžu sa však vyskytnúť štatistické problémy, pri ktorých neexistujú nestranné odhady. Väčšina slávny príklad je nasledovné: zvážte Poissonovo rozdelenie s parametrom a položte problém odhadu parametra . Dá sa dokázať, že pre tento problém neexistuje žiadny objektívny odhad.

Porovnanie hodnotenia a účinnosti

Na porovnanie rôznych odhadov toho istého parametra sa používa nasledujúca metóda: vyberte niektoré riziková funkcia, ktorý meria odchýlku odhadu od skutočnej hodnoty parametra a za najlepší sa považuje ten, pre ktorý táto funkcia nadobúda menšiu hodnotu.

Najčastejšie sa za rizikovú funkciu považuje matematické očakávanie druhej mocniny odchýlky odhadu od skutočnej hodnoty.

Pre nestranné odhady je to jednoducho rozptyl.

Existuje dolná hranica tejto rizikovej funkcie, tzv Cramer-Rao nerovnosť.

(Nezaujaté) odhady, pre ktoré je dosiahnutá táto dolná hranica (t. j. s čo najmenším rozptylom), sa nazývajú efektívne. Existencia efektívneho odhadu je však dosť silnou požiadavkou na úlohu, čo nie je vždy prípad.

Slabší stav je asymptotická účinnosť, čo znamená, že pomer rozptylu neskresleného odhadu k nižší limit Cramer-Rao inklinuje k jednote na .

Všimnite si, že za dostatočne širokých predpokladov o študovanom rozdelení poskytuje metóda maximálnej pravdepodobnosti asymptoticky efektívny odhad parametra, a ak efektívny odhad existuje, potom poskytuje efektívny odhad.

Dostatočná štatistika

Štatistiky sú tzv dostatočné pre parameter , ak podmienené rozdelenie odberu vzoriek za predpokladu , nezávisí od parametra pre všetkých .

Dôležitosť konceptu dostatočnej štatistiky určuje nasledovné schválenie. Ak je dostatočná štatistika a je nezaujatým odhadom parametra, potom podmienené očakávanie je tiež nezaujatým odhadom parametra a jeho rozptyl je menší alebo rovný rozptylu pôvodného odhadu.

Pripomeňme, že podmienené očakávanie je náhodná premenná, ktorá je funkciou . V triede nezaujatých odhadov teda stačí brať do úvahy len tie, ktoré sú funkciami dostatočnej štatistiky (za predpokladu, že takáto štatistika pre daný problém existuje).

(Nezaujatý) odhad efektívneho parametra je vždy dostatočnou štatistikou.

Dá sa povedať, že dostatočná štatistika obsahuje všetky informácie o odhadovanom parametri, ktoré sú obsiahnuté vo vzorke.

Osnova prednášky:

    Koncepcia hodnotenia

    Vlastnosti štatistických odhadov

    Metódy zisťovania bodových odhadov

    Odhad intervalového parametra

    Interval spoľahlivosti pre matematické očakávanie so známym rozptylom normálne rozloženej populácie.

    Chí-kvadrát rozdelenie a Studentovo t-rozdelenie.

    Interval spoľahlivosti pre matematické očakávanie náhodnej premennej, ktorá má normálne rozdelenie s neznámym rozptylom.

    Interval spoľahlivosti pre štandardnú odchýlku normálneho rozdelenia.

Bibliografia:

    Wentzel, E.S. Teória pravdepodobnosti [Text] / E.S. Wentzel. – M.: absolventská škola, 2006. – 575 s.

    Gmurman, V.E. Teória pravdepodobnosti a matematická štatistika [Text] / V.E. Gmurman. - M.: Vyššia škola, 2007. - 480 s.

    Kremer, N.Sh. Teória pravdepodobnosti a matematická štatistika [Text] / N.Sh. Kremer - M: UNITY, 2002. – 543 s.

P.1. Koncepcia hodnotenia

Rozdelenia ako binomické, exponenciálne a normálne sú rodiny rozdelení, ktoré závisia od jedného alebo viacerých parametrov. Napríklad exponenciálne rozdelenie s hustotou pravdepodobnosti závisí od jedného parametra λ, normálneho rozdelenia
- z dvoch parametrov m a σ. Z podmienok skúmaného problému je zvyčajne jasné, o ktorej rodine distribúcií hovoríme. Špecifické hodnoty parametrov tohto rozdelenia, ktoré sú zahrnuté vo vyjadreniach distribučných charakteristík, ktoré nás zaujímajú, však zostávajú neznáme. Preto je potrebné poznať aspoň približnú hodnotu týchto veličín.

Nech je zákon rozdelenia všeobecnej populácie určený až do hodnôt parametrov zahrnutých v jeho rozdelení
, z ktorých niektoré môžu byť známe. Jedna z úloh matematickej štatistiky je nájsť odhady neznámych parametrov zo vzorky pozorovaní
od bežnej populácie. Odhad neznámych parametrov pozostáva z konštrukcie funkcie
z náhodnej vzorky tak, že hodnota tejto funkcie sa približne rovná odhadovanému neznámemu parametru θ . Funkcia volal štatistiky parameter θ .

Štatistické hodnotenie(v budúcnosti jednoducho hodnotenie) parameter θ Teoretické rozdelenie sa nazýva jeho približná hodnota v závislosti od údajov výberu.

stupeň je náhodná premenná, pretože je funkciou nezávislých náhodných premenných
; Ak vytvoríte ďalšiu vzorku, funkcia bude mať vo všeobecnosti inú hodnotu.

Existujú dva typy odhadov: bodový a intervalový.

Spot sa nazýva skóre určené jedným číslom. Pri malom počte pozorovaní môžu tieto odhady viesť k hrubým chybám. Aby sa im zabránilo, používajú sa intervalové odhady.

Interval je odhad, ktorý je určený dvoma číslami - koncami intervalu, v ktorom je odhadnutá hodnota s danou pravdepodobnosťou obsiahnutá θ .

P. 2 Vlastnosti štatistických odhadov

Veľkosť
volal presnosť hodnotenia. Menej
, čím lepšie, tým presnejšie je určený neznámy parameter.

Posúdenie akéhokoľvek parametra podlieha viacerým požiadavkám, ktoré musí spĺňať, aby sa „priblížil“ skutočnej hodnote parametra, t.j. byť v určitom zmysle „benígnym“ hodnotením. Kvalita odhadu je určená kontrolou, či má vlastnosti nestrannosti, efektívnosti a konzistentnosti.

stupeň parameter θ volal nevysídlený(bez systematických chýb), ak sa matematické očakávanie odhadu zhoduje so skutočnou hodnotou θ :

. (1)

Ak neplatí rovnosť (1), potom odhad volal premiestnený(so systematickými chybami). Toto skreslenie môže byť spôsobené chybami merania, chybami v počítaní alebo nenáhodnou povahou vzorky. Systematické chyby vedú k preceňovaniu alebo podceňovaniu.

Pre niektoré problémy v matematickej štatistike môže existovať niekoľko nezaujatých odhadov. Zvyčajne sa dáva prednosť tomu, ktorý má najmenší rozptyl (disperzia).

stupeň volal efektívne, ak má najmenší rozptyl spomedzi všetkých možných nezaujatých odhadov parametra θ .

Nechaj D() je minimálny rozptyl a
– rozptyl akéhokoľvek iného nestranného odhadu parameter θ . Potom účinnosť odhadu rovná

. (2)

To je jasné
. Bližšie
na 1, tým je hodnotenie efektívnejšie . Ak
pri
, potom sa volá odhad asymptoticky účinné.

Komentujte: Ak skóre zaujatý, potom malosť jeho rozptylu nenaznačuje malosť jeho chyby. Vezmime si napríklad ako odhad parametra θ nejaké číslo , dostaneme odhad aj s nulovým rozptylom. V tomto prípade však chyba (chyba)
môžu byť také veľké, ako chcete.

stupeň volal bohatý, ak s rastúcou veľkosťou vzorky (
) odhad konverguje v pravdepodobnosti k presnej hodnote parametra θ , t.j. ak pre niekoho

. (3)

Platnosť posudku parameter θ znamená, že s rastom n veľkosť vzorky kvalita hodnotenia sa zlepšuje.

Veta 1. Priemer vzorky je nezaujatý a konzistentný odhad matematického očakávania.

Veta 2. Opravený rozptyl vzorky je nezaujatý a konzistentný odhad rozptylu.

Veta 3. Empirická distribučná funkcia vzorky je nezaujatý a konzistentný odhad distribučnej funkcie náhodnej premennej.

Štatistické odhady parametrov populácie. Štatistické hypotézy

PREDNÁŠKA 16

Nech je potrebné študovať kvantitatívnu charakteristiku bežnej populácie. Predpokladajme, že na základe teoretických úvah sme boli schopní presne určiť, aké rozdelenie má funkcia. To vyvoláva problém odhadu parametrov, ktoré určujú toto rozdelenie. Napríklad, ak je známe, že študovaná charakteristika je rozdelená vo všeobecnej populácii podľa normálneho zákona, potom je potrebné odhadnúť (približne nájsť) matematické očakávanie a smerodajnú odchýlku, pretože tieto dva parametre úplne určujú normálne rozdelenie. . Ak existujú dôvody domnievať sa, že charakteristika má Poissonovo rozdelenie, potom je potrebné odhadnúť parameter, ktorým je toto rozdelenie určené.

V distribúcii má výskumník zvyčajne iba vzorové údaje, napríklad hodnoty kvantitatívnej charakteristiky získané ako výsledok pozorovaní (ďalej sa pozorovania považujú za nezávislé). Odhadovaný parameter je vyjadrený prostredníctvom týchto údajov.

Berúc do úvahy hodnoty nezávislých náhodných premenných , môžeme povedať, že nájsť štatistický odhad neznámeho parametra teoretického rozdelenia znamená nájsť funkciu pozorovaných náhodných veličín, ktorá dáva približnú hodnotu odhadovaného parametra. Napríklad, ako bude uvedené nižšie, na odhadnutie matematického očakávania normálneho rozdelenia použite funkciu (aritmetický priemer pozorovaných hodnôt atribútu):

.

takže, štatistické hodnotenie Neznámy parameter teoretického rozdelenia sa nazýva funkcia pozorovaných náhodných premenných. Vyvolá sa štatistický odhad neznámeho parametra populácie, zapísaný ako jediné číslo bod. Zvážte nasledujúce bodové odhady: neobjektívne a nezaujaté, efektívne a konzistentné.

Aby štatistické odhady poskytovali „dobré“ aproximácie odhadovaných parametrov, musia spĺňať určité požiadavky. Uveďme tieto požiadavky.

Nech existuje štatistický odhad neznámeho parametra teoretického rozdelenia. Predpokladajme, že pri vzorkovaní objemu sa nájde odhad. Zopakujme experiment, to znamená, že z bežnej populácie vytiahneme ďalšiu vzorku rovnakej veľkosti a použijeme jej údaje na nájdenie odhadu atď. Opakovaním experimentu mnohokrát dostaneme čísla , ktoré sa vo všeobecnosti budú navzájom líšiť. Odhad teda možno považovať za náhodná premenná a čísla – ako jeho možné významy.

Je jasné, že ak odhad udáva približnú hodnotu s prebytkom, potom každé číslo zistené z údajov vzorky bude väčšie ako skutočná hodnota. Následne bude v tomto prípade matematická (priemerná hodnota) náhodnej premennej väčšia ako , teda . Je zrejmé, že ak dáva približnú hodnotu s nevýhodou, potom .


Preto použitie štatistického odhadu, ktorého matematické očakávanie sa nerovná odhadovanému parametru, vedie k systematickým chybám (rovnakého znamienka). Z tohto dôvodu je prirodzené vyžadovať, aby sa matematické očakávanie odhadu rovnalo odhadovanému parametru. Hoci súlad s touto požiadavkou vo všeobecnosti neodstráni chyby (niektoré hodnoty sú väčšie a iné menšie ako), chyby rôznych znakov sa budú vyskytovať rovnako často. Splnenie požiadavky však zaručuje nemožnosť získať systematické chyby, to znamená, že systematické chyby eliminuje.

Nezaujatý sa nazýva štatistický odhad (chyba), ktorého matematické očakávanie sa rovná odhadovanému parametru pre akúkoľvek veľkosť vzorky, tzn.

Premiestnený sa nazýva štatistický odhad, ktorého matematické očakávanie sa pre žiadnu veľkosť vzorky nerovná odhadovanému parametru, tzn.

Bolo by však chybou predpokladať, že nestranný odhad vždy poskytuje dobrú aproximáciu odhadovaného parametra. V skutočnosti môžu byť možné hodnoty značne rozptýlené okolo ich strednej hodnoty, to znamená, že rozptyl môže byť významný. V tomto prípade sa odhad zistený napríklad z údajov jednej vzorky môže ukázať ako veľmi vzdialený od priemernej hodnoty, a teda od samotného odhadovaného parametra. Ak teda vezmeme ako približnú hodnotu, urobíme veľkú chybu. Ak požadujete, aby bol rozptyl malý, potom bude vylúčená možnosť urobiť veľkú chybu. Z tohto dôvodu štatistické vyhodnotenie podlieha požiadavke efektívnosti.

Efektívne je štatistický odhad, ktorý (pre danú veľkosť vzorky) má najmenší možný rozptyl.

Bohatí nazývajú štatistický odhad, ktorý má tendenciu pravdepodobnosti k odhadovanému parametru, to znamená, že rovnosť je pravdivá:

.

Napríklad, ak má rozptyl nezaujatého odhadu tendenciu k nule, potom sa takýto odhad tiež ukáže ako konzistentný.

Zamyslime sa nad otázkou, ktoré charakteristiky vzorky najlepšie odhadnú všeobecný priemer a rozptyl z hľadiska nezaujatosti, efektívnosti a konzistentnosti.

Poďme študovať diskrétnu všeobecnú populáciu s ohľadom na nejakú kvantitatívnu charakteristiku.

Všeobecné sekundárne sa nazýva aritmetický priemer charakteristických hodnôt bežnej populácie. Vypočítava sa podľa vzorca:

§ - ak sú všetky hodnoty charakteristiky všeobecnej populácie objemu odlišné;

§ – ak hodnoty charakteristiky bežnej populácie majú frekvenciu a . To znamená, že všeobecný priemer je vážený priemer hodnôt atribútov s váhami rovnými zodpovedajúcim frekvenciám.

Komentujte: nech všeobecná populácia zväzku obsahuje objekty s rôznymi hodnotami atribútu. Predstavme si, že z tejto množiny sa náhodne vyberie jeden objekt. Pravdepodobnosť, že sa získa napríklad objekt s hodnotou funkcie, sa samozrejme rovná . Akýkoľvek iný objekt je možné získať s rovnakou pravdepodobnosťou. Hodnotu vlastnosti teda možno považovať za náhodnú premennú, ktorej možné hodnoty majú rovnakú pravdepodobnosť rovnajúcu sa . V tomto prípade nie je ťažké nájsť matematické očakávanie:

Ak teda skúmanú charakteristiku všeobecnej populácie považujeme za náhodnú premennú, potom sa matematické očakávanie charakteristiky rovná všeobecnému priemeru tejto charakteristiky: . K tomuto záveru sme dospeli uvažovaním, že všetky objekty v bežnej populácii majú rôzne významy znamenie. Rovnaký výsledok sa získa, ak predpokladáme, že všeobecná populácia obsahuje niekoľko objektov s rovnakú hodnotu znamenie.

Zovšeobecnením získaného výsledku na všeobecnú populáciu so spojitým rozložením charakteristiky definujeme všeobecný priemer ako matematické očakávanie charakteristiky: .

Nechajte odobrať vzorku objemu na štúdium všeobecnej populácie s ohľadom na kvantitatívnu charakteristiku.

Priemer vzorky sa nazýva aritmetický priemer charakteristických hodnôt vzorky populácie. Vypočítava sa podľa vzorca:

§ – ak sú všetky hodnoty charakteristiky objemu vzorky odlišné;

§ – ak hodnoty charakteristiky vzorovej populácie majú frekvenciu a . To znamená, že priemer vzorky je vážený priemer hodnôt atribútov s váhami rovnými zodpovedajúcim frekvenciám.

Komentujte: Priemer vzorky zistený z údajov jednej vzorky je zjavne určité číslo. Ak odoberiete iné vzorky rovnakej veľkosti z rovnakej populácie, priemerná hodnota vzorky sa bude meniť od vzorky k vzorke. Výberový priemer teda možno považovať za náhodnú premennú, a preto môžeme hovoriť o distribúciách (teoretických a empirických) výberového priemeru a numerických charakteristikách tohto rozdelenia, najmä o matematickom očakávaní a rozptyle výberového súboru. distribúcia.

Ďalej, ak všeobecný priemer nie je známy a je potrebné ho odhadnúť pomocou vzorových údajov, potom sa za odhad všeobecného priemeru považuje výberový priemer, ktorý je nestranným a konzistentným odhadom (odporúčame, aby ste si toto tvrdenie sami dokázali). Z vyššie uvedeného vyplýva, že ak sa zistia priemery vzoriek pre niekoľko vzoriek s dostatočne veľkým objemom z tej istej všeobecnej populácie, potom sa budú navzájom približne rovnať. Toto je nehnuteľnosť stabilita prostriedkov vzorky.

Všimnite si, že ak sú rozptyly dvoch populácií rovnaké, potom blízkosť priemeru vzorky k všeobecným priemerom nezávisí od pomeru veľkosti vzorky k veľkosti všeobecnej populácie. Závisí to od veľkosti vzorky: čím väčšia je veľkosť vzorky, tým menej sa priemer vzorky líši od všeobecného priemeru. Ak sa napríklad z jednej populácie vyberie 1 % objektov a z inej populácie sa vyberú 4 % objektov a objem prvej vzorky sa ukáže byť väčší ako druhej, potom sa priemer prvej vzorky bude líšiť od zodpovedajúci všeobecný priemer ako druhý.