Vrste vzorcev. Majhen vzorec. praksa uporabe majhnega vzorčenja v komercialnih dejavnostih Majhen vzorec vključuje vzorec, ki vključuje

Zgoraj obravnavane metode za izračun značilnosti vzorčne populacije (variance, povprečne in največje napake itd.) zagotavljajo dovolj veliko velikost vzorca (n > 30). Hkrati velika velikost vzorca ni vedno mogoča ali priporočljiva. V praksi industrijskih opazovanj in pri znanstvenoraziskovalnem delu je pogosto treba uporabiti majhne vzorce, katerih število ne presega 30 enot.(agronomski in zootehniški poskusi, preverjanje kakovosti izdelkov v zvezi z uničenjem vzorcev itd.). V statistiki jih imenujemo majhni vzorci. Vzorci s populacijo več kot 30 enot se imenujejo veliki vzorci.

Majhna velikost vzorca zmanjša njegovo natančnost v primerjavi z velikim vzorcem. Vendar pa je dokazano, da je mogoče rezultate, pridobljene z majhnimi vzorci, posplošiti tudi na splošno populacijo. Toda tukaj je treba upoštevati nekatere značilnosti, zlasti pri izračunu standardnega odklona. Če je velikost vzorca majhna, je treba uporabiti nepristransko oceno variance 52.

Osnove teorije majhnih vzorcev je razvil angleški matematik in statistik W. Gosset (psevdonim Student). Študentove študije so pokazale, da se pri majhni populaciji standardna deviacija v vzorcu bistveno razlikuje od standardne deviacije v splošni populaciji.

Ker je standardna deviacija populacije eden od parametrov normalne porazdelitvene krivulje, je uporaba normalne porazdelitvene funkcije za oceno parametrov populacije iz podatkov majhnih vzorcev zaradi velikih napak neprimerna.

Pri izračunu povprečne napake za majhne vzorce morate vedno uporabiti nepristransko oceno variance

kjer je n - 1 število stopenj svobode variacije (k), ki se razume kot število enot, ki lahko sprejmejo poljubne vrednosti, ne da bi jih spremenile splošne značilnosti(povprečno).

Podane so bile na primer tri ugotovitve: x1= 4; x2 = 2; x3 = 6. Povprečna vrednost

Ostaneta torej samo še dve prosto spreminjajoči se količini, saj tretjo najdemo iz znanih dveh količin in povprečja:

Zato je za ta primer število stopenj svobode variacije 2 (k = n - 1 = 3 - 1 = 2).

T-test je utemeljil zakon porazdelitve odstopanj vzorčnih povprečij od splošnega povprečja za majhne vzorce. V skladu s Studentovo porazdelitvijo je verjetnost, da mejna napaka ne bo presegla u-kratne povprečne napake v majhnih vzorcih, odvisna od velikosti in velikosti vzorca.

Teoretični normalizirani odklon za majhne vzorce se imenuje i-kriterij, v nasprotju z i-kriterijem za normalno porazdelitev, ki se uporablja pri velikih vzorcih. Vrednost Studentovega t-testa je podana v posebnih tabelah (Priloga 3).

Oglejmo si postopek za določitev povprečne in največje napake za majhen vzorec na tem primeru. Recimo, da smo za določitev količine izgub med spravilom krompirja prekopali pet naključno izbranih površin po 4 m2. Izgube po lokacijah so bile (kg); 0,6; 0,2; 0,8; 0,4; 0,5.

Povprečna izguba

Sodeč po posameznih opazovanjih je velikost izgub zelo različna in povprečje le petih opazovanj ima lahko veliko napako.

Za izračun vzorčnih napak definiramo nepristransko oceno variance

Izračunajmo povprečno napako vzorčne sredine, kjer namesto standardne deviacije uporabimo njeno nepristransko oceno:

S pomočjo Studentovih tabel (priloga 3) ugotovimo, da z zaupanjem verjetnosti G= 0,95 (stopnja pomembnosti a = 0,05) in pri k = n - 1 = 5 - 1 = 4 variacije prostostnih stopenj in= 2,78. Potem je največja napaka vzorčenja

Torej z verjetnostjo P = 0,95 lahko rečemo, da bo količina izgub na celotnem polju 0,5 ± 0,28 kg oziroma od 0,22 do 0,78 kg na 4 m2.

Kot lahko vidimo iz primera, so meje naključnih nihanj pri majhnih vzorcih precej velike in jih je mogoče zmanjšati s povečanjem velikosti vzorca in zmanjšanjem nihanj (razpršenosti) karakteristik.

Če smo za izračun meja zaupanja splošne povprečja uporabili tabelo verjetnostnega integrala (Priloga 2), potem in bi bilo enako 1,96 in єх = iZi = 1,96 o 0,10 = 0,20 kg, tj. interval zaupanja bi bil ožji (0,30 do 0,70 kg).

Majhni vzorci zaradi majhnega števila tudi ob najbolj skrbni organizaciji opazovanja ne odražajo natančno kazalcev splošne populacije. Zato se rezultati majhnih vzorcev redko uporabljajo za določitev zanesljivih meja, znotraj katerih so značilnosti populacije.

Studentov t test se uporablja predvsem za preverjanje statističnih hipotez o pomembnosti razlik med uspešnostjo dveh ali več majhnih vzorcev (glejte razdelek 7).

Poleg dejanskega naključnega vzorca z jasno verjetnostno utemeljitvijo obstajajo še drugi vzorci, ki sicer niso povsem naključni, a se pogosto uporabljajo. Opozoriti je treba, da stroga uporaba povsem naključnega izbora enot iz splošne populacije v praksi ni vedno mogoča. Takšni vzorci vključujejo mehansko vzorčenje, tipično, serijsko (ali ugnezdeno), večfazno in številne druge.

Redko se zgodi, da je populacija homogena; to je prej izjema kot pravilo. Torej, če obstaja populacija v populaciji različne vrste Pogosto je zaželeno zagotoviti enakomernejšo zastopanost različnih vrst pojavov v vzorčni populaciji. Ta cilj uspešno dosežemo z uporabo tipičnega vzorčenja. Glavna težava je, da moramo imeti dodatne informacije o celotni populaciji, kar je v nekaterih primerih težko.

Tipičen vzorec imenujemo tudi stratificiran ali stratificiran vzorec; uporablja se tudi zaradi enotnejše zastopanosti različnih regij v vzorcu in v tem primeru se vzorec imenuje regionaliziran.

Torej, pod tipično Vzorec razumemo kot vzorec, v katerem je splošna populacija razdeljena na tipične podskupine, oblikovane po eni ali več bistvenih značilnostih (npr. populacija je razdeljena na 3-4 podskupine glede na povprečni dohodek na prebivalca ali stopnjo izobrazbe – osnovnošolsko). , srednja, višja itd.). Nato lahko iz vseh tipičnih skupin izberete enote za vzorec na več načinov, tako da oblikujete:

a) tipičen vzorec z enotno postavitvijo, kjer je izbrano enako število enot iz različnih tipov (plasti). Ta shema dobro deluje, če se v populaciji plasti (tipi) med seboj ne razlikujejo zelo po številu enot;

b) tipično vzorčenje s sorazmerno razporeditvijo, ko se zahteva (v nasprotju z enotno razporeditvijo), da je delež (%) izbora za vse stratume enak (npr. 5 ali 10 %);

c) tipičen vzorec z optimalno umestitvijo, ko se upošteva stopnja variacije lastnosti v različnih skupinah splošne populacije. S to postavitvijo se poveča delež selekcije za skupine z veliko variabilnostjo lastnosti, kar na koncu privede do zmanjšanja naključne napake.

Formula za povprečno napako pri tipičnem izboru je podobna običajni vzorčni napaki za čisto naključni vzorec, z edino razliko, da se namesto skupne variance vnese povprečje posameznih znotrajskupinskih varianc, kar seveda vodi zmanjšanje napake v primerjavi s povsem naključnim vzorcem. Vendar pa njegova uporaba ni vedno mogoča (iz več razlogov). Če ni potrebe po veliki natančnosti, je lažje in ceneje uporabiti serijsko vzorčenje.

Serijski(cluster) vzorčenje je sestavljeno iz dejstva, da za vzorec niso izbrane enote populacije (na primer študenti), temveč posamezne serije ali gnezda (na primer študijske skupine). Z drugimi besedami, pri serijskem (grozdnem) vzorčenju enota opazovanja in enota vzorčenja ne sovpadata: izbrane so določene skupine enot (gnezda), ki mejijo drug na drugega, in enote, vključene v ta gnezda, so predmet pregleda. Tako lahko na primer pri vzorčnem raziskovanju stanovanjskih razmer naključno izberemo določeno število gospodinjstev (enota vzorčenja) in nato ugotovimo bivalne razmere družin, ki živijo v teh hišah (enote opazovanja).

Serije (gnezda) sestavljajo enote, ki so med seboj povezane teritorialno (okraji, mesta itd.), organizacijsko (podjetja, delavnice itd.) ali časovno (na primer niz enot proizvodov, proizvedenih v določenem obdobju čas).

Serijsko selekcijo lahko organiziramo v obliki enostopenjske, dvostopenjske ali večstopenjske selekcije.

Naključno izbrane serije so predmet stalnih raziskav. Tako je serijsko vzorčenje sestavljeno iz dveh stopenj naključnega izbora serij in kontinuiranega preučevanja teh serij. Serijska selekcija zagotavlja znatne prihranke delovne sile in sredstev, zato se pogosto uporablja v praksi. Napaka serijske izbire se razlikuje od same napake naključne izbire v tem, da se namesto vrednosti celotne variance uporablja medserijska (medskupinska) varianca, namesto velikosti vzorca pa se uporablja število serij. Natančnost običajno ni zelo visoka, vendar je v nekaterih primerih sprejemljiva. Serijski vzorec je lahko ponovljen ali neponavljajoč, serije pa so lahko enako velike ali neenako velike.

Serijsko vzorčenje je mogoče organizirati glede na različne sheme. Vzorčno populacijo lahko na primer oblikujete v dveh fazah: najprej se v naključnem vrstnem redu izberejo serije, ki jih je treba raziskati, nato pa se iz vsake izbrane serije v naključnem vrstnem redu izbere tudi določeno število enot, ki se neposredno opazujejo (merijo, stehtajo itd.). Napaka takega vzorca bo odvisna od napake serijskega izbora in od napake posameznega izbora, tj. večstopenjska selekcija običajno daje manj natančne rezultate v primerjavi z enostopenjsko metodo, kar je razloženo s pojavom napak reprezentativnosti na vsaki stopnji vzorčenja. V tem primeru morate za kombinirano vzorčenje uporabiti formulo napake vzorčenja.

Druga oblika selekcije je večfazna selekcija (1, 2, 3 faze ali stopnje). Ta izbor se po strukturi razlikuje od večstopenjskega izbora, saj se pri večfaznem izboru v vsaki fazi uporabljajo iste selekcijske enote. Napake pri večfaznem vzorčenju se izračunavajo v vsaki fazi posebej. glavna značilnost dvofazno vzorčenje je, da se vzorci med seboj razlikujejo po treh kriterijih glede na: 1) delež preučevanih enot v prvi fazi vzorca in ponovno vključenih v drugo in naslednje faze; 2) od ohranjanja enakih možnosti, da bo vsaka vzorčna enota prve faze ponovno predmet proučevanja; 3) na velikost intervala, ki ločuje faze med seboj.

Oglejmo si še eno vrsto izbora, in sicer mehanski(ali sistematično). Ta izbor je verjetno najpogostejši. To je očitno razloženo z dejstvom, da je od vseh selekcijskih tehnik ta tehnika najpreprostejša. Predvsem je veliko enostavnejši od naključnega izbora, ki zahteva sposobnost uporabe tabel naključnih števil in ne zahteva dodatnih informacij o populaciji in njeni strukturi. Poleg tega je mehanska selekcija tesno prepletena s proporcionalno stratificirano selekcijo, kar vodi do zmanjšanja vzorčne napake.

Na primer, z mehanskim izborom članov stanovanjske zadruge s seznama, sestavljenega po vrstnem redu sprejema v to zadrugo, bo zagotovljena sorazmerna zastopanost zadružnikov z različnimi staži. Uporaba iste tehnike za izbiro anketirancev iz abecednega seznama posameznikov zagotavlja enake možnosti za priimke, ki se začnejo z različnimi črkami itd. Uporaba časovnic ali drugih seznamov v podjetjih ali izobraževalnih ustanovah itd. lahko zagotovi potrebno sorazmernost v zastopanosti delavcev z različnimi izkušnjami. Upoštevajte, da se mehanska selekcija pogosto uporablja v sociologiji, pri preučevanju javnega mnenja itd.

Da bi zmanjšali velikost napake in predvsem stroške izvedbe vzorčne študije, se v veliki meri uporabljajo različne kombinacije posameznih vrst selekcije (mehanske, serijske, individualne, večfazne itd.), v takšnih primerih pa so bolj zapletene napake vzorčenja. je treba izračunati, ki je sestavljen iz napak, ki se pojavijo na različnih stopnjah študije.

Majhen vzorec je skupek enot, manjših od 30. Majhni vzorci se v praksi pogosto pojavljajo. Na primer število redkih bolezni ali število enot z redko lastnostjo; Poleg tega se k majhnemu vzorcu zatečejo, kadar je raziskava draga ali gre za uničenje izdelkov ali vzorcev. Majhni vzorci se pogosto uporabljajo na področju raziskav kakovosti izdelkov. Teoretične temelje za določanje majhnih vzorčnih napak je postavil angleški znanstvenik W. Gosset (psevdonim Student).

Ne smemo pozabiti, da pri določanju napake za majhen vzorec namesto velikosti vzorca vzamete vrednost ( n– 1) ali pred določitvijo povprečne vzorčne napake izračunajte tako imenovano popravljeno vzorčno varianco (v imenovalcu namesto n treba postaviti ( n- 1)). Upoštevajte, da se tak popravek izvede samo enkrat - pri izračunu vzorčne variance ali pri določanju napake. Magnituda ( n– 1) se imenuje stopnja svobode. Poleg tega se zamenja običajna porazdelitev t-razdelitev (Studentova porazdelitev), ki je tabelirana in je odvisna od števila prostostnih stopinj. Edini parameter Studentove porazdelitve je vrednost ( n- 1). Naj še enkrat poudarimo, da amandma ( n– 1) je pomembno in pomembno le za majhne vzorčne populacije; pri n> 30 in več razlika izgine in se približa ničli.

Doslej smo govorili o naključnih vzorcih, tj. kadar je izbor enot iz populacije naključen (ali skoraj naključen) in imajo vse enote enako (ali skoraj enako) verjetnost, da bodo vključene v vzorec. Lahko pa izbor enot temelji na načelu nenaključnega izbora, ko je v ospredju načelo dostopnosti in namenskosti. V takšnih primerih je nemogoče govoriti o reprezentativnosti dobljenega vzorca, izračun napak reprezentativnosti pa lahko opravimo le s podatki o splošni populaciji.

Znanih je več shem za oblikovanje nenaključnega vzorca, ki so se močno razširile in se uporabljajo predvsem v socioloških raziskavah: izbor razpoložljivih opazovalnih enot, izbor po nürnberški metodi, ciljno vzorčenje pri identifikaciji strokovnjakov itd. Kvotno vzorčenje, ki ki ga raziskovalec oblikuje iz majhnega števila, je prav tako pomemben pomemben parameter in se zelo ujema s splošno populacijo. Z drugimi besedami, kvotna selekcija bi morala raziskovalcu zagotoviti skoraj popolno sovpadanje vzorčne in generalne populacije glede na izbrane parametre. Namensko doseganje bližine dveh populacij v omejenem obsegu indikatorjev dosežemo praviloma z bistveno manjšim vzorcem kot pri naključnem izboru. Prav zaradi te okoliščine je izbira kvot privlačna za raziskovalca, ki nima možnosti, da bi se osredotočil na velik naključni vzorec s samoutežjo. Dodati je treba, da je zmanjšanje velikosti vzorca najpogosteje kombinirano z zmanjšanjem denarnih stroškov in časa raziskovanja, kar povečuje prednosti te selekcijske metode. Opozorimo še, da je s kvotnim vzorčenjem precejšnji preliminarni podatek o strukturi populacije. Glavna prednost pri tem je, da je velikost vzorca bistveno manjša kot pri naključnem vzorčenju. Izbrane značilnosti (najpogosteje sociodemografske - spol, starost, izobrazba) naj tesno korelirajo s proučevanimi značilnostmi splošne populacije, tj. predmet raziskovanja.

Kot že omenjeno, metoda vzorčenja omogoča pridobivanje informacij o splošni populaciji z veliko manj denarja, časa in truda kot s kontinuiranim opazovanjem. Jasno je tudi, da je popolna študija celotne populacije v nekaterih primerih nemogoča, na primer pri preverjanju kakovosti izdelkov, katerih vzorci so uničeni.

Ob tem pa je treba poudariti, da populacija ni povsem »črna skrinjica« in o njej imamo še nekaj podatkov. Če na primer izvajamo vzorčno raziskavo o življenju, vsakdanjem življenju, premoženjskem stanju, dohodkih in izdatkih študentov, njihovih mnenjih, interesih itd., imamo še vedno podatke o njihovem skupnem številu, razvrščanju po spolu, starosti, zakonskem stanu, kraj bivanja, smer študija in druge značilnosti. Te informacije se vedno uporabljajo pri raziskavah vzorcev.

Poznamo več vrst porazdelitve vzorčnih značilnosti na splošno populacijo: metoda neposrednega preračunavanja in metoda korekcijskih faktorjev. Ponovni izračun značilnosti vzorca se praviloma izvede ob upoštevanju intervalov zaupanja in se lahko izrazi v absolutnih in relativnih vrednostih.

Tukaj je povsem na mestu poudariti, da večina statističnih informacij o gospodarskem življenju družbe v njegovih najrazličnejših pojavnih oblikah in vrstah temelji na vzorčnih podatkih. Seveda jih dopolnjujejo popolni registrski podatki in podatki, pridobljeni s popisi (prebivalstva, podjetij itd.). Na primer, vse proračunske statistike (o dohodkih in izdatkih prebivalstva), ki jih zagotavlja Rosstat, temeljijo na podatkih iz vzorčne študije. Tudi informacije o cenah, obsegu proizvodnje in obsegu trgovanja, izražene v ustreznih indeksih, v veliki meri temeljijo na vzorčnih podatkih.

Statistične hipoteze in statistični testi. Osnovni pojmi

Koncepta statističnega testa in statistične hipoteze sta tesno povezana z vzorčenjem. Statistična hipoteza (v nasprotju z drugimi znanstvenimi hipotezami) je predpostavka o nekaterih lastnostih populacije, ki jih je mogoče preizkusiti z uporabo podatkov iz naključnega vzorca. Ne smemo pozabiti, da je dobljeni rezultat verjetnostne narave. Posledično rezultat študije, ki potrjuje veljavnost postavljene hipoteze, skoraj nikoli ne more služiti kot osnova za njeno dokončno sprejetje, in nasprotno, rezultat, ki ni v skladu z njo, je povsem dovolj, da zavrnemo postavljeno hipotezo kot napačno. ali lažno. To je zato, ker je dobljeni rezultat lahko skladen z drugimi hipotezami in ne le s tisto, ki je bila postavljena.

Spodaj statistični kriterij razumemo kot niz pravil, ki nam omogočajo odgovor na vprašanje, pod katerimi rezultati opazovanja je hipoteza zavrnjena in pod katerimi ne. Z drugimi besedami, statistični kriterij je nekakšno odločilno pravilo, ki z visoko stopnjo verjetnosti zagotavlja sprejem prave (pravilne) hipoteze in zavrnitev napačne hipoteze. Statistični testi so enostranski in dvostranski, parametrični in neparametrični, bolj ali manj močni. Nekatera merila se uporabljajo pogosto, druga manj pogosto. Nekateri kriteriji so namenjeni reševanju posebnih vprašanj, nekateri kriteriji pa se lahko uporabljajo za reševanje širokega razreda problemov. Ta merila so postala razširjena v sociologiji, ekonomiji, psihologiji, naravne znanosti itd.

Predstavimo nekaj osnovnih konceptov statističnega testiranja hipotez. Testiranje hipotez se začne z ničelno hipotezo. n 0, tj. neka predpostavka raziskovalca, pa tudi konkurenčna, alternativna hipoteza n 1, ki je v nasprotju z glavnim. Na primer: n 0: , n 1: oz n 0: , n 1: (kje A- splošna havarija).

Glavni cilj raziskovalca pri testiranju hipoteze je zavrniti hipotezo, ki jo postavi. Kot je zapisal R. Fisher, je namen testiranja katere koli hipoteze le-ta zavrniti. Preizkušanje hipotez temelji na protislovju. Če torej verjamemo, da na primer povprečna plača delavcev, pridobljena iz določenega vzorca in znaša 186 denarnih enot na mesec, ne sovpada z dejanskimi plačami za celotno populacijo, potem je sprejeta ničelna hipoteza, da so te plače enaka.

Konkurenčna hipoteza n 1 je mogoče formulirati na različne načine:

n 1: , n 1: , n 1: .

Nato je določeno Napaka tipa I(a), ki navaja verjetnost, da bo prava hipoteza zavrnjena. Očitno bi morala biti ta verjetnost majhna (običajno od 0,01 do 0,1, najpogosteje je privzeta vrednost 0,05 oz. tako imenovana 5-odstotna stopnja pomembnosti). Ti nivoji izhajajo iz metode vzorčenja, po kateri dvakratna ali trikratna napaka predstavlja mejo, preko katere naključna variacija značilnosti vzorca največkrat ne seže. Napaka tipa II(b) je verjetnost, da bo nepravilna hipoteza sprejeta. Napaka tipa I je praviloma bolj »nevarna«; prav to beleži statistik. Če želimo na začetku študije hkrati zabeležiti a in b (na primer a = 0,05; b = 0,1), potem moramo za to najprej izračunati velikost vzorca.

Kritično območje(ali območje) je niz merilnih vrednosti, pri katerih n 0 je zavrnjen. Kritična točka T kr je točka, ki ločuje območje sprejemanja hipoteze od območja odstopanja ali kritičnega območja.

Kot že omenjeno, je napaka tipa I (a) verjetnost zavrnitve pravilne hipoteze. Manjši kot je a, manjša je verjetnost napake tipa I. Toda hkrati, ko se a zmanjša (na primer z 0,05 na 0,01), je težje zavrniti ničelno hipotezo, ki si jo raziskovalec pravzaprav zastavi. Ponovno poudarimo, da bo nadaljnje zmanjšanje a na 0,05 in več dejansko povzročilo, da bodo vse hipoteze, resnične in napačne, sodile v obseg sprejemljivosti ničelne hipoteze, in bo onemogočilo razlikovanje med njimi.

Napaka tipa II (b) se pojavi, ko je sprejeta n 0, vendar je v resnici alternativna hipoteza resnična n 1. Vrednost g = 1 – b imenujemo moč kriterija. Napaka tipa II (tj. nepravilno sprejemanje napačne hipoteze) se zmanjšuje z večanjem velikosti vzorca in naraščajočo stopnjo pomembnosti. Iz tega sledi, da ni mogoče hkrati zmanjšati a in b. To je mogoče doseči le s povečanjem velikosti vzorca (kar ni vedno mogoče).

Najpogosteje se naloge preverjanja hipotez zmanjšajo na primerjavo dveh vzorčnih povprečij ali deležev; primerjati splošno povprečje (ali delež) z vzorčnim; primerjava empiričnih in teoretičnih porazdelitev (kriteriji primernosti); primerjava dveh vzorčnih varianc (c 2 -merilo); primerjava dveh vzorčnih korelacijskih koeficientov oziroma regresijskih koeficientov in nekatere druge primerjave.

Odločitev o sprejetju ali zavrnitvi ničelne hipoteze je sestavljena iz primerjave dejanske vrednosti kriterija s tabelarično (teoretično) vrednostjo. Če je dejanska vrednost manjša od vrednosti v tabeli, se sklepa, da je odstopanje naključno in nepomembno, ničelne hipoteze pa ni mogoče zavrniti. Nasprotna situacija (dejanska vrednost je večja od vrednosti v tabeli) vodi do zavrnitve ničelne hipoteze.

Pri testiranju statističnih hipotez se uporabljajo tabele normalne porazdelitve, porazdelitve c 2 (beri: hi-kvadrat), t-distribucije (Študentske distribucije) in F-razporeditve (Fisherjeve porazdelitve).

Metoda majhnega vzorca ima številne prednosti pred metodo velikega vzorca. Njene glavne prednosti so, prvič, zmanjšanje količine računskega dela, in drugič, možnost spremljanja dinamike sprememb natančnosti procesa skozi čas, česar z metodo velikega vzorca ni mogoče storiti. Metoda velikega vzorca lahko poda samo predstavo o točnosti in stabilnosti procesa v času vzorčenja, ki lahko ostane tudi v prihodnje, če se pogoji procesa po odvzemu vzorca ne spremenijo. V resnici takšne nespremenljivosti proizvodnih pogojev ni mogoče vnaprej predvideti. Na primer, pri delu na paličnem stroju se med izmeno večkrat zamenja material (menjava palice), zamenja orodje zaradi obrabe, prilagodi stroj ipd., kar lahko bistveno prilagodi predhodno pridobljeno. parametri porazdelitve. Metoda majhnih vzorcev, če se slednji redno jemljejo med izmeno v določenih intervalih, vam omogoča, da dobite popolno sliko o stanju procesa v preučevanem obdobju, določite stopnjo njegove stabilnosti in tudi ugotovite razloge zaradi nezadostne stabilnosti procesa skozi čas, če obstaja.

Statistična analiza z majhnimi vzorci se izvede na naslednji način. Vzorci od n = 5-10 kosov. jemati v določenih fiksnih intervalih (na primer po 15-30 minutah). Določeno je časovno obdobje za vzorčenje empirično in je odvisna od produktivnosti stroja, volumna vzorčenja in stopnje stabilnosti tehnološkega procesa. Za vsak vzorec morate izračunati in S. Nato je potrebno za vsaka dva sosednja vzorca preveriti hipotezo o homogenosti vzorčnih varianc z uporabo F - Fisherjev kriterij.

Če je hipoteza potrjena, potem to kaže na stabilnost disperzije oziroma na to, da so primerjani vzorci vzeti iz iste populacije. Pri potrditvi hipoteze o homogenosti varianc dveh vzorcev je potrebno preveriti hipotezo o homogenosti dveh vzorčnih sredin. t - Študentski test.

Potrditev hipoteze o enakosti dveh sosednjih vzorčnih sredstev pomeni, da se središče uglaševanja opreme v času odvzema tega vzorca ne bo spremenilo in ostaja enako, kot je bilo pri odvzemu prejšnjega vzorca, tj. proces je v stabilnem stanju. Če hipoteza o enakosti obeh povprečnih vzorcev ni potrjena, to kaže na premik središča strojnega uglaševanja v času odvzema tega vzorca. Ker se vzorci jemljejo v določenih intervalih, je mogoče, če je zaznan premik v centru za nastavitev ali sprememba v disperzijski coni, določiti časovno obdobje, po katerem je prišlo do kršitve stabilnosti procesa.

Po odkritju dejstva o kršitvi stabilnosti procesa je mogoče določiti področje, na katerem je treba iskati vzrok tega pojava. Heterogenost disperzij vzorcev, ki kaže na nestabilnost disperzije, kaže, da je vzrok za to treba iskati v stroju oziroma v mehanskih lastnostih materiala, ki ga obdelujemo. Heterogenost vzorčnih povprečij kaže na premik središča uglasitve (vzrok poiščite v instrumentu).

Tako je z jemanjem majhnih vzorcev iz trenutne proizvodnje stroja med izmeno v določenih časovnih intervalih izračunano povprečje in variance vzorcev s primerjavo in ocenjevanjem njihovih neskladij z uporabo F in t-meril, je mogoče ugotoviti trenutke procesne motnje in celo izvore teh motenj.

A.M. Nosovski1*, A.E. Pikhlak2, V.A. Logačev2, I.I. Chursinova3, N.A. Mutyeva2 STATISTIKA MAJHNIH VZORCEV V MEDICINSKIH RAZISKAVAH

"Država center znanosti Ruska federacija- Inštitut za medicinske in biološke probleme Ruska akademija Sciences, 123007, Moskva, Rusija; 2GBOU VPO "Moskovska državna medicinska in stomatološka univerza po imenu A. I. Evdokimov" Ministrstvo za zdravje Rusije, 127473, Moskva, Rusija; 3ANO "Artrološka bolnišnica NPO SKAL", 109044, Moskva, Rusija

* Andrej Maksimovič Nosovski, E-naslov: [e-pošta zaščitena]

♦ Značilnosti statističnih kriterijev so bile ugotovljene eksperimentalno. Kot rezultat je bila izračunana vrednost statistik W. Ansari-Bradly in K. Klotz. Za vsako začetno statistiko se izračunata normalni približek (Z-statistika) in stopnja pomembnosti p ničelne hipoteze, da ni razlik v širjenju vrednosti obeh vzorcev. Če p>

Predlagane metode matematične statistike omogočajo potrditev zanesljivosti razlik v dobljenih rezultatih tudi v majhnih skupinah opazovanj, če so razlike dovolj pomembne. Ponazoritev so podali klinični primeri bolnikov z osteoartikularno patologijo. Ključne besede: majhen vzorec, testna moč, koksartroza, protinski poliartritis

A.M. Nosovskiy1, A.E.Pihlak2, V.A. Logačev2, I.I. Chursinova3, N.AMuteva2 STATISTIČNA ANALIZA MAJHNIH PODATKOV V ŠTUDIJAH MEDICINE

1 Državni raziskovalni center-inštitut za medicinsko biološke probleme Ruske akademije medicinskih znanosti, 123007 Moskva, Rusija; 2Moskovska državna univerza za medicino in zobozdravstvo poimenovana po A.I. Evdokimov, 127473 Moskva, Rusija; 3Artrološka bolnišnica znanstvenega in praktičnega združenja SKAL, 109044 Moskva, Rusija

♦ Eksperimentalno so bile ugotovljene značilnosti statističnih kriterijev. Kot rezultat izračunana vrednost statistike W. An-sari-Bradly in K. Klotz. Za vsak vir statistike izračunana normalna aproksimacija (Z-statistika) in stopnja pomembnosti p ničelne hipoteze o odsotnosti razlike v širjenju vrednosti obeh vzorcev. Pri p>0,05 je ničelno hipotezo mogoče sprejeti. Predlagane metode matematične statistike lahko potrjujejo točnost razlik rezultatov tudi v majhnih skupinah opazovanj, če so razlike dovolj velike.

Uporabili smo medicinske primere bolnikov s sklepno in kostno patologijo.

Ključne besede: analiza majhnih podatkov, moč kriterijev, koksartroza, protinski artritis

Načela medicine, ki temelji na dokazih, postavljajo visoke zahteve glede zanesljivosti primerjalne ocene rezultatov raziskav. To postane še toliko bolj pomembno, ker ima večina zdravnikov zelo površno razumevanje tehnik statistične obdelave, svoje objave omejil onkraj računanja odstotkov, v najboljši možni scenarij/-Studentov t-test.

Vendar v nekaterih primerih to ni dovolj za popolno analizo rezultatov raziskave. Običajno ni dvoma o zanesljivosti ugotovljenih vzorcev, ko je število opazovanj nekaj tisoč ali celo sto. In če jih je več deset? Kaj pa, če imamo le nekaj primerov? Navsezadnje so v medicini precej redke bolezni, kirurgi včasih izvajajo edinstvene operacije, ko je število opazovanj zelo majhno. Kje je tista meja, tista potrebna in zadostna količina raziskav, ki nam omogoča, da trdimo o nedvomni prisotnosti enega ali drugega vzorca?

To vprašanje je izjemnega pomena ne le pri ocenjevanju obstoječih raziskav, ampak tudi pri načrtovanju znanstvenega dela. Je dovolj spremljati 20 bolnikov ali jih je potrebnih najmanj 40? Ali pa bo morda 10 primerov dovolj? Od pravočasnega in pravilnega odgovora na to vprašanje ni odvisna le zanesljivost sklepov, temveč tudi čas raziskave, njeni stroški, potreba po osebju, opremi itd.

Sodobna statistika pozna kar nekaj tehnik, s katerimi lahko že z majhnim številom opazovanj ugotavljamo zanesljivost rezultatov. To so metode "majhnega vzorca". Splošno sprejeto je, da se je statistika majhnih vzorcev začela v prvem desetletju 20. stoletja z objavo dela Državne univerze

sklop, kjer je pod psevdonimom “Student” (študent) postuliral tako imenovano /-distribucijo. Za razliko od teorije normalne porazdelitve teorija porazdelitve za majhne vzorce ne zahteva vnaprejšnjega znanja ali natančnih ocen matematičnega pričakovanja in variance populacije ter ne zahteva predpostavk o parametrih. V /-porazdelitvi je eno od odstopanj od vzorčne sredine vedno fiksno, saj mora biti vsota vseh takih odstopanj enaka nič. To vpliva na vsoto kvadratov pri izračunu variance vzorca kot nepristranske ocene variance populacije in vodi do dejstva, da je število prostostnih stopinj df enako številu meritev minus ena za vsak vzorec. Zato je v formulah in postopkih za izračun /-statistike za testiranje ničelne hipoteze df=w-1. Znana so tudi klasična dela vodilnega angleškega statistika R.A. Fisher (po katerem je ^-porazdelitev dobila ime) glede na analizo variance - statistična metoda, se je izrecno osredotočil na analizo majhnih vzorcev. Med številnimi statistikami, ki jih je smiselno uporabiti na majhnih vzorcih, lahko omenimo: Fisherjev eksaktni verjetnostni test; dvofaktorska neparametrična (rang) Friedmanova analiza variance; korelacijski koeficient ranga/Kendall; Kendallov koeficient skladnosti; Kruskal-Wallaceov I-test za neparametrično (rangirano) enosmerno analizo variance; ^/-Mann-Whitneyjev test; merilo mediane; kriterij znaka; Spearmanov rang korelacijski koeficient; /-Wilcoxonov test.

Na vprašanje, kako velik mora biti vzorec, da ga lahko štejemo za majhnega, ni dokončnega odgovora. Vendar velja, da je konvencionalna meja med majhnim in velikim vzorcem df=30. Osnova

Za to nekoliko poljubno rešitev je uporabljen rezultat primerjave /-porazdelitve (za majhne vzorce) z normalno porazdelitvijo (r). Razlika med vrednostma / in r se nagiba k povečanju z zmanjševanjem in zmanjševanju z naraščanjem Pravzaprav se 1 začne približevati b dolgo pred mejnim primerom, ko je / = r. Preprost vizualni pregled vrednosti tabele / vam omogoča, da vidite, da ta približek postane precej hiter, začenši od ^=30 in več. Primerjalne vrednosti / (pri ^=30) in r so enake: 2,04 oziroma 1,96 za p=0,05; 2,75 in 2,58 za p=0,01; 3,65 in 3,29 za p = 0,001.

V matematični statistiki se uporablja koeficient zaupanja /, vrednosti funkcije so prikazane v tabeli pri različnih vrednostih in pridobljene so ustrezne stopnje zaupanja (tabela 1).

Koeficient zaupanja vam omogoča izračun največje vzorčne napake AX, izračunane po formuli AXsr=1tsr, tj. mejna vzorčna napaka je enaka 1/2-kratnemu številu povprečnih vzorčnih napak.

Tako je mogoče z določeno verjetnostjo ugotoviti vrednost največje vzorčne napake. Kot je razvidno iz zadnjega stolpca tabele 1, je verjetnost napake, ki je enaka ali večja od trojne povprečne napake vzorčenja, tj. AXc = 3cc, izredno majhna in enaka 0,003 (1–0,997). Takšni malo verjetni dogodki veljajo za praktično nemogoče, zato se lahko vrednost AX = 3cs vzame kot meja možne napake vzorčenja p3].

Interval, v katerem bo neznana vrednost ocenjenega parametra z dano stopnjo verjetnosti, se imenuje zaupanje, verjetnost P pa je verjetnost zaupanja. Najpogosteje je verjetnost zaupanja 0,95 ali 0,99, potem je koeficient zaupanja 1 enak 1,96 oziroma 2,58.

To pomeni, da interval zaupanja vsebuje splošno povprečje z dano verjetnostjo.

Večja kot je največja vzorčna napaka, večji je interval zaupanja in posledično manjša je točnost ocene.

Uporabo tega pristopa lahko ponazorimo z opazovanjem 20 bolnikov s koksartrozo, ki so bili zdravljeni v artrološki bolnišnici NPO "SKAL" (Raziskovalno-proizvodno združenje "Specializirani tečaj ambulantnega zdravljenja") v Moskvi.

Pri testiranju statistične hipoteze so možne napake. Obstajata dve vrsti napak. Napaka tipa I se pojavi, ko je ničelna hipoteza zavrnjena, čeprav je ničelna hipoteza dejansko resnična. Napaka tipa II se pojavi, ko je ničelna hipoteza sprejeta, ko je v resnici ničelna hipoteza napačna.

Verjetnost napake tipa I se imenuje stopnja pomembnosti in je označena z a. Tako je a=Р(Ш¥ | Н0), tj. stopnja pomembnosti a je verjetnost dogodka (Te¥), izračunana ob predpostavki, da je ničelna hipoteza H0 resnična.

Raven pomembnosti in testna moč sta združena v koncept testne jakostne funkcije – funkcije, ki določa verjetnost, da bo ničelna hipoteza zavrnjena. Funkcija moči je odvisna od kritične regije ¥ in dejanske porazdelitve opazovanj. V parametričnem

Tabela 1

Faktor zaupanja t in ustrezne stopnje zaupanja

t 1,00 1,96 2,00 2,58 3,00

F(0 0,683 0,950 0,954 0,990 0,997

V problemu testiranja hipotez je porazdelitev rezultatov opazovanja določena s parametrom 0. V tem primeru je funkcija moči označena z M(¥,0) in je odvisna od kritičnega območja ¥ in dejanske vrednosti proučevanega parametra 0 Če je H0: 0=00, H1: 0=01, potem je M (¥.00) = a, M(¥.01) = 1-b, kjer je a verjetnost napake prve vrste, b je verjetnost napake druge vrste. Nato je moč testa verjetnost, da bo ničelna hipoteza zavrnjena, ko je alternativna hipoteza resnična.

Funkcija moči M(¥,0) v primeru enodimenzionalnega parametra 0 običajno doseže minimum enak a pri 0=00, monotono narašča z razdaljo od 00 in se približa 1 pri | 0 - 00 | ^ da.

Ocenimo potrebno moč statističnih kriterijev (slika 1), s katerimi bi lahko analizirali zdravljenje 20 bolnikov s koksartrozo.

Kot lahko vidite, bodo s standardnim odklonom 3,0, kar je izjemno redko, rezultati pridobljeni z visoko stopnjo zanesljivosti /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

Za določitev stopnje pomembnosti p se običajno uporablja približni normalni 2-približek ustrezne statistike. Ta približek daje dober približek za dovolj velike velikosti vzorcev. Z majhno velikostjo vzorca in vrednostmi p blizu 0,05 smo testirali zaključek ničelne hipoteze primerjave

Krivulja moči alfa=0,05, sigma=

krivulja moči alfa=0,05, sigma=1,

Resnična razlika med sredstvi

Resnična razlika med sredstvi

riž. 1. Eksperimentalno ugotovljene značilnosti statistike

merila.

Tabela 2.

Skupine za opazovanje

Skupina 1 Skupina 2 Skupina 3 Skupaj opažanj

Nimesulid, vitamini, hondroprotektorji, fizikalna terapija + + + 20

Fizioterapija --- + + 15

Masaža... --- + 8

Bolečina pri premikanju

Bolečina v mirovanju 43±13 27±17

neskladje med izračunano vrednostjo statistike in kritično vrednostjo v tabeli ustrezne porazdelitve iz statističnega priročnika.

Kriteriji razlike v premiku (položaju). Ta merila smo uporabili za testiranje naslednjih hipotez:

♦ ni razlik v relativnih legah (medianah) obeh proučevanih vzorcev;

♦ premik vzorcev drug glede na drugega je enak določeni vrednosti d;

♦ mediana enega analiziranega vzorca je enaka vrednosti d.

V primeru b) je bilo treba najprej zmanjšati vse vrednosti drugega vzorca za vrednost d: yi=yi-d.

V primeru c) je treba pripraviti pomožni parni vzorec, katerega vsi elementi so enaki d.

Kot rezultat smo izračunali:

♦ vrednost W. Wilcoxonove statistike - vsota rangov Rxi elementov enega od vzorcev v združenem rangiranem vzorcu;

♦ vrednost Van der Vardenove statistike V, ki temelji na uporabi metode »poljubnih oznak«.

Za vsako statistiko sta bila izračunana normalni približek (Z-statistika) in stopnja pomembnosti P ničelne hipoteze o odsotnosti razlik v medsebojnem premiku. Če je p>0,05, je ničelna hipoteza sprejemljiva.

Nekateri paketi in avtorji predlagajo uporabo Mann-Whitneyjevega testa in Wald-Wolfowitzevega testa. Vendar je že dolgo dokazano, da je Mann-Whitneyjev kriterij enakovreden, tj. ima enake zmogljivosti kot kritični

Tabela 3.

Povprečne ocene intenzivnosti bolečine (VAS ocene)

1. skupina (n=5) 2. skupina (n=7) 3. skupina (n=8)

Indikator Začetek opazovanja Konec opazovanja Zmanjšanje bolečine Začetek opazovanja Konec opazovanja Zmanjšanje bolečine Začetek opazovanja Konec opazovanja Zmanjšanje bolečine

Tabela 4.

Podatki laboratorijskih preiskav bolnika B.

Št. Indikator Norma Rezultat predzadnjega Rezultat zadnjega

njega obiski obiski

Hematokrit, % 40-48 38,7

Limfociti, % 19-37 42

ESR, mm / uro 2-10 39

Sečna kislina, µmol/l 200-416 504

Kreatinin, µmol/l 44-106 238

Paratiroidni hormon, pg/ml 7-53 76,8

Fibrinogen, g/l 1,69-3,92 5.7

Beljakovine v urinu, g/l 0-0,1 1

43,5 39 10 489 202 101 3

predzadnji

Zadnja stvar

riž. 2. p-vrednosti kliničnih kazalcev bolnika B. na predzadnjem in zadnjem pregledu.

Wilcoxonov in Wald-Wolfowitzev test imata relativno nizko občutljivost.

Kriteriji za razlike v merilu (razpršenost). Ta merila smo uporabili za testiranje naslednjih hipotez:

♦ hipoteza o odsotnosti razlik v lestvicah (v razpršenosti ali disperziji vrednosti) proučevanih vzorcev;

♦ hipoteza, da je razmerje vzorčnih lestvic enako dani vrednosti g.

V slednjem primeru je treba najprej spremeniti vrednosti drugega vzorca y1 = (y1-m0)^, kjer je m0 skupna mediana obeh proučevanih spektrov.

Če mediani populacij, iz katerih so vzeti vzorci, niso enaki po vrednosti, temveč njihovi

uporabite tako, da najprej spremenite enega od vzorcev, na primer v vzorec yi=yi-m2+mr

Če mediane niso enake in neznane, je treba hipotezo, da ni razlik v premikih, potrditi ali pa uporabiti metodo za odkrivanje poljubnih alternativ.

Kot rezultat je bila izračunana vrednost statistik W. Ansari-Bradly in K. Klotz, ki sta konceptualni analogi Wilcoxonove in Van der Waerdenove statistike.

Za vsako začetno statistiko se izračunata normalni približek (Z-statistika) in stopnja pomembnosti P ničelne hipoteze, da ni razlik v širjenju vrednosti obeh vzorcev. Če je />>0,05, je ničelna hipoteza lahko sprejeta.

Tako zgoraj predlagane metode matematične statistike omogočajo potrditev zanesljivosti razlik

dobili rezultate tudi v majhnih skupinah opazovanj, če so razlike dovolj velike.

Kot ponazoritev lahko služita dva klinična primera bolnikov z osteoartikularno patologijo.

Klinični primer št. 1. Pri 20 bolnikih s koksartrozo je bil uporabljen osnovni kompleks zdravljenja, vključno s peroralno uporabo nimesulida, hondroprotektorjev, intramuskularne injekcije vitamini in fizikalna terapija. Poleg tega jih je 15 prejelo fizioterapevtsko obravnavo, 6 bolnikov pa masažo. Tako so bile oblikovane 3 skupine bolnikov z majhnim (od 5 do 8) številom opazovanj (tabela 2).

Med drugimi parametri smo pred začetkom zdravljenja in po zaključku tečaja (21±2 dni) ocenjevali intenzivnost bolečine med gibanjem in v mirovanju na 100-stopenjski vizualni analogni lestvici (VAS).

W. Ansari-Bradly in K. Klotz sta uporabila naslednje statistične metode (tabela 3).

Glede na pridobljene podatke (tabela 3) je bilo ugotovljeno, da zmanjšanje bolečine v mirovanju v skupini 1 na koncu opazovanja ni bilo pomembno. Vendar pa so bile razkrite zanesljive vrednosti za vse druge proučevane parametre. Obravnavani klinični primer dokazuje možnost pridobitve zanesljivih rezultatov iz majhnega vzorca.

Klinični primer št. 2 preučuje dinamiko laboratorijskih podatkov bolnika B., ki trpi za kroničnim protinskim poliartritisom, protino nefropatijo s simptomi kronične odpovedi ledvic, ki so bili zunaj referenčnih vrednosti (tabela 4).

Izračunajmo verjetnost, da rezultati analize statistično značilno presegajo meje klinične norme. Za to uporabljamo verjetnostni kalkulator statističnega paketa “STATISTICA 6.0”. V tem primeru p-vrednost meri napako tipa I: verjetnost zavrnitve pravilne hipoteze, ko je v resnici resnična. V večini primerov se rezultati predzadnjega obiska statistično značilno razlikujejo od norme (slika 2). Ker v tem primeru vzamemo mejno stopnjo signifikantnosti 0,05, so se rezultati hematokrita, limfocitov, ESR, fibrinogena ob zadnjem obisku statistično značilno izboljšali. Skladno s tem se klinični kazalniki sečne kisline, kreatinina, obščitničnega hormona in beljakovin v urinu z vidika matematične statistike niso izboljšali.

Tako je pri načrtovanju študije pomembno upoštevati moč uporabljenih statističnih testov, ki jih določata variabilnost vzorca in podana stopnja pomembnosti.

Predlagani pristop bi lahko bil zanimiv za specialiste na področju personalizirane medicine za

analiza dinamike uporabljenih metod zdravljenja in zdravil ob spremljanju izvajanja terapevtskih in diagnostičnih ukrepov.

LITERATURA

1. Bolshev L.N., Smirnov N.V. Tabele matematične statistike. M.: Znanost; 1995.

2. Korn G., Korn T. Priročnik iz matematike za znanstvenike in inženirje. M.: Znanost; 2003.

3. Kobzar A.I. Uporabna matematična statistika. Za inženirje in znanstvenike. M.: FIZMATLIT; 2006.

4. Pravetsky N.V., Nosovski A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Matematična utemeljitev zadostnega števila meritev za zanesljivo oceno zabeleženih parametrov v vesoljski biologiji in medicini. Vesoljska biologija in vesoljska medicina. M .: Medicina; 1990; 5:53-6.

5. HollenderM., Wulf D.A. Neparametrične metode statistike. M.: Finance in statistika; 1983.

6. Nosovski A.M. Uporaba verjetnostnih modelov na krožnici v biomedicinskih raziskavah. Vesoljska biologija in vesoljska medicina. Povzetki poročil IX vsezvezne konference. Kaluga, 19.-21. junij 1990.

7. Nosovski A.M., Pravetsky N.V., Kholin S.F. Matematični pristop k ocenjevanju točnosti meritev fiziološkega parametra različne metode. Vesoljska biologija in vesoljska medicina. M .: Medicina; 1991; 6:53-5.

1. Bol'shev L. N., Smirnov N. V. Tabele matematične statistike, Moskva: Nauka, 1995 (v ruščini).

2. Korn G., Korn T. Matematični priročnik za znanstvenike in inženirje. Moskva: Nauka; 2003 (v ruščini).

3. Kobzar" A.I. Uporabna matematična statistika. Za inženirje in znanstvenike. Moskva: FIZMATLIT; 2006 (v ruščini).

4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Matematična utemeljitev zadostnega števila meritev za zanesljivo vrednotenje zabeleženih parametrov v vesoljski biologiji in medicini. Vesoljska biologija in vesoljska medicina. Moskva: Meditsina; 1990; 5: 53-6 (v ruščini).

5. Khollender M., Vul'f D.A. Neparametrične statistične metode. Moskva: Finansy i statistika; 1983 (v ruščini).

6. Nosovskiy A.M. Uporaba verjetnostnih modelov na krogu v biomedicinskih raziskavah. Vesoljska biologija in vesoljska medicina. Povzetki IX vsezvezne konference. Kaluga, 19.-21. junij 1990 (v ruščini).

7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Matematični pristop k ocenjevanju točnosti fiziološkega parametra z različnimi metodami. Vesoljska biologija in vesoljska medicina. Moskva: Me-ditsina; 1991; 6: 53-5 (v ruščini).