Provtyper. Litet prov. praxis att använda små prover i kommersiell verksamhet Ett litet urval avser ett urval som inkluderar

Ovanstående metoder för att beräkna egenskaperna hos en urvalspopulation (spridning, medel- och marginalfel, etc.) ger en tillräckligt stor urvalsstorlek (n > 30). Samtidigt är en stor urvalsstorlek inte alltid möjlig och lämplig. I praktiken av produktionsobservationer och i forskningsarbete är det ofta nödvändigt att använda små prover, vars antal inte överstiger 30 enheter.(agronomiska och zootekniska experiment, kvalitetskontroll av produkter i samband med destruktion av prover, etc.). I statistiken kallas de för små urval. Enligt urvalet med mer än 30 enheter kallas stora urval.

Ett litet urval minskar dess noggrannhet jämfört med ett stort urval. Det har dock visat sig att resultaten som erhålls med små prover även kan utvidgas till den allmänna befolkningen. Men här är det nödvändigt att ta hänsyn till vissa funktioner, särskilt vid beräkning av standardavvikelsen. Med en liten urvalsstorlek bör en opartisk uppskattning av variansen 52 användas.

Grunderna för teorin om små prover utvecklades av den engelske matematikern-statistikern W. Gosset (pseudonym Student). Students forskning har visat att med en liten population skiljer sig standardavvikelsen i urvalet signifikant från standardavvikelsen i den allmänna populationen.

Eftersom standardavvikelsen för den allmänna populationen är en av parametrarna för normalfördelningskurvan är det olagligt att använda normalfördelningsfunktionen för att uppskatta parametrarna för den allmänna populationen baserat på data från små urval på grund av stora fel.

Vid beräkning av medelfelet för urval av liten storlek är det alltid nödvändigt att använda en opartisk uppskattning av variansen

där n - 1 är antalet grader av variationsfrihet (k), vilket förstås som antalet enheter som kan ta godtyckliga värden utan att ändra deras allmänna egenskaper (genomsnitt).

Till exempel gjordes tre observationer: x1= 4; x2 = 2; x3 = 6. Medelvärde

Så det återstår bara två fritt varierande kvantiteter, eftersom den tredje kan hittas från de kända två kvantiteterna och genomsnittet:

Därför, för det här exemplet, är antalet grader av variationsfrihet 2 (till = n - 1 = 3 - 1 = 2).

Eleven underbyggde lagen om fördelning av avvikelser av urvalsmedelvärden från det allmänna medelvärdet för små urval. Enligt Studentens fördelning beror sannolikheten för att marginalfelet inte överstiger det n-faldiga medelfelet i små urval på urvalets storlek och storlek.

Den teoretiska normaliserade avvikelsen för små prover kallas u-test, till skillnad från normalfördelningen u-test, som används i stora stickprov. Värdet på Students i-test anges i särskilda tabeller (bilaga 3).

Överväg proceduren för att bestämma medel- och marginella fel för ett litet urval med hjälp av ett sådant exempel. Antag att fem slumpmässigt utvalda platser på 4 m2 grävdes ut för att bestämma storleken på förlusterna vid skörd av potatis. Förluster per platser var (kg); 0,6; 0,2; 0,8; 0,4; 0,5.

Genomsnittlig förlust

Att döma av enskilda observationer varierar storleken på förlusten mycket och genomsnittet av endast fem observationer kan ha ett stort fel.

För att beräkna urvalsfel definierar vi en opartisk uppskattning av variansen

Låt oss beräkna medelfelet för provmedelvärdet, där istället för standardavvikelsen används dess opartiska uppskattning:

Enligt Students tabeller (bilaga 3) fastställer vi det med en konfidensnivå G= 0,95 (signifikansnivå a = 0,05) och vid k = n - 1 = 5 - 1 = 4 frihetsgrader variation Och= 2,78. Då är det marginella urvalsfelet

Så, med en sannolikhet P = 0,95, kan det hävdas att mängden förluster i hela fältet kommer att vara 0,5 ± 0,28 kg, eller från 0,22 till 0,78 kg per 4 m2.

Som vi kan se från exemplet är gränserna för slumpmässiga fluktuationer för små urval ganska stora och kan minskas genom att öka urvalsstorleken och minska fluktuationen (spridningen) av funktioner.

Om vi ​​använde sannolikhetsintegraltabellen (bilaga 2) för att beräkna konfidensgränserna för det allmänna medelvärdet, då Och skulle vara 1,96 och єх = iIzi \u003d 1,96 o 0,10 \u003d 0,20 kg, dvs. konfidensintervallet skulle vara snävare (från 0,30 till 0,70 kg).

Små prover, på grund av sin lilla storlek, även med den mest noggranna organisationen av observation, återspeglar inte exakt indikatorerna för den allmänna befolkningen. Därför används resultaten från små urval sällan för att fastställa tillförlitliga gränser för populationens egenskaper.

Elevens t-test används främst för att testa statistiska hypoteser om signifikansen av skillnader mellan indikatorerna för två eller flera små urval (se avsnitt 7).

Utöver själva stickprovet med dess tydliga probabilistiska motivering finns det andra stickprov som inte är absolut slumpmässiga, men som används flitigt. Det bör noteras att en strikt tillämpning av det faktiska slumpmässiga urvalet av enheter från den allmänna befolkningen inte alltid är möjlig i praktiken. Sådana prover inkluderar mekanisk provtagning, typisk, seriell (eller kapslad), flerfasig och ett antal andra.

Det händer sällan att den allmänna befolkningen är homogen, detta är mer undantag än regel. Om det finns olika typer av fenomen i den allmänna populationen är det därför ofta önskvärt att säkerställa en jämnare representation av olika typer i urvalspopulationen. Detta mål uppnås framgångsrikt genom att använda ett typiskt prov. Den största svårigheten är att vi måste ha ytterligare information om hela befolkningen, vilket i vissa fall är svårt.

Ett typiskt urval kallas också ett stratifierat eller stratifierat urval; det används också för att mer jämnt representera olika regioner i urvalet, i vilket fall provet kallas ett regionsprov.

Så under typisk Ett urval är ett sådant urval där den allmänna befolkningen är indelad i typiska undergrupper bildade enligt en eller flera väsentliga egenskaper (till exempel är befolkningen indelad i 3-4 undergrupper enligt den genomsnittliga inkomsten per capita eller utbildningsnivån - primär, sekundär, högre, etc.). Vidare, från alla typiska grupper, är det möjligt att välja enheter i urvalet på flera sätt, som bildar:

a) ett typiskt prov med en enhetlig fördelning, där lika många enheter väljs från olika typer (lager). Detta schema fungerar bra om i den allmänna befolkningen lagren (typerna) inte skiljer sig särskilt mycket från varandra i antalet enheter;

b) Typisk provtagning med proportionell placering, när det krävs (i motsats till enhetlig placering) att andelen (%) av urvalet för alla lager är densamma (till exempel 5 eller 10 %);

c) ett typiskt urval med optimal placering, när man tar hänsyn till graden av variation av egenskaper i olika grupper av den allmänna befolkningen. Med denna placering ökar andelen urval för grupper med stor fluktuation av egenskapen, vilket i slutändan leder till en minskning av slumpmässiga fel.

Formeln för medelfelet i typiskt urval liknar det vanliga urvalsfelet för ett korrekt slumpmässigt urval, med den enda skillnaden att istället för den totala variansen, läggs medelvärdet av de specifika inom-gruppvarianserna ner, vilket naturligtvis leder till till en minskning av felet jämfört med ett ordentligt stickprov. Men dess tillämpning är inte alltid möjlig (av många skäl). Om det inte finns något behov av stor noggrannhet är det enklare och billigare att använda seriell provtagning.

Serie(kapslade) provtagning består i att inte enheter av populationen (till exempel studenter) väljs ut i urvalet, utan separata serier eller bon (till exempel studiegrupper). Med andra ord, med seriellt (kapslat) urval sammanfaller inte observationsenheten och urvalsenheten: vissa grupper av enheter som gränsar till varandra (bon) väljs ut, och enheterna som ingår i dessa bon är föremål för undersökning. Så, till exempel, i en urvalsundersökning av bostadsförhållanden kan vi slumpmässigt välja ut ett visst antal hushåll (urvalsenhet) och sedan ta reda på levnadsvillkoren för de familjer som bor i dessa hus (observationsenheter).

Serier (bon) består av enheter som är sammankopplade geografiskt (distrikt, städer, etc.), organisatoriskt (företag, verkstäder, etc.), eller i tid (till exempel en uppsättning enheter av produkter som producerats under en given tidsperiod) .

Serievalet kan organiseras i form av ett-, två- eller flerstegsval.

Slumpmässigt utvalda serier utsätts för kontinuerlig forskning. Serieprovtagningen består alltså av två steg av slumpmässigt urval av serier och kontinuerlig studie av dessa serier. Serieval ger betydande besparingar i arbetskraft och resurser och används därför ofta i praktiken. Det seriella urvalsfelet skiljer sig från det faktiska slumpmässiga urvalsfelet genom att variansen mellan serier (intergrupp) används istället för den totala variansen, och antalet serier används istället för urvalsstorleken. Noggrannheten är vanligtvis inte särskilt hög, men i vissa fall är den acceptabel. Seriell provtagning kan upprepas och inte upprepas, och serier kan vara lika och ojämlika.

Serieprovtagning kan organiseras enligt olika scheman. Det är till exempel möjligt att bilda en urvalsuppsättning i två steg: först väljs serierna som ska undersökas ut slumpmässigt, sedan väljs också ett visst antal enheter som ska direkt observeras (mätas, vägs etc.) slumpmässigt från varje utvald serie. Felet för ett sådant prov kommer att bero på felet i serievalet och på felet i individuellt urval, dvs. flerstegsval ger vanligtvis mindre exakta resultat än enstegsurval, vilket förklaras av förekomsten av representativitetsfel vid varje urvalssteg. I det här fallet är det nödvändigt att använda samplingsfelsformeln för kombinerat urval.

En annan form av urval är flerfasval (1, 2, 3 faser eller steg). Detta val skiljer sig i sin struktur från flerstegsval, eftersom i flerfasval används samma urvalsenheter i varje fas. Fel i flerfasval beräknas för varje fas separat. Huvuddragen för ett tvåfasprov är att proverna skiljer sig från varandra enligt tre kriterier beroende på: 1) andelen enheter som studerats i den första fasen av provet och återinkluderats i den andra och efterföljande faserna; 2) från att observera lika chanser för varje provenhet i den första fasen att bli föremål för studien igen; 3) på storleken på intervallet som separerar faserna från varandra.

Låt oss uppehålla oss vid ytterligare en typ av urval, nämligen mekanisk(eller systematisk). Detta val är förmodligen det vanligaste. Detta beror tydligen på det faktum att av alla urvalsmetoder är denna den enklaste. I synnerhet är det mycket enklare än slumpmässigt urval, vilket innebär möjligheten att använda tabeller med slumpmässiga tal, och kräver inte ytterligare information om den allmänna befolkningen och dess struktur. Dessutom är mekaniskt urval tätt sammanflätat med proportionellt stratifierat urval, vilket leder till en minskning av urvalsfel.

Till exempel kommer användningen av ett mekaniskt urval av medlemmar i en bostadsrättsförening från en lista som sammanställts i ordningsföljden för antagning till detta kooperativ att säkerställa proportionell representation av medlemmar i kooperativet med olika tjänstgöringslängd. Att använda samma teknik för att välja respondenter från en alfabetisk lista över personer ger lika chanser för efternamn som börjar med olika bokstäver och så vidare. Användning av personal eller andra listor i företag eller utbildningsinstitutioner etc. kan säkerställa den nödvändiga proportionaliteten i representationen av arbetstagare med olika anställningstid. Observera att mekaniskt urval används mycket inom sociologi, i studiet av den allmänna opinionen, etc.

För att minska felet och särskilt kostnaden för provtagning används i stor utsträckning olika kombinationer av enskilda typer av provtagning (mekanisk, seriell, individuell, flerfasig etc.) I sådana fall bör mer komplexa provtagningsfel beräknas som består av av fel som uppstår i olika skeden av studien.

Ett litet urval är en uppsättning enheter mindre än 30. Små prov är ganska vanliga i praktiken. Till exempel antalet fall av sällsynta sjukdomar eller antalet enheter med en sällsynt egenskap; dessutom används ett litet prov när forskningen är dyr eller forskningen innebär att produkter eller prover förstörs. Små prover används i stor utsträckning inom området produktkvalitetsundersökningar. De teoretiska grunderna för att fastställa felen i ett litet urval lades av den engelske vetenskapsmannen W. Gosset (pseudonym Student).

Man måste komma ihåg att när man bestämmer felet för ett litet urval, istället för urvalsstorleken, ta värdet ( n- 1) eller, innan det genomsnittliga urvalsfelet bestäms, beräkna den så kallade korrigerade samplingsvariansen (i nämnaren istället för n ska sätta ( n- 1)). Observera att en sådan korrigering endast görs en gång - vid beräkning av provvariansen eller vid fastställande av felet. Värde ( n– 1) kallas frihetsgraden. Normalfördelningen ersätts också t-fördelning (Students fördelning), som är tabellerad och beror på antalet frihetsgrader. Den enda parametern i studentfördelningen är värdet ( n- 1). Vi betonar än en gång att ändringen ( n– 1) är viktig och signifikant endast för små urvalspopulationer; på n> 30 och uppåt försvinner skillnaden och närmar sig noll.

Fram till nu har vi pratat om stickprov, d.v.s. sådana när urvalet av enheter från den allmänna populationen görs slumpmässigt (eller nästan slumpmässigt) och alla enheter har lika stor (eller nästan lika) sannolikhet att ingå i urvalet. Urvalet av enheter kan dock baseras på principen om icke-slumpmässigt urval, när principen om tillgänglighet och ändamålsenlighet står i främsta rummet. I sådana fall är det omöjligt att tala om representativiteten för det erhållna urvalet, och beräkningen av representativitetsfel kan endast göras om vi har information om den allmänna befolkningen.

Det finns flera scheman för bildandet av icke-slumpmässigt urval, som har fått stor spridning och används främst inom sociologisk forskning: urval av tillgängliga observationsenheter, urval enligt Nürnbergmetoden, målprovtagning vid fastställande av experter etc. Kvotprovtagning, som är bildad av en forskare baserat på ett litet antal signifikanta parametrar och ger en mycket nära matchning med befolkningen. Med andra ord bör kvoturval ge forskaren en nästan fullständig matchning mellan urvalet och den allmänna populationen enligt de parametrar han valt. Det målmedvetna uppnåendet av närheten till två populationer inom ett begränsat spektrum av indikatorer uppnås som regel med ett urval av en betydligt mindre storlek än när man använder slumpmässigt urval. Det är denna omständighet som gör kvotvalet attraktivt för en forskare som inte kan fokusera på ett självvägt slumpmässigt urval av stor storlek. Det bör tilläggas att en minskning av urvalsstorleken oftast kombineras med en minskning av monetära kostnader och tidpunkten för studien, vilket ökar fördelarna med denna urvalsmetod. Vi noterar också att det med ett kvoturval finns ganska mycket preliminär information om den allmänna befolkningens struktur. Den största fördelen här är att urvalsstorleken är betydligt mindre än med ett slumpmässigt urval. De identifierade egenskaperna (oftast sociodemografiska - kön, ålder, utbildning) bör nära korrelera med de studerade egenskaperna hos den allmänna befolkningen, d.v.s. studieobjekt.

Som redan nämnts gör urvalsmetoden det möjligt att få information om den allmänna befolkningen med mycket mindre pengar, tid och ansträngning än med kontinuerlig observation. Det är också uppenbart att en kontinuerlig undersökning av hela befolkningen är omöjlig i ett antal fall, till exempel när man kontrollerar kvaliteten på produkter vars prover förstörs.

Tillsammans med detta bör det dock påpekas att den allmänna befolkningen inte är helt en "svart låda" och vi har fortfarande en del information om det. Genom att till exempel göra en selektiv undersökning om studenters liv, liv, egendomsstatus, inkomster och utgifter, deras åsikter, intressen etc., har vi fortfarande information om deras totala antal, gruppering efter kön, ålder, civilstånd, ort av bostad, studiegång och andra egenskaper. Denna information används alltid i en provstudie.

Det finns flera varianter av fördelningen av provegenskaper till den allmänna befolkningen: metoden för direkt omräkning och metoden för korrektionsfaktorer. Omräkningen av provets egenskaper utförs som regel med hänsyn till konfidensintervall och kan uttryckas i absoluta och relativa värden.

Här är det mycket lämpligt att understryka att merparten av den statistiska informationen rörande det ekonomiska livet i samhället i dess olika yttringar och typer bygger på selektiva uppgifter. Naturligtvis kompletteras de med fullständiga registreringsuppgifter och information som erhållits som ett resultat av folkräkningar (av befolkning, företag, etc.). Till exempel är all budgetstatistik (om befolkningens inkomster och utgifter) som tillhandahålls av Rosstat baserad på urvalsundersökningsdata. Information om priser, produktionsvolymer, handelsvolymer, uttryckta i motsvarande index, bygger också till stor del på urvalsdata.

Statistiska hypoteser och statistiska tester. Grundläggande koncept

Begreppen statistiskt test och statistisk hypotes är nära besläktade med urval. En statistisk hypotes (till skillnad från andra vetenskapliga hypoteser) består i att anta vissa egenskaper hos den allmänna befolkningen som kan testas baserat på data från ett slumpmässigt urval. Man bör komma ihåg att det erhållna resultatet är sannolikhetsmässigt till sin natur. Följaktligen kan resultatet av studien, som bekräftar giltigheten av den framförda hypotesen, nästan aldrig tjäna som en grund för dess slutgiltiga acceptans, och vice versa, resultatet, som är oförenligt med det, är fullt tillräckligt för att förkasta den framställda hypotesen som felaktiga eller falska. Detta beror på att det erhållna resultatet kan överensstämma med andra hypoteser, och inte bara med den som lagts fram.

Under statistiskt kriterium förstås som en uppsättning regler som tillåter att besvara frågan om under vilka observationsresultat hypotesen förkastas och under vilka den inte är det. Ett statistiskt kriterium är med andra ord en viss beslutsregel som säkerställer acceptansen av en sann (sann) hypotes och förkastandet av en falsk hypotes med en hög grad av sannolikhet. Statistiska tester är ensidiga och tvåsidiga, parametriska och icke-parametriska, mer eller mindre kraftfulla. Vissa kriterier används ofta, andra används mer sällan. Vissa av kriterierna är utformade för att lösa speciella problem, och vissa kriterier kan användas för att lösa en bred klass av problem. Dessa kriterier har blivit allestädes närvarande inom sociologi, ekonomi, psykologi, naturvetenskap och så vidare.

Låt oss introducera några grundläggande begrepp för statistisk hypotestestning. Hypotestestning börjar med nollhypotesen H 0 , dvs. något antagande av forskaren, samt en konkurrerande, alternativ hypotes H 1 , vilket motsäger den huvudsakliga. Till exempel: H 0: , H 1: eller H 0: , H 1: (var A- det allmänna genomsnittet).

Det huvudsakliga målet för forskaren när han testar en hypotes är att förkasta den hypotes som lagts fram av honom. Som R. Fisher skrev är målet med att testa varje hypotes att förkasta den. Hypotesprövning bygger på motsatsen. Därför, om vi tror att, till exempel, genomsnittslönerna för arbetare, erhållna enligt data från ett visst urval och lika med 186 monetära enheter per månad, inte sammanfaller med de faktiska lönerna för hela befolkningen, så antas det som en nollhypotes att dessa löner är lika.

Konkurrerande hypotes H 1 kan formuleras på olika sätt:

H 1: , H 1: , H 1: .

Nästa bestäms typ I fel(a), som anger sannolikheten för att en sann hypotes kommer att förkastas. Självklart bör denna sannolikhet vara liten (vanligtvis från 0,01 till 0,1, oftast som standard 0,05, eller den så kallade 5 % signifikansnivån). Dessa nivåer följer av urvalsmetoden, enligt vilken det dubbla eller trippelfelet representerar de gränser över vilka den slumpmässiga variationen av urvalsegenskaperna oftast inte går. Typ II fel(b) är sannolikheten att fel hypotes kommer att accepteras. Som regel är typ I-felet mer "farligt"; Det är hon som fixas av statistikern. Om vi ​​i början av studien vill fixa a och b samtidigt (till exempel a = 0,05; b = 0,1), måste vi för detta först beräkna urvalsstorleken.

Kritisk zon(eller område) är en uppsättning kriteriumvärden under vilka H 0 avvisas. kritisk punkt T kr är den punkt som skiljer området för acceptans av hypotesen från området för avvikelse, eller den kritiska zonen.

Som redan nämnts är typ I-fel (a) sannolikheten att förkasta en korrekt hypotes. Ju mindre a, desto mindre sannolikt är det att göra ett typ I-fel. Men samtidigt, när a minskar (till exempel från 0,05 till 0,01), är det svårare att förkasta nollhypotesen, som i själva verket är vad forskaren sätter upp sig själv. Vi betonar än en gång att en ytterligare minskning av a till 0,05 och längre faktiskt kommer att leda till det faktum att alla hypoteser, sanna och falska, kommer att falla inom området för att acceptera nollhypotesen och kommer att göra det omöjligt att skilja mellan dem .

Ett typ II-fel (b) uppstår när man accepterar H 0 , men i själva verket är den alternativa hypotesen sann H 1 . Värdet g = 1 – b kallas kriteriets potens. Typ II-fel (d.v.s. felaktig acceptans av en falsk hypotes) minskar med ökande urvalsstorlek och ökande signifikansnivå. Av detta följer att det är omöjligt att minska a och b samtidigt. Detta uppnås endast genom att öka urvalsstorleken (vilket inte alltid är möjligt).

Oftast reduceras uppgifterna med att testa en hypotes till att jämföra två urvalsmedelvärden eller andelar; att jämföra det allmänna medelvärdet (eller andelen) med urvalet; jämförelse av empiriska och teoretiska fördelningar (fitnesskriterier); jämförelse av två urvalsvarianser (c2-kriterium); jämförelse av två provkorrelationskoefficienter eller regressionskoefficienter och några andra jämförelser.

Beslutet att acceptera eller förkasta nollhypotesen består i att jämföra det faktiska värdet av kriteriet med det tabellformiga (teoretiska). Om det faktiska värdet är mindre än tabellvärdet dras slutsatsen att avvikelsen är slumpmässig, obetydlig och nollhypotesen kan inte förkastas. Den omvända situationen (det faktiska värdet är större än det tabellformade) leder till att nollhypotesen förkastas.

Vid testning av statistiska hypoteser används oftast tabeller med normalfördelning, fördelningar c 2 (läs: chi-kvadrat), t-fördelningar (Elevfördelningar) och F-distributioner (Fisher distributioner).

Den lilla urvalsmetoden har ett antal fördelar jämfört med den stora urvalsmetoden. Dess främsta fördelar är, för det första, en minskning av mängden beräkningsarbete, och för det andra, förmågan att övervaka dynamiken i förändringar i processens noggrannhet över tid, vilket inte kan göras med hjälp av metoden med stort urval. Metoden med stora prover kan bara ge en uppfattning om processens noggrannhet och stabilitet under provtagningsperioden, vilket kan bevaras i framtiden om processförhållandena inte ändras efter provtagningen. I själva verket kan en sådan oföränderlighet av produktionsförhållandena inte förutses i förväg. Till exempel, när man arbetar på en stångmaskin under ett skift, byts material flera gånger (stångbyte), verktygsbyte på grund av slitage, maskinavstämning etc., vilket kan göra betydande justeringar av tidigare erhållna fördelningsparametrar. Metoden med små prover, om de senare tas regelbundet under skiftet med vissa intervall, gör att du kan få en fullständig bild av processens tillstånd under studieperioden, ta reda på graden av dess stabilitet och också identifiera orsakerna för processens otillräckliga stabilitet över tid, om någon.

Statistisk analys av små prover utförs enligt följande. Provstorlek n = 5-10 st. tas med vissa fasta intervall (till exempel efter 15-30 minuter). Tidsperioden för provtagning fastställs empiriskt och beror på maskinens produktivitet, provstorleken och graden av stabilitet hos den tekniska processen. För varje prov måste du beräkna och S. Därefter, för varje två angränsande prov, är det nödvändigt att testa hypotesen om homogenitet av provvarianser med hjälp av F - Fishers kriterium.

Om hypotesen bekräftas, indikerar detta spridningsstabiliteten eller att de jämförda proverna är tagna från samma allmänna population. När man bekräftar hypotesen om homogenitet av varianserna för två prover, bör man kontrollera hypotesen om homogenitet för två urvalsmedelvärden i termer av t -Elevens kriterium.

Bekräftelse av hypotesen om likhet mellan två intilliggande prov betyder att utrustningens inställningscentrum inte kommer att ändras vid tidpunkten för provtagningen och förblir densamma som när det föregående provet togs, dvs. processen är i ett stabilt tillstånd. När hypotesen om likhet mellan de två medelproven inte bekräftas, indikerar detta en förskjutning i mitten av maskininställningen under provtagningen. Eftersom prover tas med vissa tidsintervall, när en förskjutning i justeringens centrum eller en förändring i spridningszonen detekteras, är det möjligt att bestämma tidsperioden efter vilken en kränkning av stabiliteten i processen inträffade.

Efter att ha upptäckt faktumet av brott mot processens stabilitet är det möjligt att fastställa det område där orsaken till detta fenomen ska sökas. Inhomogeniteten hos provdispersionerna, vilket indikerar dispersionens instabilitet, indikerar att orsaken till detta bör sökas i verktygsmaskinen eller i de mekaniska egenskaperna hos materialet som bearbetas. Heterogeniteten hos provmedlet indikerar en förskjutning i justeringscentrum (anledningen är att leta efter i instrumentet).

Genom att ta små prover från den nuvarande produktionen av maskinen under skiftet vid vissa tidsintervall, beräkna medelvärden och varianser för proverna genom att jämföra och utvärdera deras avvikelse med F- och t-kriterier, är det möjligt att fastställa processmomenten störning och till och med källorna till dessa störningar.

A.M. Nosovsky1*, A.E. Pihlak2, V.A. Logachev2, I.I. Chursinova3, N.A. Mutyeva2 STATISTIK ÖVER SMÅ PROV I MEDICINSK FORSKNING

"Ryska federationens statliga vetenskapliga centrum - Ryska vetenskapsakademins institut för medicinska och biologiska problem, 123007, Moskva, Ryssland; NPO SKAL Hospital, 109044, Moskva, Ryssland

*Nosovsky Andrey Maksimovich, e-post: [e-postskyddad]

♦ Egenskaper för statistiska kriterier hittas experimentellt. Som ett resultat har värdet av statistiken W. Ansari-Bradley (Ansari-Bradly) och K. Klotts (Klotz) beräknats. För varje initial statistik beräknas en normal approximation (Z-statistik) och en signifikansnivå p för nollhypotesen om frånvaron av skillnader i spridningen av värdena för de två proverna. Om p>

De föreslagna metoderna för matematisk statistik gör det möjligt att bekräfta tillförlitligheten av skillnaderna i de erhållna resultaten även i små grupper av observationer, om skillnaderna är tillräckligt betydande. Kliniska exempel på patienter med osteoartikulär patologi tjänade som en illustration. Nyckelord: litet urval, kriteriets kraft, coxarthrosis, giktartrit

A.M. Nosovskiy1, A.E. Pikhlak2, V.A. Logachev2, I.I. Chursinova3, N.AMuteva2 SMÅDATA STATISTIK ANALYS I MEDICINSKA STUDIER

1Det statliga forskningscentret-institutet för medicinska biologiska problem vid Rysslands akademi för medicinska vetenskaper, 123007 Moskva, Ryssland; 2Moscow State University of Medicine and Dentistry uppkallad efter A.I. Evdokimov, 127473 Moskva, Ryssland; 3Artrologisjukhuset för vetenskaplig och praktisk förening SKAL, 109044 Moskva, Ryssland

♦ Den experimentella hittades egenskaper hos statistiska kriterier. Som ett resultat, beräknade värdet av statistiken av W. An-sari-Bradly och K. Klotz. För varje statistikkälla beräknas normal approximation (Z-statistik) och signifikansnivån för p av nollhypotesen om ingen skillnad i spridningen av värdena för de två proverna. Atp>0,05 kan nollhypotesen accepteras. Föreslagna metoder för matematisk statistik kan vara att bekräfta riktigheten av skillnaderna i resultaten, även i små grupper av observationer, om skillnaderna är tillräckligt betydande.

Vi använde medicinska fall av patienter med led- och benpatologi.

Nyckelord: analys av små data, kriteriernas makt, coxarthrosis, giktartrit

Principerna för evidensbaserad medicin ställer höga krav på tillförlitligheten i den jämförande bedömningen av erhållna forskningsresultat. Detta blir desto viktigare eftersom de flesta läkare har en mycket ytlig förståelse av metoderna för statistisk bearbetning, begränsar sig själva i sina publikationer, förutom att de i bästa fall beräknar procentsatser efter Students /-kriterium.

Men för en fullständig analys av studiens resultat räcker detta i vissa fall inte. Det råder vanligtvis inga tvivel om tillförlitligheten av de avslöjade regelbundenheterna när antalet observationer är flera tusen eller till och med hundratals. Tänk om det är flera dussin? Tänk om vi bara har ett fåtal fall? Det finns faktiskt ganska sällsynta sjukdomar inom medicin, kirurger utför ibland unika operationer när antalet observationer är mycket litet. Var finns den gränsen, den nödvändiga och tillräckliga mängd forskning som gör att vi kan hävda den otvivelaktiga närvaron av den eller den regelbundenhet?

Denna fråga är av stor betydelse inte bara vid utvärderingen av redan genomförda studier utan också vid planeringen av vetenskapligt arbete. Räcker det med att observera 20 patienter eller är minst 40 nödvändigt? Eller kanske 10 fall räcker? Inte bara tillförlitligheten av de slutsatser som dras, utan också tidpunkten för forskningen, deras kostnad, behovet av personal, utrustning etc. beror på ett snabbt och korrekt svar på denna fråga.

Modern statistik känner till ganska många knep med vilka du kan bestämma resultatens tillförlitlighet även med ett litet antal observationer. Dessa är "småprov" metoder. Det är allmänt accepterat att starten för statistik med små urval lades under det första decenniet av 1900-talet genom publiceringen av U.S.

set, där han under pseudonymen "Student" (student) postulerade den så kallade /-fördelningen. Till skillnad från teorin om normalfördelning kräver teorin om små urvalsfördelningar inte a priori kunskap eller exakta uppskattningar av populationens medelvärde och varians, och kräver inga antaganden om parametrarna. I /-fördelningen är alltid en av avvikelserna från urvalsmedelvärdet fast, eftersom summan av alla sådana avvikelser måste vara lika med noll. Detta påverkar kvadratsumman vid beräkning av urvalsvariansen som en opartisk skattning av populationsvariansen och leder till att antalet frihetsgrader df är lika med antalet mätningar minus en för varje urval. Därför, i formlerna och procedurerna för att beräkna /-statistik för att testa nollhypotesen df=w-1. Kända är också de klassiska verken av den största engelska statistikern R.A. Fisher (efter vilken ^-fördelningen fått sitt namn) på variansanalys - en statistisk metod som tydligt är inriktad på analys av små prover. Av de många statistik som rimligen kan tillämpas på små urval kan vi nämna: Fishers exakta sannolikhetstest; tvåfaktors icke-parametrisk (rang) variansanalys Friedman; rank korrelationskoefficient / Kendall; Kendalls konkordansfaktor; Kruskal-Wallace R-test för icke-parametrisk (rank) envägsanalys av varians; ^/-Mann-Whitney test; mediankriterium; tecken kriterium; rangkorrelationskoefficient Mr Spearman; /-Wilcoxon test.

Det finns inget entydigt svar på frågan hur stort ett urval bör vara för att anses vara litet. Den villkorliga gränsen mellan ett litet och stort urval anses dock vara df=30. fundament

för denna, till viss del, en godtycklig lösning, tjänar resultatet av att jämföra /-fördelningen (för små prov) med normalfördelningen (r). Diskrepansen mellan värdena på / och r tenderar att öka med minskande och minska med ökande. Faktum är att 1 börjar närma sig b långt före begränsningsfallet när / = r. En enkel visuell undersökning av tabellvärdena / låter dig se att denna approximation blir ganska snabb, med början med ^=30 och uppåt. Jämförande värden för / (vid t=30) och r är respektive: 2,04 och 1,96 för p=0,05; 2,75 och 2,58 för p=0,01; 3,65 och 3,29 för p=0,001.

I matematisk statistik används konfidensfaktorn /, funktionens värden tabelleras för dess olika värden och motsvarande konfidensnivåer erhålls (tabell 1).

Konfidenskoefficienten låter dig beräkna marginalsamplingsfelet AX, beräknat med formeln AXav = 1tsav, dvs. det marginella urvalsfelet är lika med /-faldigt antalet genomsnittliga urvalsfel.

Således kan värdet på det marginella urvalsfelet ställas in med en viss sannolikhet. Som kan ses från den sista kolumnen i Tabell 1 är sannolikheten för ett fel lika med eller större än tredubbla det genomsnittliga samplingsfelet, dvs AXs = 3tss, extremt liten och lika med 0,003 (1-0,997). Sådana osannolika händelser anses praktiskt taget omöjliga, och därför kan värdet AX = 3cs tas som gränsen för det möjliga samplingsfelet p3].

Intervallet i vilket det okända värdet av den uppskattade parametern kommer att inneslutas med en given grad av sannolikhet kallas konfidensintervall, och sannolikheten P kallas konfidenssannolikheten. Oftast tas konfidenssannolikheten lika med 0,95 eller 0,99, då är konfidenskoefficienten 1 lika med 1,96 respektive 2,58.

Det betyder att konfidensintervallet innehåller det generella medelvärdet med en given sannolikhet.

Ju större värdet på det marginella urvalsfelet är, desto större är värdet på konfidensintervallet och följaktligen desto lägre blir noggrannheten för skattningen.

Tillämpningen av detta tillvägagångssätt kan illustreras genom observation av 20 patienter med coxarthrosis som behandlades på Arthrological Hospital NPO "SKAL" (Scientific and Production Association "Specialiserad kurs öppenvårdsbehandling") i Moskva.

När man testar en statistisk hypotes är fel möjliga. Det finns två typer av fel. Ett typ I-fel uppstår när nollhypotesen förkastas när nollhypotesen faktiskt är sann. Ett typ II-fel uppstår när nollhypotesen accepteras när nollhypotesen i själva verket är falsk.

Sannolikheten för ett typ I-fel kallas signifikansnivån och betecknas a. Således, a=P(W¥ | H0), dvs. signifikansnivån a är sannolikheten för händelsen (Ce¥), beräknad under antagandet att nollhypotesen H0 är sann.

Testets signifikans- och maktnivå kombineras i begreppet testets potensfunktion – en funktion som bestämmer sannolikheten för att nollhypotesen ska förkastas. Effektfunktionen beror på det kritiska området ¥ och den faktiska fördelningen av observationsresultaten. I det parametriska

bord 1

Konfidensfaktor t och motsvarande konfidensnivåer

t 1,00 1,96 2,00 2,58 3,00

F(0 0,683 0,950 0,954 0,990 0,997

I hypotestestningsproblemet ges fördelningen av observationsresultat av parametern 0. I detta fall betecknas potensfunktionen med M(¥,0) och beror på det kritiska området ¥ och det faktiska värdet av parametern som studeras 0. Om H0: 0=00, H1: 0=01, då M (¥,00) \u003d a, M(¥,01) \u003d 1-c, där a är sannolikheten för ett fel av det första slaget , b är sannolikheten för ett fel av det andra slaget. Sedan är testets styrka sannolikheten att nollhypotesen kommer att förkastas när den alternativa hypotesen är sann.

Effektfunktionen M(¥,0) i fallet med en endimensionell parameter 0 når vanligtvis ett minimum lika med a vid 0=00, ökar monotont med avståndet från 00 och närmar sig 1 vid | 0 - 00 | ^ ja.

Låt oss uppskatta den erforderliga styrkan hos statistiska kriterier (Fig. 1), som kan användas för att analysera behandlingen av 20 patienter med coxarthrosis.

Som du kan se, med en standardavvikelse på 3.0, vilket är extremt sällsynt, kommer resultat att erhållas med en hög grad av tillförlitlighet /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

För att bestämma signifikansnivån p används vanligtvis en ungefärlig normal 2-approximation av motsvarande statistik. Denna approximation ger en bra approximation för tillräckligt stora urvalsstorlekar. Med en liten urvalsstorlek och p-värden nära 0,05 testade vi slutsatsen om nollhypotesen genom att jämföra

Effektkurva alfa=0,05, sigma=

Effektkurva alfa=0,05, sigma=1,

Sann skillnad mellan medel

Sann skillnad mellan medel

Ris. 1. Experimentellt hittade egenskaper hos statistiska

kriterier.

Tabell 2 .

Observationsgrupper

Grupp 1 Grupp 2 Grupp 3 Totala observationer

Nimesulid, vitaminer, kondroprotektorer, träningsterapi + + + 20

Fysioterapi --- + + 15

Massage... --- + 8

Smärta vid rörelse

Smärta i vila 43±13 27±17

beräkningen av statistikens beräknade värde med ett kritiskt värde i tabellen över motsvarande fördelning från statistikhandboken.

Kriterier för skillnader i skift (position). Vi använde dessa kriterier för att testa följande hypoteser:

♦ inga skillnader i den inbördes positionen (medianerna) för de två studerade proverna;

♦ förskjutningen av sampel i förhållande till varandra är lika med något värde d;

♦ medianen för ett analyserat prov är lika med värdet d.

I fall b) var det nödvändigt att minska alla värden för det andra provet med värdet d: yi=yi-d.

I fall c) är det nödvändigt att förbereda ett extra parat prov, vars alla element är lika med d.

Som ett resultat beräknade vi:

♦ värdet av W. Wilcoxons statistik (Wilco-xon) - summan av rangorden Rxi för elementen i ett av proverna i det kombinerade rangordnade urvalet;

♦ värdet av van der Varden V-statistiken baserad på användningen av metoden "godtyckliga märken".

För varje statistik beräknades en normal approximation (Z-statistik) och en signifikansnivå P för nollhypotesen om ingen skillnad i förskjutning i förhållande till varandra. Om p>0,05 kan nollhypotesen accepteras.

Vissa paket och författare föreslår att man använder Mann-Whitney ^/-testet och Wald-Wolfowitz-testet. Det är dock sedan länge bevisat att Mann-Whitney-kriteriet är likvärdigt, d.v.s. har samma kapacitet som den kritiska

Tabell 3.

Medelindikatorer för smärtintensitet (i poäng enligt VAS)

Grupp 1 (n= 5) Grupp 2 (n=7) Grupp 3 (n= =8)

Parameter Start av uppföljning Slutet av uppföljning Smärtminskning Start av uppföljning Slutet av uppföljning Smärtminskning Start av uppföljning Slutet av uppföljning Smärtminskning

Tabell 4

Data från laboratorieundersökning av patient B.

Nr. Indikator Norm Resultat av det näst sista resultatet av det senaste

honom på besök

Hematokrit, % 40-48 38,7

Lymfocyter, % 19-37 42

ESR, mm/timme 2-10 39

Urinsyra, µmol/l 200-416 504

Kreatinin, µmol/l 44-106 238

Paratyreoideahormon, pg/ml 7-53 76,8

Fibrinogen, g/l 1,69-3,92 5,7

Protein i urin, g/l 0-0,1 1

43,5 39 10 489 202 101 3

näst sista

Sista sak

Ris. 2. p-värden för kliniska indikatorer för patient B. vid den näst sista och sista undersökningen.

Wilcoxon-testet och Wald-Wolfowitz-testet lider av relativt låg känslighet.

Skalskillnadskriterier (spridning). Vi använde dessa kriterier för att testa följande hypoteser:

♦ hypotesen att det inte finns några skillnader i skalorna (i spridningen eller spridningen av värden) för de studerade proverna;

♦ hypotesen att förhållandet mellan provskalor är lika med ett givet värde på g.

I det senare fallet är det nödvändigt att först ändra värdena för det andra provet y1=(y1-m0)^ , där m0 är den gemensamma medianen för de två studerade spektra.

Om medianerna för de populationer från vilka proverna tas inte är lika stora, utan deras

tillämpas efter att du har ändrat ett av valen, till exempel i urvalet yi=yi-m2+mr

Om medianerna inte är lika och inte är kända, bör hypotesen om frånvaron av skillnader i skiftet bekräftas, eller så bör metoden användas för att upptäcka godtyckliga alternativ.

Som ett resultat beräknades värdet av statistiken för W. Ansari-Bradley (Ansari-Bradly) och K. Klotz (Klotz), som är begreppsmässiga analoger till statistiken från Wilcoxon och Van der Waerden.

För varje initial statistik beräknas en normal approximation (Z-statistik) och en signifikansnivå P för nollhypotesen om frånvaron av skillnader i spridningen av värdena för de två proverna. Om />>0,05 kan nollhypotesen accepteras.

Således gör metoderna för matematisk statistik som föreslagits ovan det möjligt att bekräfta tillförlitligheten av skillnader

erhållit resultat även i små grupper av observationer, om skillnaderna är tillräckligt betydande.

Två kliniska exempel på patienter med osteoartikulär patologi kan tjäna som en illustration.

Kliniskt exempel nr 1. Hos 20 patienter med coxartros användes ett grundläggande behandlingskomplex, inklusive oral administrering av nimesulid, kondroprotektorer, intramuskulära injektioner av vitaminer och träningsterapi. Dessutom användes sjukgymnastik hos 15 av dem, och massage användes hos 6 patienter. Således bildades 3 grupper av patienter med ett litet (från 5 till 8) antal observationer (tabell 2).

Bland andra parametrar, före behandlingsstart och efter avslutad kurs (21 ± 2 dagar), bedömdes smärtintensiteten under rörelse och vila med hjälp av en 100-punkts visuell analog skala (VAS).

Följande statistiska metoder användes av W. Ansari-Bradly och K. Klotz (tabell 3).

Enligt erhållna data (tabell 3) noterades att minskningen av smärta i vila i grupp 1 vid slutet av observationen inte var signifikant. Men signifikanta värden hittades för alla andra studerade parametrar. Det övervägda kliniska exemplet indikerar möjligheten att erhålla tillförlitliga resultat på en liten provstorlek.

I kliniskt exempel nr 2 beaktas laboratoriedata från patient B., som lider av kronisk giktpolyartrit, giktnefropati med symtom på CRF, som låg utanför referensvärdena, i dynamiken (tabell 4).

Låt oss beräkna sannolikheten för att resultaten av analysen statistiskt signifikant överskrider gränserna för den kliniska normen. För att göra detta använder vi den probabilistiska kalkylatorn för statistikpaketet "STATISTICA 6.0". I det här fallet kännetecknar p-värdet felet av den första typen: sannolikheten att förkasta den korrekta hypotesen när den i själva verket är sann. I de flesta fall skilde sig resultaten från det näst sista besöket statistiskt signifikant från normen (Fig. 2). Eftersom tröskelnivån av signifikans i detta fall, tar vi lika med 0,05, förbättrades resultaten av hematokrit, lymfocyter, ESR, fibrinogen statistiskt signifikant vid det senaste besöket. Följaktligen förbättrades inte de kliniska indikatorerna för urinsyra, kreatinin, bisköldkörtelhormon och protein i urinen när det gäller matematisk statistik.

När man planerar en studie är det således viktigt att ta hänsyn till styrkan hos de tillämpade statistiska kriterierna, som bestäms av urvalsvariabiliteten och den givna signifikansnivån.

Det föreslagna tillvägagångssättet kan vara av intresse för specialister inom området personlig medicin för

analys av dynamiken i de behandlingsmetoder och läkemedel som används, samtidigt som de pågående terapeutiska och diagnostiska åtgärderna övervakas.

LITTERATUR

1. Bolshev L.N., Smirnov N.V. Tabeller för matematisk statistik. M.: Nauka; 1995.

2. Korn G., Korn T. Handbok i matematik för vetenskapsmän och ingenjörer. M.: Nauka; 2003.

3. Kobzar A.I. Tillämpad matematisk statistik. För ingenjörer och vetenskapsmän. Moskva: FIZMATLIT; 2006.

4. Pravetsky N.V., Nosovsky A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Matematiskt underbyggande av ett tillräckligt antal mätningar för en tillförlitlig bedömning av de registrerade parametrarna inom rymdbiologi och medicin. Rymdbiologi och flygmedicin. M.: Medicin; 1990; 5:53-6.

5. HollenderM., Wulf D.A. Icke-parametriska metoder för statistik. M.: Finans och statistik; 1983.

6. Nosovsky A.M. Tillämpning av probabilistiska modeller på en cirkel i biomedicinsk forskning. Rymdbiologi och flygmedicin. Abstracts IX All-Union Conference. Kaluga, 19-21 juni 1990.

7. Nosovsky A.M., Pravetsky N.V., Kholin S.F. Matematiskt tillvägagångssätt för att bedöma noggrannheten i mätningar av en fysiologisk parameter med olika metoder. Rymdbiologi och flygmedicin. M.: Medicin; 1991; 6:53-5.

1. Bol "shev L.N., Smirnov N.V. Tabeller för matematisk statistik. Moskva: Nauka; 1995 (på ryska).

2. Korn G., Korn T. Matematisk handbok för vetenskapsmän och ingenjörer. Moskva: Nauka; 2003 (på ryska).

3. Kobzar" A.I. Tillämpad matematisk statistik. För ingenjörer och vetenskapsmän. Moskva: FIZMATLIT; 2006 (på ryska).

4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Matematisk motivering av ett tillräckligt antal mätningar för tillförlitlig utvärdering av registrerade parametrar inom rymdbiologi och medicin. Rymdbiologi och flygmedicin. Moskva: Meditsina; 1990; 5:53-6 (på ryska).

5. Khollender M., Vul "f D.A. Icke-parametriska statistiska metoder. Moskva: Finansy i statistika; 1983 (på ryska).

6. Nosovskiy A.M. Användning av probabilistiska modeller på cirkeln i biomedicinsk forskning. Rymdbiologi och flygmedicin. Sammandrag från IX All-Union Conference. Kaluga, 19-21 juni 1990 (på ryska).

7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Matematiskt förhållningssätt till uppskattningsnoggrannhet av den fysiologiska parametern med olika metoder. Rymdbiologi och flygmedicin. Moskva: Me-ditsina; 1991; 6:53-5 (på ryska).