Видове проби. Малка проба. практика за използване на малка извадка в търговски дейности Малката извадка включва извадка, която включва

Обсъдените по-горе методи за изчисляване на характеристиките на извадкова съвкупност (вариация, средни и максимални грешки и т.н.) осигуряват достатъчно голям размер на извадката (n > 30). В същото време голям размер на извадката не винаги е възможен или препоръчителен. В практиката на индустриалните наблюдения и в научноизследователската работа често е необходимо да се използват малки проби, чийто брой не надвишава 30 единици(агрономически и зоотехнически опити, проверки на качеството на продуктите, свързани с унищожаване на проби и др.). В статистиката те се наричат ​​малки извадки. Според проби с популация над 30 единици се наричат ​​големи проби.

Малкият размер на извадката намалява нейната прецизност в сравнение с голямата проба. Въпреки това е доказано, че резултатите, получени с малки извадки, могат също да бъдат обобщени за общата популация. Но тук е необходимо да се вземат предвид някои характеристики, по-специално при изчисляване на стандартното отклонение. Ако размерът на извадката е малък, трябва да се използва безпристрастна оценка на дисперсията от 52.

Основите на теорията за малките извадки са разработени от английския математик и статистик У. Госет (псевдоним Студент). Проучванията на Student показват, че когато размерът на популацията е малък, стандартното отклонение в извадката се различава значително от стандартното отклонение в общата популация.

Тъй като стандартното отклонение на популацията е един от параметрите на кривата на нормалното разпределение, не е подходящо да се използва функцията на нормалното разпределение за оценка на параметрите на популацията от данни от малки извадки поради големи грешки.

Когато изчислявате средната грешка за малки извадки, винаги трябва да използвате безпристрастна оценка на дисперсията

където n - 1 е броят на степените на свобода на вариация (k), което се разбира като броя на единиците, способни да приемат произволни стойности, без да ги променят основни характеристики(средно аритметично).

Например бяха направени три наблюдения: x1= 4; x2 = 2; x3 = 6. Средна стойност

И така, остават само две свободно вариращи количества, тъй като третото може да се намери от известните две количества и средната стойност:

Следователно за този пример броят на степените на свобода на вариация е 2 (k = n - 1 = 3 - 1 = 2).

T-тестът обосновава закона за разпределение на отклоненията на извадковите средни стойности от общата средна стойност за малки извадки. Според разпределението на Стюдънт, вероятността пределната грешка да не надвишава u-кратно средната грешка в малки извадки зависи от размера и размера на извадката.

Теоретичното нормализирано отклонение за малки проби се нарича i-критерий, за разлика от i-критерия за нормално разпределение, който се използва в големи проби. Стойността на t-критерия на Стюдънт е дадена в специални таблици (Приложение 3).

Нека разгледаме процедурата за определяне на средната и максималната грешка за малка извадка, използвайки този пример. Да кажем, че за да се определи количеството на загубите по време на прибиране на реколтата от картофи, бяха изкопани пет произволно избрани площи от 4 m2 всяка. Загубите по място бяха (kg); 0,6; 0,2; 0,8; 0,4; 0,5.

Средна загуба

Съдейки по индивидуалните наблюдения, големината на загубите варира значително и средната стойност от само пет наблюдения може да има голяма грешка.

За да изчислим извадковите грешки, ние дефинираме безпристрастна оценка на дисперсията

Нека изчислим средната грешка на средната стойност на извадката, където вместо стандартното отклонение се използва неговата безпристрастна оценка:

С помощта на таблиците на Стюдънт (Приложение 3) установяваме, че с уверена вероятност Ж= 0,95 (ниво на значимост a = 0,05) и при k = n - 1 = 5 - 1 = 4 степени на вариация на свобода И= 2,78. Тогава максималната грешка на извадката е

И така, с вероятност P = 0,95, можем да кажем, че количеството на загубите по цялото поле ще бъде 0,5 ± 0,28 kg, или от 0,22 до 0,78 kg на 4 m2.

Както можем да видим от примера, границите на случайните флуктуации с малки извадки са доста големи и могат да бъдат намалени чрез увеличаване на размера на извадката и намаляване на флуктуациите (дисперсията) на характеристиките.

Ако използвахме вероятностната интегрална таблица (Приложение 2), за да изчислим доверителните граници на общата средна стойност, тогава Ище бъде равно на 1,96 и єх = iZi = 1,96 o 0,10 = 0,20 kg, т.е. доверителният интервал би бил по-тесен (0,30 до 0,70 kg).

Малките извадки, поради малкия си брой, дори и при най-внимателната организация на наблюдението, не отразяват точно показателите на генералната съвкупност. Следователно резултатите от малки проби рядко се използват за установяване на надеждни граници, в които се намират характеристиките на популацията.

Тестът на Стюдънт се използва предимно за тестване на статистически хипотези за значимостта на разликите между представянето на две или повече малки проби (вижте раздел 7).

В допълнение към действителната случайна извадка с нейната ясна вероятностна обосновка, има и други извадки, които не са напълно случайни, но се използват широко. Трябва да се отбележи, че стриктното прилагане на чисто случаен подбор на единици от генералната съвкупност не винаги е възможно на практика. Такива проби включват механично вземане на проби, типично, серийно (или вложено), многофазно и редица други.

Рядко се случва популацията да е хомогенна; това е по-скоро изключение, отколкото правило. Следователно, ако има население в населението различни видовеЧесто е желателно да се осигури по-равномерно представяне на различни видове явления в извадкова популация. Тази цел се постига успешно чрез използване на типично вземане на проби. Основната трудност е, че трябва да имаме допълнителна информация за цялото население, което в някои случаи е трудно.

Типичната извадка се нарича още стратифицирана или стратифицирана извадка; използва се и с цел по-равномерно представяне на различните региони в извадката и в този случай извадката се нарича регионална.

И така, под типиченПод извадка се разбира извадка, в която генералната съвкупност е разделена на типични подгрупи, формирани по един или повече съществени признаци (например съвкупността е разделена на 3-4 подгрупи според средния доход на глава от населението или степента на образование - основно , средно, висше и др.). След това от всички типични групи можете да изберете единици за извадката по няколко начина, образувайки:

а) типична проба с равномерно разположение, където равен брой единици са избрани от различни типове (слоеве). Тази схема работи добре, ако в популацията слоевете (типовете) не се различават много един от друг по броя на единиците;

б) типично вземане на проби с пропорционално поставяне, когато се изисква (за разлика от равномерното разполагане) съотношението (%) на селекцията за всички страти да бъде еднакво (например 5 или 10%);

в) типична извадка с оптимално разположение, когато се отчита степента на вариация на характеристиките в различни групи от генералната съвкупност. С това разположение се увеличава делът на селекцията за групи с голяма вариабилност на признака, което в крайна сметка води до намаляване на случайната грешка.

Формулата за средната грешка в типична селекция е подобна на обичайната извадкова грешка за чисто произволна извадка, като единствената разлика е, че вместо общата дисперсия се въвежда средната стойност на отделните дисперсии в рамките на групата, което естествено води до намаляване на грешката в сравнение с чисто произволна извадка. Използването му обаче не винаги е възможно (по много причини). Ако няма нужда от голяма прецизност, по-лесно и по-евтино е да се използва серийно вземане на проби.

Сериен(клъстер) извадката се състои в това, че за извадката не се избират единици от съвкупността (например студенти), а отделни серии или гнезда (например учебни групи). С други думи, при серийно (клъстерно) вземане на проби единицата за наблюдение и единицата за вземане на проби не съвпадат: избрани са определени групи единици (гнезда), съседни една на друга, и единиците, включени в тези гнезда, подлежат на изследване. Така например, когато провеждаме извадково проучване на жилищните условия, можем произволно да изберем определен брой домакинства (извадкова единица) и след това да разберем условията на живот на семействата, живеещи в тези къщи (единици за наблюдение).

Сериите (гнездата) се състоят от единици, свързани помежду си териториално (области, градове и т.н.), организационно (предприятия, цехове и т.н.) или във времето (например набор от единици продукти, произведени за даден период от време).

Серийният подбор може да бъде организиран под формата на едноетапен, двуетапен или многоетапен подбор.

Произволно избраните серии се подлагат на непрекъснати изследвания. По този начин серийното вземане на проби се състои от два етапа на случаен подбор на серии и непрекъснато изследване на тези серии. Серийният подбор осигурява значителни икономии на работна сила и ресурси и затова често се използва в практиката. Грешката на серийния подбор се различава от грешката на самата случайна селекция по това, че вместо стойността на общата дисперсия се използва междусерийна (междугрупова) дисперсия, а вместо размера на извадката се използва броят на сериите. Точността обикновено не е много висока, но в някои случаи е приемлива. Една серийна проба може да бъде повтаряща се или неповтаряща се, а сериите могат да бъдат с еднакъв или различен размер.

Серийното вземане на проби може да бъде организирано според различни схеми. Например, можете да формирате извадкова съвкупност на два етапа: първо се избират в произволен ред сериите, които ще бъдат изследвани, след което от всяка избрана серия също се избира в произволен ред определен брой единици, които да бъдат директно наблюдавани (измерени, претеглени и т.н.). Грешката на такава проба ще зависи от грешката на серийния подбор и от грешката на индивидуалния подбор, т.е. многоетапният подбор обикновено дава по-малко точни резултатив сравнение с едноетапен метод, което се обяснява с появата на грешки в представителността на всеки етап на вземане на проби. В този случай трябва да използвате формулата за грешка при вземане на проби за комбинирано вземане на проби.

Друга форма на селекция е многофазната селекция (1, 2, 3 фази или етапи). Тази селекция се различава по структура от многоетапната селекция, тъй като при многофазната селекция се използват едни и същи селекционни единици във всяка фаза. Грешките при многофазно вземане на проби се изчисляват на всяка фаза поотделно. основна характеристикадвуфазното вземане на проби е, че пробите се различават една от друга по три критерия в зависимост от: 1) дела на изследваните единици в първата фаза на извадката и отново включени във втората и следващите фази; 2) от запазване на равни шансове всяка извадкова единица от първата фаза отново да бъде обект на изследване; 3) от размера на интервала, разделящ фазите една от друга.

Нека се спрем на още един вид селекция, а именно механичен(или систематично). Този избор е може би най-често срещаният. Това очевидно се обяснява с факта, че от всички техники за селекция тази техника е най-простата. По-специално, той е много по-прост от случайния подбор, който изисква възможността да се използват таблици със случайни числа и не изисква допълнителна информация за популацията и нейната структура. В допълнение, механичният подбор е тясно преплетен с пропорционалния стратифициран подбор, което води до намаляване на грешката при вземане на проби.

Например използването на механичен подбор на членове на жилищна кооперация от списък, съставен по реда на приемане в тази кооперация, ще осигури пропорционално представителство на членовете на кооперацията с различен стаж. Използването на една и съща техника за избиране на респонденти от азбучен списък от лица осигурява равни шансове за фамилни имена, започващи с различни букви и т.н. Използването на графики за работно време или други списъци в предприятия или образователни институции и др. може да осигури необходимата пропорционалност в представянето на работници с различна продължителност на трудовия стаж. Имайте предвид, че механичният подбор се използва широко в социологията, при изучаването на общественото мнение и т.н.

За да се намали големината на грешката и особено разходите за провеждане на извадково изследване, широко се използват различни комбинации от отделни видове селекция (механична, серийна, индивидуална, многофазна и др.) В такива случаи по-сложни извадкови грешки трябва да се изчислят, които се състоят от грешки, които възникват на различни етапи от изследването.

Малка извадка е колекция от единици, по-малки от 30. Малки извадки се срещат доста често в практиката. Например, броя на редките заболявания или броя на единиците, притежаващи рядка черта; Освен това до малка проба се прибягва, когато изследването е скъпо или е свързано с унищожаване на продукти или проби. Малките проби се използват широко в областта на проучванията за качеството на продуктите. Теоретичните основи за определяне на малките извадкови грешки са положени от английския учен У. Госет (псевдоним Студент).

Трябва да се помни, че при определяне на грешката за малка извадка, вместо размера на извадката, трябва да вземете стойността ( н– 1) или преди да определите средната грешка на извадката, изчислете така наречената коригирана дисперсия на извадката (в знаменателя вместо нтрябва да се постави ( н- 1)). Имайте предвид, че такава корекция се прави само веднъж - при изчисляване на дисперсията на извадката или при определяне на грешката. величина ( н– 1) се нарича степен на свобода. Освен това се заменя нормалното разпределение T-разпределение (Distribution Student), което е таблично и зависи от броя на степените на свобода. Единственият параметър на разпределението на Student е стойността ( н- 1). Нека още веднъж подчертаем, че изменението ( н– 1) е важен и значим само за малки извадкови популации; при н> 30 и повече разликата изчезва, приближавайки се до нула.

Досега говорихме за случайни проби, т.е. когато подборът на единици от популацията е случаен (или почти случаен) и всички единици имат еднаква (или почти еднаква) вероятност да бъдат включени в извадката. Изборът на единици обаче може да се основава на принципа на неслучайния подбор, когато принципът на достъпност и целенасоченост е на преден план. В такива случаи е невъзможно да се говори за представителност на получената извадка и изчисляването на грешките на представителността може да се направи само с информация за генералната съвкупност.

Известни са няколко схеми за формиране на неслучайна извадка, които са широко разпространени и се използват главно в социологическите изследвания: подбор на налични единици за наблюдение, подбор по Нюрнбергския метод, целева извадка при идентифициране на експерти и др. Квотна извадка, която се формира от изследователя от малък брой, също е важен значими параметри и дава много близко съответствие с общата съвкупност. С други думи, квотният подбор трябва да осигури на изследователя почти пълно съвпадение на извадката и генералните съвкупности според избраните от него параметри. Целенасоченото постигане на близостта на две популации в ограничен диапазон от показатели се постига, като правило, с помощта на извадка със значително по-малък размер, отколкото при използване на случаен подбор. Именно това обстоятелство прави избора на квота привлекателен за изследовател, който няма възможност да се съсредоточи върху самопретегляща се случайна извадка с голям размер. Трябва да се добави, че намаляването на размера на извадката най-често се комбинира с намаляване на паричните разходи и времето за изследване, което увеличава предимствата на този метод на подбор. Нека също да отбележим, че при квотната извадка има доста значителна предварителна информация за структурата на съвкупността. Основното предимство тук е, че размерът на извадката е значително по-малък, отколкото при случайната извадка. Избраните характеристики (най-често социално-демографски – пол, възраст, образование) трябва тясно да корелират с изследваните характеристики на генералната популация, т.е. обект на изследване.

Както вече беше посочено, методът на вземане на проби дава възможност да се получи информация за генералната съвкупност с много по-малко средства, време и усилия, отколкото при непрекъснато наблюдение. Също така е ясно, че пълно изследване на цялата популация е невъзможно в някои случаи, например при проверка на качеството на продуктите, проби от които са унищожени.

В същото време обаче трябва да се отбележи, че популацията не е изцяло „черна кутия” и все пак имаме информация за нея. Провеждайки например извадково проучване относно живота, ежедневието, имотното състояние, доходите и разходите на студентите, техните мнения, интереси и т.н., все пак имаме информация за общия им брой, групиране по пол, възраст, семейно положение, място на пребиваване, курс на обучение и други характеристики. Тази информация винаги се използва в извадкови изследвания.

Има няколко вида разпределение на характеристиките на извадката към генералната съвкупност: методът на директно преизчисляване и методът на корекционните коефициенти. Преизчисляването на характеристиките на извадката се извършва, като правило, като се вземат предвид доверителните интервали и може да се изрази в абсолютни и относителни стойности.

Тук е съвсем уместно да се подчертае, че по-голямата част от статистическата информация, отнасяща се до икономическия живот на обществото в най-разнообразните му проявления и видове, се базира на извадкови данни. Разбира се, те се допълват от пълни регистрационни данни и информация, получена в резултат на преброявания (на население, предприятия и др.). Например цялата бюджетна статистика (за доходите и разходите на населението), предоставена от Росстат, се основава на данни от извадково проучване. Информацията за цените, обемите на производство и обемите на търговията, изразени в съответните индекси, също се основава до голяма степен на извадкови данни.

Статистически хипотези и статистически тестове. Основни понятия

Концепциите за статистически тест и статистическа хипотеза са тясно свързани с извадката. Статистическата хипотеза (за разлика от други научни хипотези) е предположение за някои свойства на популацията, които могат да бъдат тествани с помощта на данни от произволна извадка. Трябва да се помни, че полученият резултат има вероятностен характер. Следователно резултатът от изследването, потвърждаващ валидността на изтъкнатата хипотеза, почти никога не може да послужи като основа за окончателното й приемане и обратно, несъвместим с нея резултат е напълно достатъчен, за да се отхвърли изтъкнатата хипотеза като погрешна. или невярно. Това е така, защото полученият резултат може да съответства и на други хипотези, а не само на изложената.

Под статистически критерийсе разбира като набор от правила, които ни позволяват да отговорим на въпроса при кои резултати от наблюдение хипотезата се отхвърля и при кои не. С други думи, статистическият критерий е вид решаващо правило, което гарантира приемането на вярна (правилна) хипотеза и отхвърлянето на невярна хипотеза с висока степен на вероятност. Статистическите тестове са едностранни и двустранни, параметрични и непараметрични, повече или по-малко мощни. Някои критерии се използват често, други се използват по-рядко. Някои критерии са предназначени за решаване на специални проблеми, а някои критерии могат да се използват за решаване на широк клас проблеми. Тези критерии са широко разпространени в социологията, икономиката, психологията, природни наукии т.н.

Нека въведем някои основни концепции за проверка на статистически хипотези. Тестването на хипотези започва с нулева хипотеза. н 0, т.е. някакво предположение на изследователя, както и конкурентна алтернативна хипотеза н 1, което противоречи на осн. Например: н 0: , н 1: или н 0: , н 1: (къде А- обща авария).

Основната цел на изследователя при проверка на хипотеза е да отхвърли хипотезата, която излага. Както пише Р. Фишър, целта на проверката на всяка хипотеза е да се отхвърли. Тестването на хипотези се основава на противоречие. Следователно, ако смятаме, че например средната заплата на работниците, получена от определена извадка и равна на 186 парични единици на месец, не съвпада с действителната заплата за цялото население, тогава се приема нулевата хипотеза, че тези заплати са равен.

Конкурираща се хипотеза н 1 може да се формулира по различни начини:

н 1: , н 1: , н 1: .

След това се определя Грешка тип I(a), което посочва вероятността вярна хипотеза да бъде отхвърлена. Очевидно тази вероятност трябва да е малка (обикновено от 0,01 до 0,1, най-често по подразбиране е 0,05 или така нареченото 5% ниво на значимост). Тези нива произтичат от метода на вземане на проби, според който двукратна или тройна грешка представлява границите, отвъд които случайната вариация в характеристиките на извадката най-често не се простира. Грешка тип II(b) е вероятността неправилна хипотеза да бъде приета. Като правило, грешка от тип I е по-„опасна“; точно това е записано от статистиката. Ако в началото на изследването искаме да запишем a и b едновременно (например a = 0,05; b = 0,1), тогава за това първо трябва да изчислим размера на извадката.

Критична зона(или площ) е набор от стойности на критерии, при които н 0 се отхвърля. Критична точка T kr е точката, разделяща зоната на приемане на хипотезата от зоната на отклонение или критичната зона.

Както вече беше споменато, грешка от тип I (a) е вероятността за отхвърляне на правилна хипотеза. Колкото по-малко е, толкова по-малка е вероятността да се направи грешка от тип I. Но в същото време, когато a намалява (например от 0,05 до 0,01), е по-трудно да се отхвърли нулевата хипотеза, което всъщност е това, което изследователят си поставя. Нека подчертаем отново, че по-нататъшното намаляване на a до 0,05 и повече всъщност ще доведе до това, че всички хипотези, верни и неверни, попадат в обхвата на приемане на нулевата хипотеза и ще направи невъзможно разграничаването между тях.

Грешка тип II (b) възниква, когато се приеме н 0, но всъщност алтернативната хипотеза е вярна н 1 . Стойността g = 1 – b се нарича мощност на критерия. Грешка тип II (т.е. неправилно приемане на невярна хипотеза) намалява с увеличаване на размера на извадката и повишаване на нивото на значимост. От това следва, че е невъзможно едновременно да се намалят a и b. Това може да се постигне само чрез увеличаване на размера на извадката (което не винаги е възможно).

Най-често задачите за проверка на хипотези се свеждат до сравняване на две извадкови средни стойности или пропорции; да се сравни общата средна (или дял) с извадката; сравнение на емпирични и теоретични разпределения (критерии за съответствие); сравнение на две извадкови дисперсии (c 2 -критерий); сравняване на два примерни коефициента на корелация или регресионни коефициенти и някои други сравнения.

Решението за приемане или отхвърляне на нулевата хипотеза се състои от сравняване на действителната стойност на критерия с табличната (теоретична) стойност. Ако действителната стойност е по-малка от табличната стойност, тогава се прави заключението, че несъответствието е случайно и незначително и нулевата хипотеза не може да бъде отхвърлена. Обратната ситуация (действителната стойност е по-голяма от табличната) води до отхвърляне на нулевата хипотеза.

При тестване на статистически хипотези, таблиците на нормалното разпределение, разпределение c 2 (да се чете: хи-квадрат), T-разпределения (Студентски разпределения) и Е-разпределения (разпределения на Фишер).

Методът на малката извадка има редица предимства пред метода на голямата извадка. Неговите основни предимства са, първо, намаляване на обема на изчислителната работа, и второ, възможността да се наблюдава динамиката на промените в точността на процеса във времето, което не може да се направи с помощта на метода на голямата извадка. Методът на голямата проба може да даде само представа за точността и стабилността на процеса през периода на вземане на проби, което може да остане в бъдеще, ако условията на процеса не се променят след вземането на пробата. В действителност такава неизменност на производствените условия не може да се предвиди предварително. Например, при работа на прътова машина, по време на смяна, материалът се подменя няколко пъти (смяна на пръта), сменя се инструмента поради износване, регулира се машината и т.н., което може да направи значителни корекции на предварително получените параметри на разпространение. Методът на малки проби, ако последните се вземат редовно през цялата смяна на определени интервали, ви позволява да получите пълна картина на състоянието на процеса през изследвания период, да определите степента на неговата стабилност и също така да идентифицирате причините за недостатъчната стабилност на процеса във времето, ако има такава.

Статистическият анализ с малки проби се извършва, както следва. Образци на н = 5-10 бр. приемани на определени фиксирани интервали (например след 15-30 минути). Задава се времевият период за вземане на проби емпиричнои зависи от производителността на машината, обема на вземане на проби и степента на устойчивост на технологичния процес. За всяка проба трябва да изчислите и С. След това е необходимо за всеки две съседни проби да се тества хипотезата за хомогенност на дисперсиите на пробите, като се използва Е - Критерий на Фишер.

Ако хипотезата се потвърди, това показва стабилността на дисперсията или че сравняваните проби са взети от една и съща популация. При потвърждаване на хипотезата за хомогенност на дисперсиите на две извадки трябва да се тества хипотезата за хомогенност на две средни извадки. T - Тест на ученика.

Потвърждаването на хипотезата за равенството на две съседни средни проби означава, че центърът на настройка на оборудването няма да се промени по време на вземането на тази проба и остава същият, както беше при вземането на предишната проба, т.е. процесът е в стабилно състояние. Когато хипотезата за равенство на двете средни проби не се потвърди, това показва изместване на центъра на машинната настройка в момента на вземане на тази проба. Тъй като пробите се вземат на определени интервали, ако се открие промяна в центъра за настройка или промяна в зоната на дисперсия, е възможно да се определи периодът от време, след който е настъпило нарушение на стабилността на процеса.

Откривайки факта на нарушение на стабилността на процеса, е възможно да се установи областта, в която трябва да се търси причината за това явление. Разнородността на дисперсиите на пробите, показваща нестабилност на дисперсията, показва, че причината за това трябва да се търси в машината или в механичните свойства на обработвания материал. Хетерогенността на извадковите средни стойности показва изместване в центъра на настройката (потърсете причината в инструмента).

По този начин, като се вземат малки проби от текущата мощност на машината по време на смяна на определени интервали от време, средните стойности и дисперсиите на пробите се изчисляват чрез сравняване и оценка на техните несъответствия с помощта на F и t-критерии, е възможно да се установят моментите на нарушение на процесите и дори източниците на тези нарушения.

А.М. Носовски1*, А.Е. Пихлак2, В.А. Логачев2, И.И. Чурсинова3, Н.А. Mutyeva2 СТАТИСТИКА НА МАЛКИ ИЗВАДКИ В МЕДИЦИНСКИТЕ ИЗСЛЕДВАНИЯ

„Държава научен център Руска федерация- Институт по медико-биологични проблеми Руска академиянауки, 123007, Москва, Русия; 2GBOU VPO "Московски държавен медицински и стоматологичен университет на името на A.I. Evdokimov" Министерство на здравеопазването на Русия, 127473, Москва, Русия; 3ANO "Артрологична болница НПО СКАЛ", 109044, Москва, Русия

*Андрей Максимович Носовски, E-mail: [имейл защитен]

♦ Експериментално са установени характеристиките на статистическите критерии. В резултат на това беше изчислена стойността на статистиката на W. Ansari-Bradly и K. Klotz. За всяка първоначална статистика се изчисляват нормалното приближение (Z-статистика) и нивото на значимост p на нулевата хипотеза, че няма разлики в разпространението на стойностите на двете извадки. Ако p>

Предложените методи на математическата статистика позволяват да се потвърди надеждността на разликите в получените резултати дори в малки групи наблюдения, ако разликите са достатъчно значителни. Илюстрацията беше предоставена от клинични примери на пациенти с костно-ставна патология. Ключови думи: малка извадка, тестова мощност, коксартроза, подагрозен полиартрит

А.М. Носовский1, А.Е.Пихлак2, В.А. Логачев2, И.И. Chursinova3, N.AMuteva2 СТАТИСТИЧЕСКИ АНАЛИЗ НА МАЛКИ ДАННИ В МЕДИЦИНСКИТЕ ИЗСЛЕДВАНИЯ

1 Държавен изследователски център-институт по медико-биологични проблеми на Руската академия на медицинските науки, 123007 Москва, Русия; 2Московски държавен университет по медицина и стоматология на името на A.I. Евдокимов, 127473 Москва, Русия; 3 Болница по артрология на научно-практическата асоциация СКАЛ, 109044 Москва, Русия

♦ Експериментално са установени характеристики на статистически критерии. В резултат на това се изчислява стойността на статистиката от W. An-sari-Bradly и K. Klotz. За всеки източник на статистика се изчислява нормалното приближение (Z-статистика) и нивото на значимост на p на нулевата хипотеза за липса на разлика в разпространението на стойностите на двете проби. Atp>0,05 нулевата хипотеза може да бъде приета. Предложените методи на математическата статистика могат да потвърдят точността на разликите в резултатите, дори в малки групи от наблюдения, ако разликите са достатъчно значителни.

Използвахме медицински случаи на пациенти със ставно-костна патология.

Ключови думи: анализ на малки данни, сила на критериите, коксартроза, подагрозен артрит

Принципите на медицината, основана на доказателства, поставят високи изисквания към надеждността на сравнителната оценка на резултатите от изследванията. Това става още по-важно, тъй като повечето лекари имат много повърхностно разбиране за техниките статистическа обработка, ограничавайки публикациите си извън изчисляването на проценти, в най-добрият сценарий/-Т-тест на Стюдънт.

Но в някои случаи това не е достатъчно, за да се извърши пълен анализ на резултатите от изследването. Обикновено няма съмнение относно надеждността на идентифицираните модели, когато броят на наблюденията е няколко хиляди или дори стотици. И ако са няколко десетки? Ами ако имаме само няколко случая? Всъщност в медицината има доста редки заболявания, понякога хирурзите извършват уникални операции, когато броят на наблюденията е много малък. Къде е тази граница, онова необходимо и достатъчно количество изследвания, което ни позволява да твърдим несъмненото наличие на един или друг модел?

Този въпрос е от изключителна важност не само при оценката на съществуващите изследвания, но и при планирането на научна работа. Достатъчно ли е да се наблюдават 20 пациента или са необходими минимум 40? Или може би 10 случая ще са достатъчни? От навременния и правилен отговор на този въпрос зависи не само достоверността на направените заключения, но и времето на изследването, неговата цена, необходимостта от персонал, оборудване и др.

Съвременната статистика познава доста техники, които могат да се използват за определяне на надеждността на резултатите дори при малък брой наблюдения. Това са методи на "малка извадка". Общоприето е, че статистиката с малка извадка започва през първото десетилетие на 20-ти век с публикуването на труда на Държавния университет

набор, където той, под псевдонима “Студент” (студент), постулира т. нар. /-разпределение. За разлика от теорията на нормалното разпределение, теорията на разпределението за малки извадки не изисква априорни знания или точни оценки на математическото очакване и дисперсията на съвкупността и не изисква допускания относно параметрите. В /-разпределението едно от отклоненията от средната стойност на извадката винаги е фиксирано, тъй като сумата от всички такива отклонения трябва да бъде равна на нула. Това се отразява на сумата от квадрати при изчисляване на дисперсията на извадката като безпристрастна оценка на дисперсията на популацията и води до факта, че броят на степените на свобода df е равен на броя на измерванията минус едно за всяка проба. Следователно във формулите и процедурите за изчисляване на /-статистиката за тестване на нулевата хипотеза df=w-1. Известни са и класическите трудове на водещия английски статистик Р.А. Фишър (след когото ^-разпределението получи името си) според дисперсионния анализ - статистически метод, изрично фокусиран върху анализа на малки проби. Сред многобройните статистики, които могат разумно да бъдат приложени към малки извадки, можем да споменем: точния вероятностен тест на Фишер; двуфакторен непараметричен (рангов) дисперсионен анализ на Фридман; коефициент на рангова корелация/Кендал; коефициент на съгласуване на Kendall; Kruskal-Wallace I-тест за непараметричен (рангов) еднопосочен анализ на дисперсията; ^/-тест на Ман-Уитни; медианен критерий; знаков критерий; коефициент на рангова корелация на Спирман; /-тест на Wilcoxon.

Няма категоричен отговор на въпроса колко голяма трябва да е една извадка, за да се счита за малка. Обаче конвенционалната граница между малка и голяма извадка се счита за df=30. Основата

За това донякъде произволно решение се използва резултатът от сравняване на /-разпределението (за малки проби) с нормалното разпределение (r). Несъответствието между стойностите на / и r има тенденция да се увеличава с намаляване и да намалява с увеличаване. Всъщност 1 започва да се доближава до b много преди ограничаващия случай, когато / = r. Просто визуално изследване на стойностите на таблицата / ви позволява да видите, че това приближение става доста бързо, започвайки от ^=30 и по-горе. Сравнителните стойности на / (при ^=30) и r са равни съответно: 2,04 и 1,96 за p=0,05; 2,75 и 2,58 за p=0,01; 3,65 и 3,29 за p=0,001.

В математическата статистика се използва коефициентът на доверие /, стойностите на функцията се табулират при различните й стойности и се получават съответните нива на доверие (Таблица 1).

Коефициентът на доверие ви позволява да изчислите максималната грешка на извадката AX, изчислена по формулата AXsr=1tsr, т.е. пределната извадкова грешка е равна на 1/2 пъти броя на средните извадкови грешки.

По този начин стойността на максималната грешка на извадката може да бъде установена с известна вероятност. Както може да се види от последната колона на таблица 1, вероятността за грешка, равна на или по-голяма от утроената средна грешка на извадката, т.е. AXc = 3cc, е изключително малка и равна на 0,003 (1-0,997). Такива малко вероятни събития се считат за практически невъзможни и следователно стойността AX = 3cs може да се приеме като граница на възможната грешка на извадката p3].

Интервалът, в който неизвестната стойност на оценения параметър ще се съдържа с дадена степен на вероятност, се нарича доверителна вероятност, а вероятността P е доверителна вероятност. Най-често вероятността за доверие се приема за 0,95 или 0,99, тогава коефициентът на доверие 1 е равен съответно на 1,96 и 2,58.

Това означава, че доверителният интервал съдържа общата средна стойност с дадена вероятност.

Колкото по-голяма е максималната извадкова грешка, толкова по-голям е доверителният интервал и следователно толкова по-ниска е точността на оценката.

Приложението на този подход може да бъде илюстрирано чрез наблюдение на 20 пациенти с коксартроза, които са били лекувани в артрологичната болница на НПО "СКАЛ" (Научно-производствено обединение "Специализиран курс на амбулаторно лечение") в Москва.

При проверка на статистическа хипотеза са възможни грешки. Има два вида грешки. Грешка от тип I възниква, когато нулевата хипотеза е отхвърлена, когато всъщност нулевата хипотеза е вярна. Грешка тип II възниква, когато нулевата хипотеза се приеме, когато всъщност нулевата хипотеза е невярна.

Вероятността за грешка от тип I се нарича ниво на значимост и се обозначава с a. Така а=Р(Ш¥ | Н0), т.е. нивото на значимост a е вероятността на събитието (Te¥), изчислена при предположението, че нулевата хипотеза H0 е вярна.

Нивото на значимост и мощността на теста се комбинират в концепцията за функция на тестовата мощност - функция, която определя вероятността нулевата хипотеза да бъде отхвърлена. Степенната функция зависи от критичната област ¥ и действителното разпределение на наблюденията. В параметричен

маса 1

Коефициент на доверие t и съответните нива на доверие

t 1,00 1,96 2,00 2,58 3,00

F(0 0,683 0,950 0,954 0,990 0,997

В проблема за тестване на хипотези, разпределението на резултатите от наблюдението се определя от параметър 0. В този случай степенната функция се обозначава с M(¥,0) и зависи от критичната област ¥ и действителната стойност на параметъра, който се изследва 0 Ако H0: 0=00, H1: 0=01, тогава M (¥.00) = a, M(¥.01) = 1-b, където a е вероятността за грешка от първия тип, b е вероятността от грешка от втори тип. Тогава силата на теста е вероятността нулевата хипотеза да бъде отхвърлена, когато алтернативната хипотеза е вярна.

Степенната функция M(¥,0) в случай на едномерен параметър 0 обикновено достига минимум равен на a при 0=00, нараства монотонно с разстояние от 00 и се доближава до 1 при | 0 - 00 | ^ да.

Нека оценим необходимата мощност на статистическите критерии (фиг. 1), които биха могли да се използват за анализ на лечението на 20 пациенти с коксартроза.

Както можете да видите, със стандартно отклонение от 3,0, което е изключително рядко, резултатите ще бъдат получени с висока степен на надеждност /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

За да се определи нивото на значимост на p, обикновено се използва приблизителното нормално 2-приближение на съответната статистика. Това приближение дава добро приближение за достатъчно големи размери на извадката. С малък размер на извадката и стойности на р, близки до 0,05, тествахме заключението на нулевата хипотеза за сравнение

Крива на мощността алфа=0,05, сигма=

Крива на мощността алфа=0,05, сигма=1,

Истинска разлика между средствата

Истинска разлика между средствата

Ориз. 1. Експериментално установени характеристики на статистиката

критерии.

Таблица 2 .

Групи за наблюдение

Група 1 Група 2 Група 3 Общо наблюдения

Нимезулид, витамини, хондропротектори, физиотерапия + + + 20

Физиотерапия --- + + 15

Масаж... --- + 8

Болка при движение

Болка в покой 43±13 27±17

несъответствие между изчислената стойност на статистиката и критичната стойност в таблицата на съответното разпределение от статистическия справочник.

Критерии за разлика в изместване (позиция). Използвахме тези критерии, за да тестваме следните хипотези:

♦ няма разлики в относителните позиции (медиани) на двете изследвани проби;

♦ изместването на извадките една спрямо друга е равно на определена стойност d;

♦ медианата на една анализирана проба е равна на стойността на d.

В случай б) беше необходимо първо да се намалят всички стойности на втората проба със стойността d: yi=yi-d.

В случай c) е необходимо да се подготви спомагателна сдвоена проба, всички елементи на която са равни на d.

В резултат на това изчислихме:

♦ стойността на статистиката на W. Wilcoxon - сумата от ранговете Rxi на елементите на една от извадките в комбинираната класирана извадка;

♦ стойността на V статистиката на Ван дер Варден, базирана на използването на метода на „произволни етикети”.

За всяка статистика бяха изчислени нормалното приближение (Z-статистика) и нивото на значимост P на нулевата хипотеза за липса на разлики в изместването едно спрямо друго. Ако p>0,05, нулевата хипотеза може да бъде приета.

Някои пакети и автори предлагат използването на теста на Ман-Уитни и теста на Валд-Уолфовиц. Отдавна обаче е доказано, че критерият на Ман-Уитни е еквивалентен, т.е. има същите възможности като критичната

Таблица 3.

Средни резултати за интензивност на болката (VAS резултати)

Група 1 (n=5) Група 2 (n=7) Група 3 (n=8)

Индикатор Начало на наблюдението Край на наблюдението Намаляване на болката Начало на наблюдението Край на наблюдението Намаляване на болката Начало на наблюдението Край на наблюдението Намаляване на болката

Таблица 4.

Данни от лабораторни изследвания на пациент Б.

№ Показател Норма Резултат от предпоследния Резултат от последния

него посещава посещения

Хематокрит, % 40-48 38.7

Лимфоцити, % 19-37 42

ESR, mm/час 2-10 39

Пикочна киселина, µmol/l 200-416 504

Креатинин, µmol/l 44-106 238

Паратироиден хормон, pg/ml 7-53 76.8

Фибриноген, g/l 1,69-3,92 5.7

Белтък в урината, g/l 0-0,1 1

43,5 39 10 489 202 101 3

предпоследен

Последно нещо

Ориз. 2. p-стойности на клиничните показатели на пациент Б. при предпоследния и последния преглед.

Тестът на Wilcoxon и тестът на Wald-Wolfowitz страдат от относително ниска чувствителност.

Критерии за разлики в мащаба (разсейване). Използвахме тези критерии, за да тестваме следните хипотези:

♦ хипотеза за липса на разлики в скалите (в разпръскването или дисперсията на стойностите) на изследваните извадки;

♦ хипотеза, че отношението на извадковите скали е равно на дадена стойност g.

В последния случай е необходимо първо да се променят стойностите на втората проба y1 = (y1-m0)^, където m0 е общата медиана на двата изследвани спектъра.

Ако медианите на популациите, от които са взети пробите, не са равни по стойност, а техните

приложете, като първо модифицирате една от пробите, например, в пробата yi=yi-m2+mr

Ако медианите не са равни и са неизвестни, тогава хипотезата, че няма разлики в изместването, трябва да бъде потвърдена или методът трябва да се използва за откриване на произволни алтернативи.

В резултат на това е изчислена стойността на статистиките на W. Ansari-Bradly и K. Klotz, които са концептуални аналози на статистиките на Wilcoxon и Van der Warden.

За всяка първоначална статистика се изчислява нормалното приближение (Z-статистика) и нивото на значимост P на нулевата хипотеза, че няма разлики в разпространението на стойностите на двете извадки. Ако />>0,05, нулевата хипотеза може да бъде приета.

По този начин методите на математическата статистика, предложени по-горе, позволяват да се потвърди надеждността на разликите

получени резултати дори при малки групи от наблюдения, ако разликите са достатъчно значителни.

За илюстрация могат да служат два клинични примера на пациенти с костно-ставна патология.

Клиничен пример № 1. При 20 пациенти с коксартроза е използван основен лечебен комплекс, включващ перорално приложение на нимезулид, хондропротектори, интрамускулни инжекциивитамини и физиотерапия. Освен това 15 от тях получиха физиотерапевтично лечение, а 6 пациенти получиха масаж. Така се формират 3 групи пациенти с малък (от 5 до 8) брой наблюдения (Таблица 2).

Сред другите параметри, преди началото на лечението и след завършване на курса (21±2 дни), интензивността на болката по време на движение и в покой беше оценена по 100-точкова визуална аналогова скала (VAS).

Следните статистически методи са използвани от W. Ansari-Bradly и K. Klotz (Таблица 3).

Според получените данни (Таблица 3), беше отбелязано, че намаляването на болката в покой в ​​група 1 в края на наблюдението не е значимо. Въпреки това бяха разкрити надеждни стойности за всички останали изследвани параметри. Разглежданият клиничен пример показва възможността за получаване на надеждни резултати от малка проба.

Клиничен пример № 2 изследва динамиката на лабораторните данни на пациент Б., страдащ от хроничен подагрозен полиартрит, подагрозна нефропатия със симптоми на хронична бъбречна недостатъчност, които са извън референтните стойности (Таблица 4).

Нека изчислим вероятността резултатите от анализа да надхвърлят статистически значимо границите на клиничната норма. За целта използваме вероятностния калкулатор на статистическия пакет „STATISTICA 6.0“. В този случай p-стойността измерва грешка от тип I: вероятността за отхвърляне на правилна хипотеза, когато тя всъщност е вярна. В повечето случаи резултатите от предпоследното посещение са статистически значимо различни от нормата (фиг. 2). Тъй като приемаме праговото ниво на значимост в този случай за равно на 0,05, резултатите за хематокрит, лимфоцити, СУЕ, фибриноген са се подобрили статистически значимо при последното посещение. Съответно клиничните показатели на пикочна киселина, креатинин, паратиреоиден хормон и протеин в урината, от гледна точка на математическата статистика, не са се подобрили.

По този начин, когато планирате изследване, е важно да вземете предвид силата на използваните статистически тестове, които се определят от променливостта на извадката и определеното ниво на значимост.

Предложеният подход може да представлява интерес за специалисти в областта на персонализираната медицина за

анализ на динамиката на прилаганите лечебни методи и медикаменти при проследяване на провежданите терапевтични и диагностични мерки.

ЛИТЕРАТУРА

1. Болшев Л.Н., Смирнов Н.В. Таблици на математическата статистика. М.: Наука; 1995 г.

2. Корн Г., Корн Т. Наръчник по математика за учени и инженери. М.: Наука; 2003 г.

3. Кобзар А.И. Приложна математическа статистика. За инженери и учени. М.: ФИЗМАТЛИТ; 2006 г.

4. Правецки Н.В., Носовски А.М., Матросова М.А., Холин С.Ф., Шакин В.В. Математическа обосновка на достатъчен брой измервания за надеждна оценка на регистрираните параметри в космическата биология и медицина. Космическа биология и космическа медицина. М.: Медицина; 1990 г.; 5:53-6.

5. HollenderM., Wulf D.A. Непараметрични методи на статистиката. М.: Финанси и статистика; 1983 г.

6. Носовски A.M. Приложение на вероятностни модели върху кръг в биомедицинските изследвания. Космическа биология и космическа медицина. Резюмета на докладите на IX Всесъюзна конференция. Калуга, 19-21 юни 1990 г.

7. Носовски А.М., Правецки Н.В., Холин С.Ф. Математически подход за оценка на точността на измерванията на физиологичен параметър различни методи. Космическа биология и космическа медицина. М.: Медицина; 1991 г.; 6:53-5.

1. Болшев Л. Н., Смирнов Н. В. Таблици на математическата статистика, Москва: Наука, 1995 (на руски).

2. Корн Г., Корн Т. Математически наръчник за учени и инженери. Москва: Наука; 2003 (на руски).

3. Кобзар" А.И. Приложна математическа статистика. За инженери и учени. Москва: ФИЗМАТЛИТ; 2006 (на руски език).

4. Правецкий Н.В., Носовски А.М., Матросова М.А., Холин С.Ф., Шакин В.В. Математическа обосновка на достатъчен брой измервания за надеждна оценка на регистрираните параметри в космическата биология и медицина. Космическа биология и аерокосмическа медицина. Москва: Медицина; 1990 г.; 5: 53-6 (на руски).

5. Khollender M., Vul'f D.A. Непараметрични статистически методи. Москва: Финанси и статистика, 1983 (на руски).

6. Носовски А.М. Използването на вероятностни модели на кръга в биомедицинските изследвания. Космическа биология и аерокосмическа медицина. Резюмета на IX Всесъюзна конференция. Калуга, 19-21 юни 1990 г. (рус.).

7. Носовски А.М., Правецки Н.В., Холин С.Ф. Математически подход за оценка на точността на физиологичния параметър чрез различни методи. Космическа биология и аерокосмическа медицина. Москва: Ме-дицина; 1991 г.; 6: 53-5 (на руски).