асимптотично оптимален. Асимптотична нотация за времето за изпълнение на програмите. Оценки отдолу, отгоре, асимптотично точни. Правило за суми и правило за произведение Асимптотични критерии за избор

В съвременните условия интересът към анализа на данни непрекъснато и интензивно нараства в напълно различни области като биология, лингвистика, икономика и, разбира се, ИТ. В основата на този анализ са статистическите методи и всеки уважаващ себе си специалист по извличане на данни трябва да ги разбира.

За съжаление, наистина добрата литература, такава, че да може да предостави както математически строги доказателства, така и разбираеми интуитивни обяснения, не е много често срещана. И тези лекции, според мен, са необичайно добри за математици, които разбират теорията на вероятностите точно поради тази причина. Те се преподават на магистри в немския университет Кристиан-Албрехт в програмите "Математика" и "Финансова математика". А за тези, които се интересуват как се преподава този предмет в чужбина, преведох тези лекции. Превеждането ми отне няколко месеца, разредих лекциите с илюстрации, упражнения и бележки под линия към някои теореми. Отбелязвам, че не съм професионален преводач, а просто алтруист и любител в тази област, така че приемам всякаква критика, ако е градивна.

Накратко, лекциите са за:


Условно очакване

Тази глава не се занимава пряко със статистиката, но е идеална отправна точка за нейното изучаване. Условното очакване е най-добрият избор за прогнозиране на случаен резултат въз основа на информацията, която вече имате. И това също е случайно. Тук се разглеждат различните му свойства, като линейност, монотонност, монотонна конвергенция и други.

Основи на точковата оценка

Как да оценим параметъра на разпределението? Какъв е критерият за това? Какви методи трябва да се използват за това? Тази глава ви позволява да отговорите на всички тези въпроси. Тук се въвеждат концепциите за безпристрастен оценител и равномерно безпристрастен оценител с минимална дисперсия. Обяснява откъде идват разпределението хи-квадрат и разпределението на Стюдънт и защо са важни при оценяването на параметрите на нормално разпределение. Казва се какво е неравенството на Рао-Крамер и информацията на Фишер. Въвежда се и понятието експоненциално семейство, което многократно улеснява получаването на добра оценка.

Байесово и минимаксно оценяване на параметри

Тук е описан различен философски подход към оценката. В този случай параметърът се счита за неизвестен, тъй като е реализация на някаква случайна променлива с известно (априорно) разпределение. Наблюдавайки резултата от експеримента, изчисляваме така нареченото задно разпределение на параметъра. Въз основа на това можем да получим байесова оценка, където критерият е минималната средна загуба, или минимаксна оценка, която минимизира максималната възможна загуба.

Достатъчност и пълнота

Тази глава е от сериозно практическо значение. Достатъчната статистика е функция на извадката, така че е достатъчно да се съхрани само резултатът от тази функция, за да се оцени параметърът. Има много такива функции и сред тях е така наречената минимална достатъчна статистика. Например, за да се оцени медианата на нормално разпределение, е достатъчно да се съхрани само едно число - средното аритметично за цялата извадка. Това работи ли и за други разпределения, като разпределението на Коши? Как достатъчно статистически данни помагат при избора на прогнози? Тук можете да намерите отговори на тези въпроси.

Асимптотични свойства на оценките

Може би най-важното и необходимо свойство на оценката е нейната последователност, тоест тенденцията към истинския параметър с увеличаване на размера на извадката. Тази глава описва свойствата на известните ни оценки, получени чрез статистическите методи, описани в предишните глави. Въвеждат се понятията асимптотична безпристрастност, асимптотична ефективност и разстояние Кулбак-Лайблер.

Основи на тестването

В допълнение към въпроса как да оценим непознат за нас параметър, трябва по някакъв начин да проверим дали той отговаря на необходимите свойства. Например, провежда се експеримент, в който се тества ново лекарство. Как да разберете дали е по-вероятно да се оправите с него, отколкото с по-стари лекарства? Тази глава обяснява как се изграждат такива тестове. Ще научите какъв е единно най-мощният тест, тестът на Нейман-Пиърсън, ниво на значимост, доверителен интервал, а също и откъде идват прословутите тест на Гаус и t-тест.

Асимптотични свойства на критериите

Подобно на оценките, критериите трябва да отговарят на определени асимптотични свойства. Понякога могат да възникнат ситуации, когато е невъзможно да се конструира необходимия критерий, но с помощта на добре известната централна гранична теорема ние конструираме критерий, който асимптотично клони към необходимия. Тук ще научите какво е асимптотичното ниво на значимост, метода на съотношението на вероятността и как се изграждат тестът на Бартлет и тестът за независимост хи-квадрат.

Линеен модел

Тази глава може да се разглежда като допълнение, а именно приложението на статистиката в случай на линейна регресия. Ще разберете какви оценки са добри и при какви условия. Ще научите откъде идва методът на най-малките квадрати, как да изградите критерии и защо имате нужда от F-разпределение.

асимптотично оптимален

  • - концепция, която утвърждава безпристрастността на оценката в границата. Нека е последователност от случайни променливи на вероятностно пространство, където Pm е една от мерките на семейството...

    Математическа енциклопедия

  • - концепция, която утвърждава безпристрастността на критерия в границата ...

    Математическа енциклопедия

  • - решение на диференциална система, която е стабилна по смисъла на Ляпунов и привлича всички други решения с достатъчно близки начални стойности ...

    Математическа енциклопедия

  • - концепция, която разширява идеята за ефективна оценка в случай на големи проби. Еднозначно определение на A. e. относно. не притежава. Например в класическата вариант говорим за асимптотичен ...

    Математическа енциклопедия

  • - желателно, целесъобразно ...

    Справочен търговски речник

  • - 1. най-доброто, най-благоприятното, най-подходящото за определени условия и задачи 2 ...

    Голям икономически речник

  • - най-благоприятното, възможно най-доброто ...

    Велика съветска енциклопедия

  • - най-доброто, най-подходящото за определени условия и задачи ...

    Съвременна енциклопедия

  • - най-доброто, най-подходящото за определени условия и задачи ...

    Голям енциклопедичен речник

  • - ...
  • - ...

    Правописен речник

  • - ...

    Правописен речник

  • - ...

    Правописен речник

  • - ...

    Правописен речник

  • - ...

    Правописен речник

  • - ...

    Правописен речник

"асимптотично оптимален" в книгите

Оптимален визуален контраст (OVC)

От книгата Цвят и контраст. Технология и творчески избор автор Железняков Валентин Николаевич

Оптимален визуален контраст (HVAC) Представете си черен костюм, осветен от слънцето, и бяла риза, осветена от луната. Ако измерим тяхната яркост с уред, се оказва, че при тези условия черният костюм е многократно по-ярък от бялата риза и въпреки това знаем, че

Какъв е оптималният мащаб?

От книгата Twitonomics. Всичко, което трябва да знаете за икономиката, кратко и по същество автор Комптън Ник

Какъв е оптималният мащаб? Автор на концепцията за оптимален мащаб е немско-британският философ Фриц Шумахер, автор на книгата „По-малко е по-добре: икономиката като човешко същество.” Той говори за факта, че капиталистическата тенденция към „гигантизъм” не само

8.4.2. Оптимален път на растеж

От книгата Икономическа теория: Учебник автор Маховикова Галина Афанасиевна

8.4.2. Оптимален път на растеж Да приемем, че цените на ресурсите остават постоянни, докато бюджетът на фирмата непрекъснато нараства. Свързвайки точките на контакт на изоквантите с изокостите, получаваме линията 0G - „пътят на развитие“ (пътят на растеж). Този ред показва темпа на нарастване на съотношението

Най-добрият вариант

От книгата на СССР: от опустошение до световна власт. съветски пробив автор Боф Джузепе

Оптимален вариант В огъня на битките през 1928 г. се ражда първият петгодишен план. От 1926 г. различни проекти на планове се изготвят един след друг в две институции - Държавната планова комисия и Висшият стопански съвет. Тяхното развитие беше придружено от непрекъснати дискусии. Като една схема

НАЙ-ДОБРИЯТ ВАРИАНТ

От книгата руски рок. Малка енциклопедия автор Бушуева Светлана

Оптимално

От книгата Велика съветска енциклопедия (ОП) на автора TSB

Оптимален ред

От книгата CSS3 за уеб дизайнери от Siderholm Dan

Оптимален ред Когато използвате префикси на браузъра, е важно да запомните реда, в който свойствата са изброени. Може да забележите, че в предишния пример свойствата с префикс са записани първи, последвани от свойството без префикс.

Човекът е оптимален

От книгата Computerra Magazine № 40 от 31 октомври 2006 г автор Списание Computerra

Оптимален мъж Автор: Владимир ГуриевНякои теми, популярни преди около четиридесет години, днес изглеждат толкова маргинални, че почти не се обсъждат сериозно. В същото време - съдейки по тона на статиите в популярни списания - те изглеждаха уместни и дори

Най-добрият вариант

От книгата Първият удар на Сталин 1941 [Колекция] авторът кремльов сергей

Оптимален вариант Анализът на възможните сценарии за развитие на събитията неизбежно кара човек да мисли за избора на оптималния вариант. Не може да се каже, че различни "летни" варианти, тоест алтернативи, обвързани с май-юни - юли 1941 г., вдъхват оптимизъм. Не те

Най-добрият вариант

От книгата Велика патриотична алтернатива автор Исаев Алексей Валериевич

Оптимален вариант Анализът на възможните сценарии за развитие на събитията неизбежно кара човек да мисли за избора на оптималния вариант. Не може да се каже, че различни "летни" варианти, т.е. алтернативи, свързани с май - юни - юли 1941 г., вдъхват оптимизъм. Не те

Оптимален контрол

От книгата Самочувствие при деца и юноши. Книга за родители авторът Eyestad Guru

Оптимален контрол Какво означава да държиш умерено стегнат? Това трябва да определите сами, въз основа на познанията на собственото си дете и условията на средата, в която живеете. В повечето случаи родителите на тийнейджъри се опитват да предпазят децата си от тютюнопушене, пиене на алкохол,

Оптимален начин

От книгата Парадоксът на перфекциониста автор Бен-Шахар Тал

Съвършенството на оптималния път постоянно ни атакува. Корицата на Men's Health е украсена от Адонис, корицата на Vogue от Елена Прекрасная; жени и мъже на необятния екран за час-два разрешават конфликтите си, разиграват идеалния сюжет, предават се на идеалната любов. Всички чухме

Оптимален подход

От книгата Експерт № 07 (2013) автор сп. Експерт

Оптимален подход Сергей Костяев, Ph.D.

Най-добрият вариант

От книгата Два сезона автор Арсениев Л

Най-добрият вариант - Кажете ми, разумно ли е да играете на няколко фронта едновременно? - попитаха журналистите Базилевич и Лобановски в самото начало на сезон 75. - Неразумно, разбира се - отговориха те. - Но е необходимо. Смятаме, че е необходимо да се диференцира значимостта

Оптимален контрол

От книгата Управление на лични (семейни) финанси. Системен подход автор Стайнбок Майкъл

Оптимален контрол >> При оптимален контрол ние разделяме всички разходи на две големи групи: - "нормални" - редовни разходи, - еднократни или нестандартни разходи Оптимален контрол може да се използва само след няколко месеца детайлен контрол.

Терминологичен речник

Обратно към раздел 7

Автоковариация (автоковариация) - за стационарната серия Xt, ковариацията на случайни променливи Xt9 Xt+T9 y(t) Cov(Xn Xt+T).

Автокорелационна функция (autocorrelation Junction -ACF) - за стационарна серия Xt - последователността от нейните автокорелации p(t) = Corr(Xt9 Xt + r), r = 0.1, 2, ...

Автокорелация (автокорелация), коефициент на автокорелация (коефициент на автокорелация) - за стационарната серия Xt, коефициентът на корелация на случайни величини Xp Xt+T, p(t) = Corr(Xt, Xt+T).

Бял шум, процес на бял шум - стационарен случаен процес Xt с нулева средна и ненулева дисперсия,

за които Corr(Xt, Xs) = 0 за t Ф s.

„По-икономични“ модели (по-пестеливи модели) – сред някакъв набор от алтернативни модели на времеви редове, модели с най-малък брой коефициенти за оценка.

Времеви редове (времеви редове) - поредица от стойности на някаква променлива, измерена в последователни точки във времето. Времевият ред се разбира и като случаен процес с дискретно време (случайна последователност), чиято реализация е наблюдаваната серия от стойности.

Примерна автокорелационна функция (SACF - sample ACF) - поредица от примерни автокорелации r (k), & = 0, 1.2, изградена върху съществуващата реализация на времевия ред. Анализът на тази последователност помага да се идентифицира процесът на подвижната средна и неговия ред.

Примерна частична автокорелационна функция (SPACF-проба PACF) - последователност от примерни частични автокорелации rpart(k), k = 0, 1, 2, изградена на базата на съществуващата реализация на времевия ред. Анализът на тази последователност помага да се идентифицира процесът на подвижната средна и неговия ред.

Примерни автокорелации (извадкови автокорелации) - оценки на автокорелации p(k) на случаен процес, изградени на базата на съществуващата реализация на времевия ред. Един от вариантите за оценка на автокорелацията p(k) има формата:

T-kf?x "I) U t + k I) y (k) 1 t

където p \u003d x \u003d - ^xt - оценка за p \u003d E (Xt),] m-k

y(k) = y](xt p)(xt+k p) е оценка за автоковариацията y(k).

Примерни частични автокорелации (пробни частични автокорелации) - оценки на частични автокорелации prap(t) на случаен процес, изградени въз основа на съществуващата реализация на времевия ред.

Процес на бял шум на Гаус - Процес на бял шум, чиито едномерни разпределения са нормални разпределения с нулева средна стойност.

Гаусов случаен процес (процес на Гаус) - случаен процес, при който за всяко цяло число m > O и произволен набор от времеви точки tx< t2 < ... < tm совместные распределения случайных величин Xti, Xtm являются m-мерными нормальными распределениями.

Иновация (иновация) - текущата стойност на случайната грешка от дясната страна на съотношението, което определя процеса на авторегресия Xr Иновация не е

корелирани с изоставащите стойности на Xt_k9 k= 1, 2, ... Последователните иновационни стойности (иновационна последователност) образуват процес на бял шум.

Информационният критерий на Akaike (АІС) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел се избира стойност, която минимизира стойността

o 2k A1C(t) = 1n0£2+y,

Оценката на дисперсията на иновациите в AR модела е наред.

Критерият на Akaike асимптотично надценява (надценява) истинската стойност на k0 с различна от нула вероятност.

Информационен критерий Ханан - Куин (информационен критерий на Ханан-Куин - HQC) - един от критериите за избор на "най-добрия" модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел се избира стойност, която минимизира стойността

UQ(k) = In a2k + k -,

където T е броят на наблюденията;

(mt е оценка на дисперсията на иновациите st в AR модела от A>ти ред.

Критерият се свежда сравнително бързо до истинската стойност на k0 при T -» oo. Въпреки това, за малки стойности на T, този критерий подценява реда на авторегресия.

Информационният критерий на Шварц (SIC) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел се избира стойност, която минимизира стойността

SIC(£) = lno>2+Ar-,

където T е броят на наблюденията;

а? - оценка на дисперсията на иновациите в AR модел A:-ти ред.

Корелограма (корелограма) - за стационарна серия: графика на зависимостта на стойностите на автокорелациите p (t) на стационарна серия от m. Корелограмата се нарича още двойка графики, дадени в протоколи за анализ на данни в различни статистически пакети за анализ: графика на примерна автокорелационна функция и графика на примерна частична автокорелационна функция. Наличието на тези два графика помага да се идентифицира моделът ARMA, генериращ наличните серии от наблюдения.

Backcasting е техника за получаване на по-точно приближение на функцията на условната правдоподобност, когато се оценява модел на подвижна средна MA(q):

Xt = et + bxst_x + b2st_2 + ... + bqet_q9 bq Ф0,

според наблюденията xl9 ..., xt. Резултатът от максимизиране (без bx, bl9 ..., bq) на условната функция на вероятността, съответстваща на наблюдаваните стойности xX9x29 ...9xm при фиксирани стойности на є09 є_X9 є_d+X9 зависи от избраните стойности b*0, е_є_д+1. Ако процесът MA(q) е обратим, тогава можем да зададем условна функция на вероятността. Операторът за забавяне (L)9 обратно изместване е оператор, дефиниран от връзката: LXt = Xt_x. Той е удобен за компактно записване на модели на времеви редове и за формулиране на условия, които осигуряват определени свойства на редовете. Например, използвайки този оператор, уравнението, определящо модела ARMA(p, q).

Xt = Z ajxt-j + Z bj£t-j ><*Р*ъ>з* О,

може да се запише като: a(L) Xt = b(b)êp където

a(L) = 1 (axL + a2L2 + ... + apLp

b(L)=l+blL + b2L2 + ... + bqLq.

Проблемът с общите фактори (общи фактори) е наличието на общи фактори за полиномите a(L) и b(L)9, съответстващи на компонентите AR и MA на модела ARMA:

Наличието на общи фактори в спецификацията на модела ARMA затруднява практическото идентифициране на модела от поредица от наблюдения.

Авторегресивен процес от първи ред (AR(1)) е случаен процес, чиято текуща стойност е сумата от линейна функция на стойността на процеса, изоставаща с една стъпка, и случайна грешка, която не е в корелация с минали стойности на процеса. В този случай поредица от случайни грешки образува процес на бял шум.

Авторегресивен процес от порядък p (pth-order autoregressive process - AR(p)) е случаен процес, чиято текуща стойност е сумата от линейна функция на стойностите на процеса, изоставащи с p стъпки или по-малко, и случайна грешка, която не е корелирани със стойностите на минали процеси. В този случай поредица от случайни грешки образува процес на бял шум.

Процес на подвижна средна q (процес на подвижна средна от q-ти ред - MA(g)) е случаен процес, чиято текуща стойност е линейна функция на текущата стойност на някакъв процес с бял шум и стойностите на този процес с бял шум, изоставащи с p стъпки или по-малко.

Декомпозицията на Уолд е представяне на широко стационарен процес с нулево математическо очакване като сбор от процес на пълзяща средна безкраен ред и линейно детерминиран процес.

Сезонна авторегресия от първи ред (SAR(l) - сезонна авторегресия от първи ред) е случаен процес, чиято текуща стойност е линейна функция на стойността на този процес, изоставаща с S стъпки и случайна грешка, която не е в корелация с минали стойности на процеса. В този случай поредица от случайни грешки образува процес на бял шум. Тук S = 4 за тримесечни данни, S = 12 за месечни данни.

Сезонна пълзяща средна от първи ред (SMA(l) - сезонна пълзяща средна от първи ред) е случаен процес, чиято текуща стойност е равна на сумата от линейна функция на текущата стойност на някакъв процес с бял шум и стойността на този процес с бял шум изоставане с S стъпки. В този случай поредица от случайни грешки образува процес на бял шум. Тук 5 = 4 за тримесечни данни, 5 = 12 за месечни данни.

Системата от уравнения на Юл - Уокър (уравнения на Юл - Уокър) - система от уравнения, свързваща автокорелациите на стационарен процес на авторегресия от ред p с неговите коефициенти. Системата ви позволява последователно да намерите автокорелационни стойности и прави възможно, използвайки първите p уравнения, да изразите коефициентите на стационарния авторегресивен процес по отношение на стойностите на първите p автокорелации, които могат да бъдат директно използвани, когато напасване на авторегресионния модел към реални статистически данни.

Случаен процес с дискретно време (стохастичен процес с дискретно време, случаен процес с дискретно време) - последователност от случайни променливи, съответстващи на наблюдения, направени в последователни времена, имащи определена вероятностна структура.

Смесен процес на авторегресия - подвижна средна, авторегресивен процес с остатъци под формата на подвижна средна (авторегресивна подвижна средна, смесена авторегресивна подвижна средна - ARMA (p, q)) - случаен процес, чиято текуща стойност е сумата от линейна функция на изоставащи p стъпки или по-малко стойности на процеса и линейна функция на текущата стойност на някакъв процес с бял шум и стойностите на този процес на бял шум, изоставащи с q стъпки или по-малко.

Q-статистика на Box-Pierce - една от опциите на g-статистиката:

Є = r e r2(*),

Q-статистиката на Ljung-Box е един от вариантите на g-статистиката, по-предпочитана от статистиката на Box-Pearce:

където T е броят на наблюденията; r (j) - примерни автокорелации.

Използва се за тестване на хипотезата, че наблюдаваните данни са изпълнение на процес на бял шум.

Стационарен в широк смисъл (стационарен в широк смисъл), слабо стационарен (стационарен в слаб смисъл, слабо стационарен), стационарен от втори ред (стационарен от втори ред), ковариантно стационарен (ковариантно-стационарен) случаен процес (стохастичен процес) - случаен процес с постоянно математическо очакване, постоянна дисперсия и инвариантни ковариации на случайни променливи Xt,Xt+T:

Cov(Xt,Xt+T) = r(r).

Строго стационарен, строг смисъл стационарен (строго стационарен, строг смисъл стационарен) случаен процес (стохастичен процес) - случаен процес с инвариантни по r съвместни разпределения на случайни величини Xh + T, ..., + T.

Условие за обратимост за процеси Xt от формата MA(g): Xt = b(L)st или ARMA(p, q): a(L)(Xt ju ) = = b(L)st - условие върху корените на уравнение b(z) = O, което осигурява съществуването на еквивалентно представяне на процеса Xt под формата на авторегресивен процес от безкраен ред AR(oo):

Условие за обратимост: всички корени на уравнението b(z) = 0 лежат извън единичната окръжност |z|< 1.

Условие за стационарност за процеси AR(p) и ARMA(p, q) (условие за стационарност) - за процеси Xt от формата AR(p): a(L)(Xt ju) = et или ARMA(p, q) a( L)( Xt ju) = b(L)st - условие върху корените на уравнението a(z) = 0, което осигурява стационарността на процеса Xg Условие за стационарност: всички корени на уравнението b(z) = 0 лежат извън единичната окръжност |z|< 1. Если многочлены a(z) и b(L) не имеют общих корней, то это условие является необходимым и достаточным условием стационарности процесса Хг

Частична автокорелационна функция (PACF - частична автокорелационна функция) - за стационарна серия, последователността от частични автокорелации prap(r), m = 0, 1,2, ...

Частична автокорелация (РАС - partial autocorrelation) - за стационарен ред, стойността ppart(r) на коефициента на корелация между случайни променливи Xt nXt+k, изчистена от влиянието на междинни случайни променливи Xt+l9...9Xt+k_Y.

Етапът на диагностична проверка е диагностиката на приблизителен ARMA модел, избран въз основа на наличния набор от наблюдения.

Етап на идентификация на модела (етап на идентификация) - избор на модел за генериране на серии въз основа на наличните серии от наблюдения, определяне на p и q поръчките на модела ARMA.

Етап на оценка на модела (етап на оценка) - оценка на коефициентите на модела ARMA, избрани въз основа на наличните серии от наблюдения.

(7-статистика (Q-статистика) - статистика на критериите, използвани за тестване на хипотезата, че наблюдаваните данни са изпълнение на процеса на бял шум.

Обратно към раздел 8

Ред на векторна авторегресия (ph-order vector autoregression - VAR (p)) - модел за генериране на група от времеви редове, в които текущата стойност на всяка серия се състои от постоянен компонент, линейни комбинации от изоставане (до ред p) стойности на тази серия и други серии и случайна грешка. Случайните грешки във всяко уравнение не са свързани с изоставащите стойности на всички разглеждани серии. Случайните вектори, образувани от грешки в различни серии по едно и също време, са независими, равномерно разпределени случайни вектори с нулеви средни стойности.

Дългосрочна (дългосрочна) връзка - определена връзка между променливи, която се установява с течение на времето, по отношение на която възникват доста бързи колебания.

Дългосрочни множители (long-run multipliers, equilibrum multipliers) - в динамичен модел с авторегресивно разпределени закъснения - коефициенти cx, cs на дългосрочната зависимост на променлива от екзогенни променливи chi, xst. Коефициентът Cj отразява промяната в стойността на yt, когато текущите и всички предишни стойности на променливата xjt се променят с единица.

Импулсни множители (множител на въздействие, краткосрочен множител) - в динамичен модел с авторегресивно разпределени закъснения - стойности, показващи влиянието на еднократни (импулсни) промени в стойностите на екзогенни променливи xi, xst върху текущата и последващи стойности на променливата jr

Кръстосани ковариации (кръстосани ковариации) - коефициенти на корелация между стойностите на различни компоненти на векторната серия в едни и същи или различни времеви точки.

Крос-ковариационна функция - последователност от взаимни корелации на два компонента на стационарна векторна серия.

Модели с авторегресивни разпределени закъснения (авторегресивни разпределени лаг модели - ADL) - модели, при които текущата стойност на променливата, която се обяснява, е сумата от линейна функция на няколко изоставащи стойности на тази променлива, линейни комбинации от текущата и няколко изоставащи стойности на обяснителните променливи и случайна грешка.

Трансферна функция (трансферна функция) - матрична функция, която установява влиянието на единични промени в екзогенни променливи върху ендогенни променливи.

Процесът на генериране на данни (DGP) е вероятностен модел, според който се генерират наблюдавани статистически данни. Процесът на генериране на данни обикновено е неизвестен за изследователя, който анализира данните. Изключение правят ситуациите, когато изследователят сам избира процеса на генериране на данни и получава изкуствени статистически данни, симулиращи избрания процес на генериране на данни.

Статистически модел (СМ) - модел, избран за оценка, чиято структура се предполага, че съответства на процеса на генериране на данни. Изборът на статистически модел се прави въз основа на наличната икономическа теория, анализ на наличните статистически данни, анализ на резултатите от по-ранни изследвания.

Стационарни векторни (AG-мерни) серии (K-мерни стационарни времеви редове) - последователност от произволни вектори с размерност K, имащи еднакви вектори на очакване и еднакви ковариационни матрици, за които кръстосани корелации (кръстосани корелации) между стойността на k-тата компонента на редицата в момента t и стойността на 1-вата компонента на редицата в момента (t + s) зависят само от s.

Назад към раздел 9

Хипотеза за единичен корен (UR - хипотеза за единичен корен) - хипотеза, формулирана в рамките на модела ARMA(^, q): a(L)Xt = b(L)cr Хипотезата, че авторегресивният полином a(L) на Моделът ARMA има поне един корен, равен на 1. В този случай обикновено се приема, че полиномът a(L) няма корени, които са по-малки от 1 по абсолютна стойност.

Диференциация (диференциране) - преход от серия от нива Xt към серия от разлики Xt Xt_v Последователното диференциране на серията прави възможно елиминирането на стохастичната тенденция, присъстваща в оригиналната серия.

Интегрирана серия от ред k е серия Xn, която не е стационарна или стационарна по отношение на детерминирана тенденция (т.е. не е TS-серия) и за която серията, получена в резултат на ^-кратно диференциране на Xn серията е стационарна, но серията, получена в резултат на (k 1)-кратно диференциране на серията Xr, не е HH-серия.

Коинтеграция - дългосрочна връзка между няколко интегрирани серии, характеризиращи равновесното състояние на системата от тези серии.

Моделът за коригиране на грешки е комбинация от краткосрочни и дългосрочни динамични регресионни модели при наличие на коинтеграционна връзка между интегрирани серии.

Операторът за диференциране е оператор A, който трансформира поредица от нива Xt в поредица от разлики:

Свръхдиференциран времеви ред - серия, получена в резултат на диференциране на G5-серията. Последователното диференциране на GO-серията помага да се елиминира детерминистичната полиномна тенденция. Разграничаването на Γ-сериите обаче има някои нежелани последствия при монтиране на модел към статистически данни и използване на монтирания модел за целите на прогнозиране на бъдещи стойности на серията.

Разлика стационарна, LU-серия (DS - разлика стационарна времева серия) - интегрирана серия от различни порядъци k = 1,2, ... Те се редуцират до стационарна серия чрез единично или многократно диференциране, но не могат да бъдат сведени до стационарна серия чрез изваждане детерминистична тенденция.

Серия от тип ARIMA(p, A, q) (ARIMA - авторегресивна интегрирана подвижна средна) - времева серия, която в резултат на ^-кратно диференциране се свежда до стационарна серия ARMA(p, q).

Серия, стационарна по отношение на детерминиран тренд, Г5-серия

(TS - trend-stationary time series) - серии, които стават стационарни след изваждане на детерминирана тенденция от тях. Класът на такива серии също включва стационарни серии без детерминистичен тренд.

Случайна разходка, процес на произволна разходка (произволна разходка) - случаен процес, чиито стъпки образуват процес на бял шум: AXt st, така че Xt = Xt_ x + єg

Случайна разходка с дрейф, произволна разходка с дрейф - случаен процес, чиито нараствания са сумата от константа и процес на бял шум: AXt = Xt Xt_x = a + st, така че Xt = Xt_x + a + y характеризира дрейфа на случайния траектории на ходене, която постоянно присъства при прехода към следващия момент от време, върху който се наслагва случайната компонента.

Стохастичен тренд - времеви редове Zt, за които

Z, = єх + є2 + ... + et. Стойността на случайното ходене в момент t е t

Xt \u003d X0 + ^ є8, така че Xt X0 \u003d єx + є2 + ... + єr С други думи, моделът

стохастичен тренд - процесът на случайна разходка, "напускане на произхода" (за него X0 = 0).

Шокова иновация (шокова иновация) - еднократна (импулсна) промяна в иновацията.

Ефект на Слуцки - ефектът от образуването на фалшива периодичност при диференциране на серия, която е стационарна по отношение на детерминирана тенденция. Например, ако оригиналната серия е сбор от детерминирана линейна тенденция и бял шум, тогава диференцираната серия няма детерминирана тенденция, но е автокорелирана.

^-хипотеза (TS хипотеза) - хипотеза, че разглежданият времеви ред е стационарен или серия, стационарна по отношение на детерминирана тенденция.

Обратно към раздел 10

Дългосрочна вариация (дългосрочна вариация) - за серия u с нулево математическо очакване се определя като граница

Var(ux + ... + um)

Г-н T T-+OD

Тестове на Дики-Фулър - група статистически тестове за проверка на хипотезата за единичен корен в модели, които предполагат нулево или ненулево математическо очакване на времевия ред, както и възможното наличие на детерминистична тенденция в реда.

При прилагането на критериите на Дики-Фулър най-често се оценяват статистически модели

рAxt = a + (3t + cpxt_x + +є*> t = P + h---,T,

Axt =a + cpxt_x + ^0jAxt_j + £*, t = /7 + 1,..., r,

Axt = cpxt_x + ]T 6j Axt_j +єп t = p +1,...,T.

Стойностите на /-statistics /, получени чрез оценка на тези статистически модели за тестване на хипотезата H0: cp = 0, се сравняват с критичните стойности /crit, в зависимост от избора на статистически модел. Хипотезата за единичния корен се отхвърля, ако f< /крит.

Тестът на Kwiatkowski-Phillips-Schmidt-Shine (тест KPSS) е критерий за разграничаване между DS и G5-серии, при които n-хипотезата се приема за нулева.

Тестът на Лейбърн е критерий за проверка на хипотезата за единичен корен, чиято статистика е равна на максимума от две стойности на статистиката на Дики - Фулър, получена от оригиналната серия и от серията с обърнато време.

Тестът на Перон е критерий за тестване на нулевата хипотеза, че дадена серия принадлежи към класа DS, обобщавайки процедурата на Дики-Фулър за ситуации, при които има структурни промени в модела в даден момент от времето Tv под формата на изместване на ниво (модел „срив“) по време на периода на наблюдение или промяна в наклона на тенденцията (модел „промяна на растежа“), или комбинация от тези две промени. В същото време се приема, че моментът Tv се определя екзогенно - в смисъл, че не е избран на базата на визуално изследване на серийната графика, а е свързан с момента на добре познат мащабен промяна в икономическата ситуация, която значително влияе върху поведението на разглежданата серия.

Хипотезата за единичен корен се отхвърля, ако наблюдаваната стойност на статистиката ta на критерия е под критичното ниво, т.е. ако

Асимптотичните разпределения и критичните стойности за статистиката ta9, първоначално дадени от Perron, са валидни за модели с иновативни отклонения.

Тест на Филипс-Перон (тест на Филипс-Перон) - критерий, който намалява проверката на хипотезата, че серията xt принадлежи към класа на DS-серията до проверката на хипотезата R0: cp = O в рамките на статистическия модел

SM: kxt=a + f3t + (pxt_x+un t = 2,...,T,

където, както при теста на Дики-Фулър, параметрите an p могат да се приемат равни на нула.

Въпреки това, за разлика от критерия на Дики-Фулър, е разрешен за разглеждане по-широк клас времеви редове.

Критерият се основава на G-статистиката за тестване на хипотезата H0:<р = О, но использует вариант этой статистики Zn скорректированный на возможную автокоррелированность и гетероскедастичность ряда иг

Тест на Шмид-Филипс (тест на Шмид-Филипс) - критерий за проверка на хипотезата за единичен корен в модела

където wt = jSwt_x + st; t - 2,G;

y/ - параметър, представящ нивото; £ - параметър, представящ тенденцията.

Тестът DF-GLS (тест DF-GLS) е тест, който е асимптотично по-мощен от теста на Дики-Фулър.

Ексцес (kurtosis) - пиков коефициент на разпределение.

Модел на адитивно отклонение е модел, при който при преминаване през датата на прекъсване телевизионната поредица yt веднага започва да се колебае около ново ниво (или нова линия на тенденция).

Модел на извънредни стойности на иновациите е модел, при който след преминаване през датата на прекъсване Tv, процесът yt само постепенно достига ново ниво (или нова линия на тенденция), около която траекторията на серията започва да се колебае.

Многовариантна процедура за тестване на хипотезата за единичен корен (Dolado, Jenkinson, Sosvilla-Rivero) - формализирана процедура за използване на критериите на Dickey - Fuller с последователна проверка на възможността за намаляване на първоначалния статистически модел, който се счита за модел

RAxt = a + fit + (pxt_x + ^0jAxt-j + £7> t = P + h---9T.

Предпоставка за използване на формализирана многовариантна процедура е ниската мощност на тестовете за единичен корен. В това отношение многовариантната процедура предвижда многократни тестове на хипотезата за единичен корен в по-прости модели с по-малко оценени параметри. Това увеличава вероятността за правилно отхвърляне на хипотезата за единичния корен, но е придружено от загуба на контрол върху нивото на значимост на процедурата.

Обобщеният тест на Perron е безусловен тест, предложен от Zivot и Andrews (свързан с иновативни извънредни стойности), при който датата на точка на промяна на режима се прави в „автоматичен режим“, чрез изброяване на всички възможни опции за датиране и изчисляване за всяка опция за датиране / -статистика ta за тестване на хипотезата за единичен корен; очакваната дата е тази, за която стойността на ta е минимална.

Процедура на Cochrane, тест за съотношение на вариация - процедура за разграничаване на TS и /) 5-серии въз основа на специфичното поведение за тези

серия от връзката VRk = -, където Vk = -D(Xt -Xt_k).

Стандартното брауново движение е случаен процес W(r) с непрекъснато време, което е непрекъснат аналог на дискретно случайно блуждаене. Това е процес, за който:

увеличенията (W(r2) W(r()),(W(rk) W(rk_x)) са колективно независими, ако 0< rx < г2 < ... < гк и W(s) W(r) ~ N(0, s г) при s >G;

реализациите на процеса W(r) са непрекъснати с вероятност 1.

Размерът на прозореца е броят на извадковите автоковариации на серията, използвани в оценката на Newey-West за дългосрочната дисперсия на серията. Недостатъчната ширина на прозореца води до отклонения от номиналния размер на теста (ниво на значимост). В същото време увеличаването на ширината на прозореца, за да се избегнат отклонения от номиналния размер на критерия, води до намаляване на мощността на критерия.

Двумерният бял шум на Гаус (двумерен бял шум на Гаус) е поредица от независими, идентично разпределени произволни вектори, които имат двумерно нормално разпределение с нулево математическо очакване.

Детерминистична коинтеграция (стохастична коинтеграция) - съществуването за група от интегрирани серии на тяхната линейна комбинация, която отменя стохастичните и детерминистичните тенденции. Серията, представена от тази линейна комбинация, е неподвижна.

Идентифициране на коинтегриращите вектори - изборът на основата на коинтегриращото пространство, състоящо се от коинтегриращи вектори, които имат разумна икономическа интерпретация.

Коинтегриращо пространство - множеството от всички възможни коинтегриращи вектори за коинтегрираща система от серии.

Коинтегрирани времеви редове, тясно коинтегрирани времеви редове - група от времеви редове, за които има нетривиална линейна комбинация от тези редове, която е стационарна серия.

Коинтегриращият вектор е вектор от коефициенти на нетривиална линейна комбинация от няколко серии, която е стационарна серия.

Тестът за максимална собствена стойност е тест, използван в процедурата на Йохансен за оценка на коинтеграционния ранг r на система от интегрирани (порядък 1) серии за тестване на хипотезата H0: r = r* срещу алтернативната хипотеза HA: r = r* + 1 .

Тест за проследяване - критерий, който се използва в процедурата на Йохансен за оценка на коинтеграционния ранг r на система от интегрирани (порядък 1) серии за тестване на хипотезата H0: r = r* срещу алтернативната хипотеза HA: r > r*.

Общи тенденции - група серии, които контролират стохастичната нестационарност на система от коинтегрирани серии.

Причинно-следствената връзка на Грейнджър е фактът за подобряване на качеството на прогнозата на стойността yt на променливата Y в момент t въз основа на съвкупността от всички минали стойности на тази променлива, като се вземат предвид миналите стойности на друга променлива.

Пет ситуации в процедурата на Йохансен - пет ситуации, от които зависят критичните стойности на статистиката на теста за съотношението на вероятността, използвана в процедурата на Йохансен за оценка на ранга на коинтеграция на система от интегрирани (порядък 1) серии:

H2(r): няма детерминистични тенденции в данните, нито константа, нито тенденция са включени в CE;

H*(r): няма детерминистични тенденции в данните,

CE включва константа, но не включва тенденция;

Hx (r): има детерминистична линейна тенденция в данните, константа е включена в CE, но не е включена тенденция;

H*(r) има детерминистична линейна тенденция в данните, константа и линейна тенденция са включени в CE;

H(r): Има детерминистична квадратична тенденция в данните, постоянна и линейна тенденция са включени в CE.

(Тук CE е коинтеграционното уравнение.)

За фиксиран ранг r изброените 5 ситуации образуват верига от вложени хипотези:

H2(r) с H*(r) с H, (r) с Hr) с H(r).

Това дава възможност, използвайки теста за съотношението на вероятността, да се провери изпълнението на хипотезата вляво в тази верига, в рамките на хипотезата, разположена непосредствено вдясно.

Коинтегриращ ранг - максималният брой линейно независими коинтегриращи вектори за дадена група серии, рангът на коинтегриращото пространство.

Стохастична коинтеграция - съществуването за група от интегрирани серии на линейна комбинация, която отменя стохастичната тенденция. Серията, представена от тази линейна комбинация, не съдържа стохастична тенденция, но може да има детерминирана тенденция.

Триъгълна система на Филипс - представяне на система от телевизионни коинтегрирани серии с коинтеграционен ранг r под формата на система от уравнения, първите r от които описват зависимостта на r избрани променливи от останалите (N r) променливи (общи тенденции) , а останалите уравнения описват модели за генериране на общи тенденции.

ТВ-размерният бял шум на Гаус (N-мерен Гаусов бял шум) е последователност от независими, идентично разпределени произволни вектори, които имат ТВ-измерно нормално разпределение с нулево математическо очакване.

Точните тестове предоставят два допълнителни метода за изчисляване на нивата на значимост за статистическите данни, налични чрез процедурите за кръстосани таблици и непараметрични тестове. Тези методи, точният метод и методът на Монте Карло, предоставят средства за получаване на точни резултати, когато вашите данни не отговарят на някое от основните допускания, необходими за надеждни резултати, използвайки стандартния асимптотичен метод. Предлага се само ако сте закупили опциите за точни тестове.

пример.Асимптотични резултати, получени от малки набори от данни или редки или небалансирани таблици, могат да бъдат подвеждащи. Точните тестове ви позволяват да получите точно ниво на значимост, без да разчитате на предположения, които може да не бъдат изпълнени от вашите данни. Например, резултатите от приемен изпит за 20 пожарникари в малък град показват, че и петимата бели кандидати са получили положителен резултат, докато резултатите за чернокожите, азиатските и латиноамериканските кандидати са смесени. Хи-квадрат на Пиърсън, тестващ нулевата хипотеза, че резултатите са независими от расата, дава асимптотично ниво на значимост от 0,07. Този резултат води до заключението, че резултатите от изпита са независими от расата на изпитвания. Въпреки това, тъй като данните съдържат само 20 случая и клетките имат очаквани честоти по-малки от 5, този резултат не е надежден. Точната значимост на хи-квадрат на Пиърсън е 0,04, което води до обратното заключение. Въз основа на точното значение бихте заключили, че резултатите от изпита и расата на изпитвания са свързани. Това демонстрира важността на получаването на точни резултати, когато предположенията на асимптотичния метод не могат да бъдат изпълнени. Точното значение винаги е надеждно, независимо от размера, разпределението, разрядността или баланса на данните.

статистика.безсимптомно значение. Приближение Монте Карло с ниво на достоверност или точна значимост.

  • асимптотичен. Нивото на значимост въз основа на асимптотичното разпределение на тестова статистика. Обикновено стойност под 0,05 се счита за значима. Асимптотичното значение се основава на предположението, че наборът от данни е голям. Ако наборът от данни е малък или лошо разпределен, това може да не е добра индикация за значимост.
  • Оценка на Монте Карло. Безпристрастна оценка на точното ниво на значимост, изчислено чрез многократно вземане на проби от референтен набор от таблици със същите размери и граници на редове и колони като наблюдаваната таблица. Методът Монте Карло ви позволява да оцените точната значимост, без да разчитате на предположенията, необходими за асимптотичния метод. Този метод е най-полезен, когато наборът от данни е твърде голям, за да се изчисли точната значимост, но данните не отговарят на допусканията на асимптотичния метод.
  • Точно. Вероятността за наблюдавания резултат или по-краен резултат се изчислява точно. Обикновено ниво на значимост под 0,05 се счита за значимо, което показва, че има някаква връзка между променливите в реда и колоната.
Теза

Следователно, един от начините за развитие на проверката на статистическите хипотези се превърна в начина на "емпирично" изграждане на критерии, когато изградената статистика на критерия се основава на определен принцип, остроумна идея или здрав разум, но неговата оптималност е не е гарантирано. За да се оправдае използването на такава статистика при тестване на хипотези срещу определен клас алтернативи, най-често по метода ...

  • 1. подкрепяща информация
    • 1. 1. Информация от теорията на C/- и V-статистиката
    • 1. 2. Определение и изчисляване на ефективността на Бахадур
    • 1. 3. При големи отклонения на II- и V-статистиката
  • 2. Критерии за симетрия на Барингхаус-Хенце
    • 2. 1. Въведение
    • 2. 2. Статистика
    • 2. 3. Статистика
  • 3. Критерии за експоненциалност
    • 3. 1. Въведение
    • 3. 2. Статистика I
    • 3. 3. статистика стр
  • 4. Критерии за нормалност
    • 4. 1. Въведение
    • 4. 2. Статистика B^
    • 4. 3. B^n статистика
    • 4. 4. Статистика B|)P
  • 5. Критерии за съответствие със закона на Коши
    • 5. 1. Въведение
    • 5. 2. Статистика
    • 5. 3. Статистика

Асимптотични свойства на симетрията и тестове за добро съответствие, базирани на характеристики (реферат, курсова работа, дипломна, контролна)

В тази дисертация ние конструираме и изучаваме критерии за добро съответствие и симетрия въз основа на характеристиките на свойствата на разпределенията и също така изчисляваме тяхната асимптотична относителна ефективност за редица алтернативи.

Конструирането на статистически критерии и изследването на техните асимптотични свойства е един от най-важните проблеми на математическата статистика. Когато се тества проста хипотеза срещу проста алтернатива, проблемът се решава с помощта на лемата на Нейман-Пиърсън, която, както е известно, дава оптималния (най-мощен) критерий в класа на всички критерии на дадено ниво. Това е тестът за съотношението на вероятността.

Въпреки това, за по-трудните и практически проблеми на тестването на хипотези, свързани или с тестване на сложни хипотези, или с разглеждане на сложни алтернативи, рядко съществуват еднакво най-мощните критерии и ролята на критерия за съотношението на вероятността се променя значително. Статистическите данни за коефициента на вероятност обикновено не могат да бъдат изчислени изрично, те губят своето свойство за оптималност и тяхното разпределение е нестабилно спрямо промените в статистическия модел. Освен това статистикът често изобщо не може да определи вида на алтернативата, без което изграждането на параметрични критерии губи смисъл.

Следователно, един от начините за развитие на проверката на статистическите хипотези се превърна в начина на "емпирично" изграждане на критерии, когато изградената статистика на критерия се основава на определен принцип, остроумна идея или здрав разум, но неговата оптималност е не е гарантирано.

Типични примери за такива статистики са знаковата статистика, x2 статистиката на Пиърсън (1900), статистиката на Колмогоров (1933), която измерва равномерното разстояние между емпиричните и истинските функции на разпределение, коефициентът на рангова корелация на Кендъл (1938) или статистиката на Бикел-Розенблат (1973), въз основа на квадратичния риск при оценка на ядрената плътност. Понастоящем математическата статистика разполага с много десетки „емпирични“ статистики за тестване на хипотезите за съгласие, симетрия, хомогенност, случайност и независимост и все повече и повече статистики от този тип непрекъснато се предлагат в литературата. Огромна литература е посветена на изследването на техните точни и гранични разпределения, оценки на скоростта на конвергенция, големи отклонения, асимптотични разширения и др.

За да се оправдае използването на такива статистики при тестване на хипотези срещу определен клас алтернативи, тяхната сила най-често се изчислява чрез статистическо моделиране. Въпреки това, за всеки последователен критерий, мощността има тенденция към единство с увеличаване на размера на извадката и следователно не винаги е информативна. По-задълбочен анализ на сравнителните свойства на статистиката може да се извърши въз основа на концепцията за асимптотична относителна ефективност (AER). Различни подходи за изчисляване на AOE бяха предложени от E. Pitman, J. Hodges и E. Lehman, R. Bahadur, G. Chernov и V. Kallenberg в средата на 20 век, резултатите от развитието на теорията за AOE от средата на 90-те години са обобщени в монографията. Общоприето е, че синтезът на нови критерии трябва да бъде придружен не само от анализ на техните свойства, но и от изчисляване на AOE, за да се оцени тяхното качество и да се дадат разумни препоръки за тяхното използване в практиката.

В тази статия използваме идеята за конструиране на критерии, базирани на характеризирането на разпределенията чрез свойството за равноразпределение. Теорията за характеризиране произхожда от работата на D. Poya, публикувана през 1923 г. След това е развита в трудовете на I. Martsinkevich, S. N. Bernshtein, E. Lukach, Yu. V. Linnik, A.A. Сингър, Ж. Дармоа, В. П. Скитович, С. Р. Пао, А.М. Каган, Я. Галамбош, С. Коц, Л. Б. Клебанов и много други математици. Литературата по този въпрос е голяма и в момента има няколко монографии, посветени на характеристиките, например, , , , , , , .

Идеята за конструиране на статистически критерии въз основа на характеристики на свойството на равноразпределение принадлежи на Ю. В. Линник,. В края на една обширна работа той пише: може да се повдигне въпросът за конструиране на критерии за съответствие на извадка със сложна хипотеза, базирана на идентичното разпределение на двете съответстващи статистики gi (xi> .xr) и q2(x, ¦¦¦xr) и по този начин да се намали въпрос на критерий за хомогенност.

Нека се върнем към класическата теорема на Поя, за да обясним с конкретен пример как може да работи такъв подход. В най-простата версия тази теорема е формулирана по следния начин.

Теорема на Поя. Нека X и Y са две независими и еднакво разпределени центрирани s. в. Тогава s. в. (X + Y)//2 и X са еднакво разпределени тогава и само ако разпределението на X е нормално.

Да предположим, че имаме извадка от центрирани независими наблюдения Xi, ., Xn и искаме да тестваме (сложната) нулева хипотеза, че разпределението на тази извадка принадлежи на нормалния закон със средно 0 и известна дисперсия. Въз основа на нашата извадка, ние конструираме обичайната емпирична функция на разпределение (d.f.) n

Fn(t) = n-^VD

Gn(t) = n~2? VD + Xj< iv^}, t <= R1. i, j=l

По силата на теоремата на Гливенко-Кантели, която е валидна и за V-статистически емпиричен d.f. , за големи n функцията Fn(t) равномерно се доближава до d.f. F (t) \u003d P (X< t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Въпреки това, тази конструкция, базирана на идеята на Ю. В. Линник, не е получила почти никакво развитие, може би поради технически трудности при конструирането и анализа на получените критерии. Друга причина вероятно е, че характеристиките на разпределенията чрез свойството за равноразпределение са малко и рядко се срещат.

Известни са ни само няколко произведения, посветени в една или друга степен на развитието на идеята на Ю. В. Линник. Това са произведенията на Baringhaus и Henze и Muliere и Nikitin, които ще бъдат разгледани по-долу. Има и работи, в които критериите за добро съответствие за специфични разпределения също са изградени въз основа на характеристики, но не и на основата на равноразпределение, например, , , , , , , , .

Най-честата употреба в литературата е използването на характеризиране на експоненциалното разпределение чрез различни варианти на свойството без памет , , , , , , .

Трябва да се отбележи, че в почти всички тези работи (освен може би само ) AOE на разглежданите критерии не се изчислява или обсъжда. В тази дисертация ние не само изучаваме асимптотичните свойства на известните и предложени от нас критерии, базирани на характеристики, но също така изчисляваме тяхната локална точна (или приблизителна) AOE според Бахадур.

Сега даваме дефиниция на понятието AOE. Нека (Tn) и (1^) са две поредици от статистики, конструирани от извадката X,., Xn с разпределението Pg, където в € 0 ⊂ R1, и нулевата хипотеза Ho се тества: 9 € в С в спрямо алтернатива A: в € ©-x = ©-60. Нека Mm (a, P, 0) е минималният размер на извадката X[,., Xn, за който последователността (Tn) с дадено ниво на значимост, a > 0, достига размера /3< 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Тъй като относителната ефективност като функция на три аргумента не може да бъде изрично изчислена дори за най-простите статистики, обичайно е да се вземат предвид ограничения:

Ntet, y (a, /?, 0), Ntet, y (a, / 3,0).

В първия случай се получава AOE по Бахадур, втората граница определя AOE по Hodges-Lehman, а третата води до дефиницията на AOE по Pitman. Тъй като случаите на ниски нива на значимост, високи мощности и близки алтернативи са най-интересни в практическите приложения, и трите определения изглеждат разумни и естествени.

В тази статия, за да сравним критериите, ще използваме AOE според Bahadur. Причините за това са няколко. Първо, ефективността на Pitman е подходяща главно за асимптотично нормална статистика и при това условие съвпада с локалната ефективност на Bach-Dur, . Разглеждаме не само асимптотично нормални статистики, но и статистики от квадратичен тип, за които граничното разпределение при нулевата хипотеза се различава рязко от нормалното, така че ефективността на Питман е неприложима. Второ, Hodges-Lehman AOE е неподходящ за изследване на двустранни критерии, тъй като всички те се оказват асимптотично оптимални, а за едностранни критерии този AOE обикновено съвпада локално с Bahadur AOE. Трето, наскоро беше постигнат значителен напредък в областта на големите отклонения за тестовата статистика, което е решаващо при изчисляването на AOE според Бахадур. Имаме предвид големите отклонения на u- и V-статистиките, описани в последните статии и .

Сега преминаваме към преглед на съдържанието на дисертацията. Първата глава е със спомагателен характер. Той представя необходимата теоретична и техническа информация от теорията на 11-статистиката, теорията на големите отклонения и теорията на асимптотичната ефективност според Бахадур.

Глава 2 е посветена на изграждането и изследването на критерии за проверка на хипотезата за симетрия. Baringhaus и Henze предложиха идеята за конструиране на критерии за симетрия въз основа на следната елементарна характеристика.

Нека X и Y са i.i.r.v., имащи непрекъснат d.f. След това |X| и |max(X, Y)| са еднакво разпределени тогава и само ако X и Y са симетрично разпределени около нулата.

Ние използваме тази характеристика, за да конструираме нови критерии за симетрия. Нека си припомним, че няколко класически критерия за симетрия (виж Глава 4) се основават на характеризирането на симетрията чрез още по-простото свойство, че X и -X са равномерно разпределени.

Нека се върнем към характеристиката на Baringhaus-Henze. Нека X, ., Xn са наблюдения, които имат непрекъснат d.f.<7. Рассмотрим проверку гипотезы симметрии:

H0: OD = 1 -<3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в >0-изкривена алтернатива, т.е. g (x-b) = 2f (x)F ($x), v > 0- алтернатива на Lehman, т.е. G (x-, 6) = F1+ e (x), 6 > 0 и алтернатива на замърсяване, т.е. G(x-6) = (1 - 6) F(x) + 6Fr+1(x), in > 0, r > 0, където F (x) и f (x) са d.f. и плътността на някакво симетрично разпределение.

В съответствие с горната характеристика, емпирична d.f. се конструира въз основа на |Xj|,., Xn, n

Hn (t) = n~2 J2 Tmax (X^Xk)<г}. На основе этих функций составляются статистики: лоо ):

Нека X uY е неотрицателно и неизродено i.i.r.v. F и нека 0< а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

В допълнение към конструирането на самия критерий за добро съответствие и изучаването на неговите асимптотични свойства, представлява интерес да се изчисли AOE на нов критерий и да се проучи неговата зависимост от параметъра a.

Второто обобщение на тази характеристика се дължи на Des. Ние го формулираме въз основа на по-късни произведения, :

Нека Xi, ., Xm, m ^ 2 са неотрицателни и неизродени i.i.d. r.v., имащ d.f., диференцируем при нула F. Тогава статистиките X и m minpfi, ., Xm) са идентично разпределени тогава и само ако F е d.f. експоненциален закон.

Нека Xx,., Xn са независими наблюдения с d.f. Въз основа на характеристиките, формулирани по-горе, можем да тестваме хипотезата за експоненциалност Ho, която е, че (7 е df на експоненциалния закон.P, срещу алтернативата на H, която се състои във факта, че С Ф? при слаби допълнителни условия.

В съответствие с тези характеристики се конструира емпирична d.f. n = pvd< О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Предлагаме критериите за тестване на експоненциалността да се базират на статистиката: pkn = - c&bdquo-(*)] aop(1).

Като алтернативи избираме стандартните алтернативи, използвани в литературата за тестване на експоненциалност: алтернативата на Weibull с g(x) = (b + 1) xexp(-x1 + b), x ^ 0- алтернативата на Makeham с g(x) = ( 1 + 0(1 - exp (-x))) exp (-x - 0(exp (-x) - 1 + x)), x ^ 0 е алтернатива на линейността на функцията за процент на отказ с q ( x) = (1 + inx) exp[-x - ^inx2], x > 0.

За двете статистики, предложени по-горе, ограничаващите разпределения са записани под нулевата хипотеза:

ТЕОРЕМА 3.2.1 За статистиката ΚΕ като η —* оо имаме отношението, където Δ3(a) е определено в (3.2.2). Теорема 3.3.1 За статистиката n при n -> oo имаме отношението

W0,(m + 1)2A1(m)), където D4(m) е определено в (3.3.6).

Тъй като и двете статистики зависят от параметрите a и m, ние установяваме при какви стойности на параметрите на AOE според Bahadur те достигат своите максимуми и намираме тези стойности. В допълнение, ние конструираме алтернатива, в която максимумът се достига в точка и φ ½.

Четвъртата глава е посветена на проверка на хипотезата за нормалност. Има много характеристики на нормалния закон като един от централните закони на теорията на вероятностите и математическата статистика и две монографии, посветени изключително на този въпрос. Ние разглеждаме леко опростена версия на добре познатата характеристика от и:

Нека Xr, X2, ., Xm са центрирани i.i.r.v., имащи d.f. o константите a, a-2,., am са такива, че 0< а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Нека X, ., Xn е образец с d.f. G. Въз основа на тази характеристика можем да тестваме основната хипотеза R0, която е, че G е d.f. нормален закон Fa (x) = Ф (х/а), срещу алтернативния Hi, който се състои в това, че G f Fa. Конструира се обичайният емпиричен d.f. Gn и V-статистически d.f. n^

Bm, n (t) = n~t (E 1 + - +< *}),

1.¿-t=1s

Тук и по-нататък символът и означава сумиране върху всички пермутации на индекси. Критериите за тестване на нормалността могат да се основават на следните статистически данни:

B, n = Г dGn (t), J -00 oo

BmAt)-Gn(t)]dGn(t), oo

Кошче = G)

Свързани публикации