Асимптотично оптимален. Асимптотична нотация за времето за изпълнение на програмата. Оценки отдолу, отгоре и асимптотично точни. Правило за суми и правило за произведение Асимптотични критерии за избор

В съвременните условия интересът към анализа на данни непрекъснато и интензивно нараства напълно различни области, като биология, лингвистика, икономика и, разбира се, ИТ. В основата на този анализ са статистическите методи и всеки уважаващ себе си специалист по извличане на данни трябва да ги разбира.

За съжаление наистина добрата литература, която може да предостави както математически строги доказателства, така и ясни, интуитивни обяснения, не е много често срещана. И тези лекции, според мен, са необичайно добри за математици, които разбират теорията на вероятностите точно поради тази причина. Те се преподават на магистри в немския университет Кристиан-Албрехт в програмите по математика и финансова математика. А за тези, които се интересуват как се преподава този предмет в чужбина, преведох тези лекции. Превеждането ми отне няколко месеца, разредих лекциите с илюстрации, упражнения и бележки под линия към някои теореми. Искам да отбележа, че не съм професионален преводач, а просто алтруист и любител в тази област, така че приемам всякаква критика, ако е градивна.

Накратко това е темата на лекциите:


Условно математическо очакване

Тази глава не се отнася пряко до статистиката, но е идеална за започване на нейното изучаване. Условното математическо очакване е най-добър изборда се предвиди произволен резултат въз основа на вече налична информация. И това също е случайна променлива. Тук разглеждаме различните му свойства, като линейност, монотонност, монотонна конвергенция и други.

Основи на точковата оценка

Как да оценим параметъра на разпределението? Какъв критерий трябва да избера за това? Какви методи трябва да използвам? Тази глава помага да се отговори на всички тези въпроси. Тук въвеждаме концепциите за безпристрастен оценител и равномерно безпристрастен оценител на минимална дисперсия. Обяснява откъде идват хи-квадрат и t-разпределенията и защо те са важни при оценяването на параметрите на нормалното разпределение. Обяснява какво представляват неравенството на Рао-Крамер и информацията на Фишер. Въвежда се и концепцията за експоненциално семейство, което значително улеснява получаването на добра оценка.

Байесова и минимаксна оценка на параметрите

Тук е описан различен философски подход към оценката. В този случай параметърът се счита за неизвестен, тъй като е реализация на определена случайна променлива с известно (априорно) разпределение. Като наблюдаваме резултата от експеримента, изчисляваме така нареченото задно разпределение на параметъра. Въз основа на това можем да получим байесов оценител, където критерият е минималната средна загуба, или минимаксен оценител, който минимизира максималната възможна загуба.

Достатъчност и пълнота

Тази глава има сериозно практическо значение. Достатъчна статистика е функция на извадката, така че е достатъчно да се съхрани само резултатът от тази функция, за да се оцени параметърът. Има много такива функции и сред тях е така наречената минимална достатъчна статистика. Например, за да се оцени медианата на нормално разпределение, е достатъчно да се съхрани само едно число - средното аритметично за цялата извадка. Това работи ли и за други разпределения, като разпределението на Коши? Как достатъчно статистически данни помагат при избора на прогнози? Тук можете да намерите отговори на тези въпроси.

Асимптотични свойства на оценките

Може би най-важното и необходимо свойство на оценката е нейната последователност, тоест тенденцията към истински параметър с увеличаване на размера на извадката. Тази глава описва какви свойства притежават познатите ни оценки, получени чрез статистическите методи, описани в предишните глави. Въвеждат се понятията асимптотична безпристрастност, асимптотична ефективност и разстояние Кулбак-Лайблер.

Основи на тестването

В допълнение към въпроса как да оценим параметър, който не ни е известен, трябва по някакъв начин да проверим дали той отговаря на необходимите свойства. Например, провежда се експеримент за тестване на ново лекарство. Как да разберете дали вероятността за възстановяване е по-висока с него, отколкото с използването на стари лекарства? Тази глава обяснява как се конструират такива тестове. Ще научите кой е единно най-мощният тест, тестът на Нейман-Пиърсън, нивото на значимост, доверителният интервал и откъде идват добре познатите тест на Гаус и t-тест.

Асимптотични свойства на критериите

Подобно на оценките, критериите трябва да отговарят на определени асимптотични свойства. Понякога могат да възникнат ситуации, когато е невъзможно да се конструира необходимия критерий, но с помощта на добре известната централна гранична теорема ние конструираме критерий, който асимптотично клони към необходимия. Тук ще научите какво е асимптотичното ниво на значимост, метода на съотношението на вероятността и как са конструирани тестът на Бартлет и тестът хи-квадрат за независимост.

Линеен модел

Тази глава може да се разглежда като допълнение, а именно прилагането на статистика в случай на линейна регресия. Ще разберете какви оценки са добри и при какви условия. Ще разберете откъде идва методът най-малки квадрати, как да се конструират критерии и защо е необходимо F-разпределението.

асимптотично оптимален

  • - концепция, която гласи, че оценката е безпристрастна в границата. Нека е последователност от случайни променливи на вероятностно пространство, където R е една от мерките на семейството...

    Математическа енциклопедия

  • - концепция, която утвърждава безпристрастността на критерия в границата...

    Математическа енциклопедия

  • - решение на диференциална система, която е стабилна по Ляпунов и привлича всички други решения с достатъчно близки начални стойности...

    Математическа енциклопедия

  • - концепция, която разширява идеята за ефективна оценка в случай на големи проби. Еднозначно определение на A. e. О. няма. Например в класическия вариант говорим за асимптотика...

    Математическа енциклопедия

  • - желателно, целесъобразно...

    Справочен търговски речник

  • - 1. най-добър, най-благоприятен, най-подходящ за определени условия и задачи 2...

    Голям икономически речник

  • - най-благоприятната, възможно най-добрата...

    Велика съветска енциклопедия

  • - най-доброто, най-подходящото за определени условия и задачи...

    Съвременна енциклопедия

  • - най-доброто, най-подходящото за определени условия и задачи...

    Голям енциклопедичен речник

  • - ...
  • - ...

    Правописен речник-справочник

  • - ...

    Правописен речник-справочник

  • - ...

    Правописен речник-справочник

  • - ...

    Правописен речник-справочник

  • - ...

    Правописен речник-справочник

  • - ...

    Правописен речник-справочник

"асимптотично оптимален" в книгите

Оптимален визуален контраст (OVC)

От книгата Цвят и контраст. Технология и творчески избор автор Железняков Валентин Николаевич

Оптимален визуален контраст (OVC) Представете си черен костюм, осветен от слънцето, и бяла риза, осветена от луната. Ако измерим тяхната яркост с уред, се оказва, че при тези условия черният костюм е многократно по-ярък от бялата риза и въпреки това знаем, че

Какъв е оптималният мащаб?

От книгата Twitonomics. Всичко, което трябва да знаете за икономиката, кратко и по същество от Комптън Ник

Какъв е оптималният мащаб? Автор на концепцията за оптималния мащаб е немско-британският философ Фриц Шумахер, автор на книгата „По-малко е по-добре: Икономиката като човешка същност“. Той каза, че капиталистическата тенденция към „гигантизъм“ не е само

8.4.2. Оптимален път на растеж

От книгата Икономическа теория: Учебник автор Маховикова Галина Афанасиевна

8.4.2. Оптимален път на растеж Нека приемем, че цените на ресурсите остават непроменени, докато бюджетът на предприятието непрекъснато нараства. Свързвайки допирателните точки на изоквантите с изокостите, получаваме линия 0G - „път на развитие“ (път на растеж). Този ред показва темпа на нарастване на съотношението

Най-добрият вариант

От книгата СССР: от разруха до световна сила. съветски пробив от Бофа Джузепе

Най-добрият вариантВ огъня на битките през 1928 г. се ражда първата петилетка. От 1926 г. две институции, Gosplan и VSNKh, изготвят различни проекти на планове един след друг. Тяхното развитие беше придружено от непрекъснати дискусии. Като една схема

ОПТИМАЛЕН ВАРИАНТ

От книгата Руски рок. Малка енциклопедия автор Бушуева Светлана

Оптимално

От книгата Велика съветска енциклопедия (ОП) на автора TSB

Оптимален ред

От книгата CSS3 за уеб дизайнери от Siderholm Dan

Оптимален ред Когато използвате префикси на браузъра, е важно да имате предвид реда, в който свойствата са изброени. Можете да забележите, че в предишния пример свойствата на префикса са написани първи, последвани от свойството без префикс Why put the genuine

Оптимален човек

От книгата Computerra Magazine № 40 от 31 октомври 2006 г автор Списание Computerra

Оптимален човек Автор: Владимир Гуриев Някои теми, популярни преди около четиридесет години, днес изглеждат толкова маргинални, че почти не се обсъждат сериозно. В същото време - съдейки по тона на статиите в популярните списания - те изглеждаха уместни и дори

Най-добрият вариант

От книгата Първият удар на Сталин 1941 [Колекция] автор Кремльов Сергей

Оптимален вариант Анализът на възможните сценарии за развитие на събитията неизбежно кара човек да мисли за избора на оптималния вариант. Не може да се каже, че различните „летни“ варианти, тоест алтернативи, свързани с май-юни - юли 1941 г., вдъхват оптимизъм. Не, те

Най-добрият вариант

От книгата Великата патриотична алтернатива автор Исаев Алексей Валериевич

Оптимален вариант Анализът на възможните сценарии за развитие на събитията неизбежно кара човек да мисли за избора на оптималния вариант. Не може да се каже, че различните "летни" варианти, т.е. алтернативи, свързани с май - юни - юли 1941 г., вдъхват оптимизъм. Не, те

Оптимален контрол

От книгата Самочувствие при деца и юноши. Книга за родители от Айестад Гиру

Оптимален контрол Какво означава да държиш умерено здраво? Вие трябва да определите това сами, въз основа на знания собствено детеи условията на средата, в която живеете. В повечето случаи родителите на тийнейджъри се опитват да предпазят децата си от тютюнопушене, пиене на алкохол,

Оптимален начин

От книгата Парадоксът на перфекциониста от Бен-Шахар Тал

Оптималният път Постоянно сме бомбардирани от съвършенство. Адонис краси корицата на Men’s Health, Елена Красивата краси корицата на Vogue; жени и мъже на необятния екран за час-два разрешават конфликтите си, разиграват идеален сюжет, отдават се на идеална любов. Всички сме чували

Оптимален подход

От книгата Експерт № 07 (2013) авторско списание Експерт

Оптимален подход Сергей Костяев, канд политически науки, старши изследовател в INION RAS Министерството на отбраната на САЩ похарчи милиард долара за неработеща компютърна програма Снимка: EPA От 1 март разходите на Пентагона вероятно ще бъдат намалени с 43 милиарда

Най-добрият вариант

От книгата Два сезона автор Арсеньев Л

Оптимален вариант - Кажете ми, разумно ли е да играете на няколко фронта едновременно? - попитаха журналистите Базилевич и Лобановски в самото начало на сезон 75. „Неразумно е, разбира се“, отговориха те. - Но е необходимо. Смятаме, че е наложително да се диференцира значимостта

Оптимален контрол

От книгата Управление на лични (семейни) финанси. Системен подход автор Стайнбок Михаил

Оптимален контрол >> При оптимален контрол разделяме всички разходи на две големи групи: – „обикновени“ – редовни разходи, – еднократни или нестандартни разходи може да се използва само след няколко месеца подробен контрол.

Речник

Към раздел 7

Автоковариация - за стационарен ред Xt, ковариацията на случайни променливи Xt9 Xt+T9 y(t) Cov(Xn Xt+T).

Autocorrelation Junction -ACF - за стационарен ред Xt - последователността от неговите автокорелации p(t) = Corr(Xt9 Xt+ r), r = 0.1, 2,...

Автокорелация, коефициент на автокорелация - за стационарен ред Xt, коефициентът на корелация на случайни променливи Xn Xt+T, p(t) = Corr(Xt, Xt+T).

Бял шум, процес на бял шум - стационарен случаен процес Xt с нулева средна и ненулева дисперсия,

за които Corr(Xt, Xs) = 0 при t Ф s.

„По-пестеливите“ модели са сред определен набор от алтернативни модели на времеви редове, модели с най-малък брой коефициенти за оценка.

Времеви редове - поредица от стойности на някаква променлива, измерена в последователни точки във времето. Времевият ред се разбира и като случаен процес с дискретно време (случайна последователност), чието изпълнение е наблюдавана поредица от стойности.

Примерна автокорелационна функция (SACF - sample ACF) - поредица от примерни автокорелации r (k), & = 0, 1,2, изградена от съществуващата реализация на времевия ред. Анализирането на тази последователност помага да се идентифицира процеса на пълзяща средна и неговия ред.

Примерна частична автокорелационна функция (SPACF-проба PACF) - последователност от примерни частични автокорелации rpart(k), k = 0, 1, 2, конструирана от съществуващата реализация на времевия ред. Анализирането на тази последователност помага да се идентифицира процеса на пълзяща средна и неговия ред.

Примерните автокорелации са оценки на автокорелациите p(k) на случаен процес, конструирани от съществуващата реализация на времева серия. Един от вариантите за оценка на автокорелацията p(k) има формата:

T-kf?x " И)У t+k И) у (к) 1 t

където p = x = - ^xt - оценка за p = E(Xt), ] tk

y(k) = y](xt p)(xt+k p) - оценка за автоковариацията y(k).

Примерни частични автокорелации са оценки на частични автокорелации prap(t) на случаен процес, конструирани от съществуващото изпълнение на времеви редове.

Процес на бял шум на Гаус - процес на бял шум, чиито едномерни разпределения са нормални разпределения с нула математическо очакване.

случаен процес на Гаус (процес на Гаус) - случаен процес, за който за всяко цяло число m > O и произволен набор от времена tx< t2 < ... < tm совместные распределения случайных величин Xti, Xtm являются m-мерными нормальными распределениями.

Иновацията е текущата стойност на случайната грешка от дясната страна на връзката, която определя процеса на авторегресия Xr Иновацията не е

корелирани със закъснели стойности Xt_k9 k= 1, 2, ... Последователните стойности на иновациите (последователност на иновациите) образуват процес на бял шум.

Информационният критерий на Akaike (AIC) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел е избрана стойността, която минимизира стойността

o 2k A1C(£) = 1n0£2+y,

Оценката на дисперсията на иновациите в AR модела е редовна.

Критерият на Akaike асимптотично надценява (надценява) истинската стойност на k0 с различна от нула вероятност.

Информационният критерий на Ханан-Куин (HQC) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел е избрана стойността, която минимизира стойността

UQ(k) = In a2k + k -,

където T е броят на наблюденията;

(t£ - оценка на дисперсията на иновациите st в AR модела от A>ти ред.

Критерият има сравнително бърза конвергенция към истинската стойност на k0 при T -> oo. Въпреки това, за малки стойности на T, този критерий подценява реда на авторегресия.

Информационният критерий на Шварц (SIC) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел е избрана стойността, която минимизира стойността

SIC(£) = lno>2+Ar-,

където T е броят на наблюденията;

А? - оценка на дисперсията на иновациите в AR модела на A: ред.

Корелограма - за стационарна серия: графика на зависимостта на автокорелационните стойности p(t) на стационарна серия от t. Корелограмата се нарича още двойка графики, дадени в протоколи за анализ на данни в различни пакети за статистически анализ: графика. на примерна автокорелационна функция и графика на примерна частична автокорелационна функция. Наличието на тези два графика помага да се идентифицира моделът ARMA, генериращ наличния набор от наблюдения.

Backcasting е техника за получаване на по-точна апроксимация на функцията на условната правдоподобност, когато се оценява модел на подвижна средна MA(q):

Xt = et + bxst_x + b2st_2 + ... + bqet_q9 bq Ф0,

според наблюденията xl9..., xt. Резултатът от максимизирането (без bx, bl9 ..., bq) на условната функция на вероятността, съответстваща на наблюдаваните стойности xХ9х29 ...9хт за фиксирани стойности на є09 є_Х9 є_д+Х9 зависи от избраните стойности на b*0, е_є_д+1. Ако процесът MA(q) е обратим, тогава можем да поставим 6*0 = є_х = ... = s_q+x = 0. Но за да подобрим качеството на оценката, можем да използваме метода на обратната прогноза, за да „оценим“ стойности на є09 e_Х9 є_д+х и използвайте оценените стойности в условната функция на вероятността. Оператор за забавяне (L)9 оператор за обратно изместване - оператор, определен от релацията: LXt = Xt_x. Удобен за компактен запис на модели на времеви редове и за формулиране на условия, които осигуряват определени свойства на редовете. Например, използвайки този оператор, уравнението, определящо модела ARMA(p, q).

Xt = Z ajxt-j + Z bj£t-j ><*Р*ъ>ич* О,

може да се запише като: a(L) Xt = b(b)єп където

a(L) = 1 (axL + a2L2 + ... + apLp

b(L)=l+blL + b2L2 + ... + bqLq.

Проблемът с общите фактори е наличието на общи фактори в полиномите a(L) и b(L)9, съответстващи на компонентите AR и MA на модела ARMA:

Наличието на общи фактори в спецификацията на модела ARMA затруднява практическото идентифициране на модела чрез редица наблюдения.

Авторегресивен процес от първи ред (AR(1)) е случаен процес, чиято текуща стойност е сумата от линейна функция на стойността на процеса, изостанала с една стъпка, и случайна грешка, която не е в корелация с минали стойности на процеса. В този случай поредица от случайни грешки образува процес на бял шум.

Авторегресивен процес от порядък p (pth-order autoregressive process - AR(p)) е случаен процес, чиято текуща стойност е сумата от линейна функция на стойностите на процеса, изоставащи с p стъпки или по-малко, и случайна грешка не корелира със стойностите на минали процеси. В този случай поредица от случайни грешки образува процес на бял шум.

Процес на подвижна средна от ред q (процес на подвижна средна от q-ти ред - MA(g)) е случаен процес, чиято текуща стойност е линейна функция на текущата стойност на някакъв процес с бял шум и стойностите на този процес на бял шум, изостанал с p стъпки или по-малко.

Декомпозицията на Уолд е представяне на широко стационарен процес с нулево математическо очакване като сума от процес на пълзяща средна от безкраен ред и линейно детерминиран процес.

Сезонната авторегресия от първи ред (SAR(l) - сезонна авторегресия от първи ред) е случаен процес, чиято текуща стойност е линейна функция на стойността на този процес, изостанала от S стъпки и случайна грешка, която не е корелирана с минали стойности на процеса. В този случай поредица от случайни грешки образува процес на бял шум. Тук S = 4 за тримесечни данни, S = 12 за месечни данни.

Сезонна пълзяща средна от първи ред (SMA(l) - сезонна пълзяща средна от първи ред) е случаен процес, чиято текуща стойност е равна на сумата от линейна функция на текущата стойност на някакъв процес на бял шум и стойността на този процес на бял шум, изостанал със S стъпки. В този случай поредица от случайни грешки образува процес на бял шум. Тук 5 = 4 за тримесечни данни, 5 = 12 за месечни данни.

Системата от уравнения на Юл - Уокър е система от уравнения, която свързва автокорелациите на стационарен авторегресивен процес от ред p с неговите коефициенти. Системата ви позволява последователно да намирате стойностите на автокорелациите и прави възможно, използвайки първите p уравнения, да изразите коефициентите на стационарния процес на авторегресия чрез стойностите на първите p автокорелации, които могат да се използват директно, когато избор на модел на авторегресия към реални статистически данни.

Случаен процес с дискретно време (стохастичен процес с дискретно време, случаен процес с дискретно време) е последователност от случайни променливи, съответстващи на наблюдения, направени в последователни моменти във времето, имащи определена вероятностна структура.

Смесен авторегресивен процес на пълзяща средна, процес на авторегресивна пълзяща средна с остатъци под формата на пълзяща средна (авторегресивна пълзяща средна, смесена авторегресивна пълзяща средна - ARMA(p, q)) е случаен процес, чиято текуща стойност е сума от линейна функция на стъпки, изоставащи с p или по-малко стойности на процеса, и линейна функция от текущата стойност на някакъв процес с бял шум и стойности на този процес с бял шум, изоставащи с q стъпки или по-малко.

Q-статистика на Box-Pierce - една от опциите на g-статистиката:

Є = r£g2(*),

Q-статистиката на Ljung-Box е една от опциите за g-статистика, за предпочитане пред статистиката на Box-Pierce:

където T е броят на наблюденията; r (k) - примерни автокорелации.

Използва се за тестване на хипотезата, че наблюдаваните данни са реализация на процес на бял шум.

Стационарен в широк смисъл, стационарен в слаб смисъл, слабо стационарен, стационарен от втори ред, ковариантно-стационарен стохастичен процес - случаен процес с постоянно математическо очакване, постоянна дисперсия и инвариантни случайни променливи Xt,Xt+T:

Cov(Xt,Xt+T) = r(r).

Строго стационарен, стационарен в тесен смисъл (строго стационарен, строг смисъл стационарен) случаен процес (стохастичен процес) - случаен процес със съвместни разпределения на случайни величини Xh + T, ..., + T, инвариантни по r.

Условие за обратимост на процесите MA(q) и ARMA(p, q) (условие за обратимост) - за процеси Xt от вида MA(g): Xt = b(L)st или ARMA(p, q): a(L )(Xt ju ) = = b(L)st - условие върху корените на уравнението b(z) = O, осигуряващо съществуването на еквивалентно представяне на процеса Xt под формата на авторегресивен процес от безкраен ред AR( оо):

Условие за обратимост: всички корени на уравнението b(z) = O лежат извън единичната окръжност |z|< 1.

Условие за стационарност за процеси AR(p) и ARMA(p, q) - за процеси Xt от формата AR(p): a(L)(Xt ju) = et или ARMA(p, q) a(L)( Xt ju) = = b(L)st - условие за корените на уравнението a(z) = 0, осигуряващо стационарността на процеса Xg: всички корени на уравнението b(z) = O лежат извън единицата кръг |z|< 1. Если многочлены a(z) и b(L) не имеют общих корней, то это условие является необходимым и достаточным условием стационарности процесса Хг

Частична автокорелационна функция (PACF - partial autocorrelation function) - за стационарен ред, последователността от частични автокорелации prap(r), m = 0, 1,2,...

Частична автокорелация (PAC - partial autocorrelation) - за стационарен ред, стойността ppart(r) на коефициента на корелация между случайните променливи Xt nXt+k, изчистена от влиянието на междинни случайни променливи Xt+l9...9Xt+k_Y.

Етап на диагностична проверка на модела - диагностика на оценения модел ARMA, избран въз основа на наличните серии от наблюдения.

Етап на идентификация на модела - избор на модел за генериране на серии въз основа на наличните серии от наблюдения, определяне на p и q редовете на модела ARMA.

Етап на оценка на модела (етап на оценка) - оценка на коефициентите на модела ARMA, избрани въз основа на наличните серии от наблюдения.

(Q-статистика) - тестова статистика, използвана за тестване на хипотезата, че наблюдаваните данни са изпълнение на процес на бял шум.

Към раздел 8

Векторна авторегресия от порядък р (ph-order vector autoregression - VAR(p)) - модел за генериране на група от времеви редове, в които текущата стойност на всяка серия се състои от постоянен компонент, линейни комбинации от закъснели (до ред р) стойности тази серияи останалите редове и случайна грешка. Случайните грешки във всяко уравнение не са свързани със закъснелите стойности на всички разглеждани серии. Случайните вектори, образувани от грешки в различни серии по едно и също време, са независими, идентично разпределени случайни вектори с нулеви средни стойности.

Дългосрочната връзка е определена връзка, установена във времето между променливите, по отношение на които възникват доста бързи колебания.

Дългосрочни множители (long-run multipliers, equilibrum multipliers) - в динамичен модел с авторегресивно разпределени лагове - коефициенти сх,cs на дългосрочната зависимост на променлива от екзогенни променливи xi, xst. Коефициентът Cj отразява промяната в стойността на yt, когато текущите и всички предишни стойности на променливата xjt се променят с единица.

Импулсни множители (множител на въздействие, краткосрочен множител) - в динамичен модел с авторегресивно разпределени лагове - стойности, показващи влиянието на еднократни (импулсни) промени в стойностите на екзогенни променливи chi, xst върху текущата и последващи стойности на променливата jr

Кръстосаните ковариации са коефициенти на корелация между стойностите на различни компоненти на векторна серия в съвпадащи или различни точки във времето.

Кръстосаната ковариационна функция е последователност от кръстосани корелации на два компонента на стационарна векторна серия.

Моделите с авторегресивни модели с разпределено закъснение (ADL) са модели, при които текущата стойност на обяснена променлива е сумата от линейна функция на няколко закъснели стойности на тази променлива, линейни комбинации от текущи и няколко закъснели стойности на обяснителни променливи и случайна грешка.

Трансферната функция е матрична функция, която установява ефекта от промените на единиците в екзогенни променливи върху ендогенни променливи.

Процесът на генериране на данни (DGP) е вероятностен модел, който генерира видими статистически данни. Процесът на генериране на данни обикновено е неизвестен за изследователя, който анализира данните. Изключение правят ситуациите, когато изследователят сам избира процеса на генериране на данни и получава изкуствени статистически данни чрез симулиране на избрания процес на генериране на данни.

Статистическият модел (SM) е моделът, избран за оценка, чиято структура се предполага, че съответства на процеса на генериране на данни. Изборът на статистически модел се прави въз основа на съществуваща икономическа теория, анализ на наличните статистически данни, анализ на резултатите от по-ранни изследвания.

Стационарни векторни (AG-мерни) серии (K-мерни стационарни времеви редове) - последователност от произволни вектори с размерност K, имащи еднакви вектори на математически очаквания и еднакви ковариационни матрици, за които кръстосани корелации (кръстосани корелации) между стойността на k-тата компонента на серията в момент t и стойността на 1-вата компонента на серията в момент (t + s) зависят само от s.

Към раздел 9

Хипотеза за единичен корен (UR - хипотеза за единичен корен) - хипотеза, формулирана в рамките на модела ARMA(^, q): a(L)Xt = b(L)cr Хипотезата, че авторегресивният полином a(L) на модела ARMA има поне един корен равен на 1. В този случай обикновено се приема, че полиномът a(L) няма корени, чийто модул е ​​по-малък от 1.

Диференциация - преход от серия от нива Xt към серия от разлики Xt Xt_v Последователното диференциране на серия прави възможно елиминирането на стохастичната тенденция, присъстваща в оригиналната серия.

Интегрирана серия от ред k - серия Xn, която не е стационарна или стационарна по отношение на детерминирана тенденция (т.е. не е TS-серия) и за която серията, получена в резултат на ^-кратно диференциране на серията Xn, е стационарна , но серията, получена в резултат на (k 1)-кратно диференциране на серията Xr, не е HY-ред.

Коинтеграционната връзка е дългосрочна връзка между няколко интегрирани серии, характеризиращи равновесното състояние на системата от тези серии.

Моделът за коригиране на грешки е комбинация от краткосрочни и дългосрочни динамични регресионни модели при наличие на коинтеграционна връзка между интегрирани серии.

Оператор за диференциране - оператор A, трансформиращ серия от нива Xt в серия от разлики:

Свръхдиференциран времеви ред - серия, получена в резултат на диференциране на G5-серията. Последователното диференциране на сериите GO помага да се елиминира детерминистичната полиномна тенденция. Въпреки това, диференцирането на T-серията има някои нежелани последици при избора на модел от статистически данни и използването на избрания модел за целите на прогнозиране на бъдещи стойности на серията.

Разлика стационарна, LU-серия (DS - разлика стационарна времева серия) - интегрирана серия от различни порядъци k = 1,2, ... Те се редуцират до стационарна серия чрез единично или многократно диференциране, но не могат да бъдат сведени до стационарна серия чрез изваждане на детерминистична тенденция.

Серия от тип ARIMA(p, A, q) (ARIMA - авторегресивна интегрирана подвижна средна) е времева серия, която в резултат на ^-кратно диференциране се редуцира до стационарна серия ARMA(p, q).

Серия, стационарна спрямо детерминистична тенденция, G5-серия

(TS - trend-stationary time series) - серии, които стават стационарни след изваждане на детерминирана тенденция от тях. Класът на такива серии също включва стационарни серии без детерминиран тренд.

Случайна разходка, процес на случайна разходка (случайна разходка) - случаен процес, чиито стъпки образуват процес на бял шум: AXt st, така че Xt = Xt_ x + єг

Случайна разходка с дрейф, произволна разходка с дрейф (случайна разходка с дрейф) е случаен процес, чиито нараствания са сбор от константа и процес на бял шум: AXt = Xt Xt_ x = a + st, така че Xt = Xt_x + a + ег Константата a характеризира дрейфа на произволни траектории на блуждаене, който постоянно присъства по време на прехода към следващия момент във времето, върху който се наслагва случаен компонент.

Стохастичен тренд - времеви редове Zt, за които

Z, = єх + є2 + ... + et. Стойността на случайното ходене в момент t е t

Xt = Х0 + ^ є8, така че Xt Х0 = єх + є2 + ... + єг С други думи, моделът

стохастичен тренд - процес на случайна разходка, „излизащ от началото на координатите“ (за него X0 = 0).

Шоковата иновация е еднократна (импулсна) промяна в иновацията.

Ефектът на Слуцки е ефектът от образуването на фалшива периодичност при диференциране на серия, която е стационарна спрямо детерминирана тенденция. Например, ако оригиналната серия е сбор от детерминистична линейна тенденция и бял шум, тогава диференцираната серия няма детерминистична тенденция, но се оказва автокорелирана.

^-хипотеза (хипотеза TS) - хипотезата, че разглежданият динамичен ред е стационарен или серия, стационарна по отношение на детерминирана тенденция.

Към раздел 10

Дългосрочна дисперсия - за серия с нулево математическо очакване се определя като граница

Var(ux +... + it)

Г-юс Т Т-+ОД

Тестовете на Дики-Фулър са група от статистически критерии за тестване на хипотезата за единичен корен в рамките на модели, приемащи нулево или ненулево математическо очакване на времева серия, както и възможното наличие на детерминистична тенденция в серията.

При прилагането на критериите на Дики-Фулър най-често се оценяват статистически модели

pAxt = a + (3t + cpxt_x + +є*> t = P + h---,T,

Axt =a + cpxt_x + ^0jAxt_j +£*, t = /7 + 1,..., Г,

Axt = cpxt_x + ]T 6j Axt_j +єп t = p +1,..., T.

/-статистиките / стойностите, получени по време на оценката на тези статистически модели за тестване на хипотезата H0: av = O, се сравняват с критичните стойности /crit, в зависимост от избора на статистическия модел. Хипотезата за единичния корен се отхвърля, ако f< /крит.

Тестът на Kwiatkowski-Phillips-Schmidt-Shin (KPSS тест) е критерий за разграничаване на DS и Г5-сериите, при които ha-хипотезата се приема за нулева.

Тестът на Leybourne е критерий за тестване на хипотезата за единичен корен, чиято статистика е равна на максимума от двете стойности на статистиката на Дики-Фулър, получена от оригиналната серия и от обърнатата във времето серия.

Тест на Перон - критерий за тестване на нулевата хипотеза, че дадена серия принадлежи към класа DS, обобщавайки процедурата на Дики-Фулър за ситуации, при които по време на периода на наблюдение има структурни промени в модела в даден момент от времето Tb под формата на или промяна на нивото (моделът на „колапс“) или промяна в наклона на тенденцията (моделът на „промяната в растежа“), или комбинация от тези две промени. Предполага се, че моментът Tb се определя екзогенно - в смисъл, че не е избран на базата на визуален преглед на графиката на серията, а се свързва с момента на известна мащабна промяна в икономическата ситуация, която значително влияе върху поведението на разглежданата серия.

Хипотезата за единичен корен се отхвърля, ако наблюдаваната стойност на статистиката на теста ta е под критичното ниво, т.е. Ако

Асимптотичните разпределения и критичните стойности за ta9 статистиката, първоначално дадени от Perron, са валидни за модели с извънредни стойности на иновациите.

Тест на Филипс-Перон - критерий, който намалява тестването на хипотезата, че серията xt принадлежи към класа на DS-сериите, до тестване на хипотезата R0: av = O в рамките на статистически модел

SM: kxt=a + f3t + (pxt_x+un t = 2,...,T,

където, както в критерия на Дики-Фулър, параметрите an p могат да се приемат равни на нула.

Въпреки това, за разлика от критерия на Дики-Фулър, е разрешен за разглеждане по-широк клас времеви редове.

Критерият се основава на G-статистика за тестване на хипотезата H0:<р = О, но использует вариант этой статистики Zn скорректированный на возможную автокоррелированность и гетероскедастичность ряда иг

Тест на Шмид-Филипс - критерий за проверка на хипотезата за единичен корен в рамките на модела

където wt = jSwt_x + st; t - 2,G;

y/ - параметър, представящ нивото; £ е параметър, представящ тенденцията.

Критерият DF-GLS (тест DF-GLS) е критерий, който е асимптотично по-мощен от критерия на Дики-Фулър.

Ексцесът е пикът на коефициента на разпределение.

Модел на адитивно отклонение е модел, при който след преминаване през датата на прекъсване Tb серията yt незабавно започва да се колебае около ново ниво (или нова линия на тенденция).

Моделът на отклонение от иновациите е модел, при който след преминаване през датата на прекъсване Tv, процесът yt само постепенно достига ново ниво (или нова линия на тенденция), около което траекторията на серията започва да се колебае.

Многовариантна процедура за тестване на хипотезата за единичен корен (Dolado, Jenkinson, Sosvilla-Rivero) - формализирана процедура за използване на критериите на Дики-Фулър с последователна проверка на възможността за намаляване на първоначалния статистически модел, който моделът се счита за

PAxt = a + fit + (pxt_x + ^0jAxt-j +£7> t = P + h---9T.

Предпоставка за използване на формализирана многовариантна процедура е ниската мощност на тестовете за единичен корен. Следователно многовариантната процедура включва повтарящи се тестове на хипотезата за единичен корен в по-прости модели с по-малко параметри за оценка. Това увеличава вероятността за правилно отхвърляне на хипотезата за единичния корен, но е придружено от загуба на контрол върху нивото на значимост на процедурата.

Обобщен тест на Perron - безусловен критерий, предложен от Zivot и Andrews (свързан с иновативни емисии), при който датирането на точката на промяна на режима се извършва в „автоматичен режим“, чрез търсене във всички възможни опции за датиране и изчисляване за всяко датиране опция / -статистика ta за тестване на хипотезата за единичен корен; Приблизителната дата се приема като тази, за която стойността на ta е минимална.

Процедура на Cochrane, тест за съотношение на дисперсии - процедура за разграничаване на TS и /)5-серии, въз основа на специфичното поведение за тези

серия от връзката VRk = -, където Vk = -D(Xt -Xt_k).

Стандартното брауново движение е случаен процес W(r) с непрекъснато време, което е непрекъснат аналог на дискретно случайно блуждаене. Това е процес, за който:

увеличенията (W(r2) W(r()),(W(rk) W(rk_x)) са колективно независими, ако 0< rx < г2 < ... < гк и W(s) W(r) ~ N(0, s г) при s >G;

реализациите на процеса W(r) са непрекъснати с вероятност 1.

Размерът на прозореца е броят на извадковите автоковариации на серията, използвани в оценката на Newey-West за дългосрочната дисперсия на серията. Недостатъчната ширина на прозореца води до отклонения от номиналния размер на критерия (ниво на значимост). В същото време увеличаването на ширината на прозореца, за да се избегнат отклонения от номиналния размер на критерия, води до намаляване на мощността на критерия.

Двумерният бял шум на Гаус е поредица от независими, идентично разпределени произволни вектори, имащи двумерно нормално разпределение с нулево математическо очакване.

Детерминистичната коинтеграция (стохастична коинтеграция) е съществуването на група от интегрирани серии на тяхната линейна комбинация, отменяйки стохастичните и детерминистичните тенденции. Серията, представена от тази линейна комбинация, е неподвижна.

Идентифицирането на коинтегриращите вектори е изборът на основа за коинтегриращото пространство, състоящо се от коинтегриращи вектори, които имат разумна икономическа интерпретация.

Коинтегриращо пространство е множеството от всички възможни коинтегриращи вектори за коинтегрираща система от серии.

Коинтегрирани времеви редове, коинтегрирани времеви редове в тесен смисъл, е група от времеви редове, за които има нетривиална линейна комбинация от тези редове, която е стационарна серия.

Коинтегриращият вектор е вектор от коефициенти на нетривиална линейна комбинация от няколко серии, която е стационарна серия.

Максимален критерий собствена стойност(тест за максимална собствена стойност) е критерий, който в процедурата на Йохансен за оценка на коинтеграционния ранг r на система от интегрирани (порядък 1) серии се използва за тестване на хипотезата H0: r = g* срещу алтернативната хипотеза HA: r = g* + 1.

Тестът за проследяване е критерий, който в процедурата на Йохансен за оценка на ранга на коинтеграция g на система от интегрирани (порядък 1) серии се използва за тестване на хипотезата H0: r = r* срещу алтернативната хипотеза HA: r > g* .

Общите тенденции са група серии, които контролират стохастичната нестационарност на система от коинтегрирани серии.

Причинно-следствената връзка на Грейнджър е фактът за подобряване на качеството на прогнозата на стойността yt на променливата Y в момент t въз основа на съвкупността от всички минали стойности на тази променлива, като се вземат предвид миналите стойности на друга променлива.

Пет ситуации в процедурата на Йохансен - пет ситуации, от които зависят критичните стойности на статистиката на критериите за отношение на вероятността, използвани в процедурата на Йохансен за оценка на коинтеграционния ранг на система от интегрирани (порядък 1) серии:

H2(d): няма детерминистични тенденции в данните, нито константа, нито тенденция са включени в SE;

H*(g): няма детерминистични тенденции в данните,

CE включва константа, но не включва тенденция;

Hx (g): данните имат детерминистична линейна тенденция, CE включва константа, но не включва тенденция;

Н*(r) в данните има детерминиран линеен тренд, в SE са включени константа и линеен тренд;

N(g): данните имат детерминистична квадратична тенденция, CE включва постоянна и линейна тенденция.

(Тук CE е коинтеграционното уравнение.)

За фиксиран ранг r изброените 5 ситуации образуват верига от вложени хипотези:

H2(g) с H*(g) с I, (g) с Ng) с H(g).

Това дава възможност, използвайки критерия за съотношението на вероятността, да се тества изпълнението на хипотезата, разположена вляво в тази верига, в рамките на хипотезата, разположена непосредствено вдясно.

Коинтегриращият ранг е максималният брой линейно независими коинтегриращи вектори за дадена група серии, рангът на коинтегриращото пространство.

Стохастичната коинтеграция е съществуването на група от интегрирани серии на линейна комбинация, която отменя стохастичната тенденция. Серията, представена от тази линейна комбинация, не съдържа стохастична тенденция, но може да има детерминирана тенденция.

Триъгълната система на Филипс е представяне на телевизионната система от коинтегрирани серии с коинтеграционен ранг r под формата на система от уравнения, първите r от които описват зависимостта на r избрани променливи от останалите (N r) променливи (общи тенденции) , а останалите уравнения описват модели за генериране на общи тенденции.

ТВ-размерният бял шум на Гаус (N-мерен Гаусов бял шум) е последователност от независими, идентично разпределени произволни вектори, имащи ТВ-измерно нормално разпределение с нулево математическо очакване.

Точните тестове предоставят два допълнителни метода за изчисляване на нивата на значимост за статистическите данни, налични чрез процедурите за кръстосани таблици и непараметрични тестове. Тези методи, точният метод и методът на Монте Карло, предоставят средства за получаване на точни резултати, когато вашите данни не отговарят на някое от основните предположения, необходими за надеждни резултати, използвайки стандартния асимптотичен метод. Предлага се само ако сте закупили опциите за точни тестове.

Пример.Асимптотични резултати, получени от малки набори от данни или редки или небалансирани таблици, могат да бъдат подвеждащи. Точните тестове ви позволяват да получите точно ниво на значимост, без да разчитате на предположения, които може да не бъдат изпълнени от вашите данни. Например, резултатите от приемен изпит за 20 пожарникари в малък град показват, че и петимата бели кандидати са получили положителен резултат, докато резултатите за чернокожите, азиатските и латиноамериканските кандидати са смесени. Хи-квадрат на Пиърсън, тестващ нулевата хипотеза, че резултатите са независими от расата, дава асимптотично ниво на значимост от 0,07. Този резултат води до заключението, че резултатите от изпита са независими от расата на изпитвания. Въпреки това, тъй като данните съдържат само 20 случая и клетките имат очаквани честоти по-малки от 5, този резултат не е надежден. Точната значимост на хи-квадрат на Пиърсън е 0,04, което води до обратното заключение. Въз основа на точното значение бихте заключили, че резултатите от изпита и расата на изпитвания са свързани. Това демонстрира важността на получаването на точни резултати, когато предположенията на асимптотичния метод не могат да бъдат изпълнени. Точното значение винаги е надеждно, независимо от размера, разпределението, разрядността или баланса на данните.

Статистика.Асимптотична значимост. Приближение Монте Карло с ниво на достоверност или точно значение.

  • Асимптотичен. Нивото на значимост въз основа на асимптотичното разпределение на тестова статистика. Обикновено стойност под 0,05 се счита за значима. Асимптотичното значение се основава на предположението, че наборът от данни е голям. Ако наборът от данни е малък или лошо разпределен, това може да не е добра индикация за значимост.
  • Оценка на Монте Карло. Безпристрастна оценка на точното ниво на значимост, изчислено чрез многократно вземане на проби от референтен набор от таблици със същите размери и граници на редове и колони като наблюдаваната таблица. Методът Монте Карло ви позволява да оцените точната значимост, без да разчитате на предположенията, необходими за асимптотичния метод. Този метод е най-полезен, когато наборът от данни е твърде голям, за да се изчисли точната значимост, но данните не отговарят на допусканията на асимптотичния метод.
  • Точно. Вероятността за наблюдавания резултат или по-краен резултат се изчислява точно. , ниво на значимост по-малко от 0,05 се счита за значимо, което показва, че обикновено има някаква връзка между променливите в реда и колоната.
Теза

Следователно, един от начините за развитие на проверката на статистическите хипотези беше пътят на „емпиричното“ изграждане на критерии, когато изградената статистика на критерия се основава на определен принцип, гениална идея или здрав разум, но неговата оптималност не е гарантирана. За да се оправдае използването на такава статистика при тестване на хипотези срещу определен клас алтернативи, най-често чрез...

  • 1. Подкрепяща информация
    • 1. 1. Информация от теорията на C/- и V-статистиката
    • 1. 2. Определение и изчисляване на ефективността на Bahadur
    • 1. 3. При големи отклонения на II- и V-статистиката
  • 2. Критерии за симетрия на Baringhouse-Hentze
    • 2. 1. Въведение
    • 2. 2. Статистика
    • 2. 3. Статистика
  • 3. Критерии за експоненциалност
    • 3. 1. Въведение
    • 3. 2. Статистика I
    • 3. 3. Статистика n
  • 4. Критерии за нормалност
    • 4. 1. Въведение
    • 4. 2. Статистика B^
    • 4. 3. Статистика V^n
    • 4. 4. Статистика V|)P
  • 5. Критерии за съответствие със закона на Коши
    • 5. 1. Въведение
    • 5. 2. Статистика
    • 5. 3. Статистика

Асимптотични свойства на симетрията и критерии за съгласие, базирани на характеристики (есе, курсова работа, диплома, тест)

Тази теза конструира и изучава критериите за добро съответствие и симетрия, базирани на характеристиките на свойствата на разпределенията, и също така изчислява тяхната асимптотична относителна ефективност за редица алтернативи.

Конструиране на статистически критерии и тяхното изследване асимптотични свойствае един от най-важните проблеми на математическата статистика. Когато се тества проста хипотеза срещу проста алтернатива, проблемът се решава с помощта на лемата на Нейман-Пиърсън, която, както е известно, дава оптималния (най-мощен) критерий в класа на всички критерии от дадено ниво. Това е тестът за съотношението на вероятността.

Въпреки това, за по-трудни и практични проблеми с тестване на хипотези, включващи или тестване на сложни хипотези, или разглеждане на сложни алтернативи, рядко съществуват най-мощните тестове и ролята на теста за съотношението на вероятността се променя значително. Статистиката на съотношението на вероятността обикновено не може да се изчисли изрично; тя губи своето свойство за оптималност и нейното разпределение е нестабилно спрямо промените в статистическия модел. Освен това статистикът често изобщо не може да определи вида на алтернативата, без което изграждането на параметрични критерии става безсмислено.

Следователно, един от начините за развитие на тестването на статистически хипотези беше пътят на „емпиричното“ изграждане на критерии, когато изградената статистика на критерия се основава на определен принцип, гениална идея или здрав разум, но неговата оптималност не е гарантирано.

Типични примери за такива статистики са знаковата статистика, x2 статистиката на Пиърсън (1900), статистиката на Колмогоров (1933), която измерва равномерното разстояние между емпиричната и истинската функция на разпределение, коефициентът на рангова корелация на Кендъл (1938) или Bickel- Статистиката на Розенблат (1973), базирана на квадратичния риск при оценка на ядрената плътност. Понастоящем математическата статистика има много десетки „емпирични“ статистики за тестване на хипотезите за съгласие, симетрия, хомогенност, случайност и независимост и в литературата непрекъснато се предлагат все повече статистики от този тип. Огромна литература е посветена на изследването на техните точни и гранични разпределения, оценки на скоростта на конвергенция, големи отклонения, асимптотични разширения и др.

За да се оправдае използването на такива статистики при тестване на хипотези срещу определен клас алтернативи, тяхната мощност най-често се изчислява с помощта на статистическо моделиране. Въпреки това, за всеки последователен критерий, мощността клони към единица с увеличаване на размера на извадката и следователно не винаги е информативна. По-задълбочен анализ на сравнителните свойства на статистиката може да се извърши въз основа на концепцията за асимптотична относителна ефективност (ARE). Различни подходи за изчисляване на AOE бяха предложени от E. Pitman, J. Hodges и E. Lehman, R. Bahadur, G. Chernov и W. Kallenberg в средата на 20 век, резултатите от развитието на теорията на AOE до средата на 20 век; 90-те години бяха обобщени в монографията. Съществува общоприето мнение, че синтезирането на нови критерии трябва да бъде придружено не само от анализ на техните свойства, но и от изчисляване на AOE, за да се оцени качеството им и да се дадат информирани препоръки за използването им в практиката.

Тази статия използва идеята за конструиране на критерии, базирани на характеризиране на разпределенията чрез свойството равноразпределение. Теорията за характеризиране произхожда от работата на Д. Поля, публикувана през 1923 г. След това е развита в трудовете на И. Марцинкевич, С. Н. Бернщайн, Е. Лукач, Ю. В. Линник, А.А. Singer, J. Darmois, V.P. Skitovich, S.R. Пао, А.М. Каган, Й. Галамбос, С. Коц, Л. Б. Клебанов и много други математици. Литературата по този въпрос е голяма и в момента има няколко монографии, посветени на характеристиките, например, , , , , , , .

Идеята за конструиране на статистически критерии въз основа на характеристиките на свойството на равноразпределение принадлежи на Ю. В. Линник. В края на обширния си труд той пише: „. може да се повдигне въпросът за конструирането на критерии за съответствие на извадка със сложна хипотеза, базирана на идентичното разпределение на двете съответстващи статистики gi (xi> .xr) и g2(x, ¦¦¦xr) и по този начин да се намали въпрос на критерия за хомогенност.”

Нека се върнем към класическата теорема на Поля, за да обясним конкретен примеркак може да работи подобен подход. В най-простата си форма тази теорема се формулира по следния начин.

Теорема на Поля. Нека X и Y са две независими и еднакво разпределени центрирани s. V. Тогава s. V. (X + Y)//2 и X са идентично разпределени тогава и само ако законът за разпределение на X е нормален.

Нека приемем, че имаме извадка от центрирани независими наблюдения Xi, ., Xn и искаме да тестваме (сложната) нулева хипотеза, че разпределението на тази извадка е нормално със средна стойност 0 и известна дисперсия. Използвайки нашата извадка, нека конструираме обичайната емпирична функция на разпределение (d.f.) n

Fn (t) = n-^VD

Gn(t) = n~2? VD + Xj< iv^}, t <= R1. i, j=l

По силата на теоремата на Гливенко-Кантели, която е валидна и за V-статистически емпиричен d.f. , за големи n функцията Fn(t) се доближава равномерно до d.f. F (t) = P (X< t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Въпреки това, този дизайн, базиран на идеята на Ю. В. Линник, не получи почти никакво развитие, може би поради технически трудности при конструирането и анализа на получените критерии. Друга причина вероятно е, че характеристиките на разпределенията чрез свойството равноразпределение са малко и рядко срещани.

Ние знаем само за няколко произведения, посветени в една или друга степен на развитието на идеята на Ю. В. Линник. Това са произведенията на Baringhouse и Henze и Muliere и Nikitin, които ще бъдат разгледани по-долу. Има и работи, в които критериите за добро съответствие за конкретни разпределения също са изградени въз основа на характеристики, но не и на базата на равноразпределение, например, , , , , , , , .

Най-честата употреба в литературата е да се характеризира експоненциалното разпределение, като се използват различни варианти на свойството без памет , , , , , , .

Трябва да се отбележи, че в почти всички тези работи (освен може би) AOE на разглежданите критерии не се изчислява и не се обсъжда. В тази теза ние не само изучаваме асимптотичните свойства на известните и предложените от нас критерии, базирани на характеризиране, но също така изчисляваме техния локален точен (или приблизителен) AOE според Бахадур.

Нека сега дефинираме понятието AOE. Нека (Tn) и (1^) са две поредици от статистики, конструирани от извадка X,., Xn с разпределение Pd, където в € 0 C R1 и нулевата хипотеза Ho се тества: 9 € в C срещу алтернатива A: в € ©-x = ©-6o. Нека Mm (a, P,0) е минималният размер на извадката X[,., Xn, за който последователността (Tn) с дадено ниво на значимост, a > 0 достига степен /3< 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Тъй като относителната ефективност като функция на три аргумента не може да бъде изчислена изрично дори за най-простите статистики, обичайно е да се вземат предвид ограничения:

Ptet, y (a,/?, 0), Ntet, y (a,/3,0).

В първия случай се получава AOE по Бахадур, втората граница определя AOE по Hodges-Lehman, а третата води до определяне на AOE по Pitman. Тъй като в практическите приложения най-интересни са случаите на ниски нива на значимост, високи мощности и близки алтернативи, и трите определения изглеждат разумни и естествени.

В тази работа, за да сравним критерии, ще използваме AOE според Bahadur. Причините за това са няколко. Първо, ефективността на Pitman е подходяща главно за асимптотично нормални статистики и при това условие съвпада с локалната ефективност на Bach-Dur , . Ние разглеждаме не само асимптотично нормални статистики, но и статистики от квадратичен тип, за които граничното разпределение при нулевата хипотеза се различава рязко от нормалното, така че ефективността на Питман не е приложима. Второ, Hodges-Lehman AOE е неподходящ за изследване на двустранни критерии, тъй като всички те се оказват асимптотично оптимални, а за едностранни критерии този AOE обикновено локално съвпада с Bahadur AOE. Трето, наскоро беше постигнат значителен напредък в областта на големите отклонения за тестовата статистика, което е от решаващо значение при изчисляването на Bahadur AOE. Имаме предвид големите отклонения на U- и V-статистиките, описани в последните работи и.

Нека сега да преминем към преглед на съдържанието на дисертацията. Първата глава е със спомагателен характер. Той излага необходимата теоретична и техническа информация от теорията на 11-статистиката, теорията на големите отклонения и теорията на асимптотичната ефективност според Бахадур.

Глава 2 е посветена на изграждането и изследването на критерии за проверка на хипотезата за симетрия. Baringhouse и Henze предложиха идеята за конструиране на критерии за симетрия въз основа на следната елементарна характеристика.

Нека X и Y са n.o.s.v.s, имащи непрекъснат d.f. След това |X| и |max (X, Y)| идентично разпределени тогава и само ако X и Y са симетрично разпределени около нулата.

Ние използваме тази характеристика, за да конструираме нови критерии за симетрия. Нека си припомним, че няколко класически критерия за симетрия (виж Глава 4) се основават на характеристика на симетрията още повече проста собственостравноразпределение на X и -X.

Нека се върнем към характеристиката на Baringhouse-Hentze. Нека X, ., Xn наблюдения с непрекъснат d.f.<7. Рассмотрим проверку гипотезы симметрии:

H0: OD = 1 —<3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в >0-изкривена алтернатива, т.е. d(x-b) = 2f(x)F ($x), c > 0-алтернатива на Леман, т.е. G(x-, 6) = F1+ e (x), 6 > 0 и алтернативата на замърсяване , т.е. G(x-6) = (1 - 6) F(x) + 6Fr+1(x), in > 0, r > 0, където F (x) и f (x) са d.f. и плътността на някакво симетрично разпределение.

В съответствие с горната характеристика, емпирична df се конструира въз основа на |Xj|,., Xn, n

Hn (t) = n~2 J2 Tmax (X^Xk)<г}. На основе этих функций составляются статистики: лоо ):

Нека X uY са неотрицателни и неизродени n.o.s.v.s, имащи d.f., диференцируеми при нула. F и нека 0< а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

В допълнение към конструирането на самия критерий за съгласие и изучаването на неговите асимптотични свойства, представлява интерес да се изчисли AOE на нов критерий и да се проучи неговата зависимост от параметъра a.

Второто обобщение на тази характеристика принадлежи на Des. Ние го формулираме въз основа на по-нова работа:

Нека Xi, ., Xm, m ^ 2 са неотрицателни и неизродени i.s. r.v.s с диференцируема d.f. F. Тогава статистиките X и m minpfi, ., Xm) са идентично разпределени тогава и само ако F е d.f. експоненциален закон.

Нека Xx,., Xn са независими наблюдения, имащи d.f. Въз основа на характеристиките, формулирани по-горе, можем да тестваме експоненциалната хипотеза Ho, която се състои във факта, че (7 е d.f. на експоненциалния закон. P, срещу алтернативата H, която се състои във факта, че C f? при слабо допълнително условия.

В съответствие с тези характеристики се конструира емпиричен df. p = pVD< О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Предлагаме критериите за проверка на експоненциалността да се базират на статистика: pkp = - c&bdquo-(*)] aop(1).

Като алтернативи избираме стандартните алтернативи, използвани в литературата за експоненциално тестване: алтернативата на Weibull с d(x) = (β + 1)xx(-x1+β), x ^ 0- алтернативата на Makehama с d(x) = ( 1 + 0(1 - exp (-x))) exp (-x - 0(exp (-x) - 1 + x)), x ^ 0 - алтернатива на линейността на функцията за процент на отказ с d (x) = (1 + bx) exp[—x—^bx2], x^O.

За двете статистики, предложени по-горе, граничните разпределения са записани под нулевата хипотеза:

Теорема 3.2.1 За статистиката Uε за n -* oo важи връзката: където Dz(a) е дефинирано в (3.2.2). Теорема 3.3.1 За статистиката n при n -> oo връзката е в сила

U0,(t + 1)2A1(t)), където D4 (t) е определено в (3.3.6).

Тъй като и двете статистики зависят от параметрите a и m, ние установяваме при какви стойности на параметрите AOE според Bahadur достига своя максимум и намираме тези стойности. Освен това конструираме алтернатива, при която максимумът се постига в точката и φ ½.

Четвъртата глава е посветена на проверката на хипотезата за нормалност. Има много характеристики на нормалния закон като един от централните закони на теорията на вероятностите и математическата статистика и две монографии, посветени изключително на този въпрос. Ще разгледаме леко опростена версия на добре познатата характеристика на и:

Нека Xr, X2, ., Xm са центрирани n.o.s.v.s, имащи d.f. o константите a, a-2,., am са такива, че 0< а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Нека X, ., Xn е образец с d.f. G. Въз основа на тази характеристика можем да тестваме основната хипотеза R0, която е, че G е d.f. нормалният закон Fa (x) = Ф (x/a), срещу алтернативата Hi, която е, че G φ Fa. Конструира се обичайната емпирична df. Gn и V-статистически d.f. n^

Bm, n (t) = n~t (E 1 + - +< *}),

1.¿-t=1 s

По-нататък символът a означава сумиране върху всички пермутации на индекси. Критериите за тестване на нормалността могат да се основават на следните статистически данни:

B, n = Г dGn (t), J -00 oo

BmAt)-Gn (t)]dGn (t), oo

Кошче = G)

Публикации по темата