Асимптотично оптимален. Асимптотични свойства на критериите за съгласие за тестване на хипотези в схема за избор без връщане, базирана на запълване на клетки в обща схема за разполагане на кладенци Александър Владимирович Асимптотични критерии за избор

480 търкайте. | 150 UAH | $7,5 ", MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Дисертация - 480 RUR, доставка 10 минути, денонощно, седем дни в седмицата и празници

Колодзей Александър Владимирович. Асимптотични свойства на критериите за съгласие за тестване на хипотези в схема за избор без връщане, базирана на запълване на клетки в обобщена схема за поставяне: дисертация... Кандидат на физико-математическите науки: 01.01.05.- Москва, 2006.- 110 стр.: аз ще. РГБ ОД, 61 07-1/496

Въведение

1 Ентропия и информационно разстояние 36

1.1 Основни определения и означения 36

1.2 Ентропия на дискретни разпределения с ограничен математическо очакване 39

1.3 Логаритмична обобщена метрика върху набор от дискретни разпределения 43

1.4 Компактност на функции с изброимо множество от аргументи. 46

1.5 Непрекъснатост на информационното разстояние Kullback - Leibler - Sanov 49

1.6 Заключения 67

2 Вероятности за големи отклонения 68

2.1 Вероятности за големи отклонения на функциите от броя на клетките с даден пълнеж 68

2.1.1 Локална гранична теорема 68

2.1.2 Интегрална гранична теорема 70

2.1.3 Информационно разстояние и вероятности за големи отклонения на отделими статистики 75

2.2 Вероятности за големи отклонения на отделими статистики, които не отговарят на условието на Крамер 81

2.3 Заключения 90

3 Асимптотични свойства на критериите за съответствие 92

3.1 Критерии за съгласие за избор без дизайн за връщане. 92

3.2 Асимптотична относителна ефективност на критериите за съответствие 94

3.3 Критерии, базирани на броя на клетките в обобщени оформления 95

3.4 Заключения 98

Заключение 99

Литература 103

Въведение в работата

Обект на изследване и актуалност на темата. В теорията на статистическия анализ на дискретни последователности специално място заемат критериите за добро съответствие за тестване на евентуално сложна нулева хипотеза, която е тази за случайна последователност pQ)?=i такава, че

Хі Є Ім,і= 1,...,n, Ім = (о, і,..., M), за всяко и = 1,..., n, и за всяка k Є їm вероятност за събитие ( Хі = k) не зависи от r. Това означава, че последователността (Хі)f =1 е в някакъв смисъл стационарна.

В редица приложни проблеми последователността (X() =1) се счита за последователност от цветове на топки при избор без връщане до изчерпване от урна, съдържаща rik - 1 > 0 топки от цвят k, k Є їm - Множеството от такива селекции ще обозначим с T(n 0 - 1, ...,пd/ - 1). Нека урната съдържа n - 1 топки, m n-l= (n fc -l).

Нека означим с r (k) _ r (fc) r (fc) поредицата от номера на топки с цвят k в извадката. Разгледайте последователността h« = (^,...,)). M fc) =ri fc) , ^ = ^-^ = 2,...,^-1, _ (fc)

Последователността h^ се определя с помощта на разстоянията между местата на съседни топки от цвят k по такъв начин, че *Ф = n.

Наборът от последователности h(fc) за всички k Є їм еднозначно определя последователността (Х()^ =1. Последователностите h k за различни k са зависими една от друга. По-специално, всяка от тях е еднозначно определена от всички останали. Ако мощността на множеството 1m е 2, тогава последователността от цветове на топките се определя еднозначно от последователността h() на разстоянията между местата на съседни топки от същия фиксиран цвят. Нека има две топки в урна, съдържаща n - 1 топка. различни цветове, има N - 1 топки с цвят 0. Може да се установи взаимно еднозначно съответствие между множеството M(N-l,n - N) и множеството 9\ Pi m вектори h(n, N) = (hi, ..., /i#) с компоненти на положително цяло число, така че

Множеството 9\n,m съответства на множеството от всички отделни разделения на положително цяло число n на N подредени члена.

Чрез специфициране на определено вероятностно разпределение на множеството от вектори 9R n d, получаваме съответното вероятностно разпределение на множеството Wl(N - l,n - N). Множеството V\n,y е подмножество на множеството 2Jn,iv от вектори с неотрицателни цели числа, отговарящи на (0.1). В дисертационната работа разпределенията на формата ще се разглеждат като вероятностни разпределения върху множеството от вектори

P(%, N) = (r b..., r N)) = P(& = r„, u = 1,..., N\ & = n), (0.2) където 6 > , lg - независими неотрицателни цели числа случайни променливи.

Разпределения от вида (0.2) в /24/ се наричат ​​обобщени схеми за разполагане на n частици в N клетки. По-специално, ако случайните променливи b...,lr в (0.2) са разпределени съгласно законите на Поасон с параметри Ai,...,Alr, съответно, тогава векторът h(n,N) има полиномиално разпределение с вероятности за резултати

Ri = t--~t~> ^ = 1,---,^-

Li + ... + l^

Ако случайните променливи i> >&v в (0.2) са идентично разпределени съгласно геометричния закон V(Zi = k)= P k - 1 (l-p),k=l,2,..., където p е произволно в интервалът 0

Както е отбелязано в /14/,/38/, специално място в тестването на хипотези за разпределението на честотните вектори h(n, N) = (hi,..., h^) в обобщени схеми за поставяне на n частици в N клетки се заема от критериите, конструирани на базата на статистика от формата ad%, lo) = L(i (o.z)

Фк «%,%..;$, (0.4) където /j/, v = 1,2,... и ф са някои реални функции,

Mg = E 1 (K = g), g = 0,1,... 1/=1

Величините // r в /27/ се наричат ​​брой клетки, съдържащи точно r частици.

Статистиките от формата (0.3) в /30/ се наричат ​​разделими (аддитивно разделими) статистики. Ако функциите /„ в (0.3) не зависят от u, тогава такива статистики се наричат ​​в /31/ симетрични разделими статистики.

За всяко r, статистиката /x r е симетрична разделима статистика. От равенството

DM = DFg (0.5) следва, че класът на симетричните разделими статистики на h u съвпада с класа на линейните функции на f r . Освен това класът на функциите на формата (0.4) е по-широк от класа на симетричните разделими статистики.

H 0 = (Rao(n,A0) е поредица от прости нулеви хипотези, че разпределението на вектора h(n,N) е (0.2), където случайните променливи i,...,ln и (0.2) са идентично разпределени и P(ti = k)=p k ,k = 0,l,2,..., параметрите n, N се променят в централната област.

Разгледайте някои P Є (0,1) и последователност, най-общо казано, от сложни алтернативи n = (H(n,N)), така че съществува n

P(fm > OpAR)) >: 0-Ще отхвърлим хипотезата Hq(ti,N), ако fm > a s m((3). Ако има ограничение jim ~1nP(0l > a n, N (P)) = ШН ), където вероятността за всяко N се изчислява при хипотезата #o(n,iV), тогава стойността j (fi,lcl) се нарича в /38/ индексът на критерия φ в точката (/?, Н). Последната граница може, най-общо казано, да не съществува. Следователно в дисертационния труд освен критериалния индекс се разглежда и стойността lim (_IlnP(tor > a N (J3))) =if(P,P), която авторът на дисертационния труд по аналогия наречен долен индекс на критерия φ в точката (/3,H) . Тук и по-долу lim adg, lim а# jV-уо ЛГ-оо означават съответно долната и горната граница на последователността (odg) за N -> yu,

Ако съществува индекс на критерия, тогава индексът на критерия съвпада с него. По-ниският индекс на критерия винаги съществува. Колкото по-висока е стойността на индекса на критерия (долния индекс на критерия), толкова по-добър е статистическият критерий в този смисъл. В /38/ проблемът за конструиране на критерии за съгласие за обобщени схеми на оформление с най-висока стойностиндекс на критерия в класа от критерии, които отхвърлят хипотезата Ho(n,N) за където m > 0 е някакво фиксирано число, последователността от постоянни единици се избира въз основа на дадената стойност на мощността на критерия за последователност от алтернативи , ft t е реална функция от m + 1 аргумента.

Индексите на критериите се определят от вероятностите за големи отклонения. Както беше показано в /38/, грубата (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на отделими статистики, когато условието на Крамер за случайната променлива /() е изпълнено, се определя от съответния Kull-Bak-Leibler- Информационно разстояние на Санов (случайната променлива q удовлетворява условието на Крамер, ако за някои # > 0 генериращата функция на моментите Me f7? е крайна в интервала \t\

Въпросът за вероятностите за големи отклонения на статистиката от неограничен брой fi r , както и за произволни отделими статистики, които не отговарят на условието на Крамер, остана отворен. Това не ни позволи окончателно да решим проблема с конструирането на критерии за тестване на хипотези в обобщени оформления с най-висока скоростклоняща към нулева вероятност за грешка от първи тип с приближаващи се алтернативи в класа на критериите, базирани на статистика от формата (0.4). Актуалността на дисертационното изследване се определя от необходимостта от завършване на решението на поставения проблем.

Целта на дисертационния труд е да се конструират критерии за съгласие с най-високата стойност на индекса на критерия (долен индекс на критерия) за проверка на хипотези в схемата за подбор без връщане в класа от критерии, които отхвърлят хипотезата U(n, N) за 0(iv"iv"-""" o """)>CiV " (0 " 7) където φ е функция на изброимия брой аргументи, а параметрите n, N се променят в централната област.

В съответствие с целта на изследването бяха поставени следните задачи: да се изследват свойствата на ентропията и информационното разстояние на Kull-Bak - Leibler - Sanov за дискретни разпределения с изброим брой резултати; изследване на вероятностите за големи отклонения на статистиката на формата (0,4); изследване на вероятностите за големи отклонения на симетрични сепарируеми статистики (0,3), които не отговарят на условието на Крамер; - намерете такава статистика, че критерият за съгласие, конструиран на негова основа за тестване на хипотези в обобщени схеми за поставяне, има най-високата стойност на индекса в класа от критерии на формата (0,7).

Научна новост: дава се концепцията за обобщена метрика - функция, която допуска безкрайни стойности и удовлетворява аксиомите за идентичност, симетрия и неравенство на триъгълника. Намира се обобщена метрика и се посочват набори, на които функциите на ентропията и информационното разстояние, дефинирани върху семейство от дискретни разпределения с изброим брой резултати, са непрекъснати в тази метрика; в схемата за обобщено разположение е намерена груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на статистиките от формата (0.4), отговарящи на съответната форма на условието на Крамер; в схемата за обобщено разположение беше открита груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на симетрични разделими статистики, които не отговарят на условието на Крамер; в класа критерии от формата (0.7) се конструира критерий с най-висока стойност на индекса на критерия.

Научна и практическа стойност. Работата решава редица въпроси относно поведението на вероятностите за големи отклонения в обобщените схеми за разположение. Получените резултати могат да бъдат използвани в учебния процес по специалностите математическа статистика и теория на информацията, при изучаване на статистически процедури за анализ на дискретни последователности и са използвани в /3/, /21/ за обосноваване сигурността на един клас информационни системи. Разпоредби, предложени за защита: намаляване на проблема с тестването на хипотезата от една последователност от цветове на топки от факта, че тази последователност е получена в резултат на избор без връщане до изчерпване на топки от урна, съдържаща топки от два цвята и всеки такъв избор има една и съща вероятност за изграждане на критерии за съгласие за тестване на хипотези в съответното обобщено оформление; непрекъснатост на функциите на ентропията и информационното разстояние на Кулбак-Лайблер-Санов върху безкрайномерен симплекс с въведената логаритмична обобщена метрика; теорема за груба (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на симетрични сепарируеми статистики, които не отговарят на условието на Крамер в схемата на обобщено разположение в полу-експоненциалния случай; теорема за груба (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения за статистики от вида (0.4); - изграждане на критерий за съответствие за проверка на хипотези в обобщени оформления с най-висока стойност на индекса в класа критерии на формата (0,7).

Апробация на работата. Резултатите бяха представени на семинари на катедрата по дискретна математика на Математическия институт на име. V. A. Steklov RAS, отдел за информационна сигурност на ITM&VT на име. S. A. Lebedev RAS и на: петия Всеруски симпозиум по приложна и индустриална математика. Пролетна сесия, Кисловодск, 2 - 8 май 2004 г.; Шеста международна Петрозаводска конференция "Вероятностни методи в дискретната математика" 10 - 16 юни 2004 г.; Втора международна конференция "Информационни системи и технологии (IST" 2004)", Минск, 8 - 10 ноември 2004 г.;

Международна конференция "Съвременни проблеми и нови тенденции в теорията на вероятностите", Черновци, Украйна, 19 - 26 юни 2005 г.

Основните резултати от работата са използвани в изследователската работа "Апология", извършена от ИТМиВТ РАН. С. А. Лебедева в интерес на Федерална службапо технически и експортен контрол на Руската федерация, и са включени в доклада за изпълнение на етапа на изследване /21/. Избрани резултатидисертациите са включени в научния доклад "Развитие на математическите проблеми на криптографията" на Академията по криптография на Руската федерация за 2004 г. /22/.

Авторът изказва дълбока благодарност на научния ръководител, доктор на физико-математическите науки А. Ф. Ронжин и научния консултант, доктор на физико-математическите науки, ст. н. с. А. В. Князев Авторът изказва благодарност на доктора на физико-математическите науки, проф. А. М. Зубков. и кандидат на физико-математическите науки Математически науки И. А. Круглов за вниманието към работата и редица ценни коментари.

Структура и съдържание на работата.

Първата глава разглежда свойствата на ентропията и информационното разстояние за разпределения върху множеството от неотрицателни цели числа.

В първия параграф на първа глава се въвеждат обозначения и се дават необходимите определения. По-специално се използва следната нотация: x = (:ro,i, ---) - безкрайномерен вектор с изброим брой компоненти;

Н(х) - -Ex^oXvlnx,; trunc m (x) = (x 0,x 1,...,x t,0,0,...); SI* = (x, x u > 0, u = 0,1,..., E~ o x„ 0,v = 0,l,...,E? =Q x v = 1); fi 7 = (x Є O, L 0 vx v = 7); %] = (хЄП,Эо»х и

16 mі = e o ** v \ &c = Ue>1 | 5 є Q 7) о

Ясно е, че множеството Vt съответства на семейство вероятностни разпределения върху множеството от неотрицателни цели числа, P 7 - на семейство вероятностни разпределения върху множеството от неотрицателни цели числа с математическо очакване 7 - Ако y Є Q, тогава при є > 0 множеството ще се обозначава с O e (y)

Оє(у) - (х eO,x v

Във втори параграф на първа глава е доказана теорема за ограничеността на ентропията на дискретни разпределения с ограничено математическо очакване.

Теорема 1. За ограничеността на ентропията на дискретни разпределения с ограничено математическо очакване. За всеки стоманобетон 7

Ако x Є fi 7 съответства на геометрично разпределение с математическо разпределение 7 ; това е

7 x„ = (1- р)р\ v = 0,1,..., където р = --,

1 + 7, то равенството H(x) = F(1) е в сила.

Твърдението на теоремата може да се разглежда като резултат от формално приложение на метода на условните множители на Лагранж в случай на безкраен брой променливи. Теоремата, че единственото разпределение на множеството (k, k + 1, k + 2,...) с дадено математическо очакване и максимална ентропия е геометрично разпределение с дадено математическо очакване, е дадено (без доказателство) в /47 /. Авторът обаче е дал строги доказателства.

Третият параграф на първа глава дава дефиницията на обобщена метрика - метрика, която позволява безкрайни стойности.

За x,y Є Гі функцията p(x,y) се определя като минимум є > O със свойството y v e~ e

Ако такова є не съществува, тогава се приема, че p(x,y) = oo.

Доказано е, че функцията p(x,y) е обобщена метрика върху семейството от разпределения върху множеството от неотрицателни цели числа, както и върху цялото множество Ci*. Вместо e в дефиницията на показателя p(x,y), можете да използвате всяко друго положително число, различно от 1. Получените показатели ще се различават с мултипликативна константа. Нека означим с J(x, y) информационното разстояние

Тук и по-долу се приема, че 0 In 0 = 0.01n ^ = 0. Информационното разстояние е определено за такива x, y, че x v - 0 за всички и такива, че y v = 0. Ако това условие не е изпълнено, тогава ще приемем J (S,y) = co. Нека A C $1. Тогава ще обозначим J(Ay)="mU(x,y).

Нека поставим J(Jb,y) = 00.

В четвъртия параграф на първа глава е дадено определение за компактност на функции, дефинирани върху множеството P*. Компактността на функция с изброим брой аргументи означава, че с всякаква степен на точност стойността на функцията може да бъде апроксимирана от стойностите на тази функция в точки, където само краен брой аргументи са различни от нула. Доказана е компактността на функциите на ентропията и информационното разстояние.

За всякакви 0

Ако за някои 0 0 функцията \(x) = J(x,p) е компактна в множеството 7 ] P O g (p).

Петият параграф на първа глава обсъжда свойствата на информационното разстояние, дефинирано в безкрайномерно пространство. В сравнение с крайномерния случай ситуацията с непрекъснатостта на функцията на информационното разстояние се променя качествено. Показано е, че функцията на информационното разстояние не е непрекъсната на множеството Г2 в нито една от метриките pi(,y)= E|z„-i/„|, (

00 \ 2 p 2 (x,y) = sup (x^-ij^.

Доказана е валидността на следните неравенства за ентропийните функции H(x) и информационното разстояние J(x,p):

1. За всяко x, x" Є fi \H(x) - H(x")\

2. Ако за някои х,р є П има є > 0, така че х є О є (р), то за всяко X і Є Q \J(x,p) - J(x",p)\

От тези неравенства, като се вземе предвид теорема 1, следва равномерната непрекъснатост на функциите на ентропията и информационното разстояние върху съответните подмножества fi в метриката p(x,y), а именно,

За всяко 7, такова че 0

Ако за някои 7o, O

20 тогава за всяко 0 0 функцията \p(x) = J(x t p) е равномерно непрекъсната върху множеството 7 ] P O є (p) в метриката p(x,y).

Дадена е дефиниция на неекстремалната функция. Неекстремалното условие означава, че функцията няма локални екстремуми или функцията приема същите стойности при локални минимуми (локални максимуми). Условието за неекстремност отслабва изискването за липса на локални екстремуми. Например функцията sin x в множеството от реални числа има локални екстремуми, но удовлетворява условието за неекстремност.

Нека за някои 7 > 0, областта A е дадена от условието

А = (хЄЇ1 1 ,ф(х) >а), (0.9) където Ф(х) е реална функция, а е някаква реална константа, inf Ф(х)

И 3y, възникна въпросът, n P „ при какви условия „a „ φ за i_ „ara- q метра n, N в централната област, ^ -> 7, за всичките им достатъчно големи стойности ще има такива не -отрицателни цели числа ko, k\, ..., k n, какво ko + hi + ... + k n = N,

21 k\ + 2/... + nk n - N

Kq k\ k n . ^"iv"-"iv" 0 " 0 "-")>a -

Доказано е, че за това е достатъчно да се изисква функцията φ да е неекстремна, компактна и непрекъсната в метриката p(x,y), а също така, че за поне една точка x, удовлетворяваща (0.9), за някои е > 0 има краен момент от степен 1 ​​+ є Ml + = і 1+є x и 0 за всяко u = 0.1,....

Във втората глава изучаваме грубата (до логаритмична еквивалентност) асимптотика на вероятността от големи отклонения на функциите от D = (fio,..., cn, 0,...) - броят клетки с дадена запълване на централната област на вариация на параметрите N,n . Грубата асимптотика на вероятностите за големи отклонения е достатъчна за изследване на индексите на критериите за добро съответствие.

Нека случайните променливи ^ в (0.2) са еднакво разпределени и

Р(Сі = к)=рьк = 0.1,... > P(z) - генерираща функция на случайна променлива i - се събира в окръжност с радиус 1

22 Нека означим p(.) = (p(ad = o),P№) = i),...).

Ако има решение z 1 на уравнението

M(*) = 7, то е уникален /38/. Навсякъде по-нататък ще приемем, че Pjfc>0,fc = 0,l,....

В първия параграф на първия параграф на втората глава има асимптотика на логаритмите на вероятностите под формата -m^1nP(th) = ^,...,/ = K)-

Доказана е следната теорема.

Теорема 2. Груба локална теорема за вероятностите за големи отклонения. Нека n, N -* co такива, че - ->7>0

Твърдението на теоремата следва пряко от формулата за съвместното разпределение /to, A*b / в /26/ и следната оценка: ако неотрицателните цели числа fii,fi2,/ удовлетворяват условието /I1 + 2 // 2 + ... + 71/ = 71, тогава броят на ненулевите стойности сред тях е 0(l/n). Това е груба оценка и не претендира, че е нова. Броят на ненулевите τ в обобщените схеми на оформление не надвишава стойността на максималното запълване на клетките, което в централната област, с вероятност, клоняща към 1, не надвишава стойността 0(\np) /25/, /27/. Независимо от това, получената оценка 0(y/n) е удовлетворена с вероятност 1 и е достатъчна за получаване на груба асимптотика.

Във втория параграф на първия параграф на втората глава се намира стойността на границата, където adg е последователност от реални числа, сходни към някои a Є R, φ(x) е функция с реална стойност. Доказана е следната теорема.

Теорема 3. Груба интегрална теорема за вероятностите за големи отклонения. Нека условията на теорема 2 са изпълнени, за някои r > 0, (> 0) реалната функция φ(x) е компактна и равномерно непрекъсната в метриката p на множеството

A = 0 rH (p(r 1))nP bn] и удовлетворява условието за неекстремалност на множеството Г2 7 . Ако за някаква константа a такава, че inf f(x)

24 има вектор p a fi 7 P 0 r (p(z 7)); такова, че

Ф(ra) > а J(( (x) >а,хЄ П 7 ),р(2; 7)) = J(p a ,p(^y)), mo за всяка последователност а^, сходна към а, ^ -^\nP(f(^,^,...)>a m) = Pr a,p(r,)). (0,11)

С допълнителни ограничения върху функцията φ(x), информационното разстояние J(pa,P(zy)) в (2.3) може да бъде изчислено по-конкретно. А именно следната теорема е вярна. Теорема 4. За информационното разстояние. Нека за малко 0

Независимо дали някои r > 0, C > 0, реалната функция φ(x) и нейните частни производни от първи ред са компактни и равномерно непрекъснати в обобщената метрика p(x, y) на множеството

A = O g (p)PP bn], съществуват T > 0, R > 0 такива, че за всички \t\ O p v v 1+ z u exp(i--f(x))

0(p(gaL)) = a, / h X v \Z,t) T, u= oX LJ (Z,t)

Тогава p(z a , t a) Є ft, u J((z Є Л,0(z) = а),р) = J(p(z a ,t a),p) d _ 9 = 7111 + t a «-^ OFaL)) - В 2Wexp( a --0(p(g a,i a))). j/=0 CnEi/ ^_o CX(/

Ако функцията f(x) е линейна функция и функцията fix) е дефинирана чрез равенство (0.5), тогава условие (0.12) се превръща в условието на Крамер за случайната променлива f(,(z)). Условието (0.13) е форма на условие (0.10) и се използва за доказване наличието в области на формата (x Є Г2, φ(x) > a) на поне една точка от 0(n, N) за всички достатъчно големи n, N.

Нека v ()(n,iV) = (/гі,...,/ijv) е честотният вектор в обобщеното оформление (0.2). Като следствие от теореми 3 и 4 е формулирана следната теорема.

Теорема 5. Груба интегрална теорема за вероятностите за големи отклонения на симетрични разделими статистики в обобщена схема на разпределение.

Нека n, N -> ω, така че jfr - 7» 0 0,R > 0, така че за всички \t\ Тогава за всяка последователност a#, сходна към a, 1 iv =

Тази теорема е доказана за първи път от A.F. Ronzhin в /38/ с помощта на метода на седловата точка.

Във втория параграф на втората глава се изследват вероятностите за големи отклонения на отделимите статистики в обобщеното разположение на cxj^iax в случай на неизпълнение на условието на Крамер за случайната променлива /((z)). Условието на Крамър за случайната променлива f(,(z)) не е изпълнено, по-специално, ако (z) е случайна променлива на Поасон и /(x) = x 2. Обърнете внимание, че условието на Крамър за самите отделими статистики в обобщените схеми за разпределение винаги е изпълнено, тъй като за всяко фиксирано n, N броят на възможните резултати в тези схеми е краен.

Както е отбелязано в /2/, ако условието на Крамер не е изпълнено, тогава да се намери асимптотиката на вероятностите за големи отклонения на суми от еднакво разпределени случайни променливие необходимо да бъдат изпълнени допълнителни условия за правилната промяна в разпределението на срока. Работата (разглежда случая, съответстващ на изпълнението на условие (3) в /2/, т.е. седем експоненциалния случай. Нека P(i = k) > O за всички

28 k = 0.1,... и функцията p(k) = -\nP(^ = k), може да бъде продължена до функция с непрекъснат аргумент - редовно променяща се функция от ред p, 0 oo P(tx) , r v P(t)

Нека функцията f(x) за достатъчно големи стойности на аргумента е положителна, строго нарастваща, редовно променяща се функция от ред d>1, ^ На останалата част от числовата ос

Тогава s. V. /(i) има моменти от всякакъв ред и не удовлетворява условието на Крамер, ip(x) = o(x) при x -> oo, и следната теорема 6 е валидна. Нека функцията ip(x) е монотонно ненамаляваща за достатъчно голямо x функцията ^p не нараства монотонно, n, N --> oo, така че jf - A, 0 b(z\), където b(z) = M/(1(2)), там е граница l(n,lg)) > cN] = "(c ~ b(zx))l b""ї

От теорема b следва, че ако условието на Крамер не е изпълнено, границата (^ lim ~\nP(L N (h(n,N)) > cN) = 0, "" Dv

L/-too iV и което доказва валидността на хипотезата, изразена в /39/. По този начин стойността на индекса на критерия за съгласие в обобщените схеми за разположение -^, когато условието на Крамер не е изпълнено, винаги е равна на нула. В този случай, в класа на критериите, когато условието на Крамер е изпълнено, се конструират критерии с ненулева стойност на индекса. От това можем да заключим, че използването на критерии, чиито статистики не отговарят на условието на Крамер, например теста хи-квадрат в полиномиална схема, за конструиране на тестове за добро съответствие за тестване на хипотези с неконвергиращи алтернативи в посочения смисъл е асимптотично неефективен. Подобно заключение е направено в /54/ въз основа на резултатите от сравнение на статистиката на хи-квадрат и съотношението на максималната вероятност в полиномна схема.

Третата глава решава проблема за конструиране на критерии за добро съответствие с най-голямата стойност на индекса на критерия (най-голямата стойност на индекса на критерия) за тестване на хипотези в обобщени схеми за поставяне. Въз основа на резултатите от първа и втора глава относно свойствата на ентропийните функции, информационното разстояние и вероятностите за големи отклонения, в третата глава се намира функция от вида (0.4), така че критерият за добро съответствие, конструиран въз основа на него има най-голямата стойност на точния индекс в разглеждания клас критерии. Доказана е следната теорема. Теорема 7. За съществуването на индекс. Нека са изпълнени условията на теорема 3, 0 ,... - последователност от алтернативни разпределения, 0^(/3, iV) - максималният брой, за който при хипотезата Н Р (lo, неравенството

P(φ(^^,...)>a φ (P,M))>(3, има граница limjv-»oo o>φ(P, N) - a. Тогава в точката (/3 , N) има критерий индекс f

Zff,K) = 3((φ(x) >a,xe ZD.P^)).

В този случай zf(0,th)N NP(e(2 7) = fc)"

Заключението излага получените резултати във връзката им с общата цел и конкретните задачи, поставени в дисертацията, формулира изводи въз основа на резултатите от изследването на дисертацията, посочва научната новост, теоретичната и практическата стойност на работата, както и конкретни научни задачи, идентифицирани от автора и чието решение изглежда уместно.

Кратък преглед на литературата по изследваната тема.

Дипломната работа разглежда проблема за конструиране на критерии за съгласие в обобщени схеми за поставяне с най-висока стойност на индекса на критерия в класа на функциите от вида (0.4) с неконвергиращи алтернативи.

Обобщени схеми на оформление са въведени от V.F Kolchin в /24/. Величините fi r в полиномиалната схема са наречени брой клетки с r пелети и са разгледани подробно в монографията на В. Ф. Колчин, Б. А. Севастянов, В. П. Чистяков /27/. Стойностите на \i r в обобщени оформления са изследвани от V.F. Kolchin в /25/, /26/. Статистиките под формата (0.3) са разгледани за първи път от Ю. И. Медведев в /30/ и са наречени разделими (аддитивно разделими) статистики. Ако функциите /„ в (0.3) не зависят от u, такива статистики се наричат ​​в /31/ симетрични разделими статистики. Асимптотичното поведение на моментите на отделимите статистики в обобщени схеми за разпределение е получено от Г. И. Ивченко в /9/. Граничните теореми за обобщена схема на оформление също бяха разгледани в /23/. Рецензии на резултатите от граничните теореми и критериите за съгласие в дискретни вероятностни схеми от тип (0.2) са дадени от В. А. Ивченко, Ю. И. Медведев в /8/ и Г. И. Ивченко, Ю. И. Медведев, А. Ф. Ронжин в /14/. Критериите за съгласие за обобщени оформления са разгледани от A.F. Ronzhin в /38/.

Сравнението на свойствата на статистическите критерии в тези работи е извършено от гледна точка на относителната асимптотична ефективност. Разгледан е случаят на конвергиращи (контигуални) хипотези - ефективност по смисъла на Питман и неконвергиращи хипотези - ефективност по смисъла на Бахадур, Ходжис - Леман и Чернов. Връзка между различни видовеотносителната ефективност на статистическите тестове е разгледана например в /49/. Както следва от резултатите на Ю. И. Медведев в /31/ за разпределението на разделимите статистики в полиномиална схема, критерият, базиран на хи-квадрат статистиката, има най-голяма асимптотична сила при конвергентни хипотези в класа на разделимите статистики на честотите на резултатите в полиномиална схема. Този резултат е обобщен от A.F. Ronzhin за вериги от тип (0.2) в /38/. И. И. Викторова и В. П. Чистяков в /4/ конструират оптимален критерий за полиномиална схема в класа на линейните функции на fi r. A.F. Ronzhin в /38/ конструира критерий, който при дадена последователност от алтернативи, които не са близки до нулевата хипотеза, минимизира логаритмичната скорост, при която вероятността от грешка от първи вид клони към нула, в класа на статистиката на формата (0.6). Сравнение на относителното представяне на статистиката на хи-квадрат и съотношението на максималната вероятност при приближаващи и неапроксимиращи хипотези беше извършено в /54/. Тезата разглежда случая на несближаващи се хипотези. Изследването на относителната статистическа ефективност на критерии при неконвергиращи хипотези изисква изследване на вероятностите за изключително големи отклонения - от порядъка на 0(u/n). За първи път такава задача за полиномиално разпределение с фиксиран брой изходи е решена от И. Н. Санов в /40/. В /48/ беше разгледана асимптотичната оптималност на тестовете за добро съответствие за тестване на прости и сложни хипотези за многочленно разпределение в случай на краен брой резултати с неконвергиращи алтернативи. Свойствата на информационното разстояние са разгледани преди това от Kullback, Leibler /29/,/53/ и I. II. Санов /40/, както и Хьофдинг /48/. В тези работи се разглежда непрекъснатостта на информационното разстояние върху крайномерни пространства в евклидовата метрика. Редица автори разглеждат последователност от пространства с нарастваща размерност, например в работата на Ю. В. Прохоров /37/ или в работата на В. И. Богачев, А. В. Колесников /1/. Груби (до логаритмична еквивалентност) теореми за вероятностите за големи отклонения на отделими статистики в обобщени схеми за разпределение при условието на Крамер са получени от A.F. Roizhin в /38/. А. Н. Тимашев в /42/,/43/ получи точни (до еквивалентност) многомерни интегрални и локални гранични теореми за вероятностите за големи отклонения на вектора fir^n, N),..., fi rs (n,N) , където s, gi,..., r s са фиксирани цели числа,

Статистически проблеми за тестване на хипотези и оценка на параметри в схема за подбор без връщане в малко по-различна формулировка са разгледани от Г. И. Ивченко, В. В. Левин, Е. Е. Тимонина /10/, /15/, където проблемите с оценката са решени за крайна популация, когато броят на неговите елементи е неизвестна величина, беше доказана асимптотичната нормалност на многомерна S - статистика от s независими извадки в схема за подбор без реверсия. Проблемът за изучаване на случайни променливи, свързани с повторения в последователности от независими опити, е изследван от А. М. Зубков, В. Г. Михайлов, А. М. Шойтов в /6/, /7/, /32/, /33/, /34/. Анализ на основните статистически проблеми на оценката и проверката на хипотези в рамките на общия модел на Марков-Поля е извършен от Г. И. Ивченко, Ю. И. Медведев в /13/, чийто вероятностен анализ е даден в /11 /. Метод за определяне на неравномерни вероятностни мерки върху набор от комбинаторни обекти, който не се свежда до обобщената схема на разположение (0.2), е описан в Г. И. Ивченко, Ю. И. Медведев /12/. Редица проблеми в теорията на вероятностите, в които отговорът може да бъде получен в резултат на изчисления с рекурентни формули, са посочени от А. М. Зубков в /5/.

Неравенствата за ентропията на дискретни разпределения са получени в /50/ (цитирано от резюмето на А. М. Зубков в РЖМат). Ако (p n )Lo е вероятностно разпределение,

Рп = Е Рк, к=п A = supp^Pn+i

I + (In -f-) (X Rn - R n+1)

Рп= (x f 1)n+v n>Q. (0,15)

Обърнете внимание, че екстремалното разпределение (0.15) е геометрично разпределение с математическо очакване А, а функцията F(X) на параметъра (0.14) съвпада с функцията на математическото очакване в Теорема 1.

Ентропия на дискретни разпределения с ограничено математическо очакване

Ако съществува индекс на критерия, тогава индексът на критерия съвпада с него. По-ниският индекс на критерия винаги съществува. Колкото по-висока е стойността на индекса на критерия (долния индекс на критерия), толкова по-добър е статистическият критерий в този смисъл. В /38/ е решен проблемът за конструиране на критерии за съгласие за обобщени оформления с най-висока стойност на индекса на критерия в класа на критериите, които отхвърлят хипотезата Ho(n,N) за където m 0 е някакво фиксирано число, последователността на постоянни единици се избира въз основа на дадената степен на стойност на критерия за последователност от алтернативи, ft - реална функция от m + 1 аргумента.

Индексите на критериите се определят от вероятностите за големи отклонения. Както беше показано в /38/, грубата (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на отделими статистики, когато условието на Крамер за случайната променлива /() е изпълнено, се определя от съответния Kull-Bak-Leibler- Информационно разстояние на Санов (случайната величина q удовлетворява условието на Крамер , ако за някое # 0 генериращата функция на моментите Mef7? е крайна в интервала \t\ Н /28/).

Въпросът за вероятностите за големи отклонения на статистиката от неограничен брой ели, както и за произволни отделими статистики, които не отговарят на условието на Крамер, остана отворен. Това не ни позволи окончателно да решим проблема с конструирането на критерии за тестване на хипотези в обобщени схеми за поставяне с най-висок процент на сходимост на вероятността от грешка от първи вид до нула с приближаващи се алтернативи в класа на критериите, базирани на статистика на формата (0.4). Актуалността на дисертационното изследване се определя от необходимостта от завършване на решението на поставения проблем.

Целта на дисертационния труд е да се конструират критерии за съгласие с най-голяма стойност на индекса на критерия (долен индекс на критерия) за проверка на хипотези в схема за подбор без връщане в класа на критериите, които отхвърлят хипотезата U(n, N) за където φ е функция на изброимия брой аргументи, а параметрите n, N се променят в централната област. В съответствие с целта на изследването бяха поставени следните задачи: - да се изследват свойствата на ентропията и информационното разстояние на Kull-Bak - Leibler - Sanov за дискретни разпределения с изброим брой изходи; - изследване на вероятностите за големи отклонения на статистиката на формата (0,4); - изследване на вероятностите за големи отклонения на симетрични сепарируеми статистики (0,3), които не отговарят на условието на Крамер; - намерете такава статистика, че критерият за съгласие, конструиран на негова основа за тестване на хипотези в обобщени схеми за поставяне, има най-високата стойност на индекса в класа от критерии на формата (0,7). Научна новост: - дава се концепцията за обобщена метрика - функция, която допуска безкрайни стойности и удовлетворява аксиомите за идентичност, симетрия и неравенство на триъгълника. Намира се обобщена метрика и се посочват набори, на които функциите на ентропията и информационното разстояние, дефинирани върху семейство от дискретни разпределения с изброим брой резултати, са непрекъснати в тази метрика; - в схемата за обобщено разположение е намерена груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на статистиките от формата (0,4), отговарящи на съответната форма на условието на Крамер; - в схемата за обобщено разположение беше открита груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на симетрични разделими статистики, които не отговарят на условието на Крамер; - в класа критерии от формата (0.7) се конструира критерий с най-висока стойност на индекса на критерия. Научна и практическа стойност. Работата решава редица въпроси относно поведението на вероятностите за големи отклонения в обобщените схеми за разположение. Получените резултати могат да бъдат използвани в учебния процес по специалностите математическа статистика и теория на информацията, при изучаване на статистически процедури за анализ на дискретни последователности и са използвани в /3/, /21/ за обосноваване сигурността на един клас информационни системи. Разпоредби, предложени за защита: - намаляване на проблема с тестването на хипотезата от една последователност от цветове на топки от факта, че тази последователност е получена в резултат на избор без връщане до изчерпване на топките от урна, съдържаща топки от две цветове и всеки такъв избор има една и съща вероятност, за изграждането на споразумение за критерии за тестване на хипотези в подходящото обобщено оформление; - непрекъснатост на функциите на ентропията и информационното разстояние на Кулбак-Лайблер-Санов върху безкрайномерен симплекс с въведената логаритмична обобщена метрика; - теорема за груба (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на симетрични сепарируеми статистики, които не отговарят на условието на Крамер в схемата на обобщено разположение в полуекспоненциалния случай;

Непрекъснатост на информационното разстояние Kullback - Leibler - Sanov

Обобщени схеми на оформление са въведени от V.F Kolchin в /24/. Величините fir в полиномиалната схема са наречени брой клетки с r пелети и са разгледани подробно в монографията на В. Ф. Колчин, Б. А. Севастянов, В. П. Чистяков /27/. Стойностите на \ig в обобщени оформления са изследвани от V.F. Kolchin в /25/, /26/. Статистиките под формата (0.3) са разгледани за първи път от Ю. И. Медведев в /30/ и са наречени разделими (аддитивно разделими) статистики. Ако функциите /„ в (0.3) не зависят от u, такива статистики се наричат ​​в /31/ симетрични разделими статистики. Асимптотичното поведение на моментите на отделимите статистики в обобщени схеми за разпределение е получено от Г. И. Ивченко в /9/. Граничните теореми за обобщена схема на оформление също бяха разгледани в /23/. Рецензии на резултатите от граничните теореми и критериите за съгласие в дискретни вероятностни схеми от тип (0.2) са дадени от В. А. Ивченко, Ю. И. Медведев в /8/ и Г. И. Ивченко, Ю. И. Медведев, А. Ф. Ронжин в /14/. Критериите за съгласие за обобщени оформления са разгледани от A.F. Ronzhin в /38/.

Сравнението на свойствата на статистическите критерии в тези работи е извършено от гледна точка на относителната асимптотична ефективност. Разгледан е случаят на конвергиращи (контигуални) хипотези - ефективност по смисъла на Питман и неконвергиращи хипотези - ефективност по смисъла на Бахадур, Ходжис - Леман и Чернов. Връзката между различните типове статистически тестове за относителна ефективност е разгледана например в /49/. Както следва от резултатите на Ю. И. Медведев в /31/ за разпределението на разделимите статистики в полиномиална схема, най-голямата асимптотична мощност при конвергентни хипотези в класа на разделимите статистики за честотите на резултатите в полиномиална схема има критерий, базиран на хи-квадрат статистика. Този резултат е обобщен от A.F. Ronzhin за вериги от тип (0.2) в /38/. И. И. Викторова и В. П. Чистяков в /4/ конструират оптимален критерий за полиномиална схема в класа на линейните функции на fir. A.F. Ronzhin в /38/ конструира критерий, който при дадена последователност от алтернативи, които не са близки до нулевата хипотеза, минимизира логаритмичната скорост, при която вероятността от грешка от първи вид клони към нула, в класа на статистиката на формата (0.6). Сравнение на относителното представяне на статистиката на хи-квадрат и съотношението на максималната вероятност при приближаващи и неапроксимиращи хипотези беше извършено в /54/. Тезата разглежда случая на несближаващи се хипотези. Изследването на относителната статистическа ефективност на критерии при неконвергиращи хипотези изисква изследване на вероятностите за изключително големи отклонения - от порядъка на 0(u/n). За първи път такава задача за полиномиално разпределение с фиксиран брой изходи е решена от И. Н. Санов в /40/. В /48/ беше разгледана асимптотичната оптималност на тестовете за добро съответствие за тестване на прости и сложни хипотези за многочленно разпределение в случай на краен брой резултати с неконвергиращи алтернативи. Свойствата на информационното разстояние са разгледани преди това от Kullback, Leibler /29/,/53/ и I. II. Санов /40/, както и Хьофдинг /48/. В тези работи се разглежда непрекъснатостта на информационното разстояние върху крайномерни пространства в евклидовата метрика. Редица автори разглеждат последователност от пространства с нарастваща размерност, например в работата на Ю. В. Прохоров /37/ или в работата на В. И. Богачев, А. В. Колесников /1/. Груби (до логаритмична еквивалентност) теореми за вероятностите за големи отклонения на отделими статистики в обобщени схеми за поставяне при условието на Крамер са получени от А. Ф. Роижин в /38/. А. Н. Тимашев в /42/,/43/ получава точни (до еквивалентност) многомерни интегрални и локални гранични теореми за вероятностите от големи отклонения на вектор

Изследването на вероятностите от големи отклонения при неспазване на условието на Крамер за случай на независими случайни променливи е извършено в трудовете на А. В. Нагаев /35/. Методът на спрегнатите разпределения е описан от Фелер /45/.

Статистически проблеми за тестване на хипотези и оценка на параметри в схема за подбор без връщане в малко по-различна формулировка са разгледани от Г. И. Ивченко, В. В. Левин, Е. Е. Тимонина /10/, /15/, където проблемите с оценката са решени за крайна популация, когато броят на неговите елементи е неизвестна величина, беше доказана асимптотичната нормалност на многомерна S - статистика от s независими извадки в схема за подбор без реверсия. Проблемът за изучаване на случайни променливи, свързани с повторения в последователности от независими опити, е изследван от А. М. Зубков, В. Г. Михайлов, А. М. Шойтов в /6/, /7/, /32/, /33/, /34/ . Анализ на основните статистически проблеми на оценката и проверката на хипотези в рамките на общия модел на Марков-Поля е извършен от Г. И. Ивченко, Ю. И. Медведев в /13/, чийто вероятностен анализ е даден в /11 /. Метод за определяне на неравномерни вероятностни мерки върху набор от комбинаторни обекти, който не се свежда до обобщената схема на разположение (0.2), е описан в Г. И. Ивченко, Ю. И. Медведев /12/. Редица проблеми в теорията на вероятностите, в които отговорът може да бъде получен в резултат на изчисления с рекурентни формули, са посочени от А. М. Зубков в /5/.

Информационно разстояние и големи вероятности за отклонение на отделими статистики

Когато условието на Cramer не е изпълнено, големите отклонения на отделимите статистики в обобщената схема на разположение в разглеждания седем експоненциален случай се определят от вероятността за отклонение на един независим член. Когато условието на Крамър е изпълнено, това, както е подчертано в /39/, не е така. Забележка 10. Функцията φ(x) е такава, че математическото очакване на Its AN) е крайно за 0 t 1 и безкрайно за t 1. Забележка 11. За отделими статистики, които не отговарят на условието на Крамер, границата (2.14) е равно на 0, което доказва валидността на хипотезата, изразена в /39/. Забележка 12. За хи-квадрат статистиката в полиномиална схема за n, ./V - co, така че - A, веднага следва от теоремата, че Този резултат е получен директно в /54/. В тази глава, в централната област на промените в параметрите на обобщените схеми за разполагане на частици в клетките, грубата (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на адитивно разделими статистики от броя на клетките и функциите от броя на открити са клетки с даден пълнеж.

Ако условието на Крамър е изпълнено, тогава грубата асимптотика на вероятностите за големи отклонения се определя от грубата асимптотика на вероятностите за попадане в последователност от точки с рационални координати, сближаващи се в горния смисъл до точката, в която екстремумът на е достигнато съответно информационно разстояние.

Разгледан е седемекспоненциалният случай на неизпълнение на условието на Крамер за случайните променливи f(i),...,f(k), където b, k са независими случайни променливи, генериращи обобщената декомпозиционна схема (0.2), f (k) е функция в дефиницията на симетрични адитивно разделими статистики в (0.3). Тоест, предполага се, че функциите p(k) = - lnP(i = k) и f(k) могат да бъдат разширени до редовно променящи се функции на непрекъснат аргумент от порядъка p 0 и q 0, съответно, и p р. Оказа се, че основният принос към грубата асимптотика на вероятностите за големи отклонения на отделимите статистики в обобщени схеми на разположение се прави по подобен начин от грубата асимптотика на вероятността за йонизация в съответната последователност от точки. Интересно е да се отбележи, че по-рано теоремата за вероятностите за големи отклонения за отделими статистики беше доказана с помощта на метода на седловата точка, като основният принос към асимптотиката беше направен от една седлова точка. Случаят, при който, ако условието на Крамер не е изпълнено, условието за 2-kN не е изпълнено, остава неизследван.

Ако условието на Крамер не е изпълнено, тогава определеното условие може да не е изпълнено само в случай на p 1. Както пряко следва от логаритъма на съответните вероятности, за разпределението на Поасон и геометричното разпределение p = 1. От резултата за асимптотиката на вероятностите за големи отклонения, когато условието на Крамер не е изпълнено, можем да заключим, че критериите, чиито статистики не отговарят на условието на Крамер, имат значително по-нисък процент на тенденция към нула на вероятностите за грешки на втори тип с фиксирана вероятност за грешка от първи род и неконвергиращи алтернативи спрямо критериите, чиито статистики удовлетворяват условието на Крамер. Нека се направи селекция от урна, съдържаща N - 1 1 бели ip-JV 1 черни топки, без да се връща до пълно изчерпване. Свързваме местата на белите топки в избора 1 i\ ... r -i n - 1 с последователността от разстояния между съседни бели топки hi,..., h както следва: Тогава hv l,v =1,.. ,N,M EjLi i/ - n- Нека дефинираме разпределение на вероятностите върху множеството от вектори h = (hi,...,Ldr), задавайки V(hv = rv,v = l,...,N ), където i,...,lg - независими неотрицателни цели числа случайни променливи (r.v.), т.е. разгледайте обобщената схема за разпределение (0.2). Разпределението на вектора h зависи от n,N, но съответните индекси ще бъдат пропуснати, където е възможно, за да се опрости обозначението. Забележка 14. Ако на всеки от (]) начини за избиране на топки от урна се присвои една и съща вероятност ( \) mn за всяко r i,..., rg такова, че r„ 1,u = l,...,N , T,v=\ru = n, вероятността разстоянията между съседни бели топки в избора да приемат тези стойности

Критерии, базирани на броя на клетките в общите оформления

Целта на дисертационния труд беше да се изградят критерии за добро съответствие за тестване на хипотези в схема за подбор, без да се връща от урна, съдържаща топки от 2 цвята. Авторът решава да проучи статистика въз основа на честотите на разстоянията между топките от един и същи цвят. В тази формулировка проблемът беше сведен до задачата за тестване на хипотези в подходящо обобщено оформление.

Дисертационният труд включваше: свойствата на ентропията и информационната дистанция на дискретни разпределения с неограничен брой резултати с ограничено математическо очакване; - получена е груба (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на широк клас статистики в обобщена схема на разположение; - въз основа на получените резултати е конструирана критериална функция с най-висока логаритмична скорост на клонене към нула на вероятността за грешка от първи род с фиксирана вероятност за грешка от втори род и неконвергиращи алтернативи; - доказано е, че статистиките, които не отговарят на условието на Крамер, имат по-ниска скорост на сходимост до нула на вероятностите за големи отклонения в сравнение със статистиките, които отговарят на това условие. Научната новост на работата е следната. - дава се концепцията за обобщена метрика - функция, която допуска безкрайни стойности и удовлетворява аксиомите за идентичност, симетрия и неравенство на триъгълника. Намира се обобщена метрика и се посочват набори, на които функциите на ентропията и информационното разстояние, дефинирани върху семейство от дискретни разпределения с изброим брой резултати, са непрекъснати в тази метрика; - в схемата за обобщено разположение е намерена груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на статистиките от формата (0,4), отговарящи на съответната форма на условието на Крамер; - в схемата за обобщено разположение беше открита груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на симетрични разделими статистики, които не отговарят на условието на Крамер; - в класа критерии от формата (0.7) се конструира критерий с най-висока стойност на индекса на критерия. Работата решава редица въпроси относно поведението на вероятностите за големи отклонения в обобщените схеми за разположение. Получените резултати могат да бъдат използвани в учебния процес по специалностите математическа статистика и теория на информацията, при изучаване на статистически процедури за анализ на дискретни последователности и са използвани в /3/, /21/ за обосноваване сигурността на един клас информационни системи. Въпреки това редица въпроси остават отворени. Авторът се ограничава до разглеждане на централната зона на промени в параметрите n, N на обобщени схеми за поставяне на n частици в /V клетки. Ако носителят на разпределението на случайни променливи, генериращи обобщената схема на подреждане (0.2), не е набор от формата r, r 4-1, r + 2,..., тогава при доказване на непрекъснатостта на функцията на информационното разстояние и изучавайки вероятностите за големи отклонения, е необходимо да се вземе предвид аритметичната структура на такъв носител, която не е разгледана в работата на автора. За практическото приложение на критерии, изградени на базата на предложената функция с максимална стойностиндекс, е необходимо да се изследва неговото разпределение както при нулевата хипотеза, така и при алтернативи, включително конвергентни. Също така е от интерес да се прехвърлят разработените методи и да се обобщят получените резултати към други вероятностни схеми, различни от обобщените схеми за поставяне. Ако //1,/ 2,-.. са честотите на разстоянията между числата на резултат 0 в биномна схема с вероятности на резултатите рояк 1 -POj, тогава може да се покаже, че в този случай, от анализа на формула за съвместно разпределение на стойностите \іт в обобщена схема на разположение, доказана в /26/, следва, че разпределението (3.3), най-общо казано, не може да бъде представено в общия случай като съвместно разпределение на стойностите на cg във всяка обобщена схема за поставяне на частици в клетки. Това разпределение е частен случай на разпределения върху множеството от комбинаторни обекти, въведени в /12/. Изглежда спешна задача да се прехвърлят резултатите от дисертационния труд за обобщени схеми за настаняване в този случай, който беше обсъден в /52/.

Терминологичен речник

Към раздел 7

Автоковариация - за стационарен ред Xt, ковариацията на случайни променливи Xt9 Xt+T9 y(t) Cov(Xn Xt+T).

Autocorrelation Junction -ACF - за стационарен ред Xt - последователността от неговите автокорелации p(t) = Corr(Xt9 Xt+ r), r = 0.1, 2,...

Автокорелация, коефициент на автокорелация - за стационарен ред Xt, коефициентът на корелация на случайни променливи Xn Xt+T, p(t) = Corr(Xt, Xt+T).

Бял шум, процес на бял шум - стационарен случаен процес Xt с нулева средна и ненулева дисперсия,

за които Corr(Xt, Xs) = 0 при t Ф s.

„По-пестеливите“ модели са сред определен набор от алтернативни модели на времеви редове, моделите с най-малък брой коефициенти за оценка.

Времеви редове - поредица от стойности на някаква променлива, измерена в последователни точки във времето. Времевият ред се разбира и като случаен процес с дискретно време (случайна последователност), чието изпълнение е наблюдавана поредица от стойности.

Примерна автокорелационна функция (SACF - sample ACF) - поредица от примерни автокорелации r (k), & = 0, 1,2, изградена от съществуващата реализация на времевия ред. Анализирането на тази последователност помага да се идентифицира процеса на пълзяща средна и неговия ред.

Примерна частична автокорелационна функция (SPACF-проба PACF) - последователност от примерни частични автокорелации rpart(k), k = 0, 1, 2, конструирана от съществуващата реализация на времевия ред. Анализирането на тази последователност помага да се идентифицира процеса на пълзяща средна и неговия ред.

Примерните автокорелации са оценки на автокорелациите p(k) на случаен процес, конструирани от съществуващата реализация на времева серия. Един от вариантите за оценка на автокорелацията p(k) има формата:

T-kf?x " И)У t+k И) у (к) 1 t

където p = x = - ^xt - оценка за p = E(Xt), ] tk

y(k) = y](xt p)(xt+k p) - оценка за автоковариацията y(k).

Примерни частични автокорелации са оценки на частични автокорелации prap(t) на случаен процес, конструирани от съществуващото изпълнение на времеви редове.

Процесът с бял шум на Гаус е процес с бял шум, чиито едномерни разпределения са нормални разпределения с нулево математическо очакване.

случаен процес на Гаус (процес на Гаус) - случаен процес, за който за всяко цяло число m > O и произволен набор от времена tx< t2 < ... < tm совместные распределения случайных величин Xti, Xtm являются m-мерными нормальными распределениями.

Иновацията е текущата стойност на случайната грешка от дясната страна на връзката, която определя процеса на авторегресия Xr Иновацията не е

корелирани със закъснели стойности Xt_k9 k= 1, 2, ... Последователните стойности на иновациите (последователност на иновациите) образуват процес на бял шум.

Информационният критерий на Akaike (AIC) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел се избира стойността, която минимизира стойността

o 2k A1C(£) = 1n0£2+y,

Оценката на дисперсията на иновациите в AR модела е редовна.

Критерият на Akaike асимптотично надценява (надценява) истинската стойност на k0 с различна от нула вероятност.

Информационният критерий на Ханан-Куин (HQC) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел е избрана стойността, която минимизира стойността

UQ(k) = In a2k + k -,

където T е броят на наблюденията;

(t£ - оценка на дисперсията на иновациите st в AR модела от A>ти ред.

Критерият има сравнително бърза конвергенция към истинската стойност на k0 при T -> oo. Въпреки това, за малки стойности на T, този критерий подценява реда на авторегресия.

Информационният критерий на Шварц (SIC) е един от критериите за избор на „най-добрия“ модел сред няколко алтернативни модела. Сред алтернативните стойности на реда на авторегресивния модел се избира стойността, която минимизира стойността

SIC(£) = lno>2+Ar-,

където T е броят на наблюденията;

А? - оценка на дисперсията на иновациите в AR модела на A: ред.

Корелограма - за стационарна серия: графика на зависимостта на автокорелационните стойности p(t) на стационарна серия от t. Корелограмата се нарича още двойка графики, дадени в протоколи за анализ на данни в различни пакети за статистически анализ: графика. на примерна автокорелационна функция и графика на примерна частична автокорелационна функция. Наличието на тези два графика помага да се идентифицира моделът ARMA, генериращ наличния набор от наблюдения.

Backcasting е техника за получаване на по-точна апроксимация на функцията на условната правдоподобност, когато се оценява модел на подвижна средна MA(q):

Xt = et + bxst_x + b2st_2 + ... + bqet_q9 bq Ф0,

според наблюденията xl9..., xt. Резултатът от максимизирането (без bx, bl9 ..., bq) на условната функция на вероятността, съответстваща на наблюдаваните стойности xХ9х29 ...9хт за фиксирани стойности на є09 є_Х9 є_д+Х9 зависи от избраните стойности на b*0, е_є_д+1. Ако процесът MA(q) е обратим, тогава можем да поставим 6*0 = є_х = ... = s_q+x = 0. Но за да подобрим качеството на оценката, можем да използваме метода на обратната прогноза, за да „оценим“ стойности на є09 e_Х9 є_д+х и използвайте оценените стойности в условната функция на вероятността. Оператор за забавяне (L)9 оператор за обратно изместване - оператор, определен от релацията: LXt = Xt_x. Удобен за компактен запис на модели на времеви редове и за формулиране на условия, които осигуряват определени свойства на редовете. Например, използвайки този оператор, уравнението, определящо модела ARMA(p, q).

Xt = Z ajxt-j + Z bj£t-j ><*Р*ъ>ич* О,

може да се запише като: a(L) Xt = b(b)єп където

a(L) = 1 (axL + a2L2 + ... + apLp

b(L)=l+blL + b2L2 + ... + bqLq.

Проблемът с общите фактори е наличието на общи фактори в полиномите a(L) и b(L)9, съответстващи на компонентите AR и MA на модела ARMA:

Наличието на общи фактори в спецификацията на модела ARMA затруднява практическото идентифициране на модела чрез редица наблюдения.

Авторегресивен процес от първи ред (AR(1)) е случаен процес, чиято текуща стойност е сумата от линейна функция на стойността на процеса, изостанала с една стъпка, и случайна грешка, която не е в корелация с минали стойности на процеса. В този случай поредица от случайни грешки образува процес на бял шум.

Авторегресивен процес от порядък p (pth-order autoregressive process - AR(p)) е случаен процес, чиято текуща стойност е сумата от линейна функция на стойностите на процеса, изоставащи с p стъпки или по-малко, и случайна грешка не корелира със стойностите на минали процеси. В този случай поредица от случайни грешки образува процес на бял шум.

Процес на подвижна средна от ред q (процес на подвижна средна от q-ти ред - MA(g)) е случаен процес, чиято текуща стойност е линейна функция на текущата стойност на някакъв процес с бял шум и стойностите на този процес на бял шум, изостанал с p стъпки или по-малко.

Декомпозицията на Уолд е представяне на широко стационарен процес с нулево математическо очакване като сума от процес на пълзяща средна от безкраен ред и линейно детерминиран процес.

Сезонната авторегресия от първи ред (SAR(l) - сезонна авторегресия от първи ред) е случаен процес, чиято текуща стойност е линейна функция на стойността на този процес, изостанала от S стъпки и случайна грешка, която не е корелирана с минали стойности на процеса. В този случай поредица от случайни грешки образува процес на бял шум. Тук S = 4 за тримесечни данни, S = 12 за месечни данни.

Сезонна пълзяща средна от първи ред (SMA(l) - сезонна пълзяща средна от първи ред) е случаен процес, чиято текуща стойност е равна на сумата от линейна функция на текущата стойност на някакъв процес на бял шум и стойността на този процес на бял шум, изостанал със S стъпки. В този случай поредица от случайни грешки образува процес на бял шум. Тук 5 = 4 за тримесечни данни, 5 = 12 за месечни данни.

Системата от уравнения на Юл - Уокър е система от уравнения, която свързва автокорелациите на стационарен авторегресивен процес от ред p с неговите коефициенти. Системата ви позволява последователно да намирате стойностите на автокорелациите и прави възможно, използвайки първите p уравнения, да изразите коефициентите на стационарния процес на авторегресия чрез стойностите на първите p автокорелации, които могат да се използват директно, когато избор на модел на авторегресия към реални статистически данни.

Случаен процес с дискретно време (стохастичен процес с дискретно време, случаен процес с дискретно време) е последователност от случайни променливи, съответстващи на наблюдения, направени в последователни моменти във времето, имащи определена вероятностна структура.

Смесен авторегресивен процес на пълзяща средна, процес на авторегресивна пълзяща средна с остатъци под формата на пълзяща средна (авторегресивна пълзяща средна, смесена авторегресивна пълзяща средна - ARMA(p, q)) е случаен процес, чиято текуща стойност е сума от линейна функция на стъпки, изоставащи с p или по-малко стойности на процеса, и линейна функция от текущата стойност на някакъв процес с бял шум и стойности на този процес с бял шум, изоставащи с q стъпки или по-малко.

Q-статистика на Box-Pierce - една от опциите на g-статистиката:

Є = r£g2(*),

Q-статистиката на Ljung-Box е една от опциите за g-статистика, за предпочитане пред статистиката на Box-Pierce:

където T е броят на наблюденията; r (k) - примерни автокорелации.

Използва се за тестване на хипотезата, че наблюдаваните данни са реализация на процес на бял шум.

Стационарен в широк смисъл, стационарен в слаб смисъл, слабо стационарен, стационарен от втори ред, ковариантно-стационарен стохастичен процес - случаен процес с постоянно математическо очакване, постоянна дисперсия и инвариантни случайни променливи Xt,Xt+T:

Cov(Xt,Xt+T) = r(r).

Строго стационарен, стационарен в тесен смисъл (строго стационарен, строг смисъл стационарен) случаен процес (стохастичен процес) - случаен процес със съвместни разпределения на случайни величини Xh + T, ..., + T, инвариантни по r.

Условие за обратимост на процесите MA(q) и ARMA(p, q) (условие за обратимост) - за процеси Xt от вида MA(g): Xt = b(L)st или ARMA(p, q): a(L )(Xt ju ) = = b(L)st - условие върху корените на уравнението b(z) = O, осигуряващо съществуването на еквивалентно представяне на процеса Xt под формата на авторегресивен процес от безкраен ред AR( оо):

Условие за обратимост: всички корени на уравнението b(z) = O лежат извън единичната окръжност |z|< 1.

Условие за стационарност за процеси AR(p) и ARMA(p, q) - за процеси Xt от формата AR(p): a(L)(Xt ju) = et или ARMA(p, q) a(L)( Xt ju) = = b(L)st - условие за корените на уравнението a(z) = 0, осигуряващо стационарността на процеса Xg: всички корени на уравнението b(z) = O лежат извън единицата кръг |z|< 1. Если многочлены a(z) и b(L) не имеют общих корней, то это условие является необходимым и достаточным условием стационарности процесса Хг

Частична автокорелационна функция (PACF - partial autocorrelation function) - за стационарен ред, последователността от частични автокорелации prap(r), m = 0, 1,2,...

Частична автокорелация (PAC - partial autocorrelation) - за стационарен ред, стойността ppart(r) на коефициента на корелация между случайните променливи Xt nXt+k, изчистена от влиянието на междинни случайни променливи Xt+l9...9Xt+k_Y.

Етап на диагностична проверка на модела - диагностика на оценения модел ARMA, избран въз основа на наличните серии от наблюдения.

Етап на идентификация на модела - избор на модел за генериране на серии въз основа на наличните серии от наблюдения, определяне на p и q редовете на модела ARMA.

Етап на оценка на модела (етап на оценка) - оценка на коефициентите на модела ARMA, избрани въз основа на наличните серии от наблюдения.

(Q-статистика) - тестова статистика, използвана за тестване на хипотезата, че наблюдаваните данни са изпълнение на процес на бял шум.

Към раздел 8

Векторна авторегресия от порядък р (ph-order vector autoregression - VAR(p)) - модел за генериране на група от времеви редове, в които текущата стойност на всяка серия се състои от постоянен компонент, линейни комбинации от лагирани (до ред р) стойности тази серияи останалите редове и случайна грешка. Случайните грешки във всяко уравнение не са свързани със закъснелите стойности на всички разглеждани серии. Случайни вектори, образувани от грешки в различни редовев един и същи момент от време са независими, идентично разпределени произволни вектори с нулеви средни стойности.

Дългосрочната връзка е определена връзка, установена във времето между променливите, по отношение на които възникват доста бързи колебания.

Дългосрочни множители (дългосрочни множители, равновесни множители) - в динамичен модел с авторегресивно разпределени лагове - коефициенти сх,cs на дългосрочната зависимост на променлива от екзогенни променливи хы, xst. Коефициентът Cj отразява промяната в стойността на yt, когато текущите и всички предишни стойности на променливата xjt се променят с единица.

Импулсни множители (множител на въздействие, краткосрочен множител) - в динамичен модел с авторегресивно разпределени лагове - стойности, показващи влиянието на еднократни (импулсни) промени в стойностите на екзогенни променливи chi, xst върху текущата и последващи стойности на променливата jr

Кръстосаните ковариации са коефициенти на корелация между стойностите на различни компоненти на векторна серия в съвпадащи или различни точки във времето.

Кръстосаната ковариационна функция е последователност от кръстосани корелации на два компонента на стационарна векторна серия.

Моделите с авторегресивни модели с разпределено закъснение (ADL) са модели, при които текущата стойност на обяснена променлива е сумата от линейна функция на няколко закъснели стойности на тази променлива, линейни комбинации от текущи и няколко закъснели стойности на обяснителни променливи и случайна грешка.

Трансферната функция е матрична функция, която установява ефекта от промените на единиците в екзогенни променливи върху ендогенни променливи.

Процесът на генериране на данни (DGP) е вероятностен модел, който генерира видими статистически данни. Процесът на генериране на данни обикновено е неизвестен за изследователя, който анализира данните. Изключение правят ситуациите, когато изследователят сам избира процеса на генериране на данни и получава изкуствени статистически данни чрез симулиране на избрания процес на генериране на данни.

Статистическият модел (SM) е моделът, избран за оценка, чиято структура се предполага, че съответства на процеса на генериране на данни. Изборът на статистически модел се прави въз основа на наличните икономическа теория, анализ на наличните статистически данни, анализ на резултатите от по-ранни изследвания.

Стационарни векторни (AG-мерни) серии (K-мерни стационарни времеви редове) - последователност от произволни вектори с размерност K, имащи еднакви вектори на математически очаквания и еднакви ковариационни матрици, за които кръстосани корелации (кръстосани корелации) между стойността на k-тата компонента на серията в момент t и стойността на 1-вата компонента на серията в момент (t + s) зависят само от s.

Към раздел 9

Хипотеза за единичен корен (UR - хипотеза за единичен корен) - хипотеза, формулирана в рамките на модела ARMA(^, q): a(L)Xt = b(L)cr Хипотезата, че авторегресивният полином a(L) на модела ARMA има поне един корен равен на 1. В този случай обикновено се приема, че полиномът a(L) няма корени, чийто модул е ​​по-малък от 1.

Диференциация - преход от серия от нива Xt към серия от разлики Xt Xt_v Последователното диференциране на серия прави възможно елиминирането на стохастичната тенденция, присъстваща в оригиналната серия.

Интегрирана серия от ред k - серия Xn, която не е стационарна или стационарна по отношение на детерминирана тенденция (т.е. не е TS-серия) и за която серията, получена в резултат на ^-кратно диференциране на серията Xn, е стационарна , но серията, получена в резултат на (k 1)-кратно диференциране на серията Xr, не е HY-ред.

Коинтеграционната връзка е дългосрочна връзка между няколко интегрирани серии, характеризиращи равновесното състояние на системата от тези серии.

Моделът за коригиране на грешки е комбинация от краткосрочни и дългосрочни динамични регресионни модели при наличие на коинтеграционна връзка между интегрирани серии.

Оператор за диференциране - оператор A, трансформиращ серия от нива Xt в серия от разлики:

Свръхдиференциран времеви ред - серия, получена в резултат на диференциране на G5-серията. Последователното диференциране на серията GO помага да се елиминира детерминистичната полиномна тенденция. Въпреки това, диференцирането на T-серията има някои нежелани последици при избора на модел от статистически данни и използването на избрания модел за целите на прогнозиране на бъдещи стойности на серията.

Стационарни разлики, LU-серии (DS - стационарни времеви редове на разликите) - интегрирани серии от различни порядъци k = 1,2, ... Те се редуцират до стационарни серии чрез единично или многократно диференциране, но не могат да бъдат сведени до стационарни серии чрез изваждане на детерминистична тенденция.

Серия от тип ARIMA(p, A, q) (ARIMA - авторегресивна интегрирана подвижна средна) е времева серия, която в резултат на ^-кратно диференциране се редуцира до стационарна серия ARMA(p, q).

Серия, стационарна спрямо детерминистична тенденция, G5-серия

(TS - trend-stationary time series) - серии, които стават стационарни след изваждане на детерминирана тенденция от тях. Класът на такива серии също включва стационарни серии без детерминистичен тренд.

Случайна разходка, процес на случайна разходка (случайна разходка) - случаен процес, чиито стъпки образуват процес на бял шум: AXt st, така че Xt = Xt_ x + єг

Случайна разходка с дрейф, произволна разходка с дрейф (случайна разходка с дрейф) е случаен процес, чиито нараствания са сбор от константа и процес на бял шум: AXt = Xt Xt_ x = a + st, така че Xt = Xt_x + a + ег Константата a характеризира дрейфа на произволни траектории на блуждаене, който постоянно присъства по време на прехода към следващия момент във времето, върху който се наслагва случаен компонент.

Стохастичен тренд - времеви редове Zt, за които

Z, = єх + є2 + ... + et. Стойността на случайното ходене в момент t е t

Xt = Х0 + ^ є8, така че Xt Х0 = єх + є2 + ... + єг С други думи, моделът

стохастичен тренд - процес на случайна разходка, „излизащ от началото на координатите“ (за него X0 = 0).

Шоковата иновация е еднократна (импулсна) промяна в иновацията.

Ефектът на Слуцки е ефектът от образуването на фалшива периодичност при диференциране на серия, която е стационарна спрямо детерминирана тенденция. Например, ако оригиналната серия е сбор от детерминистична линейна тенденция и бял шум, тогава диференцираната серия няма детерминистична тенденция, но се оказва автокорелирана.

^-хипотеза (TS хипотеза) - хипотезата, че разглежданият времеви ред е стационарен или серия, стационарна по отношение на детерминирана тенденция.

Към раздел 10

Дългосрочна дисперсия - за серия с нулево математическо очакване се определя като граница

Var(ux +... + it)

Г-юс Т Т-+ОД

Тестовете на Дики-Фулър са група от статистически критерии за тестване на хипотезата за единичен корен в рамките на модели, приемащи нулево или ненулево математическо очакване на времева серия, както и възможното наличие на детерминистична тенденция в серията.

При прилагането на критериите на Дики-Фулър най-често се оценяват статистически модели

pAxt = a + (3t + cpxt_x + +є*> t = P + h---,T,

Axt =a + cpxt_x + ^0jAxt_j +£*, t = /7 + 1,..., Г,

Axt = cpxt_x + ]T 6j Axt_j +єп t = p +1,..., T.

/-статистиките / стойностите, получени по време на оценката на тези статистически модели за тестване на хипотезата H0: av = O, се сравняват с критичните стойности /crit, в зависимост от избора на статистическия модел. Хипотезата за единичния корен се отхвърля, ако f< /крит.

Тестът на Kwiatkowski-Phillips-Schmidt-Shin (KPSS тест) е критерий за разграничаване на DS и Г5-сериите, при които ha-хипотезата се приема за нулева.

Тестът на Leybourne е критерий за тестване на хипотезата за единичен корен, чиято статистика е равна на максимума от двете стойности на статистиката на Дики-Фулър, получена от оригиналната серия и от обърнатата във времето серия.

Тест на Перон - критерий за тестване на нулевата хипотеза, че дадена серия принадлежи към класа DS, обобщавайки процедурата на Дики-Фулър за ситуации, при които по време на периода на наблюдение има структурни промени в модела в даден момент от времето Tb под формата на или промяна на нивото (моделът на „колапс“) или промяна в наклона на тенденцията (моделът на „промяната в растежа“), или комбинация от тези две промени. Предполага се, че моментът Tb се определя екзогенно - в смисъл, че не е избран на базата на визуален преглед на графиката на серията, а се свързва с момента на известна мащабна промяна в икономическата ситуация, която значително влияе върху поведението на разглежданата серия.

Хипотезата за единичен корен се отхвърля, ако наблюдаваната стойност на статистиката на теста ta е под критичното ниво, т.е. Ако

Асимптотичните разпределения и критичните стойности за ta9 статистиката, първоначално дадени от Perron, са валидни за модели с извънредни стойности на иновациите.

Тест на Филипс-Перон - критерий, който намалява тестването на хипотезата, че серията xt принадлежи към класа на DS-сериите, до тестване на хипотезата R0: av = O в рамките на статистически модел

SM: kxt=a + f3t + (pxt_x+un t = 2,...,T,

където, както в критерия на Дики-Фулър, параметрите an p могат да се приемат равни на нула.

Въпреки това, за разлика от критерия на Дики-Фулър, е разрешен за разглеждане по-широк клас времеви редове.

Критерият се основава на G-статистика за тестване на хипотезата H0:<р = О, но использует вариант этой статистики Zn скорректированный на возможную автокоррелированность и гетероскедастичность ряда иг

Тест на Шмид-Филипс - критерий за проверка на хипотезата за единичен корен в рамките на модела

където wt = jSwt_x + st; t - 2,G;

y/ - параметър, представящ нивото; £ е параметър, представящ тенденцията.

Критерият DF-GLS (тест DF-GLS) е критерий, който е асимптотично по-мощен от критерия на Дики-Фулър.

Ексцесът е пикът на коефициента на разпределение.

Модел на адитивно отклонение е модел, при който след преминаване през датата на прекъсване Tb серията yt незабавно започва да се колебае около ново ниво (или нова линия на тенденция).

Моделът на отклонение от иновациите е модел, при който след преминаване през датата на прекъсване Tv, процесът yt само постепенно достига ново ниво (или нова линия на тенденция), около което траекторията на серията започва да се колебае.

Многовариантна процедура за тестване на хипотезата за единичен корен (Dolado, Jenkinson, Sosvilla-Rivero) - формализирана процедура за използване на критериите на Дики-Фулър с последователна проверка на възможността за намаляване на първоначалния статистически модел, който моделът се счита за

PAxt = a + fit + (pxt_x + ^0jAxt-j +£7> t = P + h---9T.

Предпоставка за използване на формализирана многовариантна процедура е ниската мощност на тестовете за единичен корен. Следователно многовариантната процедура включва повтарящи се тестове на хипотезата за единичен корен в по-прости модели с по-малко параметри за оценка. Това увеличава вероятността за правилно отхвърляне на хипотезата за единичния корен, но е придружено от загуба на контрол върху нивото на значимост на процедурата.

Обобщен тест на Perron - безусловен критерий, предложен от Zivot и Andrews (свързан с иновативни емисии), при който датирането на точката на промяна на режима се извършва в „автоматичен режим“, чрез търсене във всички възможни опции за датиране и изчисляване за всяко датиране опция / -статистика ta за тестване на хипотезата за единичен корен; Приблизителната дата се приема като тази, за която стойността на ta е минимална.

Процедура на Cochrane, тест за съотношение на дисперсии - процедура за разграничаване на TS и /)5-серии, въз основа на специфичното поведение за тези

серия от връзката VRk = -, където Vk = -D(Xt -Xt_k).

Стандартното брауново движение е случаен процес W(r) с непрекъснато време, което е непрекъснат аналог на дискретно случайно блуждаене. Това е процес, за който:

увеличенията (W(r2) W(r()),(W(rk) W(rk_x)) са колективно независими, ако 0< rx < г2 < ... < гк и W(s) W(r) ~ N(0, s г) при s >G;

реализациите на процеса W(r) са непрекъснати с вероятност 1.

Размерът на прозореца е броят на примерните автоковариации на серията, използвани в оценката на Newey-West за дългосрочната дисперсия на серията. Недостатъчната ширина на прозореца води до отклонения от номиналния размер на критерия (ниво на значимост). В същото време увеличаването на ширината на прозореца, за да се избегнат отклонения от номиналния размер на критерия, води до намаляване на мощността на критерия.

Двумерният бял шум на Гаус е поредица от независими, идентично разпределени произволни вектори, имащи двумерно нормално разпределение с нулево математическо очакване.

Детерминистичната коинтеграция (стохастична коинтеграция) е съществуването на група от интегрирани серии на тяхната линейна комбинация, отменяйки стохастичните и детерминистичните тенденции. Серията, представена от тази линейна комбинация, е неподвижна.

Идентифицирането на коинтегриращите вектори е изборът на основа за коинтегриращото пространство, състоящо се от коинтегриращи вектори, които имат разумна икономическа интерпретация.

Коинтегриращо пространство е множеството от всички възможни коинтегриращи вектори за коинтегрираща система от серии.

Коинтегрирани времеви редове, коинтегрирани времеви редове в тесен смисъл, е група от времеви редове, за които има нетривиална линейна комбинация от тези редове, която е стационарна серия.

Коинтегриращият вектор е вектор от коефициенти на нетривиална линейна комбинация от няколко серии, която е стационарна серия.

Максимален критерий собствена стойност(тест за максимална собствена стойност) е критерий, който в процедурата на Йохансен за оценка на коинтеграционния ранг r на система от интегрирани (порядък 1) серии се използва за тестване на хипотезата H0: r = g* срещу алтернативната хипотеза HA: r = g* + 1.

Тестът за проследяване е критерий, който в процедурата на Йохансен за оценка на ранга на коинтеграция g на система от интегрирани (порядък 1) серии се използва за тестване на хипотезата H0: r = r* срещу алтернативната хипотеза HA: r > g* .

Общите тенденции са група серии, които контролират стохастичната нестационарност на система от коинтегрирани серии.

Причинно-следствената връзка на Грейнджър е фактът за подобряване на качеството на прогнозата на стойността yt на променливата Y в момент t въз основа на съвкупността от всички минали стойности на тази променлива, като се вземат предвид миналите стойности на друга променлива.

Пет ситуации в процедурата на Йохансен - пет ситуации, от които зависят критичните стойности на статистиката на критериите за отношение на вероятността, използвани в процедурата на Йохансен за оценка на коинтеграционния ранг на система от интегрирани (порядък 1) серии:

H2(d): няма детерминистични тенденции в данните, нито константа, нито тенденция са включени в SE;

H*(g): няма детерминистични тенденции в данните,

CE включва константа, но не включва тенденция;

Hx (g): данните имат детерминистична линейна тенденция, CE включва константа, но не включва тенденция;

Н*(r) в данните има детерминиран линеен тренд, в SE са включени константа и линеен тренд;

N(g): данните имат детерминистична квадратична тенденция, CE включва постоянна и линейна тенденция.

(Тук CE е коинтеграционното уравнение.)

За фиксиран ранг r изброените 5 ситуации образуват верига от вложени хипотези:

H2(g) с H*(g) с I, (g) с Ng) с H(g).

Това дава възможност, използвайки критерия за съотношението на вероятността, да се тества изпълнението на хипотезата, разположена вляво в тази верига, в рамките на хипотезата, разположена непосредствено вдясно.

Коинтегриращият ранг е максималният брой линейно независими коинтегриращи вектори за дадена група серии, рангът на коинтегриращото пространство.

Стохастичната коинтеграция е съществуването на група от интегрирани серии на линейна комбинация, която отменя стохастичната тенденция. Серията, представена от тази линейна комбинация, не съдържа стохастична тенденция, но може да има детерминирана тенденция.

Триъгълната система на Филипс е представяне на телевизионната система от коинтегрирани серии с коинтеграционен ранг r под формата на система от уравнения, първите r от които описват зависимостта на r избрани променливи от останалите (N r) променливи (общи тенденции) , а останалите уравнения описват модели за генериране на общи тенденции.

ТВ-размерният бял шум на Гаус (N-мерен Гаусов бял шум) е последователност от независими, идентично разпределени произволни вектори, имащи ТВ-измерно нормално разпределение с нулево математическо очакване.

За да се опишат асимптотични оценки, има система за обозначения:

§ Казват, че f(n)= О(g(n)), ако има константа c>0 и число n0, така че условието 0≤f(n)≤c*g(n) да е изпълнено за всички n≥n0. По-официално:

(()) { () | 0, } 0 0 O g n= fn$° С> $н"н> н£ fn£ cg n

О(g(n)) се използва за обозначаване на функции, които са не повече от постоянен брой пъти по-големи от g(n), този вариант се използва за описание на горни граници (в смисъл на „не по-лошо от“). Когато говорим за конкретен алгоритъм за решаване на конкретен проблем, целта на анализа на времевата сложност на този алгоритъм е да се получи оценка за най-лошото време или средно, обикновено асимптотична оценка отгоре О(g(n)), и, ако е възможно, асимптотично по-ниска оценка за W(g(n)), и дори по-добре, асимптотично точна оценка за Q(g(n)).

Но остава въпросът: може ли да има още по-добри алгоритми за решение на този проблем? Този въпрос поставя проблема за намиране на по-ниска оценка на времевата сложност за самия проблем (за всички възможни алгоритми за решаването му, а не за един от известните алгоритми за решаването му). Въпросът за получаване на нетривиални долни граници е много труден. Към днешна дата няма много такива резултати, но са доказани нетривиални долни граници за някои ограничени компютърни модели и някои от тях играят важна роля в практическото програмиране. Един от проблемите, за които е известна долна граница за времева сложност, е проблемът за сортиране:

§ Дадена е последователност от n елемента a1,a2,... an, избрани от множеството, на което е зададен линейният ред.

§ Изисква се да се намери пермутация p от тези n елемента, която да преобразува дадената последователност в ненамаляваща последователност ap(1),ap(2),... ap(n), т.е. ap(i)≤ap(i+1) за 1≤i метод на смесване . Нека имаме два проблема A и B, които са свързани по такъв начин, че проблем A може да бъде решен по следния начин:

1) Изходните данни за задача А се преобразуват в съответните изходни данни

данни за задача Б.

2) Задача B се решава.

3) Резултатът от решаването на задача B се преобразува в правилното решение на задача A.__ В този случай казваме, че задача А свеждащи се до проблема B. Ако стъпки (1) и (3) по-горе могат да бъдат изпълнени навреме О(t(n)), където, както обикновено, n е 25 „обем“ на задача A, тогава казваме, че A t (n)-сводимо до B и го напишете така: A μt (н) B. Най-общо казано, сводимостта не е симетрична връзка; в специалния случай, когато A и B са взаимно сводими, ние ги наричаме еквивалентни. Следващите две очевидни твърдения характеризират силата на метода на редукция при допускането, че тази редукция запазва реда на „обхвата“ на проблема.

"О" голямоИ "о" малко( и ) - математически означения за сравняване на асимптотичното поведение на функциите. Те се използват в различни клонове на математиката, но най-активно в математическия анализ, теорията на числата и комбинаториката, както и в компютърните науки и теорията на алгоритмите.

, « Омалък от " означава "безкрайно малък спрямо " [, пренебрежимо малко количество, когато се разглежда. Значението на термина „О голям“ зависи от неговата област на приложение, но винаги расте не по-бързо от „ Оголям от "(точните определения са дадени по-долу).

В частност:

Продължение 7

фразата „сложността на алгоритъма е“ означава, че с увеличаване на параметъра, характеризиращ количеството входна информация на алгоритъма, времето на работа на алгоритъма не може да бъде ограничено до стойност, която расте по-бавно от н!;

фразата „функцията е „около“ малка от функцията в околността на точката“ означава, че с приближаването на k намалява по-бързо от (съотношението клони към нула).

Правило за сумата: Нека крайно множество M е разделено на две несвързани подмножества M 1 и M 2 (в обединение, което дава цялото множество M). Тогава степента |M| = |M 1 | + |M 2 |.

Продуктово правило: Нека обект a в определен набор да бъде избран по n начина и след това (т.е. след избор на обект a), обект b може да бъде избран по m начина. Тогава обектът ab може да бъде избран по n*m начина.

Коментирайте: И двете правила позволяват индуктивно обобщение. Ако крайно множество M допуска разделяне на r по двойки несвързани подмножества M 1 , M 2 ,…,M r , тогава мощността |M| = |M 1 |+|M 2 |+…+|M r |. Ако обект A 1 може да бъде избран по k 1 начина, тогава (след като обект A 1 е избран) обект A 2 може да бъде избран по k 2 начина и така нататък и накрая, обект AR може да бъде избран по k начина, след това обект A 1 A 2 ... И r може да бъде избрано по k 1 k 2 ... k r начина.

Определение. Посоката, определена от ненулев вектор, се нарича асимптотична посока спрямо линията от втори ред, ако всякакви права линия в тази посока (т.е. успоредна на вектора) или има най-много една обща точка с правата, или се съдържа в тази права.

? Колко общи точки могат да имат права от втори ред и права с асимптотична посока спрямо тази права?

В общата теория на линиите от втори ред е доказано, че ако

Тогава ненулевият вектор ( определя асимптотичната посока спрямо правата

(общ критерий за асимптотична посока).

За линии от втори ред

ако , тогава няма асимптотични посоки,

ако тогава има две асимптотични посоки,

ако тогава има само една асимптотична посока.

Следната лема се оказва полезна ( критерий за асимптотичната посока на линия от параболичен тип).

Лема . Нека е линия от параболичен тип.

Ненулевият вектор има асимптотична посока

относително . (5)

(Задача: Докажете лемата.)

Определение. Правата линия на асимптотичната посока се нарича асимптота линия от втори ред, ако тази права или не се пресича с нея, или се съдържа в нея.

Теорема . Ако има асимптотична посока спрямо , тогава асимптотиката, успоредна на вектора, се определя от уравнението

Да попълним таблицата.

ЗАДАЧИ.

1. Намерете векторите на асимптотичните посоки за следните линии от втори ред:

4 - хиперболичен тип две асимптотични посоки.

Нека използваме критерия за асимптотична посока:

Има асимптотична посока спрямо тази линия 4.

Ако =0, тогава =0, тоест нула. След това разделете на Получаваме квадратно уравнение: , където t = . Решаваме това квадратно уравнение и намираме две решения: t = 4 и t = 1. Тогава асимптотичните посоки на правата .

(Могат да бъдат разгледани два метода, тъй като линията е от параболичен тип.)

2. Разберете дали координатните оси имат асимптотични посоки спрямо линиите от втори ред:

3. Напишете общото уравнение на линия от втори ред, за което

а) оста x има асимптотична посока;

б) И двете координатни оси имат асимптотични посоки;

в) координатните оси имат асимптотични посоки и O е центърът на правата.

4. Напишете уравненията на асимптотите за линиите:

a) ng w:val="EN-US"/>г=0"> ;

5. Докажете, че ако права от втори ред има две неуспоредни асимптоти, то тяхната пресечна точка е центърът на тази права.

Забележка:Тъй като има две непаралелни асимптоти, има две асимптотични посоки, тогава , и следователно линията е централна.

Запишете уравненията на асимптотите в общ вид и системата за намиране на центъра. Всичко е очевидно.

6.(№ 920) Напишете уравнението на хипербола, минаваща през точка A(0, -5) и имаща асимптоти x – 1 = 0 и 2x – y + 1 = 0.

Забележка. Използвайте твърдението от предишната задача.

Домашна работа . , № 915 (c, e, f), № 916 (c, d, e), № 920 (ако не сте имали време);

детски креватчета;

Силаев, Тимошенко. Практически задачив геометрията,

1-ви семестър. С.67, въпроси 1-8, стр.70, въпроси 1-3 (устен).

ДИАМЕТРИ НА ЛИНИИ ВТОРИ РЕД.

СВЪРЗВАНИ ДИАМЕТРИ.

Дана афинна системакоординати

Определение. Диаметър линия от втори ред, спрегната на вектор с неасимптотична посока по отношение на , е набор от средни точки на всички хорди на правата, успоредни на вектора .

По време на лекцията беше доказано, че диаметърът е права линия и беше получено нейното уравнение

Препоръки: Покажете (на елипса) как е конструирана (задаваме неасимптотична посока; начертайте [две] прави линии в тази посока, пресичащи линията; намерете средните точки на хордите, които трябва да бъдат отрязани; начертайте права линия през средни точки - това е диаметърът).

Обсъдете:

1. Защо при определяне на диаметъра се взема вектор с неасимптотична посока. Ако не могат да отговорят, помолете ги да конструират диаметъра, например за парабола.

2. Всяка линия от втори ред има ли поне един диаметър? Защо?

3. По време на лекцията беше доказано, че диаметърът е права линия. Средната точка на коя хорда е точка М на фигурата?


4. Погледнете скобите в уравнение (7). За какво ви напомнят?

Извод: 1) всеки център принадлежи на всеки диаметър;

2) ако има линия от центрове, тогава има единичен диаметър.

5. Каква посока имат диаметрите на параболична линия? (Асимптотичен)

Доказателство (вероятно в лекция).

Нека диаметърът d, даден от уравнение (7`), е спрегнат на вектор с неасимптотична посока. След това векторът на посоката

(-(), ). Нека покажем, че този вектор има асимптотична посока. Нека използваме критерия на вектора на асимптотичната посока за линия от параболичен тип (виж (5)). Нека заменим и се уверим (не забравяйте, че .

6. Колко диаметъра има параболата? Относителното им положение? Колко диаметъра имат останалите параболични линии? Защо?

7. Как да конструираме общия диаметър на някои двойки линии от втори ред (вижте въпроси 30, 31 по-долу).

8. Попълваме таблицата и не забравяйте да направите рисунки.

1. . Напишете уравнение за множеството от среди на всички хорди, успоредни на вектора

2. Напишете уравнението за диаметъра d, минаващ през точката K(1,-2) за правата.

Стъпки на решението:

1-ви метод.

1. Определете типа (за да знаете как се държат диаметрите на тази линия).

В този случай линията е централна, тогава всички диаметри минават през център C.

2. Съставяме уравнението на права линия, минаваща през две точки K и C. Това е търсеният диаметър.

2-ри метод.

1. Записваме уравнението за диаметър d във вида (7`).

2. Замествайки координатите на точка K в това уравнение, намираме връзката между координатите на вектора, спрегнат към диаметъра d.

3. Задаваме този вектор, като вземем предвид намерената зависимост, и съставяме уравнение за диаметър d.

В този проблем е по-лесно да се изчисли с помощта на втория метод.

3. . Напишете уравнение за диаметъра, успореден на оста x.

4. Намерете средата на хордата, отрязана от линията

на правата x + 3y – 12 =0.

Насоки към решението: Разбира се, можете да намерите точките на пресичане на правата линия и данните за линията, а след това и средата на получения сегмент. Желанието да направим това изчезва, ако вземем например права линия с уравнението x +3y – 2009 =0.

АСИМПТОТИЧНИ КРИТЕРИИ ЗА ЕФЕКТИВНОСТ

Концепция, която позволява, в случай на големи извадки, да се определят количествено две различни статистики. критерии, използвани за проверка на неверни и същите статистики. хипотези. Необходимостта от измерване на ефективността на критериите възниква през 30-40-те години, когато е проста по отношение на изчисленията, но неефективна

Математическа енциклопедия. - М.: Съветска енциклопедия.

И. М. Виноградов.

    1977-1985 г.Вижте какво е "ЕФЕКТИВЕН АСИМПТОТИЧЕН КРИТЕРИЙ" в други речници: Коефициент на корелация

    - (Коефициент на корелация) Коефициентът на корелация е статистически показател за зависимостта на две случайни величини Определение на коефициента на корелация, видове коефициенти на корелация, свойства на коефициента на корелация, изчисление и приложение... ... Енциклопедия на инвеститора

    Математически методи статистики, които не изискват познаване на функционалната форма на общите разпределения. Наименованието непараметрични методи подчертава тяхната разлика от класическите параметрични методи, при които се приема, че общият... ... Енциклопедия на инвеститора

Математическа енциклопедия

  • Безопасна защита на растенията от болести и неприятели през юли и август Безопасна защита на растенията от болести и неприятели през юли и август

    Процесът на представяне на информация в определена стандартна форма и обратният процес на възстановяване на информация според нейното представяне. По математика в литературата кодирането се нарича картографирането на произволно множество AB е множество от крайни... ...

  • Публикации по темата Публикации по темата

    Нашите предци също са знаели, че добрата реколта зависи не само от упорита и отговорна работа, но и от фазите на луната. Разберете и сте благосклонни...