Асимптотични свойства на базирана на характеризиране симетрия и тестове за съгласие. Асимптотично поведение на функциите. сравнение на безкрайно малки функции. Асимптотични критерии за избор

Точните тестове предоставят два допълнителни метода за изчисляване на нивата на значимост за статистическите данни, налични чрез процедурите за кръстосани таблици и непараметрични тестове. Тези методи, точният метод и методът на Монте Карло, предоставят средства за получаване на точни резултати, когато вашите данни не отговарят на някое от основните предположения, необходими за надеждни резултати, използвайки стандартния асимптотичен метод. Предлага се само ако сте закупили опциите за точни тестове.

Пример.Асимптотични резултати, получени от малки набори от данни или редки или небалансирани таблици, могат да бъдат подвеждащи. Точните тестове ви позволяват да получите точно ниво на значимост, без да разчитате на предположения, които може да не бъдат изпълнени от вашите данни. Например, резултатите от приемен изпит за 20 пожарникари в малък град показват, че и петимата бели кандидати са получили положителен резултат, докато резултатите за чернокожите, азиатските и латиноамериканските кандидати са смесени. Хи-квадрат на Пиърсън, тестващ нулевата хипотеза, че резултатите са независими от расата, дава асимптотично ниво на значимост от 0,07. Този резултат води до заключението, че резултатите от изпита са независими от расата на изпитвания. Въпреки това, тъй като данните съдържат само 20 случая и клетките имат очаквани честоти по-малки от 5, този резултат не е надежден. Точната значимост на хи-квадрат на Пиърсън е 0,04, което води до обратното заключение. Въз основа на точното значение бихте заключили, че резултатите от изпита и расата на изпитвания са свързани. Това демонстрира важността на получаването на точни резултати, когато предположенията на асимптотичния метод не могат да бъдат изпълнени. Точното значение винаги е надеждно, независимо от размера, разпределението, разрядността или баланса на данните.

Статистика.Асимптотична значимост. Приближение Монте Карло с ниво на достоверност или точно значение.

  • Асимптотичен. Нивото на значимост въз основа на асимптотичното разпределение на тестова статистика. Обикновено стойност под 0,05 се счита за значима. Асимптотичното значение се основава на предположението, че наборът от данни е голям. Ако наборът от данни е малък или лошо разпределен, това може да не е добра индикация за значимост.
  • Оценка на Монте Карло. Безпристрастна оценка на точното ниво на значимост, изчислено чрез многократно вземане на проби от референтен набор от таблици със същите размери и граници на редове и колони като наблюдаваната таблица. Методът Монте Карло ви позволява да оцените точната значимост, без да разчитате на предположенията, необходими за асимптотичния метод. Този метод е най-полезен, когато наборът от данни е твърде голям, за да се изчисли точната значимост, но данните не отговарят на допусканията на асимптотичния метод.
  • Точно. Вероятността за наблюдавания резултат или по-краен резултат се изчислява точно. , ниво на значимост по-малко от 0,05 се счита за значимо, което показва, че обикновено има някаква връзка между променливите в реда и колоната.

За да се опишат асимптотични оценки има система за обозначения:

§ Казват, че f(n)= О(g(n)), ако има константа c>0 и число n0, така че условието 0≤f(n)≤c*g(n) да е изпълнено за всички n≥n0. По-официално:

(()) { () | 0, } 0 0 О г н= fn$c> $п"п> п£ fn£ cg n

О(g(n)) се използва за обозначаване на функции, които са не повече от постоянен брой пъти по-големи от g(n), този вариант се използва за описание на горни граници (в смисъл на „не по-лошо от“). Когато говорим за конкретен алгоритъм за решаване на конкретен проблем, целта на анализа на времевата сложност на този алгоритъм е да се получи оценка за най-лошото време или средно, обикновено асимптотична оценкапо-горе О(g(n)), и, ако е възможно, асимптотично по-ниска оценка за W(g(n)), и дори по-добре, асимптотично точна оценка за Q(g(n)).

Но остава въпросът: може ли да има още по-добри алгоритми за решение на този проблем? Този въпрос поставя проблема за намиране на по-ниска оценка на времевата сложност за самия проблем (за всички възможни алгоритми за решаването му, а не за един от известните алгоритми за решаването му). Въпросът за получаване на нетривиални долни граници е много труден. Към днешна дата няма много такива резултати, но са доказани нетривиални долни граници за някои ограничени компютърни модели и някои от тях играят важна роля в практическото програмиране. Един от проблемите, за които е известна долна граница за времева сложност, е проблемът за сортиране:

§ Дадена е последователност от n елемента a1,a2,...an, избрани от множеството, на което е зададен линейният ред.

§ Изисква се да се намери пермутация p от тези n елемента, която да преобразува дадената последователност в ненамаляваща последователност ap(1),ap(2),... ap(n), т.е. ap(i)≤ap(i+1) за 1≤i метод на смесване . Нека имаме два проблема A и B, които са свързани по такъв начин, че проблем A може да бъде решен по следния начин:

1) Изходните данни за задача А се преобразуват в съответните изходни данни

данни за задача Б.

2) Задача B се решава.

3) Резултатът от решаването на задача B се преобразува в правилното решение на задача A.__ В този случай казваме, че задача А свеждащи се до проблема B. Ако стъпки (1) и (3) по-горе могат да бъдат изпълнени навреме О(t(n)), където, както обикновено, n е 25 „обем“ на задача A, тогава казваме, че A t (n)-сводимо до B и го напишете така: A μt (н) B. Най-общо казано, сводимостта не е симетрична връзка; в специалния случай, когато A и B са взаимно сводими, ние ги наричаме еквивалентни. Следващите две очевидни твърдения характеризират силата на метода на редукция при допускането, че тази редукция запазва реда на „обхвата“ на проблема.

"О" голямоИ "о" малко( и ) - математически означения за сравняване на асимптотичното поведение на функциите. Те се използват в различни клонове на математиката, но най-активно в математическия анализ, теорията на числата и комбинаториката, както и в компютърните науки и теорията на алгоритмите.

, « Омалък от " означава "безкрайно малък спрямо " [, пренебрежимо малко количество, когато се разглежда. Значението на термина „О голям“ зависи от неговата област на приложение, но винаги расте не по-бързо от „ Оголям от "(точните определения са дадени по-долу).

По-специално:

Продължение 7

фразата „сложността на алгоритъма е“ означава, че с увеличаване на параметъра, характеризиращ количеството входна информация на алгоритъма, времето на работа на алгоритъма не може да бъде ограничено до стойност, която расте по-бавно от п!;

фразата „функцията е „около“ малка от функцията в околността на точката“ означава, че с приближаването на k намалява по-бързо от (съотношението клони към нула).

Правило за сумата: Нека крайно множество M е разделено на две несвързани подмножества M 1 и M 2 (в обединение, което дава цялото множество M). Тогава степента |M| = |M 1 | + |M 2 |.

Продуктово правило: Нека обект a в определено множество бъде избран по n начина и след това (т.е. след избор на обект a) обект b може да бъде избран по m начина. Тогава обектът ab може да бъде избран по n*m начина.

Коментирайте: И двете правила позволяват индуктивно обобщение. Ако крайно множество M допуска разделяне на r по двойки несвързани подмножества M 1 , M 2 ,…,M r , тогава мощността |M| = |M 1 |+|M 2 |+…+|M r |. Ако обект A 1 може да бъде избран по k 1 начина, тогава (след като обект A 1 е избран) обект A 2 може да бъде избран по k 2 начина и така нататък и накрая, обект AR може да бъде избран по k начина, след това обект A 1 A 2 ... И r може да бъде избрано по k 1 k 2 ... k r начина.

АСИМПТОТИЧНИ КРИТЕРИИ ЗА ЕФЕКТИВНОСТ

Концепция, която позволява, в случай на големи извадки, да се определят количествено две различни статистики. критерии, използвани за проверка на неверни и същите статистики. хипотези. Необходимостта от измерване на ефективността на критериите възниква през 30-40-те години, когато е проста по отношение на изчисленията, но неефективна

Математическа енциклопедия. - М.: Съветска енциклопедия.

И. М. Виноградов.

    1977-1985 г.Вижте какво е "ЕФЕКТИВЕН АСИМПТОТИЧЕН КРИТЕРИЙ" в други речници: Коефициент на корелация- (Коефициент на корелация) Коефициентът на корелация е статистически показател за зависимостта на две случайни променливи

    Определение на коефициента на корелация, видове коефициенти на корелация, свойства на коефициента на корелация, изчисляване и приложение... ... Енциклопедия на инвеститора

    Математически методи статистики, които не изискват познаване на функционалната форма на общите разпределения. Наименованието непараметрични методи подчертава тяхната разлика от класическите параметрични методи, при които се приема, че общият... ... Енциклопедия на инвеститора

Математическа енциклопедия

Процесът на представяне на информация в определена стандартна форма и обратният процес на възстановяване на информация според нейното представяне. По математика в литературата кодирането се нарича картографирането на произволно множество AB е множество от крайни... ...

В съвременните условия интересът към анализа на данни непрекъснато и интензивно нараства в напълно различни области като биология, лингвистика, икономика и, разбира се, ИТ. В основата на този анализ са статистическите методи и всеки уважаващ себе си специалист по извличане на данни трябва да ги разбира.


За съжаление наистина добрата литература, която може да предостави както математически строги доказателства, така и ясни, интуитивни обяснения, не е много често срещана. И тези лекции, според мен, са необичайно добри за математици, които разбират теорията на вероятностите точно поради тази причина. Те се преподават на магистри в немския университет Кристиан-Албрехт в програмите по математика и финансова математика. А за тези, които се интересуват как се преподава този предмет в чужбина, преведох тези лекции. Превеждането ми отне няколко месеца, разредих лекциите с илюстрации, упражнения и бележки под линия към някои теореми. Искам да отбележа, че не съм професионален преводач, а просто алтруист и любител в тази област, така че приемам всякаква критика, ако е градивна.

Накратко това е темата на лекциите: Условно математическо очакванеТази глава не се отнася пряко до статистиката, но е идеална за започване на нейното изучаване. Условно

математическо очакване

Как да оценим параметъра на разпределението? Какъв критерий трябва да избера за това? Какви методи трябва да използвам? Тази глава ви позволява да отговорите на всички тези въпроси. Тук въвеждаме концепциите за безпристрастен оценител и равномерно безпристрастен оценител на минимална дисперсия. Обяснява откъде идват хи-квадрат и t-разпределенията и защо те са важни при оценяването на параметрите на нормалното разпределение. Обяснява какво представляват неравенството на Рао-Крамер и информацията на Фишер. Въвежда се и концепцията за експоненциално семейство, което значително улеснява получаването на добра оценка.

Байесова и минимаксна оценка на параметрите

Това описва различен философски подход към оценката. В този случай параметърът се счита за неизвестен, тъй като е реализация на определена случайна променлива с известно (априорно) разпределение. Като наблюдаваме резултата от експеримента, изчисляваме така нареченото задно разпределение на параметъра. Въз основа на това можем да получим байесов оценител, където критерият е минималната средна загуба, или минимаксен оценител, който минимизира максималната възможна загуба.

Достатъчност и пълнота

Тази глава има сериозно практическо значение. Достатъчна статистика е функция на извадката, така че е достатъчно да се съхрани само резултатът от тази функция, за да се оцени параметърът. Има много такива функции и сред тях е така наречената минимална достатъчна статистика. Например, за да се оцени медианата на нормално разпределение, е достатъчно да се съхрани само едно число - средното аритметично за цялата извадка. Това работи ли и за други разпределения, като разпределението на Коши? Как достатъчно статистически данни помагат при избора на прогнози? Тук можете да намерите отговори на тези въпроси.

Асимптотични свойства на оценките

Може би най-важното и необходимо свойство на оценката е нейната последователност, тоест тенденцията към истински параметър с увеличаване на размера на извадката. Тази глава описва какви свойства притежават познатите ни оценки, получени чрез статистическите методи, описани в предишните глави. Въвеждат се понятията асимптотична безпристрастност, асимптотична ефективност и разстояние Кулбак-Лайблер.

Основи на тестването

В допълнение към въпроса как да оценим параметър, който не ни е известен, трябва по някакъв начин да проверим дали той отговаря на необходимите свойства. Например, провежда се експеримент за тестване на ново лекарство. Как да разберете дали вероятността за възстановяване е по-висока с него, отколкото с използването на стари лекарства? Тази глава обяснява как се конструират такива тестове. Ще научите кой е единно най-мощният тест, тестът на Нейман-Пиърсън, нивото на значимост, доверителният интервал и откъде идват добре познатите тест на Гаус и t-тест.

Асимптотични свойства на критериите

Подобно на оценките, критериите трябва да отговарят на определени асимптотични свойства. Понякога могат да възникнат ситуации, когато е невъзможно да се конструира необходимия критерий, но с помощта на добре известната централна гранична теорема ние конструираме критерий, който асимптотично клони към необходимия. Тук ще научите какво е асимптотичното ниво на значимост, метода на съотношението на вероятността и как са конструирани тестът на Бартлет и тестът хи-квадрат за независимост.

Линеен модел

Тази глава може да се разглежда като допълнение, а именно прилагането на статистика в случай на линейна регресия. Ще разберете какви оценки са добри и при какви условия. Ще научите откъде идва методът на най-малките квадрати, как да конструирате тестове и защо е необходимо F-разпределението.

1 Ентропия и информационно разстояние

1.1 Основни определения и означения.

1.2 Ентропия на дискретни разпределения с ограничено математическо очакване.

1.3 Логаритмична обобщена метрика върху набор от дискретни разпределения.

1.4 Компактност на функции с изброимо множество от аргументи

1.5 Непрекъснатост на информационното разстояние Kullback - Leibler - Sanov

1.6 Заключения.

2 Вероятности за големи отклонения

2.1 Вероятности за големи отклонения на функциите от броя на клетките с даден пълнеж.

2.1.1 Локална гранична теорема.

2.1.2 Теорема за интегрална граница.

2.1.3 Информационно разстояние и вероятности за големи отклонения на отделими статистики

2.2 Вероятности за големи отклонения на отделими статистики, които не отговарят на условието на Крамер.

2.3 Заключения.

3 Асимптотични свойства на критериите за добро съответствие

3.1 Критерии за съгласие за подбор без схема за връщане

3.2 Асимптотична относителна ефективност на критериите за съответствие.

3.3 Критерии, базирани на броя на клетките в общите оформления.

3.4 Заключения.

Препоръчителен списък с дисертации

  • Асимптотична ефективност на тестовете за добро съответствие, базирани на характеризиращи свойства на разпределенията 2011 г., кандидат на физико-математическите науки Волкова, Ксения Юриевна

  • Големи отклонения и гранични теореми за някои случайни функционали 2011 г., кандидат на физико-математическите науки Шкляев, Александър Викторович

  • Гранични теореми и големи отклонения за произволни стъпки 2004 г., кандидат на физико-математическите науки Козлов Андрей Михайлович

  • Относно степента на конвергенция на статистиката на тестовете за съответствие със степенни мерки на отклонение към разпределението хи-квадрат 2010 г., кандидат на физико-математическите науки Зубов, Василий Николаевич

  • Вероятности за големи отклонения на асимптотично хомогенни ергодични вериги на Марков в пространството 2004 г., доктор на физико-математическите науки Коршунов, Дмитрий Алексеевич

Въведение в дисертацията (част от автореферата) на тема „Асимптотични свойства на критериите за добро съответствие за тестване на хипотези в схема за избор без връщане, базирано на попълване на клетки в обобщена схема за поставяне“

Обект на изследване и актуалност на темата. В теорията на статистическия анализ на дискретни последователности специално място заемат тестовете за добро съответствие за тестване на евентуално сложна нулева хипотеза, която е тази за случайна последователност, такава че

Xi e hi,i = 1, ,n, където hi = (0,1,. ,M), за всяко i = 1,.,n и за всяко k £ 1m вероятността на събитието

Xi = k) не зависи от r. Това означава, че последователността е в някакъв смисъл стационарна.

В редица приложни проблеми последователността (Xr-)™ = 1 се счита за последователност от цветове на топки, когато се избира без връщане до изчерпване от урна, съдържаща n - 1 > 0 топки от цвят k, k € 1m - Ще обозначим множеството от такива селекции O(n0 - 1, .,pm - 1). Нека има общо n - 1 топки в урната, m k=0

Нека означим с r(k) (fc) Jk) rw - Г! , . . . , поредица от номера на топки от цвят A; в пробата. Разгледайте последователността, където k)

Kk-p-GPk1.

Последователността h^ се определя с помощта на разстоянията между местоположенията на съседни топки от цвят k по такъв начин, че

Pk Kf = 1>=1

Наборът от последователности h(fc) за всички k £ 1m еднозначно определя последователностите hk за различни k зависят една от друга. По-специално, всеки един от тях се определя еднозначно от всички останали. Ако кардиналността на набора 1m е 2, тогава последователността от цветове на топките се определя еднозначно от последователността на разстоянията между местата на съседни топки от същия фиксиран цвят. Нека урна, съдържаща n - 1 топки, има две различни цветове, има N - 1 топки с цвят 0. Може да се установи едно-към-едно съответствие между множеството ffl(N- l,n - N) и множеството 9\n,N вектора h(n, N) = (hi,., hjf) с положителни цели числа, така че K = P. (0,1)

Множеството 9РП)дг съответства на множеството от всички различни дялове на положително цяло число n на N подредени членове.

След като зададем определено вероятностно разпределение върху множеството от вектори £Hn,dr, получаваме съответното вероятностно разпределение върху множеството Wl(N - 1,n - N). Наборът е подмножество на набор от вектори с неотрицателни цели числа, които отговарят на (0.1). Разпределенията на формата ще се разглеждат като вероятностни разпределения върху набор от вектори в дисертационната работа

P(%,N) = (n,.,rN)) = P(£„ = ru,v = l,.,N\jr^ = n), (0.2) където. ,£dr - независими неотрицателни цели числа случайни променливи.

Разпределения от вида (0.2) в /24/ се наричат ​​обобщени схеми за разполагане на n частици в N клетки. По-специално, ако случайните променливи £b. ,£lg в (0.2) са разпределени съгласно законите на Поасон с параметри съответно Ai,., Ldr, тогава векторът h(n,N) има полиномиално разпределение с вероятностите за резултати

Ri = . , L", V = \,.,N.

L\ + . . . + АН

Ако случайните променливи £ь >&v в (0-2) са еднакво разпределени съгласно геометричния закон, където p е всяко в интервала 0< р < 1, то, как отмечено в /25/,/26/, получающаяся обобщенная схема размещения соответствует равномерному распределению на множестве В силу взаимнооднозначного соответствия между множеством dft(N - 1 ,п - N) и множеством tRn,N получаем равномерное распределение на множестве выборов без возвращения. При этом, вектору расстояний между местами шаров одного цвета взаимно однозначно соответствует вектор частот в обобщенной схеме размещения, и, соответственно, числу расстояний длины г - число ячеек, содержащих ровно г частиц. Для проверки по единственной последовательности гипотезы о том, что она получена как результат выбора без возвращения, и каждая такая выборка имеет одну и ту же вероятность можно проверить гипотезу о том, что вектор расстояний между местами шаров цвета 0 распределен как вектор частот в соответствующей обобщенной схеме размещения п частиц по N ячейкам.

Както е отбелязано в /14/, /38/, специално място в тестването на хипотези за разпределението на честотните вектори h(n, N) = (hi,., /gdr) в обобщени схеми за поставяне на n частици в N клетки заема по критерии, базирани на базата на статистика от формата 1 m(N -l,n-N)\ N

LN(h(n,N))=Zfv(hv)

Фн = Ф(-Т7, flQ Hi II-

0,4), където fu, v = 1,2,. и φ - някои реални функции, N

Mr = E = r), r = 0,1,. 1/=1

Величините в /27/ се наричат ​​брой клетки, съдържащи точно g частици.

Статистиките от формата (0.3) в /30/ се наричат ​​разделими (аддитивно разделими) статистики. Ако функциите /„ в (0.3) не зависят от u, тогава такива статистики се наричат ​​в /31/ симетрични разделими статистики.

За всяко r статистиката /xr е симетрична разделима статистика. От равенството

E DM = E DFg (0.5) следва, че класът на симетричните разделими статистики на hv съвпада с класа на линейните функции на fir. Освен това класът на функциите на формата (0.4) е по-широк от класа на симетричните разделими статистики.

Но = (#o(n, N)) е поредица от прости нулеви хипотези, че разпределението на вектора h(n, N) е (0.2), където са случайните променливи,. в (0.2) са еднакво разпределени и k) = pk,k = 0,1,2,., параметрите n, N се променят в централната област.

Да разгледаме някои P £ (0,1) и последователност от, най-общо казано, сложни алтернативи

H = (H(n, N)) такова, че съществува - максималният брой, за който, за всяка проста хипотеза H\ € H(n, N), неравенството е в сила

РШ > an,N(P)) > Р

Ще отхвърлим хипотезата Hq(ti,N), ако fm > asm((3). Ако има ограничение

Шп ~1пР(0н > an,N(P))=u(p,Н), където вероятността за всяко N се изчислява при хипотезата Нк(п, N), тогава стойността ^(/З, Н) е назован в /38/ индекс на критерия φ в точката (j3, H). Последната граница може, най-общо казано, да не съществува. Ето защо в дисертационния труд освен критериалния индекс се разглежда стойността

Ish (~1pP(fm > al(/?)))

JV->oo N-ooo означава съответно долната и горната граница на последователността (odg) за N -> oo,

Ако съществува индекс на критерия, тогава индексът на критерия съвпада с него. По-ниският индекс на критерия винаги съществува. Колкото по-висока е стойността на индекса на критерия (долния индекс на критерия), толкова по-добър е статистическият критерий в разглеждания смисъл. В /38/ проблемът за конструиране на критерии за съгласие за обобщени оформления с най-висока стойносткритерий индекс в класа от критерии, които отхвърлят хипотезата Ho(n,N) при /MO Ml Mt GC iV" iV""""" ~yv" " ^ " където m > 0 е някакво фиксирано число, последователността от константа единиците се избират въз основа на дадена стойност на мощността на критерия за последователност от алтернативи, ft е реална функция от m + 1 аргумента.

Индексите на критериите се определят от вероятностите за големи отклонения. Както беше показано в /38/, грубата (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на отделими статистики, когато условието на Крамер е изпълнено за случайната променлива /(ξ) се определя от съответния Kull-Bak-Leibler- Информационно разстояние на Санов (случайната променлива rj удовлетворява условието Крамер, ако за някои R > 0 генериращата момент функция Metr] е крайна в интервала \t\< Н /28/).

Въпросът за вероятностите за големи отклонения на статистиката от неограничен брой ели, както и за произволни отделими статистики, които не отговарят на условието на Крамер, остана отворен. Това не ни позволи окончателно да решим проблема с конструирането на критерии за тестване на хипотези в обобщени схеми за поставяне с най-висок процент на сближаване на вероятността от грешка от първи вид до нула с алтернативи, които не се приближават в класа от критерии, базирани на статистика на формата (0.4). Актуалността на дисертационното изследване се определя от необходимостта от завършване на решението на поставения проблем.

Целта на дисертационния труд е да се конструират критерии за съответствие с най-висока стойност на индекса на критерия (долен индекс на критерия) за проверка на хипотези в схема за подбор без връщане в класа критерии, които отхвърлят хипотезата U(n , N) за $.<>,■ ■)><*. (0-7) где ф - функция от счетного количества аргументов, и параметры п, N изменяются в центральной области.

В съответствие с целта на изследването бяха поставени следните задачи:

Изследвайте свойствата на ентропията и информационното разстояние Kull-Bak - Leibler - Sanov за дискретни разпределения с изброим брой резултати;

Изследване на вероятностите за големи отклонения на статистиката на формата (0,4);

Изследване на вероятностите за големи отклонения на симетрични сепарируеми статистики (0,3), които не отговарят на условието на Крамер;

Намерете такава статистика, че критерият за съответствие, конструиран въз основа на него за тестване на хипотези в обобщени оформления, има най-високата стойност на индекса в класа от критерии на формата (0,7).

Научна новост:

Научна и практическа стойност. Работата решава редица въпроси относно поведението на вероятностите за големи отклонения в обобщените схеми за разположение. Получените резултати могат да се използват в образователен процесв специалностите по математическа статистика и теория на информацията, при изучаване на статистически процедури за анализ на дискретни последователности и са използвани в /3/, /21/ при обосноваване на сигурността на един клас информационни системи. Разпоредби за защита:

Намаляване на проблема с тестването, базирано на една последователност от цветове на топки, хипотезата, че тази последователност е получена в резултат на избор без връщане, докато топките бъдат изчерпани от урна, съдържаща топки от два цвята, и всеки такъв избор има същата вероятност, за изграждането на критерии за добро съответствие за тестване на хипотези в съответното обобщено оформление;

Непрекъснатост на функциите на ентропията и информационното разстояние на Кулбак-Лайблер-Санов върху безкрайномерен симплекс с въведената логаритмична обобщена метрика;

Теорема за грубата (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения на симетрични сепарируеми статистики, които не отговарят на условието на Крамер в схемата на обобщено разположение в полуекспоненциалния случай;

Теорема за груба (до логаритмична еквивалентност) асимптотика на вероятностите за големи отклонения за статистика от вида (0.4);

Изграждане на критерий за съответствие за проверка на хипотези в обобщени оформления с най-висока стойност на индекса в класа критерии на формата (0.7).

Апробация на работата. Резултатите бяха представени на семинари на катедрата по дискретна математика на Математическия институт на име. V. A. Steklov RAS, отдел за информационна сигурност на ITM&VT на име. S. A. Lebedev RAS и в:

Пети общоруски симпозиум по приложна и промишлена математика. Пролетна сесия, Кисловодск, 2 - 8 май 2004 г.;

Шеста международна Петрозаводска конференция "Вероятностни методи в дискретната математика" 10 - 16 юни 2004 г.;

Втора международна конференция " Информационни системии технологии (IST"2004), Минск, 8-10 ноември 2004 г.;

Международна конференция "Съвременни проблеми и нови тенденции в теорията на вероятностите", Черновци, Украйна, 19 - 26 юни 2005 г.

Основните резултати от работата са използвани в изследователската работа "Апология", извършена от ИТМиВТ РАН. С. А. Лебедев в интерес на Федералната служба за технически и експортен контрол на Руската федерация и бяха включени в доклада за изпълнението на етапа на изследването /21/. Някои резултати от дисертацията са включени в научния доклад "Развитие на математическите проблеми на криптографията" на Академията по криптография на Руската федерация за 2004 г. /22/.

Авторът изказва дълбока благодарност на научния ръководител, доктор на физико-математическите науки Ронжин А. Ф. и научния консултант, доктор на физико-математическите науки, ст. н. с. А. В. Князев Авторът изказва благодарност на доктора на физико-математическите науки, професор А. М. Зубков. и кандидат на физико-математическите науки Математически науки И. А. Круглов за вниманието към работата и редица ценни коментари.

Структура и съдържание на работата.

Първата глава разглежда свойствата на ентропията и информационното разстояние за разпределения върху множеството от неотрицателни цели числа.

В първия параграф на първа глава се въвеждат обозначения и се дават необходимите определения. По-специално се използва следната нотация: x = (xq,x\, . ) - безкрайномерен вектор с изброим брой компоненти;

H(x) - -Ex^oXvlnx,-, truncm(x) = (x0,x1,.,xm,0,0,.)] f2* = (x, xi > 0, zy = 0,1,. , О "< 1}; Q = {х, х, >0,u = 0,1,., o xv = 1); = (x G O, ££L0 = 7);

Ml = o Ue>1|5 € o< Ml - 7МГ1 < 00}. Понятно, что множество £1 соответствует семейству вероятностных распределений на множестве неотрицательных целых чисел, П7 - семейству вероятностных распределений на множестве неотрицательных целых чисел с математическим ожиданием 7.

Ако y 6E P, тогава за e > 0 множеството ще бъде означено с Oe(y)

Oe(y) - (x^< уие£ для всех v = 0,1,.}.

Във втори параграф на първа глава е доказана теорема за ограничеността на ентропията на дискретни разпределения с ограничено математическо очакване.

Теорема 1. За ограничеността на ентропията на дискретни разпределения с ограничено математическо очакване.

За всеки 6 P7

H(x)

Ако x € fly съответства на геометрично разпределение с математическа дефиниция 7, т.е. 7 x„ = (1- р)р\ v = 0,1,., където р = --,

1 + 7 тогава равенството е в сила

H(x) = F(<7).

Твърдението на теоремата може да се разглежда като резултат от формално приложение на метода на Лагранж на условните множители в случай на безкраен брой променливи. Теоремата, че единственото разпределение на множеството (k, k + 1, k + 2,.) с дадено математическо очакване и максимална ентропия е геометрично разпределение с дадено математическо очакване е дадено (без доказателство) в /47/. Авторът обаче е дал строги доказателства.

Третият параграф на първа глава дава дефиницията на обобщена метрика - метрика, която позволява безкрайни стойности.

За x,y € Q функцията p(x,y) се определя като минималното e > O със свойството yye~£<хи< уиее для всех и = 0,1,. Если такого е не существует, то полагается, что р(х,у) = оо.

Доказано е, че функцията p(x,y) е обобщена метрика върху семейството от разпределения върху множеството от неотрицателни цели числа, както и върху цялото множество Cl*. Вместо e в дефиницията на показателя p(x,y), можете да използвате всяко друго положително число, различно от 1. Получените показатели ще се различават с мултипликативна константа. Нека означим с J(x, y) информационното разстояние

00 £ J(x,y) = E In-.

Тук и по-долу се приема, че 0 In 0 = 0.0 In jj = 0. Информационното разстояние е определено за такива x, y, че x„ = 0 за всички и такива, че y = 0. Ако това условие не е изпълнено, тогава ние ще приеме J(x,ij) = oo. Нека L SP. Тогава ще обозначим

J (A Y) = |nf J(x,y).

Четвъртият параграф на първа глава дава определението за компактност на функции, дефинирани върху множеството Q*. Компактността на функция с изброим брой аргументи означава, че с всякаква степен на точност стойността на функцията може да бъде апроксимирана от стойностите на тази функция в точки, където само краен брой аргументи са различни от нула. Доказана е компактността на функциите на ентропията и информационното разстояние.

1. За всяка 0< 7 < оо функция Н(х) компактна на

2. Ако за някои 0< 70 < оо

R e тогава за всяка 0<7<оо,г>0 функцията x) = J(x,p) е компактна в множеството

Петият параграф на първа глава обсъжда свойствата на информационното разстояние, дефинирано в безкрайномерно пространство. В сравнение с крайномерния случай ситуацията с непрекъснатостта на функцията на информационното разстояние се променя качествено. Показано е, че функцията на информационното разстояние не е непрекъсната върху множеството в нито една от метриките

Pl&V) = E\Xi~Y»\, u=0

E (xv - Ui)2 v=Q

Рз(х,у) = 8Up\xu-yv\. v

Доказана е валидността на следните неравенства за ентропийните функции H(x) и информационното разстояние J(x,p):

1. За всяко x, x" € fi

N(x) - N(x")\< - 1){Н{х) + Н{х")).

2. Ако за някои x,p e P съществува e > 0 такова, че x 6 0 £(p), то за всяко x" £ Q J(x,p) - J(x",p)|< (е"М - 1){Н{х) + Н{х") + ееН(р)).

От тези неравенства, като се вземе предвид теорема 1, следва, че функциите на ентропията и информационното разстояние са равномерно непрекъснати върху съответните подмножества на Q в метриката p(x,y)t, а именно,

1. За всяко 7, такова че 0< 7 < оо, функция Н(х) равномерно непрерывна на Г2 в метрике р(ж,у);

2. Ако за едни 70, 0< 70 < оо

TO за всяка 0<7<оои£>0 функция

L p(x) = J(x,p) е равномерно непрекъснато в множеството Π Oe(p) в метриката p(x,y).

Дадено е определение за неекстремалност на функция. Неекстремалното условие означава, че функцията няма локални екстремуми или функцията приема същите стойности при локални минимуми (локални максимуми). Условието за неекстремност отслабва изискването за липса на локални екстремуми. Например функцията sin x в множеството от реални числа има локални екстремуми, но удовлетворява условието за неекстремност.

Нека за някои 7 > 0, областта A е дадена от условието

A = (x € VLv4>(x) > a), (0.9) където φ(x) е функция с реална стойност, a е някаква реална константа, inf φ(x)< а < inf ф(х).

Изследван е въпросът при какви условия върху функцията φ при промяна на параметрите n,N в централната област, ^ -; 7, за всички достатъчно големи стойности има неотрицателни цели ko, k\,., kn такива, че k0 + ki + . + kn = N, k\ + 2k2. + табло за управление - N и

F(ko k\ kp

-£,0,0 ,.)>а.

Доказано е, че за това е достатъчно да се изисква функцията φ да е неекстремна, компактна и непрекъсната в метриката p(x,y), а също така, че за поне една точка x, удовлетворяваща (0.9), за някои e > 0 съществува краен момент степени 1 + e и x„ > 0 за всяко v = 0,1.

Във втората глава изучаваме грубата (до логаритмична еквивалентност) асимптотика на вероятността за големи отклонения на функциите от D = (^0) ■ ) Ts "n, 0, .) - броя на клетките с дадено запълване в централната област на изменение на параметрите N, n Груба Асимптотиката на вероятностите за големи отклонения е достатъчна за изследване на показателите на критериите за съответствие.

Нека случайните променливи ^ в (0.2) са еднакво разпределени и

P(z) - генерираща функция на случайна променлива - събира се в окръжност с радиус 1< R < оо. Следуя /38/, для 0 < z < R обозначим через £(z) случайную величину такую, что

Ml+£ = £ i1+ex„< 00.

0,10) k] = Pk, k = 0,1,.

Нека обозначим

Ако има решение на уравнението m Z(z) = ъ то то е единствено /38/. Навсякъде по-нататък ще приемем, че pk > O,A; = 0,1,.

Първият параграф на първия параграф на втората глава съдържа асимптотиката на логаритмите на вероятностите от формата

1pP(/x0 = ko,.,tsp = kp).

Доказана е следната теорема.

Теорема 2. Груба локална теорема за вероятностите за големи отклонения. Нека n, N -> оо, така че jj ->7,0<7 < оо, существует z7 - корень уравнения M£(z) = 7, с. в. £(г7) имеет положительную дисперсию. Тогда для любого k G Cl(n,N)

1nP(D = k) = JftpK)) + O(^lniV).

Твърдението на теоремата следва пряко от формулата за съвместното разпределение fii,. fin в /26/ и следната оценка: ако неотрицателните цели числа, Нп отговарят на условието

Hi + 2d2 + + PNn = n, тогава броят на ненулевите стойности сред тях е 0(l/n). Това е груба оценка и не претендира да е нова. Броят на ненулевите CG в обобщените схеми на оформление не надвишава стойността на максималното запълване на клетките, което в централната област, с вероятност, клоняща към 1, не надвишава стойността O(lnn) /25/, / 27/. Независимо от това, получената оценка 0(y/n) е удовлетворена с вероятност 1 и е достатъчна за получаване на груба асимптотика.

Във втория параграф на първия параграф на втората глава се намира стойността на границата, където adg е поредица от реални числа, сходни към някои a G R, φ(x) е функция с реална стойност. Доказана е следната теорема.

Теорема 3. Груба интегрална теорема за вероятностите за големи отклонения. Нека условията на теорема 2 са изпълнени, за някои r > 0, C > 0 реалната функция φ(x) е компактна, равномерно непрекъсната в метриката p на множеството

A = 0r+<;(p(z7)) П Ц7+с] и удовлетворяет условию неэкстремальности на множестве fly. Если для некоторой константы а такой, что inf ф(х) < а < sup ф(х). xeily существует вектор ра € fi7 П 0r(p(z7)); такой, что

Ф(ra) > a и j(( (x) >a,xe P7),p(2;7)) = 7(pa,p(*y)) mo за всяка последователност a^, сходна към a,

Jim -vbPW%%,.)>aN) = J(pa,p(2h)). (0,11)

С допълнителни ограничения върху функцията φ(x), информационното разстояние J(pa,p(z7)) в (2.3) може да бъде изчислено по-конкретно. А именно следната теорема е вярна. Теорема 4. За информационното разстояние. Нека за малко 0< 7 < оо для некоторвх г >0, C > 0, реалната функция φ(x) и нейните частни производни от първи ред са компактни и равномерно непрекъснати в обобщената метрика p(x, y) на множеството p G

A = Og(p) P %+c] съществуват T > 0, R > 0 такива, че за всички \t\<Т,0 < z < R,x е А

E^exp^-f(x))< оо,

0(a;)exp(t-< со, i/=o oxv 0X1/ для некоторого е >O oo Q pvv1+£zu exp(t-ph(x))< оо, (0.13) и существует единственный вектор x(z,t), удовлетворяющий системе уравнений xv(z, t) = pvzv ехр {Ь-ф(х(г, t))}, v = 0,1,. функция ф(х) удовлетворяет на множестве А условию неэкстремальности, а - некоторая константа, ф(р) < а < sup ф(:x)(z,t),

0

00 vpv(za,ta) = 7, 1/=0

0(p(*aL)) = a, където

Тогава p(za, ta) € и

J((x e А,ф(х) = а),р) = J(p(za, ta),p)

00 d 00 d = l\nza + taYl ir- (x(za,ta)) - В E^r/exp(ta-z- (п(зата)))). j/=0 C^i/ t^=0

Ако функцията f(x) е линейна функция и функцията f(x) е дефинирана чрез равенство (0.5), тогава условието (0.12) се превръща в условието на Крамър за случайната променлива f(£(z)). Условието (0.13) е форма на условие (0.10) и се използва за доказване на присъствието в области на формата (x G f(x) > a) на поне една точка от 0(n, N) за всички достатъчно големи н, н.

Нека ^)(n, N) = (hi,., /gdr) е честотният вектор в обобщената схема на оформление (0.2). Като следствие от теореми 3 и 4 е формулирана следната теорема.

Теорема 5. Груба интегрална теорема за вероятностите за големи отклонения на симетрични разделими статистики в обобщена схема на разположение.

Нека n, N -» оо, така че ^ - 7, 0< 7 < оо, существует z1 - корень уравнения М£(,г) = 7, с. в. £(27) имеет положительную дисперсию и максимальный шаг распределения 1, а - некоторая константа, f(x) - действительная функция, а < Mf(^(z1)), существуют Т >0,R > 0, така че за всички |t|<Т,0 < z < R,

00 oo, u=0 има такива

E vVi/("01 ta) = b където f(v)p"(za,ta) = a, 1/=0

Тогава за всяка последователност adg, сходна към a,

Jim - - InF»(- £ f(h„) > aN) = J(p(za,ta),p(z7))

00 7 In 2a + taa - In £ p^/e^M i/=0

Тази теорема е доказана за първи път от A.F. Ronzhin в /38/ с помощта на метода на седловата точка.

Във втория параграф на втората глава се изследват вероятностите за големи отклонения на отделимите статистики в обобщени cxj^iax разположения в случай на неизпълнение на условието на Крамер за случайната променлива f(€(z)). Условието на Крамър за случайната променлива f(£(z)) не е изпълнено, по-специално, ако £(z) е случайна променлива на Поасон и f(x) е x2. Обърнете внимание, че условието на Крамър за самите отделими статистики в обобщените схеми за разпределение винаги е изпълнено, тъй като за всяко фиксирано n, N броят на възможните резултати в тези схеми е краен.

Както е отбелязано в /2/, ако условието на Крамер не е изпълнено, тогава за да се намери асимптотиката на вероятностите за големи отклонения на суми от еднакво разпределени случайни променливи, са необходими допълнителни такива. f

V и. . I условия за правилна промяна на разпределението на срока. В ход j

O, 5 се разглежда случаят, съответстващ на изпълнението на условие (3) в /2/, т.е. седем експоненциалния случай. Нека P(£i = k) > 0 за всички k = 0,1. и функцията p(k) = -\nP(^ = k), може да бъде разширена до функция с непрекъснат аргумент - редовно променяща се функция от ред p, 0< р < со /45/, то есть положительной функции такой, что при t ->oo p(tx) xr.

Нека функцията f(x) за достатъчно големи стойности на аргумента е положителна строго нарастваща, редовно променяща се функция от ред. Нека дефинираме функцията cp(x), като зададем за достатъчно големи x φ) = p(Γ\). x)).

На останалата част от числовата ос, ip(x) може да бъде определен по произволен ограничен измерим начин.

Тогава s. V. /(£i) има моменти от всякакъв ред и не удовлетворява условието на Крамер, p(x) = o(x) при x -> co, и следната теорема 6 е валидна. Нека функцията ip(x) е монотонна ненамаляващо за достатъчно голямо x, fg^ction не нараства монотонно, n, N -> oo, така че jj - A, 0< Л < оо; гд - единственный корень уравнения M^i(^) = Л, тогда для любого с >b(z\), където b(z) = M/(£i(.z)), има граница CN) = -(c - b(z\))4.

От теорема b следва, че ако условието на Крамър не е изпълнено, границата lim 1 InP(LN(h(n, N)) > cN) = 0, ^ ^ iv-too iv, което доказва валидността на хипотезата, изразена в / 39/. По този начин стойността на индекса на критерия за съгласие в обобщените схеми за разположение и неизпълнението на условието на Крамер винаги е равна на нула. В този случай, в класа на критериите, когато условието на Крамер е изпълнено, се конструират критерии с ненулева стойност на индекса. От това можем да заключим, че използването на критерии, чиито статистики не отговарят на условието на Крамер, например теста хи-квадрат в полиномиална схема, за конструиране на тестове за добро съответствие за тестване на хипотези с неконвергиращи алтернативи в посочения смисъл е асимптотично неефективен. Подобно заключение е направено в /54/ въз основа на резултатите от сравнение на статистиката на хи-квадрат и съотношението на максималната вероятност в полиномна схема.

Третата глава решава проблема за конструиране на критерии за добро съответствие с най-голямата стойност на индекса на критерия (най-голямата стойност на индекса на критерия) за тестване на хипотези в обобщени схеми за поставяне. Въз основа на резултатите от първа и втора глава относно свойствата на ентропийните функции, информационното разстояние и вероятностите за големи отклонения, в третата глава се намира функция от вида (0.4), така че критерият за добро съответствие, конструиран въз основа на него има най-голямата стойност на точния индекс в разглеждания клас критерии. Доказана е следната теорема.

Теорема 7. За съществуването на индекс. Нека са изпълнени условията на теорема 3: 0< /3 < 1, Н = Hp(i),Hp(2>,. е последователност от алтернативни разпределения, а,ф((3, N) е максималното число, за което при хипотезата Нр<ло выполнено неравенство существует предел lim^-оо о>φ(P, N) - а. Тогава в точката (/3, H) има критериален индекс φ

Zff, H) = 3((φ(x) > a, x £ ^.PW).

срамежлив)<ШН)>където w/fo fh h v^l ^

Заключението излага получените резултати във връзка с общата цел и конкретните задачи, поставени в дисертацията, формулира изводи въз основа на резултатите от изследването на дисертацията, посочва научната новост, теоретичната и практическата стойност на работата, както и конкретни научни задачи, идентифицирани от автора и чието решение изглежда уместно.

Кратък прегледлитература по изследваната тема. Дипломната работа разглежда проблема за конструиране на критерии за съгласие в обобщени схеми за поставяне с най-висока стойност на индекса на критерия в класа на функциите от вида (0.4) с неконвергиращи алтернативи.

Обобщени схеми на оформление са въведени от V.F Kolchin в /24/. Величините в полиномиалната схема се наричат ​​брой клетки с g пелети и са разгледани подробно в монографията на В. Ф. Колчин, Б. А. Севастянов, В. П. Чистяков /27/. Стойностите на елата в обобщени планове са изследвани от V.F. Kolchin в /25/, /26/. Статистиките под формата (0.3) са разгледани за първи път от Ю. И. Медведев в /30/ и са наречени разделими (аддитивно разделими) статистики. Ако функциите /„ в (0.3) не зависят от u, такива статистики се наричат ​​в /31/ симетрични разделими статистики. Асимптотичното поведение на моментите на отделимите статистики в обобщени схеми за разпределение е получено от Г. И. Ивченко в /9/. Граничните теореми за обобщена схема на оформление също бяха разгледани в /23/. Рецензии на резултатите от граничните теореми и критериите за съгласие в дискретни вероятностни схеми от тип (0.2) са дадени от В. А. Ивченко, Ю. И. Медведев в /8/ и Г. И. Ивченко, Ю. И. Медведев, А. Ф. Ронжин в /14/. Критериите за съгласие за обобщени оформления са разгледани от A.F. Ronzhin в /38/.

Сравнението на свойствата на статистическите критерии в тези работи е извършено от гледна точка на относителната асимптотична ефективност. Разгледан е случаят на конвергиращи (контигуални) хипотези - ефективност по смисъла на Питман и неконвергиращи хипотези - ефективност по смисъла на Бахадур, Ходжис - Леман и Чернов. Връзката между различните типове статистически тестове за относителна ефективност е разгледана например в /49/. Както следва от резултатите на 10. I. Medvedev в /31/ относно разпределението на сепарируеми статистики в полиномиална схема, най-голямата асимптотична сила при конвергентни хипотези в класа на сепарируеми статистики за честотите на резултатите в полиномиална схема има критерий, базиран на хи-квадрат статистика. Този резултате обобщен от A.F. Ronzhin за вериги от тип (0.2) в /38/. построена от И. И. Викторова и В. П. Чистяков в /4/ оптимален критерийза полиномиална схема в класа на линейните функции на /xr. A.F. Ronzhin в /38/ конструира критерий, който при дадена последователност от алтернативи, които не са близки до нулевата хипотеза, минимизира логаритмичната скорост, при която вероятността от грешка от първи вид клони към нула, в класа на статистиката на формата (0.6). Сравнение на относителното представяне на статистиката на хи-квадрат и съотношението на максималната вероятност при приближаващи и неапроксимиращи хипотези беше извършено в /54/.

Тезата разглежда случая на несближаващи се хипотези. Изследването на относителната статистическа ефективност на критерии при неконвергиращи хипотези изисква изследване на вероятностите за изключително големи отклонения - от порядъка на 0(i/n). За първи път такава задача за полиномиално разпределение с фиксиран брой изходи е решена от И. Н. Санов в /40/. В /48/ беше разгледана асимптотичната оптималност на тестовете за добро съответствие за тестване на прости и сложни хипотези за многочленно разпределение в случай на краен брой резултати с неконвергиращи алтернативи. Свойствата на информационното разстояние са разгледани преди това от Kullback, Leibler /29/,/53/ и I. II. Санов /40/, както и Хьофдинг /48/. В тези работи се разглежда непрекъснатостта на информационното разстояние върху крайномерни пространства в евклидовата метрика. Редица автори разглеждат последователност от пространства с нарастваща размерност, например в работата на Ю. В. Прохоров /37/ или в работата на В. И. Богачев, А. В. Колесников /1/. Груби (до логаритмична еквивалентност) теореми за вероятностите за големи отклонения на отделими статистики в обобщени схеми за разпределение при условието на Крамер са получени от A.F. Ronzhin в /38/. А. Н. Тимашев в /42/,/43/ получава точни (до еквивалентност) многомерни интегрални и локални гранични теореми за вероятностите за големи отклонения на вектора fir^n,N),.,iir.(n,N), където s, r\,., rs - фиксирани цели числа,

ЗА<П < .

Изследването на вероятностите за големи отклонения при неспазване на условието на Крамер за случай на независими случайни променливи е извършено в трудовете на А. В. Нагаев /35/. Методът на спрегнатите разпределения е описан от Фелер /45/.

Статистически проблеми за тестване на хипотези и оценка на параметри в схема за подбор без връщане в малко по-различна формулировка са разгледани от Г. И. Ивченко, В. В. Левин, Е. Е. Тимонина /10/, /15/, където проблемите с оценката са решени за крайна популация, когато броят на неговите елементи е неизвестна величина, беше доказана асимптотичната нормалност на многомерна S - статистика от s независими извадки в схема за подбор без реверсия. Проблемът за изучаване на случайни променливи, свързани с повторения в последователности от независими опити, е изследван от А. М. Зубков, В. Г. Михайлов, А. М. Шойтов в /6/, /7/, /32/, /33/, /34/ . Анализ на основните статистически проблеми на оценката и проверката на хипотези в рамките на общия модел на Марков-Поля е извършен от Г. И. Ивченко, Ю. И. Медведев в /13/, чийто вероятностен анализ е даден в /11 /. Метод за определяне на неравномерни вероятностни мерки върху набор от комбинаторни обекти, който не се свежда до обобщената схема на разположение (0.2), е описан в Г. И. Ивченко, Ю. И. Медведев /12/. Редица проблеми в теорията на вероятностите, в които отговорът може да бъде получен в резултат на изчисления с рекурентни формули, бяха посочени от А. М. Зубков в /5/.

Неравенствата за ентропията на дискретни разпределения са получени в /50/ (цитирано от резюмето на А. М. Зубков в РЖМат). Ако (pn)^Lo е вероятностното разпределение, oo

Рп = Е Рк, к=тг

A = supp^Pn+i< оо (0.14) п>0 и

F(x) = (x + 1) In (x + 1) - x In x, тогава за ентропията I на това вероятностно разпределение

00 i = - 5Z Рк^Рк к=0 неравенствата са валидни -L 1 00 00 Р

I + (In -f-) £ (Arn - Rn+1)< F(А) < Я + £ (АРп - P„+i)(ln

L D p=P -t p.4-1 и неравенствата се превръщат в равенства, ако

Рп= (xf1)n+vn>Q. (0,15)

Обърнете внимание, че екстремалното разпределение (0.15) е геометрично разпределение с математическо очакване A, а функцията F(A) на параметъра (0.14) съвпада с функцията на математическото очакване в Теорема 1.

Подобни дисертации по специалност "Теория на вероятностите и математическа статистика", 01.01.05 код ВАК

  • Асимптотична ефективност на експоненциални тестове без мащабни параметри 2005 г., кандидат на физико-математическите науки Чирина, Анна Владимировна

  • Някои проблеми на теорията на вероятностите и математическата статистика, свързани с разпределението на Лаплас 2010 г., кандидат на физико-математическите науки Лямин, Олег Олегович

  • Пределни теореми в задачи за плътно вграждане и плътни серии в дискретни случайни последователности 2009 г., кандидат на физико-математическите науки Меженная, Наталия Михайловна

  • Гранични теореми за броя на пресичанията на лента с произволни траектории 2006 г., кандидат на физико-математическите науки Орлова, Нина Генадиевна

  • Оптимизиране на структурата на моментните оценки на точността на нормалното приближение за разпределения на суми от независими случайни променливи 2013 г., доктор на физико-математическите науки Шевцова, Ирина Генадиевна

Заключение на дисертацията на тема „Теория на вероятностите и математическа статистика”, Колодзей, Александър Владимирович

3.4. Изводи

В тази глава, въз основа на резултатите от предишни глави, ние успяхме да изградим критерий за добро съответствие за тестване на хипотези в обобщени схеми за поставяне с най-висок логаритмичен процент на клонящи към нула вероятности за грешки от първия тип, с a фиксирана вероятност за грешка от първи род и неприближаващи алтернативи. ~"

Заключение

Целта на дисертационния труд беше да се изградят критерии за добро съответствие за тестване на хипотези в схема за подбор, без да се връща от урна, съдържаща топки от 2 цвята. Авторът решава да проучи статистика въз основа на честотите на разстоянията между топките от един и същи цвят. В тази формулировка проблемът беше сведен до задачата за тестване на хипотези в подходящо обобщено оформление.

Включена е дисертационна работа

Изследвани са свойствата на ентропията и информационното разстояние на дискретни разпределения с неограничен брой резултати и ограничено математическо очакване;

Получава се грубо (до логаритмична еквивалентност) асимптотично поведение на вероятностите за големи отклонения на широк клас статистики в обобщена схема на разположение;

Въз основа на получените резултати е конструирана критериална функция с най-висока логаритмична скорост на клонене към нула на вероятността за грешка от първи тип с фиксирана вероятност за грешка от втори тип и несближаващи алтернативи;

Доказано е, че статистиките, които не отговарят на условието на Крамер, имат по-ниска степен на сходимост до нула на вероятностите за големи отклонения в сравнение със статистиките, които отговарят на това условие.

Научната новост на работата е следната.

Дадена е концепцията за обобщена метрика - функция, която допуска безкрайни стойности и удовлетворява аксиомите за идентичност, симетрия и неравенство на триъгълника. Намира се обобщена метрика и се посочват множества, на които функциите на ентропията и информационното разстояние, дефинирани върху семейство от дискретни разпределения с изброим брой резултати, са непрекъснати в тази метрика;

В схемата за обобщено разположение беше открита груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на статистиките от формата (0.4), удовлетворяващи съответната форма на условието на Крамер;

В обобщена схема на разположение се намира груба (до логаритмична еквивалентност) асимптотика за вероятностите за големи отклонения на симетрични разделими статистики, които не отговарят на условието на Крамер;

В класа критерии от формата (0.7) се конструира критерий с най-висока стойност на индекса на критерия.

Работата решава редица въпроси относно поведението на вероятностите за големи отклонения в обобщените схеми за разположение. Получените резултати могат да бъдат използвани в учебния процес по специалностите математическа статистика и теория на информацията, при изучаване на статистически процедури за анализ на дискретни последователности и са използвани в /3/, /21/ за обосноваване сигурността на един клас информационни системи.

Въпреки това редица въпроси остават отворени. Авторът се ограничава до разглеждане на централната зона на промени в параметрите n, N на обобщени схеми за поставяне на n частици в N клетки. Ако носителят на разпределението на случайни променливи, генериращи обобщената схема на подреждане (0.2), не е набор от формата r, r + 1, r + 2,., тогава при доказване на непрекъснатостта на функцията за информационно разстояние и изследване на вероятностите на големи отклонения е необходимо да се вземе предвид аритметичната структура на такъв носител, който не е разгледан в работата на автора. За практическото приложение на критерии, изградени на базата на предложената функция с максимална стойностиндекс, е необходимо да се изследва неговото разпределение както при нулевата хипотеза, така и при алтернативи, включително конвергентни. Също така е от интерес да се прехвърлят разработените методи и да се обобщят получените резултати към други вероятностни схеми, различни от обобщените схеми за поставяне.

Ако - честотите на разстоянията между числата на резултатите 0 в биномна схема с вероятности за резултати po> 1 - Po, тогава може да се покаже, че в този случай

Pb = kh.t fin = kn) = I(± iki = n)(kl + --, (3.3) v=\ K\ \ . Kn\ където

O* = Po~1(1~Po),v =

От анализа на формулата за съвместно разпределение на стойностите на cg в обобщена схема на подреждане, доказана в /26/, следва, че разпределението (3.3), най-общо казано, не може да бъде представено в общия случай като съвместно разпределение на стойностите на cg във всяко обобщено подреждане на частици по клетки. Това разпределение е частен случай на разпределения върху множеството от комбинаторни обекти, въведени в /12/. Изглежда спешна задача да се прехвърлят резултатите от дисертационния труд за обобщени схеми за настаняване в този случай, който беше обсъден в /52/.

Ако броят на резултатите в селекция без връщане или схема за полиномно разположение е повече от два, тогава съвместното честотно разпределение на разстоянията между съседни идентични резултати вече не може да бъде представено по толкова прост начин. Засега е възможно да се изчисли само математическото очакване и дисперсията на броя на тези разстояния /51/.

Списък с литература за дисертационно изследване Кандидат на физико-математическите науки Колодзей, Александър Владимирович, 2006 г.

1. Богачев В.И., Колесников А.В. Нелинейни трансформации на изпъкнали мерки и ентропия на плътностите на Радон-Никодим // Доклади на Академията на науките. - 2004. - Т. 207. - 2. - С. 155 - 159.

2. Vidyakin V.V., Kolodzei A.V. Статистическо откриване на скрити канали в мрежи за предаване на данни // Proc. отчет II Межд. конф. "Информационни системи и технологии IST" 2004" (Минск, 8-10 октомври 2004 г.) Минск: BSU, 2004. - Част 1. - стр. 116 - 117.

3. Викторова И. И., Чистяков В. П. Някои обобщения на критерия за празна кутия // Теория на вероятностите. и неговите приложения. - 1966. - Т. XI. - 2. С. 306-313.

4. Зубков А. М. Рекурентни формули за изчисляване на функционали на шансове на дискретни случайни променливи // Преглед на прил. и промишлени математика. 1996. - Т. 3. - 4. - С. 567 - 573.

5. Г. Зубков А. М., Михайлов В. Г. Гранични разпределения на случайни променливи, свързани с дълги повторения в последователност от независими тестове // Теория на вероятностите. и неговите приложения. - 1974. - Т. XIX. 1. - стр. 173 - 181.

6. Зубков А. М., Михайлов В. Г. За повторенията на s - вериги в последователност от независими величини // Теория на вероятностите. и приложението му - 1979 г. Т. XXIV. - 2. - С. 267 - 273.

7. Иванов В. А., Ивченко Г. И., Медведев Ю. И. Дискретни проблеми в теорията на вероятностите // Резултати от науката и технологиите. сер. теория на вероятностите, математика. стат., теор. киберн. Т. 23. - М.: ВИНИТИ, 1984. С. 3 -60.

8. Ивченко Г. И. За моменти на отделими статистики в обобщена схема за разпределение // Мат. бележки. 1986. - Т. 39. - 2. - С. 284 - 293.

9. Ивченко Г. И., Левин В. В. Асимптотична нормалност в схема за избор без връщане // Теория на вероятностите. и се прилага. - 1978.- Т. XXIII. 1. - стр. 97 - 108.

10. Ивченко Г.И., Медведев Ю.И. За схемата на урната на Марков-Поля: от 1917 г. до наши дни // Приложен преглед. и промишлени математика. - 1996.- Т. 3. 4. - С. 484-511.

11. Ивченко Г. И., Медведев Ю. Случайни комбинаторни обекти // Доклади на Академията на науките. 2004. - Т. 396. - 2. - С. 151 - 154.

12. Ивченко Г. И., Медведев Ю. И. Статистически проблеми, свързани с организацията на контрол върху процесите на генериране на дискретни случайни последователности // Дискретн. математика. - 2000. - Т. 12. - 2. С. 3 - 24.

13. Ивченко Г. И., Медведев Ю. И., Ронжин А. Ф. Разделими статистики и критерии за добро съответствие за полиномиални извадки // Сборници по математика. Институт на Академията на науките на СССР. 1986. - Т. 177. - С. 60 - 74.

14. Ивченко Г. И., Тимонина Е. Е. За оценка при избор от крайна популация // Мат. бележки. - 1980. - Т. 28. - 4. - С. 623 - 633.

15. Kolodzei A. V. Теорема за вероятностите за големи отклонения за отделими статистики, които не отговарят на условието на Крамер // Дискретн. математика. 2005. - Т. 17. - 2. - С. 87 - 94.

16. Kolodzei A. V. Ентропия на дискретни разпределения и вероятността от големи отклонения на функции от запълване на клетки в обобщени оформления // Review of Appl. и промишлени математика. - 2005. - Т. 12. 2. - С. 248 - 252.

17. Kolodzey A. V. Статистически критерии за идентифициране на скрити канали въз основа на промяна на реда на съобщенията // Изследователска работа "Извинение": Доклад / FSTEC на Руската федерация, ръководител А. В. Князев. Инв. 7 ПДЧ - М., 2004. - С. 96 - 128.

18. Kolodzei A.V., Ronzhin A.F. За някои статистики, свързани с проверката на хомогенността на случайни дискретни последователности // Изследователска работа "Разработване на математически проблеми на криптографията" N 4 2004.: Доклад / AK RF, - M., 2004 .

19. Колчин А. В. Гранични теореми за обобщена схема на оформление // Дискретн. математика. 2003. - Т. 15. - 4. - С. 148 - 157.

20. Колчин V.F. Един клас гранични теореми за условни разпределения // Лит. математика. сб. - 1968. - Т. 8. - 1. - С. 111 - 126.

21. Колчин В. Ф. Случайни графи. 2-ро изд. - М.: ФИЗМАТЛИТ, 2004. - 256 с.

22. Колчин В. Ф. Случайни преобразувания. - М.: Наука, 1984. - 208 с.

23. Колчин В.Ф., Севастянов Б.А., Чистяков В.П. М.: Наука, 1976. - 223 с.

24. Крамер Г. // Успехи на математиката. наука. - 1944. - висш. 10. - стр. 166 - 178.

25. Кулбак С. Теория на информацията и статистика. - М.: Наука, 1967. - 408 с.

26. Медведев Ю. И. Някои теореми за асимптотичното разпределение на хи-квадрат статистиката // Докл. Академия на науките на СССР. - 1970. - Т. 192. 5. - С. 997 - 989.

27. Медведев Ю. И. Разделима статистика в полиномиална схема I; II. // Теория Проб. и използването му. - 1977. - Т. 22. - 1. - С. 3 - 17; 1977. Т. 22. - 3. - С. 623 - 631.

28. Михайлов В. Г. Гранични разпределения на случайни променливи, свързани с множество дълги повторения в последователност от независими тестове // Теория на вероятностите. и неговите приложения. - 1974. Т. 19. - 1. - С. 182 - 187.

29. Михайлов В. Г. Централна гранична теорема за броя на непълните дълги повторения // Теория на вероятностите. и неговите приложения. - 1975. - Т. 20. 4. - С. 880 - 884.

30. Михайлов В. Г., Шойтов А. М. Структурна еквивалентност на s - вериги в произволни дискретни последователности // Дискретно. математика. 2003. - Т. 15, - 4. - С. 7 - 34.

31. Нагаев А.В. Интегрални гранични теореми, отчитащи вероятностите за големи отклонения. I. // Теория Вероятност. и се прилага. -1969. Т. 14. 1. - с. 51 - 63.

32. Петров В. В. Суми на независими случайни променливи. - М.: Наука, 1972. 416 с.

33. Прохоров Ю. В. Пределни теореми за суми от случайни вектори, чиято размерност клони към безкрайност // Теория на вероятностите. и неговите приложения. 1990. - Т. 35. - 4. - С. 751 - 753.

34. Ронжин А.Ф. Критерии за обобщени схеми за разполагане на частици // Теория на вероятностите. и неговите приложения. - 1988. - Т. 33. - 1. - С. 94 - 104.

35. Ронжин А.Ф. Теорема за вероятностите от големи отклонения за сепарируеми статистики и нейното статистическо приложение // Мат. бележки. 1984. - Т. 36. - 4. - С. 610 - 615.

36. Санов И. Н. За вероятностите от големи отклонения на случайни променливи // Мат. сб. 1957. - Т. 42. - 1 (84). - S.I - 44.

37. Сенета Е. Правилно променящи се функции. М.: Наука, 1985. - 144 с.

38. Тимашев А. Н. Многомерна интегрална теорема за големи отклонения в равновероятна схема на разположение // Дискрет, Мат. - 1992. Т. 4. - 4. - С. 74 - 81.

39. Тимашев А. Н. Многомерна локална теорема за големи отклонения в равновероятна схема на разположение // Дискретн. математика. - 1990. Т. 2. - 2. - С. 143 - 149.

40. Федорюк М.В. Метод на преминаване. М.: Наука, 1977. 368 с.

41. Feller V. Въведение в теорията на вероятностите и нейните приложения. Т. 2. - М.: Мир, 1984. 738 с.

42. Шанън К. Математическа теория на комуникацията // Работи по теория на информацията и кибернетика: Прев. от английски / М., IL, 1963, стр. 243 - 332.

43. Конрад К. Разпределение на вероятностите и максимална ентропия // http://www.math.uconn.edu/~kconrad/blurbs/entropypost.pdf

44. Hoeffding W. Асимптотично оптимални тестове за мултиномиално разпределение // Ann. математика Статист. 1965. - Т. 36. - с. 369 - 408.

45. Inglot T,. Rallenberg W. S. M., Ledwina T. Изчезващ недостатък и асимптотична относителна ефективност // Ann. Статист. - 2000. - Т. 28. - С. 215 238.

46. ​​​​Jurdas C., Pecaric J., Roki R., Sarapa N., Относно неравенство за ентропията на вероятностното разпределение // Math. Неравен. и Appl. - 2001. Т. 4. - 2. - С. 209 - 214. (РЖМат. - 2005. - 05.07-13Б.16).

47. Kolodzey A. V., Ronzhin A. F., Тестове за добро съответствие за случайни комбинаторни обекти // Proc. отчет междун. конф. Съвременни проблеми и нови тенденции в теорията на вероятностите, (Черновци, 19 - 26 юни 2005 г.) - Киев: Институт по математика, 2005. Част 1. С. 122.

48. Kullback S. и Leibler R. A. За информацията и достатъчността // Ann. математика Статист. 1951. - Т. 22. - с. 79 - 86.

49. Quine M.P., Robinson J. Ефективност на хи-квадрат и съотношение на вероятността доброта на тестовете за съответствие // Ann. Статист. 1985. - Т. 13. - 2. - С. 727 -742.

Моля, имайте предвид, че научните текстове, представени по-горе, са публикувани само за информационни цели и са получени чрез разпознаване на текст на оригинална дисертация (OCR). Следователно те могат да съдържат грешки, свързани с несъвършени алгоритми за разпознаване. В PDF файловете на дисертациите и резюметата, които предоставяме, няма такива грешки.

Публикации по темата