WWW.KNIGI.KONFLIB.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 
<< HOME
Научная библиотека
CONTACTS

Pages:     | 1 | 2 || 4 | 5 |   ...   | 72 |

«В.К. Шитиков, Г.С. Розенберг Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R Исправленная и дополненная интернет-версия от ...»

-- [ Страница 3 ] --

Нельзя не сказать также слова благодарности некоторым фондам и программам, которые в той или иной степени способствовали появлению этой работы: мы благодарны Российскому гуманитарному научному фонду «Волжские земли в истории и культуре России» (грант 12-12-63005), Программе грантов Президента Российской Федерации для государственной поддержки ведущих научных школ Российской Федерации (грант НШРоссийскому фонду фундаментальных исследований РФФИ-Поволжье (грант 13-04-97004), программе фундаментальных исследований Президиума РАН «Живая природа: современное состояние и проблемы развития» и программе Отделения биологических наук РАН «Биологические ресурсы России: динамика в условиях глобальных климатических и антропогенных воздействий».

1. БУТСТРЕП И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ВЫБОРОЧНЫХ

ХАРАКТЕРИСТИК

1.1. Оценка параметров: точечные и интервальные характеристики Традиционно выделяют две основных задачи прикладной статистики: оценку параметров и проверку гипотез. Если проверка статистических гипотез является важнейшим и практически отработанным инструментом научного познания, то процедура оценки неизвестных параметров распределения изучаемой генеральной совокупности носит в некотором смысле предположительный и казуальный характер, не вполне поддающийся обобщению. В итоге классическая схема оценивания параметров в версии, изложенной в авторитетных учебниках по статистике, выглядит следующим образом:

1. Пусть результаты наблюдения являются измерениями некоторых признаков изучаемого объекта в форме чисел или иных свойств нечисловой природы. Эмпирическая совокупность значений изучаемой случайной величины1 представлена при этом простой выборкой Xn объемом n или несколькими ее независимыми повторностями.

2. Случайность и независимость выборок определяются той вероятностной моделью, с помощью которой был задан способ или механизм порождения данных. Например, при биологическом мониторинге часто реализуется простой случайный выборочный процесс, когда из воображаемой генеральной совокупности (популяции большого объема) случайно извлекается качественно однородный набор изучаемых эмпирических объектов.

При этом каждая из возможных комбинаций объектов имеет равную вероятность быть отобранной.

3. Генеральная совокупность – это в некотором смысле бесконечное множество значений признака X (т.е. при n ® ), имеющее в условиях эксперимента некоторое распределение, под которым понимается функция F, связывающая значения случайной величины с вероятностью их появления в совокупности. Выборочный ряд наблюдений Xn является частной случайной реализацией вероятностного процесса (т.е. произвольным подвектором из X) и имеет некоторое эмпирическое распределение Fn *. Поскольку точный вид закона распределения популяции в общем случае неизвестен, основные статистические выводы делаются в предположении, что при увеличении повторностей наблюдений их совокупное слаженное распределение асимптотически приближается к F.

4. Наибольшая информация о генеральной совокупности концентрируется в наборе основных выборочных характеристик, т.е. показателей, описывающих положение, рассеяние данных или форму кривой плотности распределения эмпирических частот. В роли таких характеристик могут выступать любые математически измеримые функционалы от результатов наблюдений, используемые для получения статистических выводов (они также часто называются статистиками). Статистика, как функция случайной выборки, также является случайной величиной. Распределение выборочной совокупности обычно предполагается унимодальным и тогда примерами основных статистик являются:

° показатели положения или центральной тенденции: различные варианты оценки среднего значения (в том числе, среднее по Колмогорову, являющееся их обобщением), стандартная ошибка средних, медиана, мода;

° показатели разброса (рассеяния, масштаба): дисперсия, стандартное отклонение, среднее отклонение, размах, коэффициент вариации, средняя разность Джини, Случайная величина – это не последовательность чисел, выбранных наугад, например, с помощью псевдогенератора случайных чисел. Значения случайной переменной отбираются на основе изучаемого вероятностного процесса; просто ее наблюдаемые реализации не могут быть известны прежде, чем сделан эксперимент.

Здесь и далее эксперимент понимается в широком смысле как «исследование любых пространственно-временных процессов в мире» (Kempthome (1979, p. 124), т.е. технических, социальных, экономических, экологических и др.

квартили, межквартильный размах;

° показатели формы и сдвига распределения: коэффициент асимметрии, эксцесс и др.

Для выборок случайных величин нечисловой природы могут быть рассчитаны доля, ошибка доли и дисперсия доли.

5. Хотя результаты отдельных наблюдений могут иметь существенную изменчивость, выборочные характеристики, основанные на начальных и центральных моментах (среднее, дисперсия, асимметрия) или некоторых функций от них, часто обнаруживают замечательную устойчивость. Общий характер случайного варьирования этих статистик приобретает асимптотически-нормальный характер, а в пределе при n ® их случайная величина вырождается в неслучайную независимо от специфики генеральной совокупности. Таким образом, основные выборочные характеристики с ростом объема выборки стремятся к своим теоретическим аналогам и ведут себя как нормально распределенные случайные величины (Айвазян, Мхитарян, 1998).



Одна из главных целей статистической обработки заключается в удобном и лаконичном описании свойств исследуемой совокупности или явления при минимальной потере эмпирической информации. Для этого часто используется параметрический подход, который предполагает приближенную аппроксимацию распределения генеральной совокупности наиболее подходящим теоретическим распределением (нормальным, логнормальным, биномиальным, гипергеометрическим или иным). В результате формируется математическая модель M(x, q), где x – текущее значение случайного исследуемого признака, характеризующий заданное теоретическое распределение с учетом эмпирических данных.

В общем случае вектор q представляет собой набор неслучайных величин (констант), значения которых не известны до эксперимента. Предполагается, что параметры q полностью определяют эмпирическое распределение данных в получаемых выборках.

Задача статистического оценивания неизвестных параметров q заключается в нахождении для их истинных величин наиболее точных приближенных значений:

( x1,..., xn ) = {q1 ( x1,..., xn ),..., qk ( x1,..., xn )} с использованием имеющихся наблюдений.

Например, если предварительный анализ природы исходных данных привел нас к выводу, что их распределение может быть описано нормальной моделью, то для характеристики исследуемой случайной величины нам необходимо оценить только два параметра:

математическое ожидание q1 = m и дисперсию q2 = s2. Вся информация об этих параметрах содержится в двух выборочных статистиках – среднем арифметическом и выборочной дисперсии, которые при n ® сходятся по вероятности к соответствующим истинным значениям m и s2. Если есть основания считать, что признак имеет распределение Пуассона, то необходимо найти только один параметр, которым это распределение определяется.

Основной задачей оценки параметров является анализ, как будут меняться их эмпирические оценки q(x) при проецировании на всю генеральную совокупность. В силу погрешности измерений или нарушения требований независимости и случайности выборочных значений ообычно мы имеем некоторое смещение D = E{q - q(x) } оценки относительно истинной величины параметра q.

Возникает вопрос о требованиях, которые следует предъявлять к статистическим оценкам, чтобы они были в определенном смысле надежными. Для этого исследуются такие свойства оценок, как состоятельность (т.е. q(x) стремится к q при n ® ), несмещенность (т.е. q(x) совпадает с q в среднем) и эффективность (т.е. q(x) обладает наименьшей степенью случайных отклонений от q). Для измерения этих свойств разработан довольно четкий протокол параметрического оценивания, который начинается с задания формы распределения, а заканчивается выявлением связи распределения выборочных статистик и искомых параметров. Сюда обычно включаются различные математические процедуры, такие, как метод моментов, поиск оптимума функции максимального правдоподобия, анализ цензурированных или взвешенных статистик и т.д.

Однако вопрос о том, являются ли полученные оценки параметров наилучшими, остается открытым. Во-первых, соображения, из которых задается вид теоретического распределения, часто оказываются субъективными. Это нередко приводит к тому, что, выполнив вычисления, мы полагаем, что найдены оценки истинных характеристик генерального распределения, тогда как на самом деле получены оценки параметров некого теоретического распределения, которое может быть «похоже» на распределение генеральной совокупности (а может быть и нет). Во-вторых, здесь можно усмотреть дефект аргументации, построенной на основе замкнутой логики: мы пользуемся выборочными характеристиками, чтобы выполнить оценивание параметров, но при этом априори задаемся предположениями о законе распределения для всей популяции, чтобы найти корректный способ расчета этих эмпирических статистик. Наконец, теоретические распределения в чистом виде в реальных условиях просто-напросто не существуют.

Имея одну конкретную выборку, можно рассчитать только один определенный набор значений оценок (x) параметров (например, среднее и стандартное отклонение), т.е. получить точечные значения статистик. При этом мы ничего не можем сказать об устойчивости модели и ошибке ее воспроизводимости: нет никакой гарантии, что при взятии повторной выборки расхождение искомых величин окажется слишком велико.

Один из способов проверить корректность статистической модели состоит в том, чтобы извлекать из нашей генеральной совокупности все новые и новые повторные выборки, пересчитывать на этой основе оценки параметров и анализировать динамику изменения величины смещения D. Пусть, например, было взято 100 однородных независимых повторностей выборок объема n изучаемой случайной переменной. Тогда 100 значений анализируемой выборочной статистики (например, среднего) образует эмпирическое распределение, описывающее некоторую неопределенность, ассоциированную с выборочным процессом.

И здесь уместно поставить вопрос о точности и надежности найденных характеристик. При статистическом приближении, как правило, не существует гарантированной точности: нельзя указать такое e 0, для которого достоверно выполняется соотношение e |q - q(x) |. Мы можем говорить лишь о вероятности, с которой выполняется это неравенство. Если эта вероятность близка к 1, то можно говорить, что статистическая погрешность в определении q не превосходит e.

Зададимся доверительной вероятностью g = 1 - 2a, близкой к 1, которой соответствуют границы области возможных значений оценок, такие, что:

Левая [ q(x) - e] и правая [ q(x) + e] границы окаймляют доверительный интервал – статистическую меру, позволяющую с надежностью g указать, в каких пределах может находиться случайное значение выборочной характеристики. Если анализируется несколько параметров, то доверительные границы будут окаймлять эллипс или многомерный эллипсоид. Чем больше значение g, тем шире становится доверительная область, поэтому на практике его принято рассчитывать для нескольких доверительных вероятностей (например: 0.7, 0.9, 0.95, 0.99), чтобы получить наглядное представление о точности статистического приближения q(x) » q.



Pages:     | 1 | 2 || 4 | 5 |   ...   | 72 |
 



Похожие работы:

«И.А. Крайнева, Н.А. Черемных Путь программиста Ответственный редактор доктор физико-математических наук, профессор А. Г. Марчук Новосибирск 2011 УДК 007(092) ББК 32.81 Е 80 Путь программиста / И.А Крайнева., Н.А. Черемных. Новосибирск: Нонпарель, 2011. 222 с. ISBN 978-5-93089-033-4 Биография выдающегося ученого, математика, программиста, создателя Сибирской школы программирования академика Андрея Петровича Ершова изложена в данной книге. В истории советской науки Ершов занимает особое место как...»

«Московский технический университет связи и информатики (ФГОБУ ВПО МТУСИ) СЕДЬМАЯ ОТРАСЛЕВАЯ НАУЧНАЯ КОНФЕРЕНЦИЯ ТЕХНОЛОГИИ ИНФОРМАЦИОННОГО ОБЩЕСТВА 20 21 февраля 2013 г. ПРОГРАММА НАУЧНО МЕТОДИЧЕСКИХ СЕКЦИЙ Москва 2013 PROGRAMMA-2013-metodich.qxd 16.02.2013 20:44 Page 2 Уважаемые коллеги! Оргкомитет приглашает Вас принять участие в работе седьмой отраслевой научной конференции “ТЕХНОЛОГИИ ИНФОРМАЦИОННОГО ОБЩЕСТВА” КОНФЕРЕНЦИЯ ПРОВОДИТСЯ 20 21 февраля 2013 г. Место проведения: Россия, Москва,...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ НАЦИОНАЛЬНАЯ АКАДЕМИЯ НАУК БЕЛАРУСИ КОНЦЕПЦИЯ РАЗВИТИЯ И ОСВОЕНИЯ НАНОТЕХНОЛОГИЙ И НАНОМАТЕРИАЛОВ В РЕСПУБЛИКЕ БЕЛАРУСЬ Минск 2011 АННОТАЦИЯ Концепция развития и освоения нанотехнологий и наноматериалов в Республике Беларусь на период 2012-2015 гг. разработана специалистами Министерства образования республики Беларусь и Национальной академии наук Беларуси во исполнение задания 3.4.02 “Создание и использование национальной нанотехнологической...»

«I МЕЖДУНАРОДНАЯ НАУЧНО-ПРАКТИЧЕСКАЯ СТУДЕНЧЕСКАЯ КОНФЕРЕНЦИЯ РАЗВИТИЕ МАШИНОСТРОИТЕЛЬНОЙ ОТРАСЛИ СТРАН МИРА г. Вязьма 2013 УДК 658/100 ББК – 65.30(0) Р - 15 I Международная научно-практическая студенческая конференция: Развитие машиностроительной отрасли стран мира, Вязьма: филиал ФГБОУ ВПО МГИУ в г. Вязьме, 2013 –77 с. ОРГАНИЗАЦИОННЫЙ КОМИТЕТ Бармашова Л.В., доцент, кэн, зав. кафедрой Менеджмента и экономического анализа, филиал ФГБОУ ВПО МГИУ в г. Вязьме Викторова Т.С., доцент, кэн, зав....»

«Рецензент Кафедра Информационный и электронный сервис к.т.н., доц. Жуков Г. П. ОПЕРАЦИОННЫЕ СИСТЕМЫ ЛАБОРАТОРНЫЙ ПРАКТИКУМ для студентов направления 230100.62 Информатика и вычислительная техника Операционные системы : лабораторный практикум / сост. О 60 А. А. Попов, А. В. Савенко, А. В. Шляпкин. – Тольятти : Изд-во ПВГУС, 2012. – 108 с. Для студентов направления 230100.62 Информатика и вычислительная техника. Одобрено Учебно-методическим Советом университета Составители: Попов А. А., Савенко...»

«СБОРНИК НАУЧНЫХ ТРУДОВ Первой Международной научно-методической конференции МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ В НАУКЕ И ОБРАЗОВАНИИ Секция: Сельскохозяйственные науки Киев, 1 сентября 2012 Первая Международная научно-методическая конференция МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ В НАУКЕ И ОБРАЗОВАНИИ МЕЖДИСЦИПЛИНАРНАЯ АКАДЕМИЯ НАУК УКРАИНЫ НАУЧНЫЙ ЦЕНТР СВЯЗИ И ИНФОРМАТИЗАЦИИ ВИТИ НТУУ “КПИ” Научно-исследовательская лаборатория МЕЖДИСЦИПЛИНАРНЫХ ИССЛЕДОВАНИЙ Военный институт телекоммуникаций и...»

«Состояние системы образования города Нижний Тагил по итогам 2012-2013 учебного года Нижний Тагил 2013 УДК 37 (470.54) ББК 74.04 (2-2 Н.Тагил) СОСТОЯНИЕ СИСТЕМЫ ОБРАЗОВАНИЯ ГОРОДА НИЖНИЙ ТАГИЛ ПО ИТОГАМ 2012-2013 УЧЕБНОГО ГОДА//Сборник аналитических материалов / отв.редактор Удинцева Т.А.- Нижний Тагил: ООО Тагил-Принт, 2013.– 155 с. Редакционная коллегия: Юрлов И.Е.- начальник управления образования Администрации г. Нижний Тагил Удинцева Т.А.- заместитель начальника управления образования...»

«Е.Н. Зверева Основы культуры речи Теоретический курс Москва 2008 1 ББК 811.161.1 УДК 81.2 Рус З 433 Зверева Е.Н. ОСНОВЫ КУЛЬТУРЫ РЕЧИ: Теоретический курс. – М.: Изд. Центр ЕАОИ, 2008. – 219 с. ISBN 5-374-00011-Х © Зверева Е.Н., 2008 © Евразийский открытый институт, 2008 2 Содержание ТЕМА 1. Культура речи как образовательная дисциплина 5 1.1. Актуальность и предмет курса Культура речи 1.2. Современная теоретическая концепция культуры речи. 12 ТЕМА 2. Язык и речь. Формы существования языка. 15...»

«NASSIM NICHOLAS TALEB FOOLED BY RANDOMNESS The Hidden Role of Chance in the Markets and in Life TEXERE New York • London 2 Нассим Николас Талеб ОДУРАЧЕННЫЕ СЛУЧАЙНОСТЬЮ Скрытая роль Шанса на Рынках и в Жизни 3 Нассим Николас Талеб. Одураченные случайностью. Скрытая роль Шанса на Рынках и в Жизни. М: Интернет-трейдинг,- 248 с. 18ВЫ 5-9900027-2-6 Русская рулетка и лидеры бизнеса, классическая история и финансовые спекуляции, поэзия и математика, Шерлок Холмс и научные войны - все есть в этом...»

«Кульчицька Є. І., Чорна Л. Г. Діагностика рівня розвитку творчих здібностей / Є. І. Кульчицька, Л. Г. Чорна // Обдарована дитина. – 2003. - №4. – С. 13-28; 2003. - №5. – С. 42-50 (рос. мовою) ДИАГНОСТИКА УРОВНЯ РАЗВИТИЯ ТВОРЧЕСКИХ СПОСОБНОСТЕЙ Кульчицкая Е. И., доктор психологических наук, профессор; Черная Л. Г., научный сотрудник лаборатории психологии творчества Института психологии им.Г.С. Костюка АПН Украины Применение тестов, диагностирующих уровень творчества - это одна из наиболее...»






 
© 2013 www.knigi.konflib.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.