Научная библиотека

Pages:     | 1 |   ...   | 70 | 71 ||

«В.К. Шитиков, Г.С. Розенберг Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R Исправленная и дополненная интернет-версия от ...»

-- [ Страница 72 ] --

Faraway J.J. Extending the linear model with R: generalized linear, mixed effects and nonparametric regression models. Boca Raton (FL): Chapman & Hall, 2006. 331 p.

Felsenstein J. Condence limits on phylogenies: an approach using the bootstrap // Evolution.

1985.V.39. P. 783-791.

Fisher R.A. The arrangement of eld experiments // Journal of the Ministry of Agriculture of GreatBritain. 1926. Vol. 33. P. 700-725.

Fisher R.A. The Design of Experiments. 8-th edit. N.Y.: Hafner Pub. Co., 1966. 248 p. (1-th edit.

Fox J. An R and S-Plus Companion to Applied Regression. London: Sage Publications Inc., Garnier E., Cortez J., Billes G. at al. Plant functional markers capture ecosystem properties during secondary succession // Ecology. 2004. V. 85. P. 2630-2637.

Goldberg D.E. Genetic algorithms in search, optimization and machine learning. Reading (MA):

Addison Wesley, 1989. 432 p.

Good P. Introduction to Statistics Through Resampling Methods and R/S-Plus. N.Y.: Springer, Good P. Permutation, parametric and bootstrap tests of hypotheses. N.Y.: Springer, 2005б. Good P. Resampling Methods: a practical guide to data analysis. N.Y.: Springer, 2006. 218 p.

Goodall C.R. Procrustes methods in the statistical analysis of shape // Journal of the Royal Statistical Society. 1991. Series B, V. 53. P. 285-339.

Goodman L.A., Kruskal W.H. Measures of association for cross classifications // Journal of the American Statistical Association. 1954. V. 49. P. 732-764.

Gordon A.D. Classification. London: Chapman and Hall/CRC, 1999. 248 p.

Gotelli N.J. Null model analysis of species co-occurrence patterns // Ecology. 2000. V. 81. P.


Gotelli N.J., Graves G.R. Null Models in Ecology. Washington (DC): Smithonian Inst. Press, Gotelli N.J., Entsminger N.J. Swap algorithms in null model analysis // Ecology. 2003. V. 84. P.


Gotelli N.J., McGill B.J. Null versus neutral models: what’s the difference? // Ecography. 2006.

V. 29. P. 793-800.

Guisan A., Thuillier W. Predicting species distribution: offering more than simple habitats models // Ecol. letters. 2005. V. 8. P. 993-1009.

Hartig F., Calabrese J.M., Reineking B. et al. Statistical inference for stochastic simulation models – theory and application // Ecol. Lett. 2011. V.14. P. 816-827.

Hastie T., Tibshirani R. Generalized Additive Models. London: Chapman & Hall, 1990. 335 p.

Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference and Prediction. N.Y.: Springer-Verlag. 2009. 763 p Helsel D. R., Hirsch R. Statistical methods in water resources. Techniques of Water Resources Investigations.U.S.: Geological Survey, 2002. Chap. A3, book 4. 522 p.

Henry M., Stevens H. A Primer of Ecology with R. N.Y.: Springer, 2009. 402 p.

Hothorn T, Hornik K, Zeileis A. Unbiased Recursive Partitioning: A Conditional Inference Framework // Journal of Computational and Graphical Statistics. 2006. V. 15, № 3. P. 651Howell D. C. Statistical Methods for Psychology. Wadsworth: Cengage Learning, 2009. 793 p.

Howell D. C. Fundamental Statistics for the Behavioral Sciences. Wadsworth: Cengage Learning, 2010. 676 p.

Huisman J., Olff H., Fresco L.F. A hierarchical set of models for species response analysis // J.

Veg. Sci. 1993. V. 4. P. 37-46.

Hurlbert S.H. Pseudoreplication and the design of ecological field experiments // Ecological Monographs. 1984. V. 54. P. 187-211. Перевод см: Проблемы экологического эксперимента (Планирование и анализ наблюдений). Тольятти: СамНЦ РАН, Кассандра, 2008. С. 9-45. URL: http://www.ievbras.ru/ecostat/Kiril/Download/Mepe.pdf.

Hyndman R., Koehler A.B., Ord J.K. et al. Forecasting with exponential smoothing: the state space approach. Berlin: Springer-Verlag, 2008. 376 р.

Jongman R.H.G., ter Braak C.J.F., van Tongeren O.F.R. Data Analysis in Community and Landscape Ecology. Wageningen: Pudoc, 1987. 299 p. [Пер. с англ.: Джонгман Р.Г.Г., тер Браак С.Дж.Ф., ван Тонгерен О.Ф.Р. Анализ данных в экологии сообществ и ландшафтов. М.: РАСХН. 1999. 306 с.].

Jung K. Least Trimmed Squares Estimator in the Errors-in-Variables Model // Journal of Applied Statistics. 2007. V. 34, № 3. P. 331-338.

Kaufman L., Rousseeuw P.J. Finding Groups in Data. An Introduction to Cluster Analysis.

Hoboken (NJ): Wiley & Sons Inc., 2005. P. 342.

Kempthorne O. Sampling inference, experimental inference and observation inference. // Sankhya: The Indian Journal of Statistics, Series B. 1979. V. 40, 3/4. P. 115-145.

Kempthorne O., Doerfler T.E. The Behaviour of Some Significance Tests under Experimental Randomization // Biometrika. 1969. V. 56. P. 231-248.

Kohonen T. Self-organized formation of topologically correct feature maps // Biological Cybernetics. 1982. № 43. P. 59-69.

Khromov-Borisov N.N., Henriques J. A.P. Good statistics practice (GSP) in genetic toxicology // Mutat. Res. 1998. V. 405, N. 1. P. 97-108.

Kuan C.-M., Hornik K. The generalized uctuation test: A unifying view // Econometric Reviews. 1995. V. 14. P. 135-161.

Legendre P., Gallagher E. Ecologically meaningful transformations for ordination of species data // Oecologia. 2001. V. 129. P. 271-280.

Legendre P., Legendre L. Numerical Ecology. Amsterdam: Elsevier Sci. BV, 1998. 853 p.

Lep J., de Bello F., Lavorel S. et al. Quantifying and interpreting functional diversity of natural communities: practical considerations matter // Preslia. 2006. V. 78. P. 481–501.

Link W.A., Baker R.J. Bayesian Inference: with Ecological Applications. London: Elsevier Ltd.

Academic Press. 2009. 339 р.

Liu H., Ciannelli L., Decker M.B. et al. Nonparametric Threshold Model of Zero-Inflated SpatioTemporal Data with Application to Shifts in Jellyfish Distribution // Journal of Agricultural, Biological and Environmental Statistics. 2011. V. 16. P. 185- Logan M. Biostatistical Design and Analysis Using R: A Practical Guide. Chichester: WileyBlackwell, 2010. 576 p.

Lunneborg C. E. Data analysis by resampling: Concepts and applications. Pacific Grove (CA):

Duxbury, 2000. 568 p.

MacArthur R.H. On the relative abundance of bird species // Proc. Natl. Acad. Sci. USA. 1957.

V. 45. P. 293-295.

Maindonald J., Braun W.J. Data Analysis and Graphics Using R. Cambridge: University Press, Manly B.F.J. Randomization, bootstrap and Monte Carlo methods in biology. London:Chapman & Hall, 2007. 445 p.

Mantel N. The detection of disease clustering and a generalized regression approach // Cancer Res. 1967. V. 27. P. 209-220.

Marcus L., Corti M., Loy A. et al. Advances in morphometrics. N.Y., London: Plenum Press, Mason N.W., Mouillot D., Lee W.G. et al. Functional richness, functional evenness and functional divergence: the primary components of functional diversity // Oikos. 2005. V.

111. P. 112-118.

McArdle B.H., Anderson M.J. Fitting multivariate models to community data: a comment on distance-based redundancy analysis // Ecology. 2001. V. 82, № 1. P. 290-297.

McCarthy M.A. Bayesian Methods for Ecology. Cambridge: University Press, 2007. 310 p.

McCullagh P., Nelder J.A. Generalized Linear Models. London: Chapman & Hall, 1989. 511 р.

McCune B., Grace J.B., Urban D.L. Analysis of Ecological Communities. Gleneden Beach (OR): MjM Software, 2002. 285 p.

Mielke P.W. Meteorological applications of permutation techniques based on distance functions // Handbook of Statistics. V. 4. Nonparametric Methods. Amsterdam: North-Holland, 1984. P. 813-830.

Mielke P.W., Berry K.J. Permutation Methods: A Distance Function Approach. N.Y.: SpringerVerlag, 2001. 357 p.

Mikls I., Podani J. Randomization of presence-absence matrices: comments and new algorithms // Ecology. 2004. V. 85. P. 86-92.

Miller A.J. Subset Selection in Regression. N.Y.: Chapman and Hall, 1990. 256 p.

Minchin P.R. An evaluation of the relative robustness of techniques for ecological ordination // Vegetatio. 1987. V. 67. P. 1167-1179.

Mooney C.Z., Duval R.D. Bootstrapping. A nonparametric approach to statistical inference. Sage (CA): University paper, 1993. 80 p.

Moore D. Bootstrap Methods and Permutation Tests // The Practice of Business Statistics. Ed.

T. Hesterberg. N.Y.: Freeman & Co, 2003. Cap. 14. 70 p.

Oberhofer W., Kmenta J. A General Procedure for Obtaining Maximum Likelihood Estimates in Generalized Regression Models // Econometrica, 1974. V. 42, № 3. P. 579-590.

Oksanen J., Minchin P.R. Continuum theory revisited: what shape are species responses along ecological gradients? // Ecol. Modelling. 2002. V. 157. P. 119-129.

Paradis E. Analysis of Phylogenetics and Evolution with R. N.Y.: Springer, 2009. 211 p.

Pateeld W.M. Algorithm AS159. An efcient method of generating r x c tables with given row and column totals // Applied Statistics. 1981. V. 30. P. 91-97.

Perry J.A., Schaeffer D.J. The longitudinal distributions of or riverine benthos: a river discontinuum? // Hydrobiologia. 1987. V. 148. P. 257-268.

Petchey O.L., Gaston K.J. Dendrograms and measuring functional diversity // Oikos. 2007. V.

116. P. 1422-1426.

Petchey O.L., Gaston K.J. Functional diversity (FD), species richness, and community composition // Ecology Letters. 2002. V. 5. P. 402-411.

Pielou E.C. Ecological Diversity. N.Y.: Wiley, 1975. 165 p.

Pillar V.D. The bootstrapped ordination reexamined. // J. Vegetation Sci. 1999. V. 10. P. 895Pinheiro, J. C., Bates D.M. Mixed effects models in S and S-plus. N.Y.: Springer, 2000. 528 p.

Rao C.R. Diversity and dissimilarity coefficients: a unified approach // Theor. Popul. Biol. 1982.

Rao C.R. The use and interpretation of principal component analysis in applied research // Sankhya. 1964. Ser. A. V. 26. P. 329-358.

Revelle W., Rocklin T. Very Simple Structure: an alternative procedure for estimating the optimal number of interpretable factors // Multivariate Behavioral Research. 1979. V. 14. P. 403Ricotta C. Through the jungle of biological diversity // Acta Biotheor. 2005. V. 53. P. 29-38.

Ricotta C., Avena G.C. An information-theoretical measure of taxonomic diversity // Acta Biotheor. 2003. V. 51. P. 35-41.

Roberts D.W. Ordination on the basis of fuzzy set theory // Vegetatio. 1986. V. 66. P. 123-131.

Roberts D.W. Statistical analysis of multidimensional fuzzy set ordinations // Ecology. 2008. V.

89, № 5. P. 1246-1260.

Ross G.J, Tasoulis D.K., Adams N.M. Nonparametric Monitoring of Data Streams for Changes in Location and Scale // Technometrics. 2011. V. 53, № 4. P. 379-389.

Rubinstein R.Y., Kroese D.P. Simulation and the Monte Carlo Method. Hoboken (NJ): Wiley & Saigo H. Comparing Four Bootstrap Methods for Stratified Three-Stage Sampling // Journal of Official Statistics. 2010. V. 26, №.1. P. 193-207.

Schaffer W. M. Stretching and folding in lynx fur returns: evidence for astrange attractor in nature? //Am. Nat. 1984. V. 124, № 6. P. 798-820.

Scherer R., Schaarschmidt F. Simultaneous condence intervals for comparing biodiversity indices estimated from overdispersed count data // Biometrical Journal. 2013. V.55. P.

Schluter D. A variance test for detecting species associations, with some example applications // Ecology. 1984. V. 65. P. 998-1005.

Seber G.A.F. Multivariate Observations. N.Y.: Wiley, 2004. 686 p.

Seefeld K., Linder E. Statistics Using R with Biological Examples. Durham (NH): University Press, 2007. URL: http://cran.r-project.org/doc/contrib/Seefeld_StatsRBio.pdf.

Shimodaira H. An approximately unbiased test of phylogenetic tree selection // Syst. Biol. 2002.

Singer J.D., Willett J.B. Applied Longitudinal Data Analysis: Modeling Change and Event Occurrence. N.Y.: Oxford University Press, 2003. 672 p.

Simon J. L. Resampling: the new statistics. Arlington (VA): Resampling Stats, 1997. 209 p.

Smouse P., Long J., Sokal R. Multiple Regression and Correlation Extensions of the Mantel Test of Matrix Correspondence // Systematic Zoology. 1986. V. 35, No. 4. P. 627- Soetaert K., Herman P. A Practical Guide to Ecological Modelling – Using R as a Simulation Platform. N.Y.: Springer, 2009. 372 p.

Sokal R.R., Rohlf F.J. Biometry: The principles and practice of statistics in biological research.

N.Y.: Freeman, 1981. 887 p.

Stone L., Roberts A. The checkerboard score and species distributions // Oecologia. 1990. V. 85.

Teetor P. 25 Recipes for Getting Started with R. Sebastopol (CA): O'Reilly Media, 2011. 62 p.

ter Braak C.J. Canonical correspondence analysis: a new eigenvector technique for multivariate direct gradient analysis // Ecology. 1986. V. 67. P. 1167-1179.

ter Braak C.J. Principal components biplots and alpha and beta diversity // Ecology. 1983. V. 64.

Tich L. JUICE, software for vegetation classification // J. Veg. Sci. 2002. V. 13. P. 451-453.

Tilman D. Functional diversity // Encyclopedia of Biodiversity (ed. Levin S.A.). San Diego:

Academic Press, 2001. P. 109-120.

Tukey J.W. Bias and confidence in not quite large samples // Ann. Math. Statist. 1958. V. 29. P.

Venables W.N., Ripley B.D. Modern Applied Statistics with S. N.Y.: Springer, 2003. 496 p.

Warwick R.M., Clarke K.R. Relearning the ABC: taxonomic changes and abundance/biomass relationships in disturbed benthic communities // Mar. Biol. 1994. V. 118, № 4. P. 739Warwick R.M., Clarke K.R. New ‘biodiversity’ measures reveal a decrease in taxonomic distinctness with increasing stress // Mar. Ecol. Prog. 1995. Ser. 129. P. 301-305.

Wehrens R. Chemometrics with R. N.Y.: Springer, 2011. 285 p.

Wood S. N. Generalized Additive Models: An Introduction with R. London: Chapman and Hall/CRC Press, 2006. 391 p.

Wright D.H., Patterson B.D., Mikkelson G.M. et al. A comparative analysis of nested subset patterns of species composition // Oecologia. 1998. V. 113. P. 1-20.

Zadeh L.A. Fuzzy sets // Information and Control. 1965. V. 8. P. 338-353.

Zieffler A.S., Harring J.R., Long J.D. Comparing Groups. Randomization and Bootstrap Methods Using R. Hoboken (NJ): Wiley & Sons Inc., 2011. 298 p.

Zuur A. F., Ieno E.N., Walker N. et al. Mixed Effects, Models and Extensions in Ecology with R.

Berlin: Springer Sci., 2009. 574 p.

Zuur A.F., Fryer R.J., Jolliffe I.T. et al. Estimating common trends in multivariate time series using dynamic factor analysis // Environmetrics, 2003. V. 7. P. 665-685.

Указатель использованных примеров и их краткое описание 1. Данные мониторинга экосистемы Куйбышевского водохранилища (1957-1988 гг).

Избранные публикации:

Меншуткин В.В., Паутова В.Н., Номоконова и др. Статистические связи в экосистеме Куйбышевского водохранилища // Гидробиол. журн. 1998. Т. 34. № 5. С. 94-103.

Шитиков В.К., Выхристюк Л.А., Паутова В.Н., Зинченко Т.Д. Многофакторное экологическое районирование Куйбышевского водохранилища // Водные ресурсы.

2007. Т. 34, № 4. С. 481-489.

Куйбышевское водохранилище (научно-информационный справочник) / Ред.

Розенберг Г.С., Выхристюк Л.А. Тольятти: ИЭВБ РАН, 2008. 123 с.

Фрагменты базы данных использовались для иллюстрации примеров в разделах 2.3, 2.4, 4.2, 4.8, 6.9 и на протяжении всей главы 7.

2. Макрозообентос малых рек Средней Волги. Гидробиологическая съемка донных сообществ проводилась на 40 средних и малых реках бассейна Куйбышевского и Саратовского водохранилищ, протекающих в основном на территории Самарской обл.

В течении вегетативных сезонов 1986-2013 гг. на 228 створах рек было взято гидробиологических проб, в которых было обнаружено 580 видов бентосных организмов. В ходе мониторинга водотоков оценивались также гидрологические и гидрохимические показатели.

В качестве отдельного модельного объекта рассматривалась средняя равнинная река Сок (375 км) вместе с ее притоком р. Байтуган (22 км). Здесь на 22 станциях наблюдения по результатам 147 гидробиологических проб в исходные таблицы было включено 375 видов и таксономических групп бентоса.

Исследования проводились лабораторией малых рек института экологии Волжского бассейна (рук. д.б.н. Зинченко Т.Д.). Избранные публикации:

Зинченко Т.Д. Эколого-фаунистическая характеристика хирономид (Diptera, Chironomidae) малых рек бассейна Средней и Нижней Волги (атлас). Тольятти: Кассандра, 2011.

Особенности пресноводных экосистем малых рек Волжского бассейна / Ред.

Розенберг Г.С., Зинченко Т.Д. Тольятти: Кассандра, 2011. 322 с.

Фрагменты базы данных использовались для иллюстрации примеров в разделах 1.4, 1.6, 2.3, 2.7, 2.8, 2.9, 3.1, 3.3, 3.6, 4.3, 4.8, 5.1, 5.2, 5.4, 5.6, 5.7, 6.2 и 6.3.

3. Геоботанические описания травянистого покрова в дельте р. Волга. В течение 1979-1981 гг. на 159 участках изучался состав травянистых растений (тростника, рагозы, пырея, череды, алтея и др.) и оценивалась в г/м2 площади их суммарная надземная биомасса. По результатам химического анализа водной вытяжки определялся ионный состав почв: хлориды, сульфаты, бикарбонаты, кальций, натрий и магний. Для каждого участка измерялась средняя высота над уровнем межени, которая имеет сильную корреляцию со степенью увлажненности грунта.

Анализ собранных материалов является частью комплексных исследований растительности Волжского бассейна, проводимых лабораторией фитоценологии института экологии Волжского бассейна (рук. д.б.н. Голуб В.Б.). Ссылка на публикацию:

Голуб В.Б., Пилипенко В.Н., Лосев Г.А. Результаты оценки совместного влияния влажности и засоления почны на встречаемость растений дельты Волги и величину их надземной биомассы. // Биологические науки, 1986. № 7. С. 93-98.

Данные использовались для иллюстрации примеров в разделах 4.5, 4.6, 5.3, 5.5, 6.2, 6.3 и 6.5.

4. Морфометрические данные популяций полевки красной в районе оз. Байкал. Особи красной полевки (Clethrionomys rutilus) отлавливались в ходе экспедиционных исследований 1979-1983 гг. в темнохвойной тайге северных предгорий хребта ХамарДабан и в байкальской котловине на различном расстоянии (5100 км) от Байкальского целлюлозно-бумажного комбината (БЦБК). Предметом морфометрических исследований явились массо-размерные характеристики животных в целом и отдельных внутренних органов, а также промеры черепных элементов и координаты характерных точек мандибул. Всего с разной степенью детализации было изучено 1230 особей.

Материал любезно предоставлен проф. Коросовым А.В. (Петрозаводский государственный университет) и нашел отражение в публикациях, представленных на сайте http://korosov.narod.ru :

Коросов А. В., Демидович А. П. Оценка состояния населения мелких млекопитающих в зоне действия Байкальского целлюлозного комбината // Региональный мониторинг состояния озера Байкал. Л.: Гидрометеоиздат, 1987. С. 212-220.

Коросов А. В. Метод теневой остеометрии // Зоол. журн. 1988. Т. 68. Вып. 3. С. 121-125.

Фрагменты данных использовались для иллюстрации примеров в разделах 4.7, 6. и 6.7.

5. Морфологические признаки и свойства ядовитого секрета популяций гадюки обыкновенной. На территории европейской части России встречаются два подвида обыкновенной гадюки Vipera berus – номинативный V. b. berus и гадюка Никольского V. b.

Nikolskii. Отлов животных проводился в Пермском крае (пос. Чепец и пос. Березовая Старица), а также в различных местообитаниях Вологодской, Пензенской, Липецкой, Саратовской и Самарской обл. Измерялись следующие морфологические признаки:

количество брюшных щитков (Ventr.), количество пар подхвостовых (S.cd.) щитков, количество рядов чешуй вокруг середины тела (Sq.), количество верхнегубных (Lab.) и нижнегубных (S.lab.) щитков, количество чешуй вокруг глаза (C.oc.), количество мелких щитков между глазом и верхнегубными щитками (S.oc.), количество скуловых щитков (Lor.), количество интеркантальных чешуй (Ic.), число парафронтальных щитков (Pf.). В обобранном ядовитом секрете в лабораторных условиях определяли протеолитическую активность яда (ПА) и оксидазы L-аминокислот (L-АМО). Объем выборок – животных, из них, 36 самцов и 64 самки.

Размерные показатели ящерицы живородящей и прыткой. Анализировались массо-размерные характеристики ящериц Zootoca vivipara, отловленных в различных районах Пермского края и Пензенской обл. Объем выборок – 92 самки, имеющие новорожденных животных и 86 взрослых самцов. Другая выборка ящерицы прыткой Lacerta agilis состояла из 213 особей, отловленных в окрестностях Тольятти и с. Мордово.

Сбор материала проводился лабораторией герпетологии института экологии Волжского бассейна (рук. к.б.н. Маленев А.Л., к.б.н. Епланова Г.В.).

Избранные публикации:

Маленев А.Л., Зайцева О.В., Бакиев А.Г., Зиненко А.И. Обыкновенная гадюка на границе речных бассейнов Волги и Дона: особенности морфологии змей и свойств ядовитого секрета в популяции из Пензенской области // Современная герпетология. 2010. Т.

10, вып. 3 / 4. С. 115–120.

Четанов Н.А., Епланова Г.В. Статистический анализ флуктуирующей асиметриии билатеральных признаков живородящей ящерицы Zootoca vivipara // Известия Самарского научного центра РАН. 2011. Т. 13, №1. С. 144 - Фрагменты данных использовались для иллюстрации примеров в разделах 1.4, 1.5, 2.5, 2.6, 3.4, 6.8 и 7.7.

6. Состав липидов и жирных кислот ульвы в малых реках Приэльтонья. Образцы зеленой водоросли Ulva intestinalis отбирались в период с 2006 по 2010 гг. на 10 станциях рек Хара, Солянка, Сморогда, Чернавка, Ланцуг, питающих оз. Эльтон и имеющих различный уровень минерализации воды. Анализ липидного состава проводился лабораторией экологической биохимии института экологии Волжского бассейна (рук.

д.б.н. Розенцвет О.А.). Ссылка на публикацию:

Розенцвет О.А., Нестеров В.Н., Богданова Е.С.. Влияние абиотических факторов на состав липидов Ulva intestinalis (L.) Link (Chlorophyta) в малых реках бассейна оз.

Эльтон Прикаспийской низменности. // Биология внутренних вод, 2012. № 2. С. 214Фрагмент данных использовался для иллюстрации примера к разделу 2.6.

7. Полиморфизм локальных популяций улиток Крыма. В четырех физикогеографических районах Крыма был проведен сбор 3115 экземпляров моллюсков Helix albescens. В лабораторных условиях был проанализирован характер опоясанности раковин и были рассчитаны частоты встречаемости отдельных морф.

Для иллюстрации примера к разделу 3.2 с согласия авторов использован материал статьи:

Крамаренко С.С., Леонов С.В. Фенетическая структура крымских популяций наземного моллюска Helix albescens (Gastropoda, Pulmonata, Helicidae) // Экология. 2011. № 2. С.

Пространственное распределение популяций наземных моллюсков. Сбор материала осуществлялся в 2011 году в пределах стационара Днепропетровского национального университета им. О. Гончара. Пробные площадки исследуемого участка располагались вдоль 8 линий по 20 квадратов в каждой линии на расстоянии 1,5 м между их центрами (как по вертикали, так и по горизонтали). Улитки видов Brephulopsis cylindrica и Monacha carthusiana собирались в пределах квадрата 0,50,5 м и подсчитывалось число особей различных размерно-возрастных групп. Для иллюстрации примера к разделу 7.5 с согласия авторов использован материал статьи:

Винарский М.В., Крамаренко С.С., Лазуткина Е.А. и др. Статистические методы в изучении континентальных моллюсков // Статистические методы анализа в биологии и медицине. Омск: Вариант, 2012. С. 5-94.

8. Видовой состав рыбного населения Чебоксарского водохранилища. В период 1996гг. с использованием неводов с ячеей 6 мм на 67 станциях пяти участков водохранилища было отловлено 26596 особей 34 видов рыб. Были рассчитаны частоты встречаемости отдельных видов на каждом из участков.

Для иллюстрации примера к разделу 3.2 с согласия авторов использован материал статьи:

Минин А.Е., Постнов Д.И., Логинов В.В., Якимов В.Н. К вопросу о статистическом анализе пространственной структуры рыбного населения прибрежья Чебоксарского водохранилища по данным неводных съемок // Известия Калининградского государственного технического университета. 2011. Т. 22. C. 159-166.

9. Высотное распределение фауны дождевых червей Северного Кавказа. Сбор дождевых червей проведился в течение полевых сезонов 2002–2010 гг. на подветренных склонах Скалистого, Бокового и Главного Кавказского хребтов. Общий объем исследованного материала – более 7000 экз. из 149 биотопов разных высотных поясов Терского и Эльбрусского вариантов поясности, граница между которыми проходит по линии Дыхтау-Каракая в нижнем течении р. Баксан.

Материал любезно предоставлен к.б.н. Рапопорт И.Б. (Институт экологии горных территорий КБНЦ РАН). Ссылка на публикацию:

Рапопорт И. Б. Высотное распределение дождевых червей (Oligochaeta, Lumbricidae) в центральной части Северного Кавказа. // Зоологический журнал, 2013. Т. 92, № 1. С.

Фрагмент данных использовался для иллюстрации примера к разделу 3.5.

Статистическая среда R и ее использование для обработки данных Предуведомление Подробно комментируемые скрипты, позволяющие выполнить расчеты по примерам, представленным в основных разделах, а также файлы с исходными данными для выполнения этих скриптов могут быть загружены из ресурса Интернет:

http://www.ievbras.ru/ecostat/Kiril/Article/A32/Data.zip Основные Интернет-ссылки Cистема статистических расчётов R является свободно распространяемой программной средой с открытым исходным кодом, развиваемая в рамках проекта GNU. С основного сайта проекта (http://cran.r-project.org) можно бесплатно загрузить бинарные сборки для всех основных поддерживаемых платформ (Windows, UNIX и MacOS), большое число специализированных пакетов, а также, при желании, исходные тексты программных модулей. Система оснащена языком программирования высокого уровня для статистической обработки данных и работы с графикой.

Приведем некоторые русскоязычные сайты, поддерживаемые группами энтузиастов, где приводятся переводы документации по R, методические материалы, ведется обсуждение и обмен идеями, а также оказывается помощь новичкам в решении их проблем:

o http://r-analytics.blogspot.com/ - блог «Анализ и визуализация данных»


o http://www.linuxformat.ru/archive.phtml - архив журнала Lunix Format (см. 2008 г o http://r-statistics.livejournal.com/ - разделы в «Живом журнале»;

o http://www.inp.nsk.su/~baldin/DataAnalysis/index.html - материалы Е.Балдина;

o http://herba.msu.ru/shipunov/school/sch-ru.htm - материалы А.Шипунова;

o http://voliadis.ru/R-intro - материалы Р. Габидуллина;

o http://molbiol.ru/forums/index.php?showtopic=102724&st=600 – раздел в форуме «Биофизика и матметоды в биологии»;

o http://donbas-socproject.blogspot.com/search/label/учебник по R - блог «странного ученого» М.Касьянчука;

o http://chetvericov.ru/tag/r/#.UBu9waDB9K0 – блог «аспиранта-психолога»

А. Четверикова;

o http://alexwin1961.livejournal.com/tag/r - блог А.Виноградова;

o http://vk.com/club8142131 - открытая группа ВКонтакте и т.д., а также наиболее интересные сайты, связанные с решением экологических задач:

o http://ecology.msu.montana.edu/labdsv/R/ - лабораторные работы по статистике в R для студентов экологического факультета университета в Монтане;

o http://www.bio.umontreal.ca/legendre/indexEn.html – страница П.Лежандра, проф.

Монреальского университета, содержащая много скриптов и функций R.

Краткое руководство по установке и настройке среды 1. Скачать и установить базовую комплектацию статистической среды R; это можно сделать с основного сайта проекта http://cran.r-project.org или русского «зеркала»

http://cran.gis-lab.info – всего около 40 Мб.

2. Выделить рабочий каталог для хранения скриптов, исходных данных и результатов. Удобно прописать путь к нему в системных файлах R, для чего добавить текстовым редактором в файл C:\Program Files\R\R-3.00.2\etc\Rprofile.site строчку setwd("D:/R/Process/Resampling") # или любой иной каталог на Вашем компьютере.

Весьма нежелательно использовать в названии рабочего каталога символы кириллицы.

3. Работать с системой R можно в командном окне R Console, что следует только приветствовать. Существуют, тем не менее, различные надстройки, позволяющие проводить вычисления в среде, используя традиционную систему меню, например, R Commander, которую можно установить, выполнив команду загрузки пакета install.packages ("Rcmdr"). Это позволит вам осуществлять обработку данных (вывод графиков и расчет всех основных статистических критериев) в рамках регрессионного и дисперсионного анализа, не будучи знакомым с синтаксисом языка R. Познакомиться с более продвинутыми средствами интерфейса запуска и отладки скриптов можно, например, на сайте http://bioinformatics.ru/Data-Analysis/R-ide.html.

4. Скачать, распаковать Data.zip и копировать в рабочий каталог комплект скриптов и данных к отдельным главам книги (см. Предуведомление).

Основные конструкции языка среды R Как и в любой вычислительной среде, основными компонентами R являются данные и операторы их обработки. Базовым объектом данных является вектор – проиндексированная последовательность числовых, символьных, логических, факториальных или иных специальных величин. Частными случаями векторов являются простая переменная, матрица (matrix – связанная совокупность однородных векторов), таблица данных (data.frame – матрица со столбцами разного типа) и список (list – иерархическая структура из векторов, матриц и т.д.).

Операторы обработки данных по синтаксису мало чем отличаются от традиционных языков программирования. Важнейшим отличием является громадное количество доступных функций, поэтому для уверенной работы в R нужна, прежде всего, хорошая память самого пользователя. Ниже приведены некоторые примеры операторов:

2*2 ; a - 1/ a = factorial(10)/sin(2*pi) v = c(8.12,0,-64)^2 Создаем вектор v из квадратов трех числовых значений seq(-5, 5, by=.2) - v Помещаем в вектор v последовательность чисел от -5 до 5 с sum(v) ; mean(v) ; median(v) Получаем сумму, среднее, медиану, дисперсию и v = rnorm(n=1000,mean=0,sd=1) Формируем вектор 1000 случайных чисел из нормального hist(v) ; boxplot(v) ; qqplot(v) распределения с нулевым средним и единичной дисперсией, plot(density(v),col="red", lwd=2) рисуем гистограмму и графики плотности распределения s - c(LETTERS[7:12], letters[1:7]) Создаем вектор из прописных и строчных букв от ‘а’ до ‘L’, sr - sample(s) ; ss - sr[order(sr)] случайно их перемешиваем, затем сортируем по алфавиту f - function (x, a) (2*x-a)^ xmin - optimize(f, c(0, 1), a = 0.35) A - read.table(“As.txt”, header=F) A[is.na(A)] - 0 ; n -ncol(A) colnames(a) = c("sex","X","Y”) plot(A$X, A$Y, pch=A$sex) Строим «облако» точек зависимости Y = f(X) table(A$sex) ; attach(A) Подсчитываем число значений каждого класса sex A-transform(A,sexf= as.factor(sex)) Добавляем в таблицу A столбец с фактором и выполняем summary(aov(X ~ sexf, data=A)) дисперсионный анализ m - lm(Y~X+sexf) ; summary(m) Получаем регрессионную модель зависимости Y= f(X, sex) и predict(m, interval="confidence") рассчитываем модельные значения Как и в любом языке программирования, в процедурах R широко используются создание собственных функций, условный оператор if (условие) {выражение}, оператор цикла for (i in 1:n) {выражение} и т.д. Существуют развитые средства импорта исходных данных из внешних файлов различных форматов (.txt,.xls,.dbf, mdb и т.д.) или экспорта результатов в файлы.pdf,.doc и др.

При работе с использованием командного окна R Console мы рекомендуем во всех случаях создавать файл со скриптом (т.е. последовательностью операторов языка R, выполняющей определенные действия). Если этот файл существует, его лучше всего поместить в рабочий каталог, а если нет – создать там же новый текстовый файл с любым именем (но, для определенности, лучше с расширением *.r). Если после запуска R выбрать пункт меню "Файл Открыть скрипт", то этот файл откроется в окне "Редактор R". Далее выделяется любой осмысленный фрагмент подготовленного скрипта (от имени одной переменной до всего содержимого) и осуществляется запуск этого блока на выполнение.

Это можно сделать четырьмя возможными способами: (из основного и контекстного меню, кнопкой на панели инструментов и комбинацией клавиш Ctrl+R). Результаты, появившиеся в окне "Консоль", можно скопировать через буфер обмена в любой текстовый файл.

Установка используемых пакетов (package) Стандартная инсталляция статистической среды R содержит базовую комплектацию из 17 пакетов (base, graphics, datasets, stats, splines, spatial, MASS, tcltk и др.), содержащих более 1600 различных функций. Этот список может быть существенно расширен в зависимости от профиля выполняемых работ: количество доступных пакетов уже превысило 2000 и их число неуклонно растет. Приведем неполный список пакетов, которые мы активно использовали в своих скриптах:

выполнение расчетов по экологии сообществ (меры сходства, vegan, labdsv, разнообразия и вложенности, ординация и другие методы многомерного simboot и FD picante нуль-модели и анализ показателей в экологии и эволюции сообществ ade4 анализ данных мониторинга окружающей среды shapes функции геометрической морфометрии boot, bootstrap функции различных процедур бутстрепа и «складного ножа»

lawstat статистические критерии в биометрии car процедуры, связанные с прикладным регрессионным анализом FWDselect, packfor,glmulti lmodel2, lars специальные виды регрессии (RMA, LARS, Lasso и др.) lme4 построение моделей со смешанными эффектами tree, rpart, randomForest, построение иерархических деревьев регрессии party, mvpart Hotelling сравнение многомерных выборок cluster процедуры кластерного анализа pvclust бутстрепинг деревьев классификации klaR, kknn, e nnet, kohonen использование нейронных сетей и карт Кохонена pastecs анализ тренда временных рядов в экологии forecast прогнозирование временных рядов и модели сезонной динамики spatstat пространственное размещение точек, подбор моделей пространственные зависимости: геостатистические методы и spdep rjags связь c программой JAGS для получения марковских цепей Монте-Карло xlsReadWrite чтение и запись в файлы Excel lattice усовершенствованный графический пакет Нет необходимости сразу устанавливать все перечисленные пакеты, если Вы не планируете рассмотреть все примеры: для каждого скрипта достаточно установить только те пакеты, которые объявляются функцией library(…). Для установки пакета достаточно в командном окне R Console выбрать пункт меню «Пакеты Установить» или ввести, например, команду:

install.packages(c("vegan", "bootstrap", "boot", "lattice", "xlsReadWrite", "car")) Пакеты можно скачивать, например, с русского «зеркала» http://cran.gis-lab.info.

Использование функций, сохраненных в файлах скриптов Некоторые разработанные нами функции используются в скриптах, относящихся к разным разделам книги. Для их инициализации достаточно указать команду загрузки кода функций из файла, например:

После этого становятся доступными следующие функции:

#-----------------------------------Функция вывода результатов рандомизацационного теста произвольной статистики G RandRes - function (emp, sim, Nrand = 999, w.plot = 0) { # Параметры: emp - эмпирическое значение Gobs;

# Nrand - число итераций рандомизации; w.plot 0 - выводится окно с гистограммой # Подготовка таблицы для вывода результатов рандомизации CI - as.matrix(rep(NA, 7)) ; ; colnames(CI) - "Стат" rownames(CI) - c("Эмпир.знач.","Средн.Ранд","CIлев", "CIправ", "Р(рандэмп)","Р(рандэмп)","Р(|ранд||эмп|)") CI[1] - emp ; CI[2] - mean(sim) # Доверительные интервалы методом процентилей CI[3] - quantile(sim, prob=0.025) ; CI[4] - quantile(sim, prob=0.975) # Проверка односторонних гипотез CI[5] - (sum(sim = emp)+1) / (Nrand + 1) ; CI[6] - (sum(sim = emp)+1) / (Nrand + 1) # Проверка двухсторонней гипотезы CI[7] - (sum(abs(sim)- abs(emp) = 0)+1) / (Nrand + 1) # Расчет доверительных интервалов CI.l - quantile(sim, prob=0.025) ; CI.u - quantile(sim, prob=0.925) # Вывод гистограммы при необходимости if (w.plot == 1) { plot(hist(sim), col="gray80") ; abline(v= emp, lty=3,col=2,lwd=2) } return(t(CI))} #-----------------------------------Функция, выполняющая вывод результатов бутстепирования # Параметры: boots - выборка со значениями показателя, полученная в ходе бутстрепа # empar - показатель, рассчитанный по эмпирической выборке BootRes - function(boots,empar, w.plot = 0) { if (w.plot == 1) hist(boots) # вывод гистограммы # Определение смещения и квантиля t-распределения. Формирование таблицы с результатами.

bias - mean(boots) - empar; tc - qt(0.975, length(boots)-1) ;

CI - as.matrix(rep(NA, 7)) ; colnames(CI) - "Стат" rownames(CI) - c("Эмпир.знач","Смещ","Ошибка","CIлев t","CIправ t","CIлев Р", "CIправ Р") CI[1] - empar ; CI[2] - bias ; CI[3] - sqrt(var(boots)) # Доверительные интервалы с использованием t-распределения CI[4] - empar - bias - tc* CI[3] ; CI[5] - empar - bias + tc* CI[3] # Доверительные интервалы методом процентилей CI[6] - quantile(boots, prob=0.025); CI[7] - quantile(boots, prob=0.975) return(t(CI))} Некоторые файлы содержат коды функций, которые необходимы для выполнения расчетов в полном объеме, но их текст не приводится в приложениях к разделам. Вот их полный список:

° pareto.R – функции оценки параметров распределения Парето (раздел 1.5);

° Kendall_Theil_Regr.r – оценка параметров линейной робастной регрессии Кендалла-Тейла (раздел 3.5);

° species_response_curves.r – подбор функции распределения популяционной плотности по градиенту (раздел 3.6);

° similary.r и abundsim.R – функции расчета различных метрик сходства (раздел 5.1);

° coldiss.R – раскраска матрицы расстояний (раздел 5.2);

° multi.mantel.R - матричная регрессия Мантеля (раздел 5.3);

° anova.1way.R – однофакторный дисперсионный анализ с рандомизацией (раздел 5.5);

° Xtree.r - создание матрицы длин ветвей по кластерной дендрограмме (раздел 5.7);

° cleanplot.pca.R – функция отрисовки биплота РСА (раздел 6.1);

° uis.r – сегментация временного ряда на бестрендовые участки (раздел 7.1);

° DF.r – тест Дики-Фуллера (раздел 7.2).

Все эти файлы включены в архив (Data.zip) с дополнительными материалами к книге.

_ Рандомизация и бутстреп: статистический анализ

Pages:     | 1 |   ...   | 70 | 71 ||

Похожие работы:

«Анна Юрьевна Филиппович КОМПЬЮТЕРНАЯ ЛЕКСИКОГРАФИЯ Лекции по дисциплине Лингвистическое обеспечение АСОИУ Модуль 2 Лингвистическое программное обеспечение Москва, 2012 2 Компьютерная лексикография Словари Основные понятия Словарь, собрание слов (иногда также морфем или словосочетаний), расположенных в определённом порядке, используемое в качестве справочника, который объясняет значения описываемых единиц, даёт различную информацию о них или их перевод на другой язык либо сообщает сведения о...»

«„Османы появляются не как народ, а как войско, как династия, как правящий класс.” Николае Йорга (N. Iorga. Histoire des Etats balcaniques. Paris, 1925, pp. 1-2.) На известной карте Фра Мауро легко заметить государство с названием „Македония”: оно расположено в юго-восточной части Балканского полуострова. Фрагменты его истории обсуждаются в настоящей статье. В центре внимания находится личность султана Мехмеда ІІ Фатиха и одного из его сыновей. На основе сведений из поэмы „Скендербей” Г....»

«ГОСУДАРСТВЕННОЕ НАУЧНОЕ УЧРЕЖДЕНИЕ ВСЕРОССИЙСКИЙ ИНСТИТУТ АГРАРНЫХ ПРОБЛЕМ И ИНФОРМАТИКИ ИМЕНИ А.А. НИКОНОВА УДК Директор ВИАПИ, № госрегистрации д.э.н. Инв. N _ Сиптиц С.О. 2012 г. ОТЧЕТ О НАУЧНО – ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЕ Мониторинг состояния и объемов информационных ресурсов информационно-консультационной службы АПК в Интернет-пространстве Руководитель темы В. И. Меденников подпись, дата Москва 2012 СПИСОК ИСПОЛНИТЕЛЕЙ Руководитель темы, В.И. Меденников (введение, Зав. отделом, д.т. н....»

«NASSIM NICHOLAS TALEB FOOLED BY RANDOMNESS The Hidden Role of Chance in the Markets and in Life TEXERE New York • London 2 Нассим Николас Талеб ОДУРАЧЕННЫЕ СЛУЧАЙНОСТЬЮ Скрытая роль Шанса на Рынках и в Жизни 3 Нассим Николас Талеб. Одураченные случайностью. Скрытая роль Шанса на Рынках и в Жизни. М: Интернет-трейдинг,- 248 с. 18ВЫ 5-9900027-2-6 Русская рулетка и лидеры бизнеса, классическая история и финансовые спекуляции, поэзия и математика, Шерлок Холмс и научные войны - все есть в этом...»

«В. Д. СиДороВ, Н. В. Струмпэ АппАрАтНое обеСпечеНие эВм учебНиК Рекомендовано Федеральным государственным учреждением Федеральный институт развития образования в качестве учебника для использования в учебном процессе образовательных учреждений, реализующих программы начального профессионального образования Регистрационный номер рецензии 160 от 28 апреля 2009 г. ФГУ ФИРО 2-е издание, стереотипное УДК 681.3(075.32) ББК 32.973я722 С347 Рецензент — преподаватель информатики и ИКТ Московского...»

«ИНФОРМАЦИОННОЕ ОБЩЕСТВО И ГЛОБАЛИЗАЦИЯ: КРИТИКА НЕОЛИБЕРАЛЬНОЙ КОНЦЕПЦИИ ТАШКЕНТ 2006 УДК 316.32 ББК 60.52 А 18 Печатается по решению Научно-технического Совета Ташкентского университета информационных технологий Абдуллаев И.З. Информационное общество и глобализация: Критика неолибеА 18 ральной концепции.: изд-во Фан ва технология.- Т., 2006.-191с. Книга посвящена исследованию процессов становления информационного общества, в рамках периодизации стадиальных этапов развития человечества....»

«Г.П.ЖМУРКО, Е.Ф.КАЗАКОВА, В.Н.КУЗНЕЦОВ, А.В.ЯЦЕНКО общая химия Под редакцией профессора С. Ф. ДУНАЕВА Допущено Учебно-методическим объединением по классическому университетскому образованию в качестве учебника для студентов, изучающих по программам классических университетов курс Общая химия (направления Геология, Почвоведение, Экология и природопользование), курс Химия (направление География) и курс Общая и неорганическая химия (направления Физика, Биология, специальности Биоинженерия и...»

«ВЫБОРЫ В КУРГАНСКОЙ ОБЛАСТИ СБОРНИК судебных решений по делам о защите избирательных прав граждан и права на участие в референдуме в Курганской области в 2007-2011 годах г. Курган, 2012 г. ИЗБИРАТЕЛЬНАЯ КОМИССИЯ КУРГАНСКОЙ ОБЛАСТИ ВЫБОРЫ В КУРГАНСКОЙ ОБЛАСТИ СБОРНИК судебных решений по делам о защите избирательных прав граждан и права на участие в референдуме в Курганской области в 2007-2011 годах г. Курган 2012 Под общей редакцией заслуженного юриста Российской Федерации, Председателя...»

«ОТЧЕТ ГЕОФИЗИЧЕСКОГО ЦЕНТРА РАН ЗА 2012 ГОД. Результаты научных исследований и международных проектов Москва 2013 GEOPHYSICAL CENTER OF RUSSIAN ACADEMY OF SCIENCES REPORT OF GEOPHYSICAL CENTER OF RAS Results of Science Researches and International Projects for 2012 Moscow 2013 В настоящем издании содержатся сведения о работе Учреждения Российской академии наук Геофизического центра в 2012 году, а также наиболее важные результаты проведенных исследований в рамках выполнения грантов РАН, РФФИ и...»

© 2013 www.knigi.konflib.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.