Оптимальное объединение интервалов группированной выборки для применения критерия типа χ2
https://doi.org/10.17586/0021-3454-2024-67-9-751-758
Аннотация
Обсуждается применение интервалов равной длины или интервалов равной вероятности для использования критерия типа χ2. При этом интервалы равной вероятности предопределяются проверяемым законом распределения. При формировании исходной выборки по данным реального производства она часто сразу является группированной с заранее заданными и неизменяемыми на производстве границами группировки и может не удовлетворять рекомендациям по применению критериев типа χ2. Предложен способ построения набора оптимальных интервалов группировки путем объединения некоторых из имеющихся в исходной выборке интервалов. Под оптимальным набором таких интервалов понимается набор интервалов, имеющий наименьшее квадратическое отклонение взвешенных частот попадания от дискретного равномерного распределения, что позволяет не изменять набор интервалов при смене подбираемого закона распределения и автоматически решить проблему выбора оптимального числа интервалов. Перечислены некоторые свойства таких наборов, рассмотрены примеры возникающих при их построении ситуаций, приведен пример формирования оптимального набора.
Об авторах
П. М. ВинникРоссия
Петр Михайлович Винник, д-р техн. наук, доцент, заведующий кафедрой
кафедра высшей математики
Санкт-Петербург
Т. В. Винник
Россия
Татьяна Викторовна Винник, канд. техн. наук,, доцент
кафедра математики
Санкт-Петербург
Е. А. Еськова
Россия
Екатерина Александровна Еськова, ассистент
кафедра высшей математики
Санкт-Петербург
Список литературы
1. Миттаг Х.-Й., Ринне Х. Статистические методы обеспечения качества. М.: Машиностроение, 1995. 616 с.
2. Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ, 2006. 816 с.
3. Лемешко Б. Ю., Постовалов С. Н. Статистический анализ одномерных наблюдений по частично группированным данным // Изв. вузов. Физика. 1995. № 9. С. 39–45.
4. Новицкий П. В., Зограф И. А. Оценка погрешностей результатов измерений Л.: Энергоатомиздат, 1991. 304 c.
5. Хальд А. Математическая статистика с техническими приложениями. М.: Изд-во иностр. лит., 1956. 664 c.
6. Mann H. B., Wald A. On the choice of the number of class intervals in the application of the chi square test // Ann. Math. Stat. 1942. Vol. 13. P. 306–317.
7. Williams C. A. Jr. On the Choice of the Number and Width of Classes for the Chi-Square Test of Goodness of Fit // Journal of the American Statistical Association. 1950. Vol. 45, N 249. P. 77–86.
8. Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик хи-квадрат Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. 1998. Т. 64, № 5. С. 56–63.
9. Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа χ<sup>2</sup> // Заводская лаборатория. Диагностика материалов. 2003. Т. 69. С. 61–67.
10. Куллдорф Г. Введение в теорию оценивания по группированным и частично группированным выборкам. М.: Наука, 1966. 176 c.
11. Энциклопедия статистических терминов. Т. 1. Методологические основы статистики. М.: Федеральная служба государственной статистики, 2011 [Электронный ресурс]: https://03.rosstat.gov.ru/storage/mediabank/05_tom1(1).pdf, 18.03.2024.
12. Винник П. М., Винник Т. В., Еськова Е. А. Математические задачи, возникающие при статистическом контроле технологических процессов машиностроительных производств // Вестник образования и развития науки Российской академии естественных наук. 2022. № 4. С. 24–30. DOI: 10.26163/RAEN.2022.32.23.003.
13. Эндрюс Г. Теория разбиений. М.: Наука, 1982. 256 с.
14. Korf R. Multi-way number partitioning // IJCAI’09: Proc. of the 21<sup>st</sup> Intern. Joint Conf. on Artificial Intelligence, Pasadena, California, USA, July 11–17, 2009. P. 538–543.
15. Бардасов С. А. Предпочтительность метода равных частот относительно метода равных интервалов при построении вариационных рядов // Вестн. Тюменск. гос. ун-та. 2003. № 5. С. 217–219.
Рецензия
Для цитирования:
Винник П.М., Винник Т.В., Еськова Е.А. Оптимальное объединение интервалов группированной выборки для применения критерия типа χ2. Известия высших учебных заведений. Приборостроение. 2024;67(9):751-758. https://doi.org/10.17586/0021-3454-2024-67-9-751-758
For citation:
Vinnik P.М., Vinnik Т.V., Еskova Е.А. Optimal Aggregation of Clustered Sample Intervals for Applying the χ2 Test. Journal of Instrument Engineering. 2024;67(9):751-758. (In Russ.) https://doi.org/10.17586/0021-3454-2024-67-9-751-758