

Методы предобработки оцифрованных рукописных документов
https://doi.org/10.17586/0021-3454-2025-68-6-494-499
Аннотация
Решается задача автоматизации анализа рукописных документов. Показано, что при решении подобных задач используются искусственные нейронные сети, способные к распознаванию образов после обучения на исходном наборе данных. При этом качество распознавания новых образов большей частью зависит от этапа предобработки оцифрованных рукописных документов. Рассмотрена частная задача предобработки — удаление линий клетки с изображения листа тетради. Проанализированы четыре метода фильтрации изображения с использованием библиотеки OpenCV языка Python. Выполнено обучение нейронной сети сверточной архитектуры распознаванию рукописных символов. Продемонстрирована работа обученной нейронной сети на документах, предобработанных разными алгоритмами.
Ключевые слова
Об авторах
Т. М. ТатарниковаРоссия
Татьяна Михайловна Татарникова — д-р техн. наук, профессор; кафедра прикладной информатики,
Санкт-Петербург.
А. А. Шихотов
Россия
Алексей Алексеевич Шихотов — магистр; кафедра прикладной информатики,
Санкт-Петербург.
Список литературы
1. Кривошеев А. В. Сопряжение мультиагентных и нейросетевых технологий в программной системе распознавания образов для роботизированного документооборота // Вестн. Рязанского государственного радиотехнического университета. 2024. № 87. С. 54–61. DOI: 10.21667/1995-4565-2024-87-54-61.
2. Ferrer M. A., Diaz M., Carmona-Duarte C., Morales A. A behavioral handwriting model for static and dynamic signature synthesis // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017. Vol. 39, N 6. P. 1041–1053.
3. Калько А. И. Система идентификации рукописных текстов как объект защиты и обработки массового объема документов // 9-я Междунар. науч.-практ. Конф. „BIG DATA and Advanced Analytics. BIG DATA и анализ высокого уровня“. Минск, Республика Беларусь, 17–18 мая 2023 года. С. 276–284.
4. Кучуганов А. В., Лапинская Г. В. Распознавание рукописных текстов. Ижевск: Мир, 2006. 514 с.
5. Шапиро Л., Стокман Дж. Компьютерное зрение. M.: БИНОМ. Лаборатория знаний, 2015. 763 с.
6. Бреусова Е. И. К проблеме распознавания рукописного текста // Вестн. Челябинского государственного педагогического университета. 2017. № 1. С. 88–92.
7. Ахунджанов У. Ю., Старовойтов В. В. Предварительная обработка изображений рукописных подписей для последующего распознавания // Системный анализ. 2022. № 2. С. 4–9. DOI: 10.21122/2309-4923-2022-2-4-9.
8. OpenCV library. O’Reilly Media Inc, 2008. 6 p.
9. Горитов А. Н. Предварительная обработка изображений в системах технического зрения // Доклады ТУСУР. 2018. Т. 21, № 4-1. С. 53–58.
10. Семенов А. Н. Обнаружение радиолокационных целей с помощью преобразования Хафа // Наука и Образование: научное издание МГТУ им. Н.Э. Баумана. 2014. № 12. С. 619–632. DOI: 10.7463/1214.0738733.
11. Wu B., Wan A., Yue X. and Keutzer K. SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud // 2018 IEEE International Conference on Robotics and Automation (ICRA). Brisbane, QLD, Australia, 2018. P. 1887–1893. DOI: 10.1109/ICRA.2018.8462926.
12. Скрыпников А. В., Денисенко В. В., Хитров Е. Г., Евтеева К. С., Савченко И. И. Распознавание рукописного текста с использованием нейронных сетей // Современные наукоемкие технологии. 2021. № 6-1. С. 91–95. https://doi.org/10.17513/snt.38703.
13. Makridakis S., Spiliotis E., Assimakopoulos V. Statistical and Machine Learning forecasting methods: Concerns and ways forward // PloS one. 2018. Vol. 13. P. 1–20.
14. Taherdoost H., Sahibuddin S., Jalaliyoon N. Exploratory Factor Analysis; Concepts and Theory // Advances in applied and pure mathematics. 2022. Vol. 27. P. 375–382.
15. He K., Zhang X., Ren S. and Sun J. Deep residual learning for image recognition // 2016 IEEE Conf. on Computer Vision and Pattern Recognition (CVPR). 27–30 June 2016. P. 770–778. DOI: 10.1109/CVPR33180.2016.
16. Татарникова Т. М., Бимбетов Ф., Богданов П. Ю. Выявление аномалий сетевого трафика методом глубокого обучения // Изв. СПбГЭТУ ЛЭТИ. 2021. № 4. С. 36–41.
17. Suprun A., Tatarnikova T., Sikarev I., Shmeleva A. Detection of malicious program for the android platform by deep training // Lecture Notes in Networks and Systems. 2022. Vol. 387. P. 31–38. DOI: 10.1007/978-3-030-93872-7_3.
Рецензия
Для цитирования:
Татарникова Т.М., Шихотов А.А. Методы предобработки оцифрованных рукописных документов. Известия высших учебных заведений. Приборостроение. 2025;68(6):494-499. https://doi.org/10.17586/0021-3454-2025-68-6-494-499
For citation:
Tatarnikova T.M., Shihotov A.A. Methods of Preprocessing of Digitized Handwritten Documents. Journal of Instrument Engineering. 2025;68(6):494-499. (In Russ.) https://doi.org/10.17586/0021-3454-2025-68-6-494-499