ПОБУДОВА ШВИДКОЇ ТА ЛЕГКОВІСНОЇ РЕКУРЕНТНОЇ НЕЙРОННОЇ МЕРЕЖІ ДЛЯ ВИРІШЕННЯ ЗАДАЧІ РОЗПІЗНАВАННЯ РУКОПИСНИХ ЖЕСТІВ

Автор(и)

DOI:

https://doi.org/10.32782/tnv-tech.2023.4.11

Ключові слова:

розпізнавання рукописних жестів, рекурентні нейронні мережі, алгоритми розпізнавання, глибокі нейронні мережі

Анотація

Об’єктом дослідження в цій роботі є нейронна мережа для розпізнавання рукописних жестів. В роботі поставлена задача для створення рішення по розпізнаванню рукописних жестів для можливого використання в різноманітних пристроях та гаджетах, в умовах з обмеженими обчислювальними потужностями та з приорітетністю швидкодії такого рішення. Було обрано набір даних для експериментів, проведено аналіз існуючих робіт та досліджень, в яких використовувався цей датасет, та зафіксовано отримані результати. Для побудови нейронної мережі обрано архітектуру з використанням рекурентних шарів. Було досліджено властивості рекурентних шарів, принципи роботи вентильних рекурентних вузлів як найбільш підходящих складових для такої моделі, особливості тренування рекуретних нейронних мереж. Описано запропоновану архітектуру мережі, обрано 7 варіантів моделей з різними наборами основних параметрів. Проведено тестування моделей, на основі якого визначено дві найбільш оптимальні моделі по точності розпізнавання та по кількості параметрів. Ці моделі було додатково протестовано для перевірки швидкості роботи, як в умовах роботи тільки з використанням процесора, так і з використанням графічного прискорювача. Якість роботи обраної оптимальної моделі було також перевірено з поданням на вхід різноманітних рукописних жестів у різних стилях, які вона не зустрічала до цього у тренувальних наборах. Проведено аналіз успішних випадків роботи мережі, а також наведено приклади невдалих результатів розпізнавання, які в більшості можуть бути виправлені за допомогою розширення тренувального датасета. Отримані результати підтверджують можливість використання рекуретних шарів для вирішення задачі з розпізнавання рукописних послідовностей, задовольняючи поставлені вимоги по мінімізації часу та ресурсів, з отриманням високої точності розпізнавання при наявності якісного датасету та правильному підбору параметрів моделі.

Посилання

Fewer and fewer people today write by hand using a pen, pencil or brush. What are the reasons? Is this a positive or negative development, 2017. URL: https://ieltsdata.org/fewer-fewer-people-today-write-hand-using-pen-pencil-brush (дата звернення: 20.08.2023).

On-Line Database SIGN-OnDB, 2010. URL: https://www-intuidoc.irisa.fr/en/base-de-donnees-en-ligne-sign-ondb (дата звернення: 20.08.2023).

Fuccella V., Isokoski P., Martin B. Gestures and widgets: performance in text editing on multi-touch capable mobile devices, 2013. URL: https://dl.acm.org/doi/10.1145/2470654.2481385 (дата звернення: 20.08.2023).

Delaye A., Anquetil. E. HBF49 feature set: A first unified baseline for online symbol recognition, 2013. URL: https://www.sciencedirect.com/science/article/abs/pii/S0031320312003317 (дата звернення: 20.08.2023).

Understanding RNN and LSTM, 2019. URL: https://towardsdatascience.com/understanding-rnn-and-lstm-f7cdf6dfc14e (дата звернення: 20.08.2023).

Рекурентні співвідношення, 2020. URL: http://matfiz.univ.kiev.ua/informatics/lectures/Theme3_2.htm (дата звернення: 20.08.2023).

Gated Recurrent Units (GRU), 2020. URL: https://d2l.ai/chapter_recurrentmodern/gru.html (дата звернення: 20.08.2023).

##submission.downloads##

Опубліковано

2023-11-09

Як цитувати

Яковчук, О. К. (2023). ПОБУДОВА ШВИДКОЇ ТА ЛЕГКОВІСНОЇ РЕКУРЕНТНОЇ НЕЙРОННОЇ МЕРЕЖІ ДЛЯ ВИРІШЕННЯ ЗАДАЧІ РОЗПІЗНАВАННЯ РУКОПИСНИХ ЖЕСТІВ. Таврійський науковий вісник. Серія: Технічні науки, (4), 87-93. https://doi.org/10.32782/tnv-tech.2023.4.11

Номер

Розділ

КОМП’ЮТЕРНІ НАУКИ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ