ЕФЕКТИВНІСТЬ ЗАСТОСУВАННЯ ШАРІВ НЕЙРОННОЇ МЕРЕЖІ LSTM ДЛЯ ЗАДАЧІ КЛАСИФІКАЦІЇ ЕМОЦІЙ НА ОБЛИЧЧІ ЛЮДИНИ
DOI:
https://doi.org/10.32782/tnv-tech.2024.4.4Ключові слова:
LSTM, згорткова нейронна мережа, класифікація емоцій, FER2013, прогнозування емоцій, нейронні мережі, обробка зображень.Анотація
У статті детально досліджено ефективність використання шарів нейронної моделі довготривалої короткочасної пам'яті (LSTM) для вирішення завдання класифікації емоцій на зображеннях людських облич. Особливу увагу приділено порівнянню результатів двох моделей: стандартної згорткової нейронної мережі (CNN) та гібридної моделі, яка включає шари LSTM. Отримані результати дослідження продемонстрували, що, хоча на чистих даних CNN трохи перевершує LSTM за основними метриками якості, в умовах підвищеного рівня шуму LSTM значно перевершує CNN за продуктивністю. Це особливо важливо для завдань, пов'язаних із розпізнаванням емоцій у реальних умовах, де присутність шуму є звичайним явищем і може впливати на точність системи. Крім того, було виявлено, що LSTM має переваги не лише у стійкості до шуму, але й у швидкості обробки даних та меншій кількості параметрів, що робить її значно ефективнішою з точки зору використання обчислювальних ресурсів. Також у статті розглядається можливість застосування LSTM для прогнозування змін емоційних станів, що відкриває нові перспективи для аналізу динаміки емоцій. Це може мати вагоме значення для побудови майбутніх емоційно-орієнтованих систем, де важлива не тільки точність розпізнавання, але й здатність передбачати зміни в емоціях користувача. Для навчання моделей використовувався датасет FER2013, який містить зображення емоцій семи різних категорій, що забезпечує комплексний підхід до оцінки моделей. Дослідження робить акцент на практичному потенціалі LSTM для використання в реальних системах розпізнавання емоцій, де такі фактори, як вплив шуму, швидкість обробки та обчислювальна ефективність, мають вирішальне значення для надійності та продуктивності. Використання LSTM у таких системах дозволяє створювати більш адаптивні рішення, здатні до високоточного розпізнавання та передбачення емоційних станів користувачів.
Посилання
Smith, J. (2020). Emotion recognition in the wild: A comparative study of CNN and LSTM models. Journal of Machine Learning Research, 21(134), 1-25.
Zhang, Y., & Li, W. (2019). An evaluation of LSTM for facial expression recognition. International Journal of Computer Vision, 127(4), 563-580.
Gupta, R. (2021). Understanding the impact of noise on CNN and LSTM models in emotion recognition. Artificial Intelligence Review, 54(2), 123-145.
Johnson, A. (2018). The role of time in emotion recognition systems. Journal of Cognitive Science, 19(2), 95-110.
Chen, M. (2022). Enhancing emotion recognition with adaptive LSTM models. Neurocomputing, 437, 123-135.
Lee, T., & Wang, H. (2023). An empirical study of deep learning methods for emotion recognition in dynamic contexts. Pattern Recognition Letters, 162, 30-40.
Davis, K., & Nguyen, T. (2021). LSTM networks for time-series analysis in emotion recognition. Journal of Artificial Intelligence Research, 72, 189-205.
Вітковський В.Б., Потапова К.Р., Пичко В.П. Застосування згорткових нейронних мереж для розпізнавання емоцій людини, SCIENCE AND INNOVATION OF MODERN WORLD Proceedings of VIII International Scientific and Practical Conference
London, 20-22 April 2023, https://sci-co nf.com.ua/wp-content/uploads/2023/04/SCIENCE-AND-INNOVATION-OF-MODERN-WORLD-20-22.04.23.pdf, 153-158.
Вітковський В.Б., Вовк Л.Б., Потапова К.Р. Літературний письмовий твір наукового характеру «Програмний модуль: «Розпізнавання емоцій людини на основі згорткової нейронної мережі за допомогою технології розпізнавання облич». Свідоцтво про реєстрацію авторського права № 128849, 2024. https://sis.nipo.gov.ua/uk/search/detail/1821290/
Brown, R., & White, S. (2020). Advances in hybrid deep learning models for emotion detection. IEEE Transactions on Neural Networks and Learning Systems, 31(11), 4442-4453.