АНСАМБЛЕВЕ НАВЧАННЯ КЛАСИФІКАТОРІВ ДЛЯ ОНЛАЙН ВИЯВЛЕННЯ ДЕЗІНФОРМАЦІЇ

Автор(и)

DOI:

https://doi.org/10.32782/tnv-tech.2024.6.6

Ключові слова:

дезінформація, фейкові новини, онлайн навчання, ансамблі класифікаторів

Анотація

У сучасному цифровому світі, де інформація розповсюджується з неймовірною швидкістю, виявлення фейкових новин та дезінформації стає критично важливим завданням. В контексті українськомовного інформаційного простору, це завдання набуває додаткової актуальності через гібридну війну з росією. Відповідно до цього, в нашому дослідженні було розроблено та впроваджено метод "Online Learning with Sliding Windows for Text Classifier Ensembles" (OLTW-TEC), спрямований на ефективне виявлення дезінформації в українськомовних текстових даних. Метою є підвищення точності та адаптивності в ідентифікації фейкових новин, зокрема в українськомовному інформаційному просторі. Ця робота акцентує увагу на необхідності забезпечення швидкої та адаптованої до змін системи у відповідь на стрімкі зміни в інформаційному потоці. Метод OLTW-TEC використовує передові техніки машинного навчання та аналізу даних для створення адаптивної системи класифікації, яка може динамічно реагувати на зміни в інформаційному потоці. Центральним елементом методу є інтеграція ансамблю класифікаторів з методом ковзних вікон, що дає можливість постійно оновлювати модель на основі останніх даних, забезпечуючи високу точність і адаптивність до нових форм дезінформації. Метод включає етапи збору та попередньої обробки даних, аналізу тональності, емоцій та векторизації тексту, що дає змогу глибше аналізувати та ефективніше виявляти фейкові новини, спираючись на унікальні лінгвістичні та культурні особливості української мови. Для аналізу ефективності OLTW-TEC було використано унікальний датасет українськомовних новин, що включає як достовірні, так і неправдиві новини. Результати дослідження продемонстрували високу ефективність методу ідентифікації дезінформації, з точністю класифікації, що сягає 93,26%. Аналіз матриці помилок та інших метрик, таких як оцінка F1, підкреслив збалансованість та надійність OLTW-TEC у виявленні фейкових новин. У порівнянні з традиційними методами класифікації, OLTW-TEC не лише показує кращі результати за більшістю метрик, але й забезпечує простір для адаптації до змін у характері даних. Вибір розміру "ковзного вікна" та можливість його регулювання залежно від специфіки даних надає методу додаткову гнучкість і точність.

Посилання

Tao, W. & Peng, Y. Differentiation and unity: A cross-platform comparison analysis of online posts’ semantics of the Russian–Ukrainian war based on Weibo and Twitter. Communication and the Public, 2023. 8(2), 105-124. DOI: https://doi.org/10.1177/20570473231165563.

Mainych, S., Bulhakova, A., & Vysotska, V. Cluster analysis of discussions change dynamics on twitter about war in Ukraine. Proceedings of the 7th International Conference on Computational Linguistics and Intelligent Systems. Volume II: Computational Linguistics Workshop Kharkiv, Ukraine, 2023. 3396, 490–530. URL: https://ceur-ws.org/Vol-3396/paper39.pdf.

Vasist, P. N., & Krishnan, S. Fake news and sustainability-focused innovations: A review of the literature and an agenda for future research. Journal of Cleaner Production, 2023. 388, 135933. DOI: https://doi.org/10.1016/j.jclepro.2023.135933.

Hamed, S. K., Ab Aziz, M. J., & Yaakub, M. R. A review of fake news detection approaches: A critical analysis of relevant studies and highlighting key challenges associated with the dataset, feature representation, and data fusion. Heliyon, e20382. 2023. DOI: https://doi.org/10.1016/j.heliyon.2023.e20382.

Kondamudi, M. R., Sahoo, S. R., Chouhan, L., & Yadav, N. A comprehensive survey of fake news in social networks: Attributes, features, and detection approaches. Journal of King Saud University – Computer and Information Sciences, 2023. 35(6), 101571. DOI: https://doi.org/10.1016/j.jksuci.2023.101571.

Hu, L., Wei, S., Zhao, Z., & Wu. B. Deep learning for fake news detection: A comprehensive survey. AI Open, 2022. 3, 133-155. DOI: https://doi.org/10.1016/j.aiopen.2022.09.001.

Phan, H. T., Nguyen, N. T., & Hwang, D. Fake news detection: A survey of graph neural network methods. Applied Soft Computing, 2023. 139, 110235. DOI: https://doi.org/10.1016/j.asoc.2023.110235.

Das, B., & Sudarshan, T. S. B. Multi-contextual learning in disinformation research: A review of challenges, approaches, and opportunities. Online Social Networks and Media, 2023. 34-35, 100247. DOI: https://doi.org/10.1016/j.osnem.2023.100247.

Ruffo, G., Semeraro, A., Giachanou, A., & Rosso, P. Studying fake news spreading, polarisation dynamics, and manipulation by bots: A tale of networks and language. Computer Science Review, 2023. 47, 100531. DOI: https://doi.org/10.1016/j.cosrev.2022.100531.

Baker, M., Jihad, K., & Taher, Y. Prediction of people sentiments on Twitter using machine learning classifiers during Russian aggression in Ukraine. Jordanian Journal of Computers and Information Technology, 2023. 9(3), 189-206. DOI: https://doi.org/10.5455/jjcit.71-1676205770.

Peng, L., Jian, S., Kan, Z., Qiao, L., & Li, D. Not all fake news is semantically similar: Contextual semantic representation learning for multimodal fake news detection. Information Processing & Management, 2023. 61(1), 103564. DOI: https://doi.org/10.1016/j.ipm.2023.103564.

Qu, Z., Meng, Y., Muhammad, G., & Tiwari, P. QMFND: A quantum multimodal fusion-based fake news detection model for social media. Information Fusion, 2023. 104, 102172. DOI: https://doi.org/10.1016/j.inffus.2023.102172.

Soga, K., Yoshida, S., & Muneyasu, M. Exploiting stance similarity and graph neural networks for fake news detection. Pattern Recognition Letters, 2024. 177, 26-32. DOI: https://doi.org/10.1016/j.patrec.2023.11.019.

Yang, H., Zhang, J., Zhang, L., Cheng, X., & Hu, Z. MRAN: Multimodal relationship-aware attention network for fake news detection. Computer Standards & Interfaces, 2024. 89, 103822. DOI: https://doi.org/10.1016/j.csi.2023.103822.

Syed, L., Alsaeedi, A., Alhuri, L. A., & Aljohani H. R. Hybrid weakly supervised learning with deep learning technique for detection of fake news from cyber propaganda. Array, 2023. 19, 100309. DOI: https://doi.org/10.1016/j.array.2023.100309.16. Xie, B., & Li, Q. Detecting fake news by RNN-based gatekeeping behavior model on social networks. Expert Systems with Applications, 2023. 231, 120716. DOI: https://doi.org/10.1016/j.eswa.2023.120716.

Přibáň, P., Hercig, T., & Steinberger, J. Machine learning approach to factchecking in west slavic languages. Proceedings of the Recent Advances in Natural Language Processing, (973-979). Incoma Ltd., Shoumen, Bulgaria. 2019. DOI: https://doi.org/10.26615/978-954-452-056-4_113.

Bucos, M., & Drăgulescu, B. Enhancing fake news detection in Romanian using transformer-based back translation augmentation. Applied Sciences, 2023. 13(24), 13207. DOI: https://doi.org/10.3390/app132413207.

Afanasieva, I., Golian, N., Golian, V., Khovrat, A., & Onyshchenko, K. Application of neural networks to identify of fake news. Proceedings of the 7th International Conference on Computational Linguistics and Intelligent Systems, Volume II: Computational Linguistics Workshop, 2023. vol-3396, (346–358). Kharkiv, Ukraine. URL: https://ceur-ws.org/Vol-3396/paper28.pdf.

Bodyanskiy, Y. V., Lipianina-Honcharenko, K. V., & Sachenko, A. O. Ensemble of adaptive predictors for multivariate nonstationary sequences and its online learning. Radio Electronics, Computer Science, Control, 2022. 4(67), 91–97. DOI: https://doi.org/10.15588/1607-3274-2023-4-9.

Gramyak, R., Lipyanina-Goncharenko, H., Sachenko, A., Lendyuk, T., & Zahorodnia, D. Intelligent method of a competitive product choosing based on the emotional feedbacks coloring. Proceedings of the 2nd International Workshop on Intelligent Information Technologies & Systems of Information Security with CEUR-WS, 2021. (246-257). Khmelnytskyi, Ukraine. URL: https://ceur-ws.org/Vol-2853/paper31.pdf.

Lipianina-Honcharenko, K., Savchyshyn, R., Sachenko, A., Chaban, A., Kit, I., & Lendiuk, T. Concept of the intelligent guide with AR support. International Journal of Computing, 2022. 21(2), 271–277. DOI: https://doi.org/10.47839/ijc.21.2.2596.

Lipianina-Honcharenko, K., Wolff, C., Sachenko, A., Desyatnyuk, O., Sachenko, S., & Kit, I. Intelligent information system for product promotion in internet market. Applied Sciences, 2023. 13(17), 9585. DOI: https://doi.org/10.3390/app13179585.

Lipyanina, H., Sachenko, O., Lendyuk, T., Sachenko, A., & Vasylkiv, N. Intelligent method of forming the HR management short-term project. in: Shakhovska, N., Medykovskyy, M.O. (eds) Advances in Intelligent Systems and Computing V. CSIT 2020, Advances in Intelligent Systems and Computing, 2021. vol. 1293, (1045–1055), Springer, Cham. DOI: https://doi.org/10.1007/978-3-030-63270-0_71.

Golovko, V., Kroshchanka, A., Komar, M., & Sachenko, A. Neural network approach for semantic coding of words. Advances in Intelligent Systems and Computing, 2020. 1020, 647–658. DOI: https://doi.org/10.1007/978-3-030-26474-1_45.

Lipianina-Honcharenko, K., Lendiuk, T., Sachenko, A., Osolinskyi, O., Zahorodnia, D., & Komar, M. An intelligent method for forming the advertising content of higher education institutions based on semantic analysis, in: Ignatenko, O., et al. ICTERI 2021 Workshops. ICTERI 2021, Communications in Computer and Information Science, 2022. vol. 1635, (169–182), Springer, Cham. DOI: https://doi.org/10.1007/978-3-031-14841-5_11.

Ukrainian news. Kaggle: Your Machine Learning and Data Science Community. URL: https://www.kaggle.com/datasets/zepopo/ukrainian-fake-and-truenews?resource=download

##submission.downloads##

Опубліковано

2024-12-30

Як цитувати

Лендюк, Д. Т., & Ліп’яніна-Гончаренко, Х. В. (2024). АНСАМБЛЕВЕ НАВЧАННЯ КЛАСИФІКАТОРІВ ДЛЯ ОНЛАЙН ВИЯВЛЕННЯ ДЕЗІНФОРМАЦІЇ. Таврійський науковий вісник. Серія: Технічні науки, (6), 46-63. https://doi.org/10.32782/tnv-tech.2024.6.6

Номер

Розділ

КОМП’ЮТЕРНІ НАУКИ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ