


Ключові слова:

дезінформація, фейкові новини, онлайн навчання, ансамблі класифікаторів


У сучасному цифровому світі, де інформація розповсюджується з неймовірною швидкістю, виявлення фейкових новин та дезінформації стає критично важливим завданням. В контексті українськомовного інформаційного простору, це завдання набуває додаткової актуальності через гібридну війну з росією. Відповідно до цього, в нашому дослідженні було розроблено та впроваджено метод "Online Learning with Sliding Windows for Text Classifier Ensembles" (OLTW-TEC), спрямований на ефективне виявлення дезінформації в українськомовних текстових даних. Метою є підвищення точності та адаптивності в ідентифікації фейкових новин, зокрема в українськомовному інформаційному просторі. Ця робота акцентує увагу на необхідності забезпечення швидкої та адаптованої до змін системи у відповідь на стрімкі зміни в інформаційному потоці. Метод OLTW-TEC використовує передові техніки машинного навчання та аналізу даних для створення адаптивної системи класифікації, яка може динамічно реагувати на зміни в інформаційному потоці. Центральним елементом методу є інтеграція ансамблю класифікаторів з методом ковзних вікон, що дає можливість постійно оновлювати модель на основі останніх даних, забезпечуючи високу точність і адаптивність до нових форм дезінформації. Метод включає етапи збору та попередньої обробки даних, аналізу тональності, емоцій та векторизації тексту, що дає змогу глибше аналізувати та ефективніше виявляти фейкові новини, спираючись на унікальні лінгвістичні та культурні особливості української мови. Для аналізу ефективності OLTW-TEC було використано унікальний датасет українськомовних новин, що включає як достовірні, так і неправдиві новини. Результати дослідження продемонстрували високу ефективність методу ідентифікації дезінформації, з точністю класифікації, що сягає 93,26%. Аналіз матриці помилок та інших метрик, таких як оцінка F1, підкреслив збалансованість та надійність OLTW-TEC у виявленні фейкових новин. У порівнянні з традиційними методами класифікації, OLTW-TEC не лише показує кращі результати за більшістю метрик, але й забезпечує простір для адаптації до змін у характері даних. Вибір розміру "ковзного вікна" та можливість його регулювання залежно від специфіки даних надає методу додаткову гнучкість і точність.


Як цитувати

Лендюк, Д. Т., & Ліп’яніна-Гончаренко, Х. В. (2024). АНСАМБЛЕВЕ НАВЧАННЯ КЛАСИФІКАТОРІВ ДЛЯ ОНЛАЙН ВИЯВЛЕННЯ ДЕЗІНФОРМАЦІЇ. Таврійський науковий вісник. Серія: Технічні науки, (6), 46-63. https://doi.org/10.32782/tnv-tech.2024.6.6

