ВИЗНАЧЕННЯ КОЕФІЦІЄНТУ УНІКАЛЬНОСТІ ТЕКСТОВОГО ДОКУМЕНТУ З ВИКОРИСТАННЯМ КОЕФІЦІЄНТУ ЖАККАРДА
DOI:
https://doi.org/10.32851/tnv-tech.2021.6.8Ключові слова:
плагіат, антиплагіат системи, алгоритм шинглів, коефіцієнт ЖаккардаАнотація
Стрімкий розвиток мережі Інтернет, поряд зі зростаючою комп’ютерною грамотністю, сприяє проникненню плагіату в різні сфери людської діяльності: плагіат є гострою проблемою в освіті, промисловості та науковому співтоваристві. Відповідно до [1] під плагіатом розуміють незаконне використання або розпорядження охоронюваними результатами чужого творчої праці, яке супроводжується доведенням до інших осіб неправдивих відомостей про себе як про дійсного автора. Плагіат може бути порушенням авторсько-правового законодавства і патентного законодавства і в якості таких може спричинити за собою юридичну відповідальність. З іншого боку, плагіат можливий і в областях, на які не поширюється дія будь-яких видів інтелектуальної власності, наприклад, в математиці та інших фундаментальних наукових дисциплінах. Плагіат з появою Інтернету перетворився в серйозну проблему. Потрапивши в Інтернет, знання стає надбанням всіх, дотримуватися авторське право стає все важче, а іноді навіть і неможливо. Тому перевірка унікальності серед документів є актуальною задачею. У статті досліджено проаналізовано сучасні методи та засоби перевірки текстової інформації на унікальність. Для кожного з них наведено приклад роботи, переваги та недоліки. Зазначено, що актуальною задачею є підвищення точності при перевірці текстів на унікальність. Ідентифіковано метод шинглів як найбільш поширений та ефективний метод перевірки текстової інформації на плагіат. На базі методу шинглів запропоновано удосконалений алгоритм перевірки текстів на унікальність з використанням коефіцієнту Жаккарда. Було пораховано складність запропонованого алгоритму відносно використання пам’яті та процесорної потужності. Наголошено, що з введенням додаткових покращень швидкодія алгоритму не погіршилась.
Посилання
Савчук Т.О., Кучевський Ю.А. Удосконалений алгоритм перевірки текстів на унікальність. INTERNET-EDUCATION-SCIENCE : Proceedings of the XII International scientific-practical conference, м. Вінниця, 26–29 травня 2020 р. Вінниця : Вінницький національний технічний університет, 2020. С. 237–239. URL: https://ir.lib.vntu.edu.ua/bitstream/handle/123456789/30970/WORK-IES-2020-269-271.pdf?sequence=1&isAllowed=y.
Савчук Т.О., Кучевський Ю.А. Підхід до аналізу на унікальність курсових розробок. Матеріали XLIX науково-технічної конференції підрозділів Вініцького національного технічного університету, м. Вінниця, 27–28 квітня 2020 р. URL: https://conferences.vntu.edu.ua/index.php/all-fitki/all-fitki-2020/paper/view/8929/7739.
Monostori K., Zaslavsky A., Schmidt H. Document Overlap Detection System for Distributed Digital Libraries. Proceedings of the fifth ACM conference on Digital libraries. 2000. P. 226–227.
Leong A., Lau H., Rynson W. H. Check: A Document Plagiarisment Detection System. Proceedings of ACM Symposium for Applied Computing. 1997. P. 70–77.
Dreher H. Automatic Conceptual Analysis for Plagiarism Detection. The Journal of Issues in Informing Science and Information Technology. 2007. Vol. 4. P. 601–614.
Meyer zu Eissen S., Stein B. Intrinsic Plagiarism Detection. European Conference on Information Retrieval. Springer, 2006. P. 565–569.
Седов А.В., Рогов А.А. Анализ неоднородностей в тексте на основе последовательностей частей речи. Современные проблемы науки и образования. 2013. № 1. URL: https://science-education.ru/ru/article/view?id=8339.
Антиплагиат: обнаружение заиствований. Веб-сайт. URL: https://www.antiplagiat.ru/corporate/education.
Unichek. Сервіс перевірки на плагіат для найкращих результатів. Вебсайт. URL: https://unicheck.com/uk-ua.
Ширяев М.А., Мустакимов В. Plagiatinform избавит от плагиата в научных работах. Educational Technology & Society. 2008. № 11 (1). С. 367‒374. URL: https://cyberleninka.ru/article/n/plagiatinform-izbavit-ot-plagiata-v-nauchnyh-rabotah/viewer.
Brin S., Davis J., Garcia-Molina H. Copy Detection Mechanisms for Digital Documents. CM International Conference on Management of Data (SIGMOD 1995), San Jose, California, May 22–25, 1995. P. 398–409.