КОМУНІКАТИВНА ПЛАТФОРМА ДЛЯ ПОБУДОВИ ТА ДОСЛІДЖЕННЯ МЕТОДІВ ГЕНЕРАЦІЇ ПРОГРАМ НА ОСНОВІ НАТУРАЛЬНИХ МОВ ІЗ ВИКОРИСТАННЯМ ШТУЧНОГО ІНТЕЛЕКТУ

А. О. Свистунов

doi:10.32782/tnv-tech.2024.5.8

Автор(и)

А. О. Свистунов Київський національний університет імені Тараса Шевченка https://orcid.org/0009-0005-4536-5083

DOI:

https://doi.org/10.32782/tnv-tech.2024.5.8

Ключові слова:

генерація програм, генерація коду, великі мовні моделі, комунікативний процес, комунікативні системи

Анотація

Роботу присвячено методам генерації програм з використанням методів штучного інтелекту на основі натуральних мов. Пропонується використання комунікативної платформи для класифікації та побудови методів генерації програм на основі натуральних мов. Важливим аспектом для генерації програм є мультимодальність засобів специфікації – сприйняття відповідним засобом генерації нечітких умов у різних формах, наприклад, у запитах натуральними мовами, діаграмах, таблицях, тощо. В роботі розглядаються підходи, що базуються на використанні засобів генеративного штучного інтелекту, в тому числі мультимодальних, з метою моделювання комунікативних систем. Ключем до використання комунікативної платформи для опису та дослідження засобів штучного інтелекту для генерації програм на основі натуральних мов є комбінування реалізацій складових частин комунікативної системи обміну інформації, зокрема методу опису предметної області, задання суб’єкта-ініціатора та суб’єкта-обробника. Таким чином, пропонується класифікація на основі способів задання об’єктів предметної області, способів задання мети обробки (програми) та вибору моделі суб’єкта-обробника та способом задання його внутрішніх процедур. Мета обробки може бути задана або неявно у вигляді вимог до вихідних об’єктів, або явно у вигляді кроків виконання необхідних перетворень. В термінах комунікативної інформатики обидва формати задання мети подаються як спеціальний інформаційний об’єкт – програма. В статті описуються в термінах комунікативної платформи методи на основі генерації програмного коду та методи на основі інтелектуальних агентів та змішані підходи, згортку комунікативних систем, де ШІ-агент є одночасно і суб’єктом-обробником, і суб’єктом-ініціатором, що задає дескриптивні системи для виконавця-обробника програмного коду, зокрема, саморефлексійні підходи (Reasoning and Acting) та архітектура Artificial Intelligence Operating System. Зокрема мультиагентна архітектура AgentCoder, є еталонним рішенням згідно оцінок на датасетах для задач генерації програмного коду HumanEval та MBPP.

Посилання

OpenAI, Achiam J., Adler S., Agarwal S. та ін. GPT-4 Technical Report. 2024. arXiv:2303.08774 [cs.CL]. URL: https://arxiv.org/abs/2303.08774.

Touvron H., Martin L., Stone K., Albert P. та ін. Llama 2: Open Foundation and Fine-Tuned Chat Models. 2023. arXiv:2307.09288 [cs.CL]. URL: https://arxiv.org/abs/2307.09288.

Lozhkov A., Li R., Ben Allal L., Cassano F. та ін. StarCoder 2 and The Stack v2: The Next Generation. 2024. arXiv:2402.19173 [cs.SE]. URL: https://arxiv.org/abs/2402.19173.

Jiang A.Q., Sablayrolles A., Mensch A., Bamford C. та ін. Mistral 7B. 2023. arXiv:2310.06825 [cs.CL]. URL: https://arxiv.org/abs/2310.06825.

Zubenko V. On the communicative informatics // Bulletin of Taras Shevchenko National University of Kyiv. Series Physics & Mathematics. 2013. № 2. P. 151–156.

Le T.H.M., Chen H., Babar M.A. Deep Learning for Source Code Modeling and Generation: Models, Applications, and Challenges // ACM Computing Surveys. 2020. Vol. 53, № 3. P. 1–38. DOI: 10.1145/3383458. URL: http://dx.doi.org/10.1145/3383458.

Chen M., Tworek J., Jun H., Yuan Q., Ponde de Oliveira Pinto H., Kaplan J., та ін. Evaluating Large Language Models Trained on Code. 2021. arXiv:2107.03374 [cs. LG]. URL: https://arxiv.org/abs/2107.03374.

Austin J., Odena A., Nye M., Bosma M., Michalewski H., та ін. Program Synthesis with Large Language Models. 2021. arXiv:2108.07732 [cs.PL]. URL: https://arxiv.org/abs/2108.07732.

Cobbe K., Kosaraju V., Bavarian M., Chen M., Jun H., та ін. Training Verifiers to Solve Math Word Problems. 2021. arXiv:2110.14168 [cs.LG]. URL: https://arxiv.org/abs/2110.14168.

Zellers R., Holtzman A., Bisk Y., Farhadi A., Choi Y. HellaSwag: Can a Machine Really Finish Your Sentence? 2019. arXiv:1905.07830 [cs.CL]. URL: https://arxiv.org/abs/1905.07830.

Yao S., Zhao J., Yu D., Du N., Shafran I., та ін. ReAct: Synergizing Reasoning and Acting in Language Models. 2023. arXiv:2210.03629 [cs.CL]. URL: https://arxiv.org/abs/2210.03629.

Xia S., Li X., Liu Y., Wu T., Liu P. Evaluating Mathematical Reasoning Beyond Accuracy. 2024. arXiv:2404.05692 [cs.CL]. URL: https://arxiv.org/abs/2404.05692.

Mei K., Li Z., Xu S., Ye R., Ge Y., Zhang Y. AIOS: LLM Agent Operating System. 2024. arXiv:2403.16971 [cs.OS]. URL: https://arxiv.org/abs/2403.16971.

Huang D., Bu Q., Zhang J.M., Luck M., Cui H. AgentCoder: Multi-Agent-based Code Generation with Iterative Testing and Optimisation. 2024. arXiv:2312.13010 [cs. CL]. URL: https://arxiv.org/abs/2312.13010.

Koziolek H., Grüner S., Hark R., Ashiwal V., Linsbauer S., Eskandani N. LLM-based and Retrieval-Augmented Control Code Generation // In Proceedings of 1st International Workshop on Large Language Models for Code (LLM4Code’24). 2024. Association for Computing Machinery (ACM).

КОМУНІКАТИВНА ПЛАТФОРМА ДЛЯ ПОБУДОВИ ТА ДОСЛІДЖЕННЯ МЕТОДІВ ГЕНЕРАЦІЇ ПРОГРАМ НА ОСНОВІ НАТУРАЛЬНИХ МОВ ІЗ ВИКОРИСТАННЯМ ШТУЧНОГО ІНТЕЛЕКТУ

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Мова