КОМУНІКАТИВНА ПЛАТФОРМА ДЛЯ ПОБУДОВИ ТА ДОСЛІДЖЕННЯ МЕТОДІВ ГЕНЕРАЦІЇ ПРОГРАМ НА ОСНОВІ НАТУРАЛЬНИХ МОВ ІЗ ВИКОРИСТАННЯМ ШТУЧНОГО ІНТЕЛЕКТУ
DOI:
https://doi.org/10.32782/tnv-tech.2024.5.8Ключові слова:
генерація програм, генерація коду, великі мовні моделі, комунікативний процес, комунікативні системиАнотація
Роботу присвячено методам генерації програм з використанням методів штучного інтелекту на основі натуральних мов. Пропонується використання комунікативної платформи для класифікації та побудови методів генерації програм на основі натуральних мов. Важливим аспектом для генерації програм є мультимодальність засобів специфікації – сприйняття відповідним засобом генерації нечітких умов у різних формах, наприклад, у запитах натуральними мовами, діаграмах, таблицях, тощо. В роботі розглядаються підходи, що базуються на використанні засобів генеративного штучного інтелекту, в тому числі мультимодальних, з метою моделювання комунікативних систем. Ключем до використання комунікативної платформи для опису та дослідження засобів штучного інтелекту для генерації програм на основі натуральних мов є комбінування реалізацій складових частин комунікативної системи обміну інформації, зокрема методу опису предметної області, задання суб’єкта-ініціатора та суб’єкта-обробника. Таким чином, пропонується класифікація на основі способів задання об’єктів предметної області, способів задання мети обробки (програми) та вибору моделі суб’єкта-обробника та способом задання його внутрішніх процедур. Мета обробки може бути задана або неявно у вигляді вимог до вихідних об’єктів, або явно у вигляді кроків виконання необхідних перетворень. В термінах комунікативної інформатики обидва формати задання мети подаються як спеціальний інформаційний об’єкт – програма. В статті описуються в термінах комунікативної платформи методи на основі генерації програмного коду та методи на основі інтелектуальних агентів та змішані підходи, згортку комунікативних систем, де ШІ-агент є одночасно і суб’єктом-обробником, і суб’єктом-ініціатором, що задає дескриптивні системи для виконавця-обробника програмного коду, зокрема, саморефлексійні підходи (Reasoning and Acting) та архітектура Artificial Intelligence Operating System. Зокрема мультиагентна архітектура AgentCoder, є еталонним рішенням згідно оцінок на датасетах для задач генерації програмного коду HumanEval та MBPP.
Посилання
OpenAI, Achiam J., Adler S., Agarwal S. та ін. GPT-4 Technical Report. 2024. arXiv:2303.08774 [cs.CL]. URL: https://arxiv.org/abs/2303.08774.
Touvron H., Martin L., Stone K., Albert P. та ін. Llama 2: Open Foundation and Fine-Tuned Chat Models. 2023. arXiv:2307.09288 [cs.CL]. URL: https://arxiv.org/abs/2307.09288.
Lozhkov A., Li R., Ben Allal L., Cassano F. та ін. StarCoder 2 and The Stack v2: The Next Generation. 2024. arXiv:2402.19173 [cs.SE]. URL: https://arxiv.org/abs/2402.19173.
Jiang A.Q., Sablayrolles A., Mensch A., Bamford C. та ін. Mistral 7B. 2023. arXiv:2310.06825 [cs.CL]. URL: https://arxiv.org/abs/2310.06825.
Zubenko V. On the communicative informatics // Bulletin of Taras Shevchenko National University of Kyiv. Series Physics & Mathematics. 2013. № 2. P. 151–156.
Le T.H.M., Chen H., Babar M.A. Deep Learning for Source Code Modeling and Generation: Models, Applications, and Challenges // ACM Computing Surveys. 2020. Vol. 53, № 3. P. 1–38. DOI: 10.1145/3383458. URL: http://dx.doi.org/10.1145/3383458.
Chen M., Tworek J., Jun H., Yuan Q., Ponde de Oliveira Pinto H., Kaplan J., та ін. Evaluating Large Language Models Trained on Code. 2021. arXiv:2107.03374 [cs. LG]. URL: https://arxiv.org/abs/2107.03374.
Austin J., Odena A., Nye M., Bosma M., Michalewski H., та ін. Program Synthesis with Large Language Models. 2021. arXiv:2108.07732 [cs.PL]. URL: https://arxiv.org/abs/2108.07732.
Cobbe K., Kosaraju V., Bavarian M., Chen M., Jun H., та ін. Training Verifiers to Solve Math Word Problems. 2021. arXiv:2110.14168 [cs.LG]. URL: https://arxiv.org/abs/2110.14168.
Zellers R., Holtzman A., Bisk Y., Farhadi A., Choi Y. HellaSwag: Can a Machine Really Finish Your Sentence? 2019. arXiv:1905.07830 [cs.CL]. URL: https://arxiv.org/abs/1905.07830.
Yao S., Zhao J., Yu D., Du N., Shafran I., та ін. ReAct: Synergizing Reasoning and Acting in Language Models. 2023. arXiv:2210.03629 [cs.CL]. URL: https://arxiv.org/abs/2210.03629.
Xia S., Li X., Liu Y., Wu T., Liu P. Evaluating Mathematical Reasoning Beyond Accuracy. 2024. arXiv:2404.05692 [cs.CL]. URL: https://arxiv.org/abs/2404.05692.
Mei K., Li Z., Xu S., Ye R., Ge Y., Zhang Y. AIOS: LLM Agent Operating System. 2024. arXiv:2403.16971 [cs.OS]. URL: https://arxiv.org/abs/2403.16971.
Huang D., Bu Q., Zhang J.M., Luck M., Cui H. AgentCoder: Multi-Agent-based Code Generation with Iterative Testing and Optimisation. 2024. arXiv:2312.13010 [cs. CL]. URL: https://arxiv.org/abs/2312.13010.
Koziolek H., Grüner S., Hark R., Ashiwal V., Linsbauer S., Eskandani N. LLM-based and Retrieval-Augmented Control Code Generation // In Proceedings of 1st International Workshop on Large Language Models for Code (LLM4Code’24). 2024. Association for Computing Machinery (ACM).