Devstral модель від Mistral AI для розробки програмного забезпечення
Mistral AI представила модель Devstral для розробки програмного забезпечення
Компанія Mistral AI представила велику мовну модель Devstral, оптимізовану для вирішення проблем, що виникають у процесі розробки програмного забезпечення. На відміну від типових AI-моделей, Mistral AI виходить за межі написання окремих функцій та доповнення коду і надає можливості для аналізу та контекстуалізації великих кодових баз, визначення зв’язків між компонентами та виявлення складних помилок у заплутаних функціях.
Технічні характеристики моделі Devstral
Модель Devstral охоплює 23,6 мільярдів параметрів та враховує контекст у 128 тисяч токенів. Вона опублікована під ліцензією Apache 2.0. Devstral займає 47 ГБ пам’яті та придатна для використання на локальних системах. Для роботи достатньо одного ПК з відеокартою NVIDIA GeForce RTX 4090 та 32 ГБ оперативної пам’яті.
Модель можна використовувати з інструментами SWE-agent та OpenHands для автоматизації виправлення помилок, аналізу коду та внесення змін. Завдяки своїй гнучкості, Devstral може бути інтегрована в різні середовища розробки.
Переваги Devstral порівняно з іншими моделями
Модель Devstral навчена для вирішення конкретних проблем на GitHub. Вона значно випереджає інші системи у тестовому наборі SWE-Bench Verified, який перевіряє коректність вирішення типових проблем у коді на основі 500 реальних повідомлень про помилки на GitHub.
У цьому тесті модель Devstral набрала 46,8%, тоді як модель Claude 3.5 Haiku отримала 40,6%, SWE-smith-LM 32B — 40,2%, а GPT-4.1-mini — лише 23,6%. Крім того, Devstral випередила такі великі моделі, як Deepseek-V3-0324 671B (38,8%) та Qwen3 232B-A22B (34,4%), які охоплюють сотні мільярдів параметрів.
Практичне застосування для розробників програмного забезпечення
Розробники програмного забезпечення можуть використовувати Devstral для багатьох завдань. Наприклад, для аналізу великих кодових баз, виявлення зв’язків між компонентами та пошуку помилок у складних функціях. Це значно прискорює процес розробки та підвищує якість коду.
Одна з ключових особливостей Devstral — здатність працювати з великими обсягами контексту, що дозволяє аналізувати цілі проєкти, а не окремі файли. Завдяки цьому, модель може запропонувати більш комплексні рішення проблем.
Для більш детальної інформації відвідайте офіційний сайт Mistral AI або перегляньте сторінку моделі Devstral на Hugging Face.