Дискусія про машинне навчання в підсистемах ядра Linux

Дискусія про використання машинного навчання в підсистемах ядра Linux

Нова дискусія в поштовому списку ядра Linux досліджує можливість використання машинного навчання для допомоги підсистемам ядра. Ідею запропонував В’ячеслав Дубейко, інженер IBM, створити загальну інфраструктуру, яка дозволяє підсистемам ядра взаємодіяти з моделями машинного навчання, що працюють повністю в користувацькому просторі.

Легкий “ML proxy” як базова концепція

У центрі пропозиції знаходиться легкий “ML proxy” всередині ядра. Цей проксі забезпечуватиме структуровані дані з підсистеми ядра, такі як внутрішній стан або показники продуктивності, та отримуватиме рекомендації, згенеровані моделлю ML у користувацькому просторі. Навчання, виконання моделей та експерименти залишаються поза ядром, в той час як ядро повністю контролює, чи та як будуть застосовані рекомендації.

Важливість контролю ядра

Оскільки машинне навчання пов’язане із штучним інтелектом, важливо прояснити цей момент. Ідея не передбачає впровадження AI чи коду ML всередину ядра. Натомість, підсистеми ядра надаватимуть дані користувацькому простору, де зазвичай працюють моделі машинного навчання, і отримуватимуть опційні рекомендації у відповідь.

Іншими словами, ядро залишатиметься повністю детермінованим і під контролем, вирішуючи у будь-який момент, чи застосовувати, тестувати чи ігнорувати ці пропозиції, при цьому все навчання та висновки залишаються поза простором ядра. Існуючі механізми, такі як sysfs, символьні пристрої, FUSE чи eBPF, згадуються як можливі шляхи транспорту та виконання.

Зворотний зв’язок і покращення моделей

Дубейко також описує зворотний зв’язок, в якому ядро оцінює застосовані рекомендації та повідомляє показники ефективності назад у користувацький простір. На його думку, ця інформація може використовуватися для удосконалення або повторного навчання моделей без впливу на продуктивність ядра або детермінізм. Важливо, що пропозиція підкреслює, що написана людиною логіка ядра залишається базовою, а ML виконує лише дорадчу функцію.

Перший доказ концепції та обговорення

Ранній доказ концепції пропонованої бібліотеки ML було опубліковано, а серія патчів RFC була надіслана в поштовий список ядра Linux для обговорення. Патчі яскраво позначені як експериментальні і призначені для збору зворотного зв’язку, а не для включення. Вони не були об’єднані в основне ядро, а робота залишається експлораційною.

Нарешті, як і з багатьма RFC на LKML, дискусія, ймовірно, зосередиться на доцільності, підтримці та довгострокових наслідках. Чи перейдуть підсистеми ядра, що використовують ML, за межі експериментів, залишається відкритим запитанням.

Додаткова інформація доступна в пропонованій бібліотеці ML та на офіційному сайті з новинами про пропозицію.