End-to-End Pipeline: Побудова архітектури навчання від симулятора до деплою на реальне залізо.
RL Control: Розробка моделей керування (PPO, SAC, TD3), що приймають рішення на основі відеопотоку та сенсорів у real-time.
Sensor Fusion: Реалізація стабільного керування (Kalman Filters або RL-native підходи) у зв'язці з Sensor Engineers.
Sim2Real & Domain Randomization: Створення симуляційного середовища (Isaac Gym / AirSim / Custom UE) з глибокою рандомізацією для роботи в екстремальну погоду (сніг, дощ, низька видимість).
Optimization: Квантування та прунінг моделей для досягнення стабільного FPS на обмежених ресурсах (Raspberry Pi, NVIDIA Jetson).
Що очікуємо
Має досвід з RL-алгоритмами та розуміє, як змусити їх працювати в реальних системах.
Знає, як наблизити фізику симулятора до реальності, щоб мінімізувати Gap при переносі на борт.
Розуміє обмеження компактних комп’ютерів і вміє боротися за кожну мілісекунду інференсу.
Готовий бути архітектором: самостійно обирати стек, симулятор та підхід.
Розглядаємо також: якщо ти маєш міцний бекграунд у CV/ML та досвід з дронами, але хочеш «увірватися» саме в Reinforcement Learning.