Machine Learning Engineer (Reinforcement Learning)

Miltech Company

Що робити

End-to-End Pipeline: Побудова архітектури навчання від симулятора до деплою на реальне залізо.
RL Control: Розробка моделей керування (PPO, SAC, TD3), що приймають рішення на основі відеопотоку та сенсорів у real-time.
Sensor Fusion: Реалізація стабільного керування (Kalman Filters або RL-native підходи) у зв'язці з Sensor Engineers.
Sim2Real & Domain Randomization: Створення симуляційного середовища (Isaac Gym / AirSim / Custom UE) з глибокою рандомізацією для роботи в екстремальну погоду (сніг, дощ, низька видимість).
Optimization: Квантування та прунінг моделей для досягнення стабільного FPS на обмежених ресурсах (Raspberry Pi, NVIDIA Jetson).

Має досвід з RL-алгоритмами та розуміє, як змусити їх працювати в реальних системах.
Знає, як наблизити фізику симулятора до реальності, щоб мінімізувати Gap при переносі на борт.
Розуміє обмеження компактних комп’ютерів і вміє боротися за кожну мілісекунду інференсу.
Готовий бути архітектором: самостійно обирати стек, симулятор та підхід.
Розглядаємо також: якщо ти маєш міцний бекграунд у CV/ML та досвід з дронами, але хочеш «увірватися» саме в Reinforcement Learning.

Знайдено через trackr.help/feed · Канал: @trackrhelp · Бот для персональних сповіщень: @trackrhelpBot