AI Center of Excellence при Міністерстві цифрової трансформації — це команда, яка будує системи національного масштабу, що реально змінюють взаємодію мільйонів громадян з державою. Ми працюємо на перетині передових AI-технологій та публічного управління, вирішуючи задачі, яких немає в жодному комерційному стартапі.
Наші цінності: Ми віримо в інакШОмислення, що формує майбутнє та відкриває шлях до постійного розвитку. Клієнтоцентричність для нас — не просто підхід, а щоденна практика розуміння й перевершення очікувань людей, для яких ми працюємо. Ми діємо в культурі кооперації та відкритості, де чесність і доброчесність є незмінними орієнтирами. А наша наполегливість дозволяє долати складні виклики та досягати амбітних цілей разом.
Ваша основна місія: Ви будуєте NLP-системи, які розуміють українську мову в усій її складності — юридичну термінологію, мікс-код, діалекти — і перетворюють мільйони державних документів та звернень громадян на структуровані, зрозумілі та корисні дані. Ваша робота безпосередньо впливає на якість і швидкість державних послуг для кожного українця. Це не черговий fine-tuning на бенчмарку — це інженерія, яка має реальний вимір у житті людей.
У фокусі роботи: — розробка систем розуміння документів: NER, information extraction зі сканів та PDF, structured output з неструктурованих звернень; — побудова класифікації та маршрутизації звернень громадян за інтентом, тематикою та терміновістю; — розробка систем резюмування та переписування державних текстів зрозумілою мовою (plain language); — створення семантичного пошуку та RAG по корпусах законодавства з урахуванням української морфології; — fine-tuning та адаптація open-source LLM (Llama, Mistral, Qwen, Gemma) для українських задач із застосуванням LoRA/QLoRA; — побудова evaluation-фреймворків та benchmark-наборів для задач, де публічних аналогів не існує; — інтеграція NLP-сервісів у продукти Дії через FastAPI, асинхронні pipelines та забезпечення моніторингу якості в продакшені.
Від вас очікуємо: — вища освіта бакалаврський або магістерський рівень (буде плюсом у галузі комп’ютерних наук, математики або суміжних дисциплін); — 3+ роки досвіду в ML/NLP з реалізованими продакшн-проєктами; — готовність працювати в офісі, в Києві (гібридний формат); — впевнений Python: ООП, чистий код, async; — практичний досвід із трансформерами та екосистемою Hugging Face (transformers, datasets, tokenizers, accelerate, peft); — досвід fine-tuning LLM: full fine-tuning, LoRA, instruction tuning — не лише prompt engineering; — досвід із RAG та векторними БД (Pinecone, pgvector, Weaviate, FAISS); — розуміння evaluation NLP-моделей: коли BLEU/ROUGE працюють, а коли — ні, та як будувати task-specific метрики; — досвід роботи з PyTorch та здатність читати й впроваджувати ідеї зі свіжих research papers.
Буде плюсом: — досвід роботи з українською або іншими low-resource мовами на продакшн-рівні, знайомство з ресурсами lang-uk, UberText, UA-GEC; — досвід із document AI (LayoutLM, Donut, OCR pipelines) та MLOps-інструментами (MLflow, W&B, CI/CD для моделей); — участь у NLP-конференціях або опубліковані papers (ACL, EMNLP, EACL, UNLP).
Ми шукаємо талант, який: — бачить різницю між «BLEU 35 на бенчмарку» і «система реально допомагає громадянину» — і будує саме друге; — мислить як дослідник і діє як інженер: перетворює свіжі papers на надійні продакшн-рішення; — розуміє low-resource контекст української мови та підходить до нього як до унікального виклику, а не обмеження; — проактивно виявляє системні помилки, edge cases та biases ще до того, як вони потрапляють до користувача.
Ми пропонуємо: — роботу над NLP-задачами національного масштабу з реальним впливом на мільйони українців; — доступ до унікальних державних датасетів та співпрацю з провідними експертами в AI, лінгвістиці та публічному управлінні; — офіс з генератором та безперебійним інтернетом; — бронювання працівників за умови актуального військового обліку.
Готові до виклику? Ми шукаємо не просто інженера — ми шук



