Працювати над ML/AI-ядром RaccoonDoc для розпізнавання, класифікації, розділення, аналізу та валідації документів.
Основні задачі:
розробляти та покращувати ML-моделі для обробки документів;
працювати з задачами Computer Vision, OCR, NLP, NER, LLM/VLM;
будувати пайплайни обробки документів - від вхідного файлу до структурованих даних;
Що очікуємо
Для цієї ролі нам важливо, щоб ти міг:
самостійно розібратись у новій задачі;
сформулювати гіпотези та запропонувати кілька варіантів рішення;
оцінити trade-off між якістю, швидкістю, складністю та вартістю;
не чекати детального технічного завдання на кожен крок;
Що пропонуємо
Продукт, а не одноразовий проєкт.
Ти працюватимеш над ядром RaccoonDoc, яке постійно розвивається і використовується реальними клієнтами.
Реальні дані та реальні задачі.
Тут не буде стерильних датасетів. Будуть документи, які щодня створюють проблеми бізнесу, і саме їх треба навчити систему обробляти краще, швидше й стабільніше.