RUKOPYS: В Україні створили перший масштабний датасет рукописного тексту

Міністерство економіки за підтримки Міністерства цифрової трансформації спільно з AI HOUSE та Українським католицьким університетом (UCU) запустили ініціативу, спрямовану на подолання одного з ключових бар’єрів цифровізації ‒ обробки рукописних даних.
Про це повідомляє пресслужба Мінекономіки.
Хакатон "Handwritten to Data" покликаний сприяти впровадженню технологічних рішень у систему "єДозвіл" та інші державні сервіси, де робота з рукописними документами залишається критично важливою.
Призначення датасету
У центрі ініціативи ‒ RUKOPYS, перший в Україні масштабний відкритий датасет українського рукописного тексту з розміткою. Він створений як базова інфраструктура для розробки моделей, здатних ефективно розпізнавати рукописні документи українською мовою.
Розробка практичних рішень на основі RUKOPYS відбуватиметься в межах хакатону "Handwritten to Data". Учасники працюватимуть над створенням інструментів для автоматичного розпізнавання та обробки рукописних заяв, журналів, довідок та інших документів, які досі широко використовуються у державному секторі.
Практичне застосування
На відміну від традиційних хакатонів, ініціатива орієнтована не на експериментальні прототипи, а на створення готових до впровадження рішень. Учасники отримають доступ до реальних даних і працюватимуть над завданнями, що мають практичне значення для держави.
Реалізація проєкту дозволить:
- суттєво пришвидшити обробку документів;
- скоротити обсяг ручної роботи;
- підвищити ефективність державних органів.
Очікується, що RUKOPYS у поєднанні з прикладними ШІ-рішеннями стане основою для усунення "сліпих зон" цифровізації та переходу до повноцінної роботи з даними в державному секторі.
Як повідомлялося, система управління публічними інвестиціями DREAM отримає вбудований штучний інтелект, а перші його функції планують презентувати вже влітку.
Нагадаємо, Міністерство цифрової трансформації розширює стратегічне партнерство зі Світовим банком, зосереджуючись, зокрема, на розвитку штучного інтелекту, посиленні кібербезпеки та впровадженні енергонезалежного інтернету.