Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. НККМ – це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.
Збір друкованих та електронних текстів кримськотатарською мовою для їх подальшого імпорту на платформу Sketch Engine розпочався з жовтня 2022 року.
За майже пів року були опрацьовані та внесені до каталогу понад 700 матеріалів. Серед них – твори кримськотатарських авторів, журнали, газети, підручники, документи міжнародних організацій, субтитри фільмів тощо.
Крім того, за цей час було розроблено словник лематизації. Мається на увазі створення реєстру (бази даних) слів з позначенням їх початкової форми та мовних характеристик (частина мови, рід, число тощо). Це потрібно для запуску модуля з пошуку слів на онлайн-платформі Нацкорпусу. Розробка відповідного програмного забезпечення триває.
Нагадаємо, проєкт реалізується за підтримки Мінреінтеграції, швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету імені Тараса Шевченка.
Докладніше з результатами роботи над створенням Національного корпусу кримськотатарської мови можна ознайомитися за посиланням.
Міністерство з питань реінтеграції тимчасово окупованих територій України