Министерство науки и высшего образования РК разработало проект правил формирования и ведения Национального словарного фонда казахского языка. Фонд создается на основе Закона «О культуре» и будет служить для сохранения, развития и цифровизации казахского языка.
Национальный словарный фонд станет государственной информационной системой, в которой соберут академические и переводческие словари, терминологические базы, корпус казахского языка и наборы данных (датасеты). Важной задачей фонда будет адаптация казахского языка к современным технологиям, включая искусственный интеллект.
Фонд сформирует юридическое лицо, определенное уполномоченным органом в сфере языковой политики. Эта организация создаст цифровую платформу, где будут собраны слова, их значения, примеры использования и переводы. Разработают поисковую систему, платформу для научных исследований, а также механизмы интеграции с цифровыми сервисами, включая технологии ИИ.
Национальный словарный фонд поможет обучению искусственного интеллекта казахскому языку. Для этого система будет включать обработку естественного языка, генерацию текстов и автоматизированный анализ слов. Эти данные смогут использовать разработчики голосовых помощников, машинного перевода, интеллектуальных чат-ботов и других технологий.
Фонд будет работать по нескольким принципам:
- научная обоснованность и соответствие нормам литературного языка,
- систематичность и постоянное обновление данных,
- сочетание традиций и современных терминов,
- доступность информации для всех пользователей.
Для бесперебойной работы системы разработают технические требования, обеспечат надежную серверную инфраструктуру и внедрят защиту данных. Также предусмотрена многоуровневая проверка информации, включая участие специалистов, занимающихся экспертизой и цифровизацией.
В будущем Национальный словарный фонд будет интегрирован с различными цифровыми сервисами, что поможет его использованию в разработке технологий машинного перевода, голосовых помощников и других интеллектуальных систем.