Актуально

Специально для тюрков

Цифровая языковая модель

Казахстанский технологический стартап Cybernet AI представил крупнейшую модель автоматического распознавания речи (ASR), разработанную специально для тюркских языков. Разработка стала первым в Центральной Азии примером масштабной ИИ-модели, изначально спроектированной под лингвистические, фонетические и социокультурные особенности тюркской языковой группы, а не адаптированной из англоязычных решений.

 

Запуск модели знаменует собой важный этап в развитии отечественной индустрии искусственного интеллекта и подтверждает переход Казахстана к формированию собственного технологического задела в сфере высоких цифровых решений.

Проект реализован при стратегической поддержке Astana Hub, Министерства искусственного интеллекта и цифрового развития РК, а также на базе высокопроизводительной GPU-инфраструктуры Microsoft в рамках международной программы Microsoft for Startups.

Cybernet AI - участник международного технопарка Astana Hub, специализирующийся на разработке защищенных корпоративных AI-решений для контакт-центров банков, финтех-компаний и других регулируемых отраслей. Платформа компании обеспечивает высокую производительность, контролируемое масштабирование и значительное снижение операционных затрат при строгом соблюдении стандартов информационной безопасности и регуляторных требований.

Компания ведет деятельность в Казахстане, Узбекистане, Кыргызстане, США, Мексике и Египте, а также реализует проекты в Великобритании и странах Европейского союза. Решения Cybernet AI поддерживают 34 языка, включая казахский, узбекский, русский, английский, арабский и испанский.

По мнению экспертов, новая разработка открывает широкие перспективы для цифровизации бизнеса и государственных услуг в странах тюркского мира, где вопрос качественного голосового взаимодействия на родных языках остается особенно актуальным.

Управляющий директор Astana Hub Танат Ускембаев, комментируя запуск модели, подчеркнул ее стратегическое значение для страны и региона.

- Разработка Cybernet AI открывает для стран тюркской языковой группы возможность масштабировать цифровые сервисы и клиентское обслуживание на родных языках с применением искусственного интеллекта без потери качества и по доступной стоимости. Для Казахстана это означает переход от роли потребителя глобальных ИИ-решений к роли разработчика собственных технологий, конкурентоспособных на международном уровне, - отметил он.

Созданная ASR-модель обучена на большом массиве данных на казахском, турецком, узбекском, кыргызском, азербайджанском и татарском языках. Важным конкурентным преимуществом решения стала способность корректно распознавать смешанную тюркско-русскую речь, которая широко распространена в реальных диалогах клиентов с бизнесом, а также при получении государственных и социальных услуг.

До настоящего времени Казахстан, как и другие страны Центральной Азии, был вынужден использовать международные ASR-модели, разработанные преимущественно под английский язык. Такие решения зачастую плохо учитывали специфику тюркской фонетики, особенности ударений, диалектов и языковое переключение внутри одного предложения. Это напрямую отражалось на качестве голосовых ассистентов, контакт-центров и автоматизированных сервисов.

В Cybernet AI приняли принципиальное решение отказаться от адаптации существующих англоязычных моделей и создать собственную архитектуру распознавания речи - внутри региона и для региона.

- Мы сознательно отказались от адаптации англоязычных моделей и создали ASR-модель, которая изначально понимает живые, смешанные формы разговорного языка. Это делает нашу разработку не просто очередным технологическим продуктом, а вкладом в формирование локальной экосистемы искусственного интеллекта и технологического суверенитета Казахстана, - отметил технический директор компании Рашид Исмаилов.

Новая модель ориентирована на организации, работающие с большими объемами голосовых коммуникаций. В их числе - банки и финансовые организации, телеком-операторы, контакт-центры различного уровня, логистические и сервисные компании, а также государственные органы, оказывающие услуги населению.

Разработчики подчеркивают, что внедрение ASR-модели позволяет существенно сократить операционные расходы, снизить нагрузку на операторов контакт-центров и обеспечить круглосуточную доступность клиентского сервиса в наиболее востребованном голосовом формате. Это особенно важно для регионов с высокой долей телефонных обращений и ограниченным доступом к цифровым каналам.

Модель демонстрирует высокую устойчивость к фоновым шумам, акцентам и диалектным особенностям, а также корректно работает при переключении языков в рамках одного диалога или даже одного предложения. По оценкам разработчиков, точность распознавания остается стабильно высокой в различных сферах применения - от финансовых технологий и телекоммуникаций до сферы государственных услуг.

Эксперты отмечают, что появление такой модели создает предпосылки для ускоренного развития локальных AI-продуктов, ориентированных на реальные потребности граждан и бизнеса, а также усиливает позиции Казахстана как регионального центра инноваций и цифровых технологий.

Подготовил Артём КИМ,
фото «Astana times»