Казахстанский стартап Cybernet AI представил крупнейшую модель автоматического распознавания речи (ASR), ориентированную на тюркские языки, сообщает портал Astana Hub.
Разработка способна корректно распознавать казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский языки, включая смешанную тюркско-русскую речь. Это значительно улучшает качество голосовых сервисов для бизнеса и государственных структур.
Ранее страны Центральной Азии использовали международные ASR-модели, ориентированные на английский язык, что ограничивало точность распознавания из-за особенностей тюркской фонетики и произношения. Новая модель, созданная с нуля для живой разговорной речи, устойчива к фоновому шуму, особенностям произношения и переключению языков в пределах одного высказывания.
Проект реализован на GPU-инфраструктуре Microsoft при стратегической поддержке Astana Hub и Министерства цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан.


