НУ ғалымдары қазақша аудионы мәтінге айналдыратын бағдарлама жасады

НУ ғалымдары қазақша аудионы мәтінге айналдыратын бағдарлама жасады
Фото: elements.envato.com

Назарбаев университетінің ғалымдары 2 мыңнан астам адамның дауысын жазып, өңдеп, қазақ тіліндегі ең үлкен дыбыс корпусын жасап шығарды. Осының арқасында түрлі бағдарламалар тек қазақ тілін түсініп қана қоймай, дауыстық көмекші жасауға серпін береді.

Ерболат Хасанов: Siri секілді қазақша түсінетін виртуал көмекші жасағымыз келеді

"Ақылды жүйелер және жасанды интеллект" институтының мамандары қазақша аудионы мәтінге айналдыратын бағдарламаға Қазақстанның әр түкпірінен еріктілер атсалысып, дауыс деректерін жіберген. 335 сағаттан тұратын аудио қоры қазіргі таңда қазақ тіліндегі ең үлкен дыбыс корпусы саналады.

Жинақталған дыбыс қорының көмегімен Назарбаев университетінің ғалымдары жасанды сананы қазақ тілін түсінуге, оны анықтауға, мағынасын ашуға, дыбыстауға үйретті. Технологияны мына жерден тексеріп көрсеңіз болады. 

Қазақ тілін түсінетін жүйе Siri, Alexa, Алиса не Cortana секілді дауыстық көмекшілерді әзірлеушілердің қызығушылығына ілінуі мүмкін. Өйткені дыбыстық корпус арқылы дауыстық көмекшілер қазақ тілін түсіне алады. 

Дегенмен дыбыс қоры қолданылатын сала аясы аз емес. Сондықтан жүйені әзірлеушілер қазақ тілі деректер жиынтығын одан әрі кеңейтіп, зерттеушілермен, кәсіпкерлермен бөлісуді жоспарлап отыр. Қызығушылық танытқан кез келген адам деректер жиынтығын тегін пайдаланып, түрлі бағдарламаларда не комерциализация үшін де қолдана алады. 

Қазірдің өзінде KaspiBank, Beeline, BTS Digital, Yandex, Silero Speech сөйлеуді тану жүйесі, бірнеше жоғары оқу орындары, оның ішінде АҚШ-тағы жекеменшік гуманитарлық Суортмор колледжі, Қазақстан-Британ техникалық университеті, Алматы энергетика және байланыс университеті және Қ.Сəтбаев атындағы Қазақ Ұлттық техникалық зерттеу университеті дыбыс қорын пайдалануға рұқсат алған.

Айта кетерлігі, 2018 жылы Yandex "Алисаға" қазақ тілін үйретуге қолға алғанын хабарлаған еді. Алайда әзірге компания қазақ тілді дыбыстық көмекшіні ел назарына ұсынған жоқ.

"Қазақ тілінде қомақты қордың болмауы тілдің сандық әлемдегі жолын тежеген. Сол үшін де біз осы жобаны қолға алдық. Қазір қазақ тіліндегі дыбыстық қорды қызығушылық танытқан зерттеуші мен кәсіпкерлермен бөлісуге дайынбыз. Жоба ел экономикасы мен қоғамын дамытуға қосар үлесінің артқанын қалаймыз", - дейді ISSAI NU директоры Атакан Варол.

Бұған қоса ғалымдар бұл жоба мүмкіндігі шектеулі адамдарға көмегін беретініне сенімді.

А. Рысдәулет