Ерболат Хасанов: Siri секілді қазақша түсінетін виртуал көмекші жасағымыз келеді

Ерболат Хасанов: Siri секілді қазақша түсінетін виртуал көмекші жасағымыз келеді
Фото: envato.elements.com

Назарбаев университетінде құрылған "Ақылды жүйелер және жасанды интеллект" институтының мамандары қазақша аудионы мәтінге айналдыратын бағдарлама жасады. Оған Қазақстанның әр түкпірінен еріктілер атсалысып, дауыс деректерін жіберген. 335 сағаттан тұратын аудио қоры қазіргі таңда қазақ тіліндегі ең үлкен дыбыс корпусы саналады.

Жоба авторларының бірі, "Ақылды жүйелер мен жасанды интеллект" институтының постдокторанты Ерболат Хасанов Massaget.kz тілшісіне берген сұхбатында жобаның мақсаты, оның пайдасы мен болашақта қандай салада сұраныста болатынын айтып берді.

Ерболат Хасанов

– Осыған дейін тілімізде көлемді деректер жиынтығының жеткіліксіз болуы қазақ тілін цифрлық әлемде шектейтін. Демек дауыспен жұмыс істейтін көп технология қазақ тіліне қолжетімсіз еді. Олар көбіне ағылшын, қытай және орыс тілдерін танитын. Бұл мәселені шешу үшін біз осы жобаны қолға алдық. Оның көмегімен қазақ тілін жаһандық цифрлық әлемге белсенді енгізуге болады.

Жобаның басты мақсаты – қазақ тілін цифрлық әлемге қосу. Ол үшін қазақ тілін түсінетін Siri немесе Алиса секілді виртуал көмекшілерді дайындап және басқа да "ақылды үй", "ақылды тоңазытқыш", "ақылды теледидар" сияқты технологияларда тілімізді қолдану керек. 

Сонымен бірге бұл жоба Қазақстанда инклюзияның дамуына үлкен серпін береді. Ерекше қажеттігі бар адамдар кеңінен қолданатын дауыстық және мәтіндік бағдарламаларда жаңа технологияны пайдалануға болады. Енді біз экономика мен қоғамның дамуына үлесімізді қосу үшін қазақ тілі дауыстық деректер жиынтығын зерттеушілермен, кәсіпкерлермен бөлісуге дайынбыз. 

– Жобаның дауысты тек 10 секунд тыңдайтын демо нұсқасы дайын, ал толық нұсқасын қашанға жоспарлап отырсыздар?

– Біз сөз тану жүйесін құрумен шектеліп қалмаймыз. Мақсатымыз – қазақ тілі деректер жиынтығын одан ары кеңейтіп, зерттеушілермен, кәсіпкерлермен бөлісу. Олар деректер жиынтығын тегін пайдаланып, түрлі бағдарламаларда не комерциализация үшін де қолдана алады. Кез келген ниет білдірген азамат бізге алдымен хабарлап, артынша деректер жиынтығын түрлі бағытта қолдануына болады. Демо нұсқасын деректер жиынтығының пайдалы әрі сенімді екенін дәлелдеу үшін жарияладық. 

– Дауыс жазуға еріктілердің дауысын әлі де қабылдайсыздар ма? Әлде қордағы материал жеткілікті ме?

– Иә, әлі де қабылдаймыз. Деректер әлі толықтырылып жатыр, жұмыс тоқтаған жоқ. Қазақ тілі дауыс деректері жиынтығының сайтына кіріп өз дауысыңызды жаза аласыз, сөйтіп деректер қорын кеңейтуге көмектесуіңізге болады.

Қазір қорда 300 сағаттан астам аудиожазба бар. Бұл сапалы сөз тану жүйесін құру үшін жеткілікті. Дегенмен жиынтығымыз әлі де толықтырылып жатыр. Болашақта қорды 1000 сағатқа жеткізу ойымызда бар. Сонымен бірге осы жиынтықты қолдана отырып сөз синтезі және сөйлеушіні тану секілді басқа да жүйелердің демосын жасағымыз келеді. 

– Болашақта Siri не Алиса секілді дауыстық көмекші жасау жоспарда бар ма?

– Иә, жоспарда бар. Бірақ мұндай виртуал көмекшілерді жасау оңай шаруа емес. Біз бұл жолда тек алғашқы қадам жасадық. Алда бізді үлкен істер күтіп тұр.

– Тіл ерекшелігіне байланысты қиындықтар болды ма?

– Түркі тілдерінің грамматикасы күрделі. Өйткені олар морфологиялық жағынан өте бай. Жұрнақ қосқанда сөз мағынасы өзгере береді. Мысалға "қанағат-тан-дыр-ыл-ма-ған-дық-тар-ыңыз-дан" сөзін алуға болады. Сондықтан қазақ тілінің сөздік қоры өте бай. Дегенмен орыс тілінен енген сөздер көп, оған қоса адамдар орыс-қазақ тілдерін жиі араластырып сөйлейді. Осының барлығы сөз тану немесе сөз синтезі секілді жүйелерге қиындық тудырады. Қазақ тілінің артықшылығы – сөздердің айтылуы мен жазылуының ұқсастығы. Мәселен ағылшын немесе француз тілдерінде көп сөздің айтылуы мен жазылуында айырмашылық көп.

– Бұл жобаның қай қызмет саласында пайдасы көп?

– Жоба көп қызмет салаларында пайдалы деп сеніммен айта аламын. Біріншіден, ерекше қажеттігі бар адамдарға, мысалы, көзі дұрыс көрмейтін немесе құлағы дұрыс естімейтін кісілерге пайдалы. Бұл инклюзияның дамуына серпін береді. Сонымен қатар халыққа қызмет көрсету орталықтарында немесе колл-орталықтарда қолдануға болады. Қазақ тілін түсінетін чат-бот әзірлеп, қойылған сұрақтарға автоматты түрде жауап алуға болады. Бұған қоса қазақ тілін түсінетін виртуал көмекшілерді және басқа технологияларын құруға мүмкіндік береді. 

– Тағы қандай жобаларыңыз бар?

– Институтымызда көп жоба іске асып жатыр. Олар ақылды индустрия 4.0, ақылды денсаулық сақтау және ақылды өмір бағыттарында жасалып жатыр. Болашақта жүйлерімізді Android және iOS платформаларында орнатуды ойластырып жатырмыз.

А. Рысдәулет