Алматыда қазақ тілі жоғалып кетпеуі үшін ғалымдар қуатты суперкомпьютерді іске қосты

02.12.2025 12:27 Арман Ермеков
Алматыда қазақ тілі жоғалып кетпеуі үшін ғалымдар қуатты суперкомпьютерді іске қосты
0
5
Фото: zakon.kz

Әл Фараби атындағы Қазақ ұлттық университетінде қазақ тілін цифрлық ортада дамытуға бағытталған үлкен тілдік модель жобасы бойынша workshop өтті. Бұл бастама былтыр қыркүйектен бері жұмыс істеп келеді. Жобаға Institute of Smart Systems and Artificial Intelligence, А.Байтұрсынұлы атындағы Тіл білімі институты, Ақпараттық және есептеу технологиялары институты, «Тіл Қазына» орталығы және SOFTCRAFT компаниясы қатысып отыр, деп хабарлайды Politico.kz.

Workshop түрлі саланың ғалымдарын, инженерлерін, деректер мамандарын және жасанды интеллект зерттеушілерін біріктіріп, қазақ тілін жаңа технологиялық деңгейге көтеруге арналған ортақ кеңістікке айналды.

Жиында ғалымдар жобаның негізгі мақсаты қазақ тілін толық қолдайтын үлкен тілдік модельді әзірлеу екенін айтты. Бұл жұмыс тек ғылыми бағыт емес, стратегиялық маңызы бар бастама саналады. Жоба аясында корпус дайындаудан бастап, модельді оқыту, инфрақұрылым құру, қауіпсіздік пен этиканы қамтамасыз етуге дейінгі барлық кезең қамтылған. Қатысушылар мұндай жобаның ел үшін өлшеусіз маңызы бар екенін атап өтті. Себебі қазақ тілін цифрлық ортаға енгізу мемлекет үшін жаңа технологиялық тәуелсіздік қалыптастырады.

Workshop барысында ҚазҰУ проректоры Марғұлан Ибрагимов жоба нәтижелері туралы кең көлемде пікір айтты.

«Біз тек ғылыми ғана емес, стратегиялық маңызы бар нәтижелер ұсынып отырмыз. 100 миллионнан астам сөзден тұратын ірі деректер қоры жасалды. Оның ішінде жанрлық және тақырыптық қосалқы корпустар, мәтін сурет аудио форматындағы мультимодальды материалдар, ресми құжаттар мен интерактивті сценарийлер бар. Жоба барысында GPU кластері мен жаңа буын деректер платформасына негізделген қуатты инфрақұрылым құрылды. Университетке NVIDIA DGX H200 жасанды интеллект кластері сатып алынды. Оның өнімділігі өте жоғары. Бұл кластер модельдерді әзірлеу, оқыту және орналастырудың толық циклін қамтамасыз етеді», деді ол.

Бұл инфрақұрылымның маңызы workshop қатысушылары тарапынан да оң бағаланды. Қуатты серверлер мен деректер платформасы үлкен көлемді тілдік модельдерді сапалы оқытуға мүмкіндік береді. Мұндай жүйе Қазақстанда алғаш рет толық құрылып отыр. Бұл елдің ғылыми және технологиялық әлеуетін едәуір арттыратыны сөзсіз. Сонымен қатар деректердің қауіпсіздігі мен этика нормалары да қатаң сақталып отыр.

Жоба аясында ҚазҰУ базасында LLM негізіндегі бірнеше арнайы агенттер әзірленген. Олар мәтін талдау, жауап генерациялау, автоматты классификация және интеллектуалды қолдау бағыттарына бейімделген. Алдағы уақытта білім беру мен зерттеу саласына арналған қазақ тілді чат боттар, оқу жүйелері және цифрлық көмекшілер жасалмақ. Сарапшылар мұның барлығы елде жасанды интеллект экожүйесін қалыптастыруға берік негіз болатынын айтты. Бұл толық циклді модель тек деректер мен инфрақұрылымды ғана емес, интеграцияны да қамтиды.

Келер жылы жобаны кеңейту жоспарланып отыр. Жаңа тақырыптық корпустар жасалып, интернет платформа іске қосылады. Үлкен тілдік модельді қолданбалы жүйелерге енгізу және арнайы қазақ тілді чат боттарды әзірлеу де күн тәртібінде тұр. Бұл жоспар workshop қатысушыларының ортақ мүддесін күшейтті. Ғалымдар қазақ тіліне арналған LLM әзірлеу әлемдік технологиялық бәсекеде Қазақстанның орнын айқындайтынын айтып өтті.

Workshop барысында Назарбаев университетіндегі ISSAI институтының директоры Атакан Варол да пікір білдірді.

«Қазақстанда қазақ тілімен қатар орыс және ағылшын тілі кең қолданылып келеді. Генеративті ЖИ кезеңінде қазақ тілін түсінетін әрі елдегі барлық тілдік қажеттілікті қанағаттандыратын ірі тілдік әрі тілдік визуальды модельдерді әзірлеу өте маңызды. Мұндай технологияларды дамытпаған елдер өз тілін жоғалтып алу қаупіне тап болады. Қазақстанда академиялық қауымдастық бұл міндетті үлкен жауапкершілікпен орындап жатыр. Ғалымдар өздері модельдерді құрып, деректер жинап, жаңа әдістер жасап, интеллектуалды кадр дайындап отыр», деп түсіндірді А. Варол.

Бұл пікір workshop көрермендері арасында үлкен қолдау тапты. Себебі тілдік технология ұлттық қауіпсіздік пен мәдени кодты сақтаудың негізгі құралына айналды. Әлемде тілін жоғалтып алған қоғамдар технологиялық тәуелділікке тез ұшырайды. Сондықтан қазақ тілін жасанды интеллект кеңістігіне енгізу стратегиялық міндет саналады.

Жиында ҚазҰУ профессоры Мәдина Мансұрова жобаның тағы бір қырын түсіндірді.

«Қазіргі кезде жасанды интеллект және үлкен тілдік модельдер құру өте маңызды бағыт болып отыр. Назарбаев университеті ғалымдары бастаған жұмысты ҚазҰУ зерттеушілері жалғастырып, қарапайым қолданушыларға арналған қосымшалар әзірледі. Қазір журналистика факультетімен бірлесіп журналистикаға байланысты құрал жасалды. Ол университет сайтында жұмыс істеп тұр. Сонымен қатар қабылдау комиссиясына арналған жүйе енгізілді. Оның көмегімен кафедра оқытушылары студенттермен кездесуді автоматты түрде жоспарлай алады. Университеттің ауқымды кітапхана қоры да цифрлы форматқа көшіріліп жатыр», деді ол.

Бұл пікір білім беру саласында LLM технологиясының маңызын көрсетіп берді. Workshop қатысушылары білім мен медицинаны цифрландыруда да бұл модельдер үлкен рөл атқарады деп бағалады. Жиын соңында сарапшылар бұл жоба елде жасанды интеллектті ұлттық мүдде тұрғысынан дамытуға мүмкіндік беретінін атап өтті. Олар қазақ тілі технологиялық бәсекеде өз орнын алуы үшін дәл осындай ғылыми бастамалар қажет екенін айтты.

Пікірлер (0)
Здесь пока ничего нет
Пікір қалдырыңыз
Войдите, чтобы оставить комментарий