Жасанды зейінді ChatGPT-сіз де қазақша сөйлетуге болады – венчурлық инвестор

0
32

Ашық көздердегі қазақша деректердің бәрін 7 млрд өлшемшарт бойынша жасанды зейінге енгізген IrbisGPT жобасының негізін қалаушылардың бірі, Advisory Board MOST холдингінің басшысы Айдар Баймахан агенттік тілшісіне берген сұхбатында ChatGPT-ге балама отандық өнім жасап жатқанын айтты.

— Айдар мырза, жалпы жұртқа сізді кім таныстырғанымыз жөн?

— Мен басқаратын Advisory Board MOST холдингі Қазақстанда венчурлық индустрияны 12 жылдан бері дамытып келеді. Соңғы кезде қазақша ақпаратты ауызша және мәтін күйінде түсінетін IrbisGPT деген жүйе құрып жатырмыз. Мысалы, ағылшындар өз тілінің цифрлық базасы негізінде ChatGPT дейтін жасанды зейін жасап шықты. Бірақ ондағы ақпараттың бәрі ағылшынша деректердің негізінде синтезделеді. Біз қазақша нұсқасын пайдаланған күннің өзінде негізгі деректерді ағылшынша ақпарат бойынша қорытып шығарады. ХІХ ғасырда қазақ тілі ғылым мен экономика тілі болуы үшін жасанды зейіннің цифрлық әлемдегі қазақша мазмұнның бәрін оқып, түсініп, талдай алатын моделі керек. Соны істеп жатырмыз. Әзірге бастамасы ғана бар. Істейтін жұмыс өте көп.

— Қазақша деректердің цифрлық қорын кімнен алып жатырсыздар?

— Ашық көздерде қандай қазақша ақпарат бар, соның бәрін енгізіп болдық. Енді меншік құқығы қорғалған ақпараттарды кіріктіру мәселесі тұр. Сол үшін Президент атына ұсыныс жолдамақпыз. Мысалы, Ұлттық кітапханалар бар. Ондағы мәліметтің бәрі цифрландырылып қойған екен. Тек біздің қолымыз жетпейді. Бір жағынан оны да түсінуге болады. Өйткені, бұл мемлекеттік қауіпсіздікпен, ұлттық қауіпсіздікпен байланысты. Жеке адамдарға, жеке компанияларға қолдағы мәліметтің бәрін беру қауіпсіздікке қайшы. Бірақ бермесең, қазақша жасанды зейін дамымай, көштен қала берейік деп тұрмыз. Мен кино, музыка, ғылым, ІТ саладағы таныстарымнан сұрап шықтым. Сексен пайызы жасанды зейінді жұмысында пайдаланатынын, бірақ ол үшін ағылшын тілінде сұрау салатындарын айтты.

Қарапайымдап айтсақ, бұл жоба іске асса, адамдар «Баламды мектеп кезегіне тіркеу үшін не істеймін?», «Кәсіп бастау үшін қандай құжат керек?» дейтін сұрақтарды интернетке қазақша қойып, жауабын оңай таба алатын болады.

— Бұл жобаға қанша уақыт керек?

— Бізде уақыт тым тапшы. 2-3 жылдың ішінде жасап үлгермесек, ChatGPT қазақтардың жеке көмекшісіне айналып шыға келеді. Ал ол әзірге тек ағылшын, орыс тіліндегі сауалдарға ғана сапалы қызмет көрсетіп тұр.

— Қазір жүйеңізде қанша дерек бар?

— Қолымызда қазір 7 млрд өлшемшартқа құрылған «үлкен тіл моделі» (Large Language Model, LLM – ред.) бар. Ашық көздердегі қазақша ақпараттың бәрін сол параметрлерге енгізіп қойдық. Екі апта ғана болды, қазақша деректерді талдап, түсіне бастады. Қараңыз, мен телефонымнан IrbisGPT-ге кіріп, «Шөп неге жасыл?» деген сұрақ жібердім. Оны жазуға ерінсем, аудио сұрақ жолдауыма болады. Жауабын қарасаңыз, ғылымның ауыр тілімен емес, түсінікті тілмен фотосинтез процесін сипаттап шыққан. Екі апта бұрын енгізілген деректерді біздің жүйе меңгеріп болған деуге болады.

— Ғылым және жоғары білім министрлігі ChatGPT-ді қазақша сөйлетуге кірісіп кеткенін білетін шығарсыз. Бір-бірлеріңізді қайталап жүрмейсіздер ме?

— Иә, білемін. Ол үшін супер компьютер алып жатқандарынан да хабардармын. Бір жағынан, шынымен де бір-бірімізді қайталаймыз. Бірақ олар мемлекет тарапынан жасап жатыр. Ал біз жеке капитал есебінен іске асырып жатырмыз, яғни біз мемлекеттен ақша сұрап отырған жоқпыз. Тек қазақ тіліндегі деректер базасына рұқсат берсе болды, ақпарат қана сұрап отырмыз. Мемлекет бірлесіп жасағысы келсе, оған да дайынбыз. Бұл – маңызды тренд. Бүкіл әлем жасанды интелектімен айналысып жатыр.

— Жүйені патенттедіңіздер ме?

— Тіркейміз.

— Мемлекет меншік құқығы қорғалған деректерге рұқсат берген күннің өзінде ғылыми еңбектердің, әдебиеттердің авторлары өз құқығын талап етіп жүрмей ме? Оны қалай шешесіздер?

— Ол мәселені реттеу әлем бойынша үлкен проблема болып тұр. Ал авторлық құқықты сыйлау керек деп күтіп отырсақ, жасанды зейін бәйгесінде шаң қауып қалайық деп тұрмыз. Ең дұрысы, бәрін қозғалыс үстінде, біртіндеп реттеп отыру керек деп ойлаймын. Өйткені, әлемде бұл мәселені тұтастай шешкен сәтті бір кейс жоқ. Авторлар қауымдастығымен бірлесе отырып реттеуге мүмкіндік бар. Мемлекет, жалпы қоғам, сарапшылар, шетелдік сарапшылар мен қорлардың бәрімен бірлесе отырып реттеу керек. Мысалы, әйгілі Илон Маск жасанды зейінге қатты қарсылық білдіріп жатыр. Қалған инноваторлар оны уақыт талабы деп қабылдайды. Жасанды зейін – интернет дәуірінің жаңа деңгейі. Бұрын ғаламторда шашыраңқы жатқан мәліметтің бәрін синтездеп, жүйелеп, іріктеп ұсынады. Ол адамның уақытын да, энергиясын да, шығынын да еселеп үнемдегелі тұр. Қазір интернетсіз бүкіл экономика тұралап қалатындай жағдайға жеттік қой. Енді бір 10 жылда жасанды зейін де дәл сондай баламасы жоқ инфрақұрылымға айналайын деп тұр.

— Жобаға қанша инвестиция салдыңыздар?

— Жобаның бастапқы капиталы 1 млн долларға жуық. Әзірге команда жасақтап, жаңағы айтқан 7 млрд параметрді орнаттық. Енді жинаған ақпараттың бәрін осы 7 млрд параметрге енгізіп, параметрлер ауқымын үлкейте береміз. Ендігі модельдері 13, 20, 70 млрд параметрге негізделген. Сол деңгейлердің бәрін еңсеріп шығу қажет.

— Мемлекетке сіздерді қолдаудан қандай пайда бар? Өздері де дәл осы жобаны басқа платформа арқылы дамытқалы жатқан жоқ па?

— Мемлекет саясатының әр саласы бойынша жеке-жеке параметрлер құрып, бәрін жасанды зейін арқылы басқарып, қолдануға болады. Ұлттық қауіпсіздік деректерін бөлек, білім берумен байланысты деректерді бөлек, денсаулық сақтау деректерін бөлек енгізуге мүмкіндік бар. Мысалы, ертең eGov-ті де бөлек жасауға болады. IrbisGPT-ді eGov-пен интеграциялау арқылы мемлекеттік қызметтерді жеңілдете аламыз. Мысалы, «Өз кәсібімді қалай ашамын?» деп қазақша сауал жіберсеңіз, IrbisGPT жүйесі eGov-тегі жеке деректеріңізге сүйене отырып, жасыңызды, табысыңыз бен мойныңыздағы борыштарды, иелігіңіздегі мүліктерді, қайда қызмет істейтініңізді зерделеу арқылы нақты қандай кәсіппен айналысуыңызға болатынын, мемлекеттен қандай жеңілдіктер алатыныңызды анықтайды. Соның бәрін талдап келіп, «Атыңыздан өтінім жібере берейін бе?» — деп сұрайды. Бұл өтініші бар азаматтың да, мемлекеттің де жұмысын бірнеше есе жеңілдетеді.


ПІКІР ЖАЗУ