Мемлекеттік тіл қалай цифрланады?
Астанада мемлекеттік тілді цифрландыруға қатысты жиын өтті, деп хабарлады Elorda.info.
IT жобаларды жұртшылық біле ме?
Туған тіліміздің құндылық ретінде орнын айқындауды басты миссиясы етіп алған «Тіл-Қазынаның» бүгінге күнге дейін жүзеге асырған IT жобалары жеткілікті. Соның ішінде цифрландыру заманында кез келген адамға қажетті: @kztts_bot (мәтінді сөйлеуге түрлендіретін телеграм-бот); @kzstt_bot (сөйлеуді мәтінге айналдыратын телеграм-бот); Sozdikqor.kz; Termincom.kz; Emle.kz; Qazlatyn.kz; Ғылыми-электрондық кітапхана; Qujat.kz сияқты 7 заманауи, өміршең жобаны бөліп-жарып көрсетуге болады.
Қазақ тіліндегі сөздіктердің бірыңғай іздеу жүйесі – Sozdikqor.kz-ті екі адамның бірі біле бермейді. Sozdikqor.kz – әртүрлі салалық сөздіктер, энциклопедиялардағы сөздер мен тұрақты сөз тіркестерін, қазақ тіліндегі көне сөздерді, кірме сөздерді, аймақтық және ақпараттық технологиялардың даму кезеңіндегі жаңа технологиялық сөздердің мағынасын білуге мүмкіндік беретін платформа. Қорда 1,5 млн тілдік бірлік бар, синонимайзер функциясы қосылған. Мақпал Жұмабай таныстыру рәсімінде Sozdikqor.kz-ке алдағы уақытта антонимайзер, омонимайзер (қазақ тіліндегі алғашқы құрал болады) функцияларын қосу; орыс, ағылшын тілдерінде 10 000 негізгі атау сөздің мазмұнының аудармасын жасау; гиперсілтемелер жүйесінің болуы; сөздіктегі барлық сөздерге айқын сілтемелердің болуы сияқты жаңа функциялар қосылатынын жеткізді. Бір қуанарлығы, Sozdikqor.kz-тің IOS ЖӘНЕ Android-та мобильді қосымшасы бар. Сондай-ақ, телеграм боты жұмыс істейді.
Қазақ терминологиясының қоры – Termincom.kz-те қазір 384 932 термин бар екен. Интерфейс екі тілде (қазақ-орыс); 6 түрлі формада іздеуге, жекелеген адамның ақпарат, хабарлама жазуына мүмкіндік бар; платформаға тіркелудің жеңіл жолы қарастырылған; көпфункционалды алаң жұмыс істейді. Ол жерде мемлекеттік терминологиялық комиссия мүшелерінің кез келген терминді талқылауы ап-анық көрініп тұрады. Кириллицадан латын қарпіне ауыстыруға арналған конвертер жүйесі – Qazlatyn.kz-ті туралы ақпаратыңыз бар ма? Егер естіп-білмеген болсаңыз, бірер мағлұмат айтайық. Ол қолданатын мәтінді кириллицадан латын әліпбиіне және керісінше түрлендіру мүмкіндігін ұсынады. Бұл қазақ тіліндегі әртүрлі жазу нұсқаларындағы мәтіндерді тез әрі қатесіз конвертациялауға және әртүрлі жазу жүйелеріндегі мәтіндермен жұмыс істеу үшін ыңғайлы. Платформа тек мәтінді ғана емес, құжатты да латын әліпбиіне немесе керісінше ауыстыра алады. Сонымен қатар, төте жазуға түрлендіру қызметі бар. «Яндекс» компаниясымен меморандумға қол қойылған соң онлайн аудармаға латын графикасы әліпбиі де қосылған. Сонымен қатар, біз қазақ тілін үйретуге қатысты Balatili.kz (0+9 жастағы балаларға қазақ тілін үйретуге арналған платформа), Tilqural.kz (қазақ тілін 5 деңгей бойынша оқытуға арналған сервис), Abai institute (қазақ диаспоралары мен шетелдіктердің қазақ тілін үйренуіне арналған платформа) деген жобалардың табысты іске асырылғанын білеміз.
Жасанды интеллект технологиясына ілесуіміз керек
Қазақта «Әп, бәрекелді!» деген қошемет, таңданыс сөзін жайшылықта көп айта бермейміз. Жаңашыл жетекші, ұлттық медианың мықты маманы ретінде көпке танымал Мақпал Жұмабай басқарып отырған шағын орталықтың туған тілдің бүгіні мен ертеңі, жас ұрпақтың өзегінен бөлінбеуі үшін қолға алған ізгілікті істерімен, креативтік бастамаларымен танысқан сәтте таңданысымыз да, ризашылығымыз да зор болғаны рас. Орталықтағы 8 бөлімнің білікті мамандарының дөңгеленген дүниенің жыл, ай, күн емес, тіпті сағат сайын құбылып, технологиялық төңкеріс заманын санасымен түйсініп, қазақ халқының мүддесіне сай қарекетке көшкеніне қуандық.
Осыған нақты мысалдар айтылды. Орталық мамандары «Көру қабілеті нашар азаматтарға арналған қазақ тілінде дыбыстау қызметі бар экрандық диктор» деп аталатын инклюзивті жобаны қолға алыпты. Еліміздегі ерекше қажеттіліктері бар 90 мыңға жуық адамның қолына тиген бұл экрандық диктор мәтінді дыбыстап жеткізуге, пернетақта арқылы басқаруға, әртүрлі форматтағы құжаттарды оқуға, түзетуге, сақтауға мүмкіндік береді. Экрандық диктор браузер, веб-қосымшаларда ашылады.
Ал жасанды интеллекттің көмегімен Qazgramma деп аталатын мәтіннің қазақ тілі ережелеріне сәйкестігін, дұрыстығын тексеретін құрал шығарылады. Ол орфографиялық, пунктуациялық, грамматикалық қателерді түзетуге, мәтінге перифраз жасауға, сөздің мағынасына синонимдер табуға, мәтіннің құрылымын реттеуге көмектеседі. Сондай-ақ, «Тіл-Қазына» биыл желтоқсан айында шеттілдік терминдердің автоматтандырылған жүйесін іске қоспақ. Бұл жүйе шеттілдік терминдерді тілімізге автоматты түрде бейімдейді, көп мөлшердегі терминді аз уақытта игеруге мүмкіндік береді.
Google-де қазақ тілінің сөздік қоры аз
Жиында әйгілі халықаралық сервистерге қазақ тілін енгізу туралы да мағлұмат берілді. Атап айтсақ, Yandex, Google, Microsoft, Fifa, Maincraft, Adobe, EA Sports, Huawei, WatsApp сияқты танымал халықаралық платформалардың сервистері мен бағдарламаларына қазақ тілін енгізуге қатысты ізгі қадамдар жасалған. Сөздің реті келгенде Yandex, Google сервистерінің мәтінді қазақшаға аударуындағы кемшіліктер туралы сұрақ қойдық.
Орталық мамандары ашық кодпен жарияланған Қазақстанда жиі қолданылатын сервистерді қазақшалауға (7zip, moodle, Nextcloud, т.б.) білек сыбанып кірісіпті. Бұдан бөлек, «Тіл-Қазына» мамандары тәуелсіз көлемді тіл моделін (large language model) құру, қазақ тілі корпустарының бірыңғай базасын қалыптастыру, мемлекеттік органдар базасында қазақ тілінің қорын жинақтау, смартфондар мен шағын дербес компьютерлер арқылы жүзеге асатын микро LLM жүйесін жасауға кірісіпті. Басқосуда модератор болған сенатор Бибігүл Жексенбай «Цифрландыру заманында «Тіл-Қазына» әзірлеген қазақ тілін дамыту бағытындағы жобалар мен түрлі платформаларды мектеп, жоғары оқу орындарында оқу-тәрбие үрдісіне енгізу, көпшілік пайдаланатын түрлі интернет ресурстарда қолжетімді ету аса маңызды» деген пікірін айтып, балабақшадағы балаларға арналған лексикалық минимум жасау мәселесін көтерді. Басқа әріптестеріміз де ой-пікірлерін ортаға салды.
Контенттің үлесін қалай арттырамыз?
Қазіргі ең өзекті мәселенің бірі – балалар мен жасөспірімдерге арналған контенттің үлесін арттыру. Бұл «Тіл-Қазынаның» ҚР-дағы тіл саясатын дамытудың 2023-2029 жылдарға арналған тұжырымдамасының 5 бағытының бірі екен. Осы бағытта орталық балаларға арналған мемлекеттік тілдегі мобильді ойын жасап шығармақ. Өйткені, қазір интернеттегі балалар ойнайтын ойындар орыс, ағылшын т.б. тілдерде. Желілік ойын арқылы балалардың қазақша сөйлеуіне ықпал ету үшін еліміздегі ең үздік IT мамандары қатысатын ауқымды хакатон ұйымдастырылады. Оның жеңімпазына ойын жасауға қаражат бөлінеді. Әрине, құптарлық жоба.
Мемлекет қазір назар аударатын саланың бірі – балалар контенті. Қазір теледидар көрмейтін балалар интернетте отыр. Орыстың «Маша мен аю», ағылшынның «Том мен Сойерін» көреді, қазақшадан «Теке мен қошқар» ғана бар. Балалардың бүгіні мен болашағына жанымыз ашыса, неге YouTube-ті қазақша контентке толтырып қоймаймыз? Мемлекеттік тапсырысқа жыл сайын бөлінетін миллиардтардың (55 млрд теңгенің 80 пайызын «Хабар», «Қазақстан» телеарнасы алады) азғантай ғана бөлігін балалар мен жасөспірімдер контентіне жұмсайтын болсақ, көп ұзамай интернет қазақша сөйлеп шығар еді. Балаларға қажетті мультфилм, кино, кітап, аудиокітап, комикс, ертегі, ойын т.б. қаптатып қойсақ, контент деген сол емес пе?
Жылышырайлы жүздесуде орталық мамандары қазақтілді басылымдардың сөз қолданысы, сөз формасы санына керемет зерттеу жүргізіп, газет-журналдардың сөздік қорының кедейлігін, шаблонның аясының тарлығын анықтағанын естіп-білдік. Бұл да назар аударарлық мәселе.
Төлен ТІЛЕУБАЙ
-->IT жобаларды жұртшылық біле ме?
Туған тіліміздің құндылық ретінде орнын айқындауды басты миссиясы етіп алған «Тіл-Қазынаның» бүгінге күнге дейін жүзеге асырған IT жобалары жеткілікті. Соның ішінде цифрландыру заманында кез келген адамға қажетті: @kztts_bot (мәтінді сөйлеуге түрлендіретін телеграм-бот); @kzstt_bot (сөйлеуді мәтінге айналдыратын телеграм-бот); Sozdikqor.kz; Termincom.kz; Emle.kz; Qazlatyn.kz; Ғылыми-электрондық кітапхана; Qujat.kz сияқты 7 заманауи, өміршең жобаны бөліп-жарып көрсетуге болады.
Қазақ тіліндегі сөздіктердің бірыңғай іздеу жүйесі – Sozdikqor.kz-ті екі адамның бірі біле бермейді. Sozdikqor.kz – әртүрлі салалық сөздіктер, энциклопедиялардағы сөздер мен тұрақты сөз тіркестерін, қазақ тіліндегі көне сөздерді, кірме сөздерді, аймақтық және ақпараттық технологиялардың даму кезеңіндегі жаңа технологиялық сөздердің мағынасын білуге мүмкіндік беретін платформа. Қорда 1,5 млн тілдік бірлік бар, синонимайзер функциясы қосылған. Мақпал Жұмабай таныстыру рәсімінде Sozdikqor.kz-ке алдағы уақытта антонимайзер, омонимайзер (қазақ тіліндегі алғашқы құрал болады) функцияларын қосу; орыс, ағылшын тілдерінде 10 000 негізгі атау сөздің мазмұнының аудармасын жасау; гиперсілтемелер жүйесінің болуы; сөздіктегі барлық сөздерге айқын сілтемелердің болуы сияқты жаңа функциялар қосылатынын жеткізді. Бір қуанарлығы, Sozdikqor.kz-тің IOS ЖӘНЕ Android-та мобильді қосымшасы бар. Сондай-ақ, телеграм боты жұмыс істейді.
Қазақ терминологиясының қоры – Termincom.kz-те қазір 384 932 термин бар екен. Интерфейс екі тілде (қазақ-орыс); 6 түрлі формада іздеуге, жекелеген адамның ақпарат, хабарлама жазуына мүмкіндік бар; платформаға тіркелудің жеңіл жолы қарастырылған; көпфункционалды алаң жұмыс істейді. Ол жерде мемлекеттік терминологиялық комиссия мүшелерінің кез келген терминді талқылауы ап-анық көрініп тұрады. Кириллицадан латын қарпіне ауыстыруға арналған конвертер жүйесі – Qazlatyn.kz-ті туралы ақпаратыңыз бар ма? Егер естіп-білмеген болсаңыз, бірер мағлұмат айтайық. Ол қолданатын мәтінді кириллицадан латын әліпбиіне және керісінше түрлендіру мүмкіндігін ұсынады. Бұл қазақ тіліндегі әртүрлі жазу нұсқаларындағы мәтіндерді тез әрі қатесіз конвертациялауға және әртүрлі жазу жүйелеріндегі мәтіндермен жұмыс істеу үшін ыңғайлы. Платформа тек мәтінді ғана емес, құжатты да латын әліпбиіне немесе керісінше ауыстыра алады. Сонымен қатар, төте жазуға түрлендіру қызметі бар. «Яндекс» компаниясымен меморандумға қол қойылған соң онлайн аудармаға латын графикасы әліпбиі де қосылған. Сонымен қатар, біз қазақ тілін үйретуге қатысты Balatili.kz (0+9 жастағы балаларға қазақ тілін үйретуге арналған платформа), Tilqural.kz (қазақ тілін 5 деңгей бойынша оқытуға арналған сервис), Abai institute (қазақ диаспоралары мен шетелдіктердің қазақ тілін үйренуіне арналған платформа) деген жобалардың табысты іске асырылғанын білеміз.
Жасанды интеллект технологиясына ілесуіміз керек
Қазақта «Әп, бәрекелді!» деген қошемет, таңданыс сөзін жайшылықта көп айта бермейміз. Жаңашыл жетекші, ұлттық медианың мықты маманы ретінде көпке танымал Мақпал Жұмабай басқарып отырған шағын орталықтың туған тілдің бүгіні мен ертеңі, жас ұрпақтың өзегінен бөлінбеуі үшін қолға алған ізгілікті істерімен, креативтік бастамаларымен танысқан сәтте таңданысымыз да, ризашылығымыз да зор болғаны рас. Орталықтағы 8 бөлімнің білікті мамандарының дөңгеленген дүниенің жыл, ай, күн емес, тіпті сағат сайын құбылып, технологиялық төңкеріс заманын санасымен түйсініп, қазақ халқының мүддесіне сай қарекетке көшкеніне қуандық.
Осыған нақты мысалдар айтылды. Орталық мамандары «Көру қабілеті нашар азаматтарға арналған қазақ тілінде дыбыстау қызметі бар экрандық диктор» деп аталатын инклюзивті жобаны қолға алыпты. Еліміздегі ерекше қажеттіліктері бар 90 мыңға жуық адамның қолына тиген бұл экрандық диктор мәтінді дыбыстап жеткізуге, пернетақта арқылы басқаруға, әртүрлі форматтағы құжаттарды оқуға, түзетуге, сақтауға мүмкіндік береді. Экрандық диктор браузер, веб-қосымшаларда ашылады.
Ал жасанды интеллекттің көмегімен Qazgramma деп аталатын мәтіннің қазақ тілі ережелеріне сәйкестігін, дұрыстығын тексеретін құрал шығарылады. Ол орфографиялық, пунктуациялық, грамматикалық қателерді түзетуге, мәтінге перифраз жасауға, сөздің мағынасына синонимдер табуға, мәтіннің құрылымын реттеуге көмектеседі. Сондай-ақ, «Тіл-Қазына» биыл желтоқсан айында шеттілдік терминдердің автоматтандырылған жүйесін іске қоспақ. Бұл жүйе шеттілдік терминдерді тілімізге автоматты түрде бейімдейді, көп мөлшердегі терминді аз уақытта игеруге мүмкіндік береді.
Google-де қазақ тілінің сөздік қоры аз
Жиында әйгілі халықаралық сервистерге қазақ тілін енгізу туралы да мағлұмат берілді. Атап айтсақ, Yandex, Google, Microsoft, Fifa, Maincraft, Adobe, EA Sports, Huawei, WatsApp сияқты танымал халықаралық платформалардың сервистері мен бағдарламаларына қазақ тілін енгізуге қатысты ізгі қадамдар жасалған. Сөздің реті келгенде Yandex, Google сервистерінің мәтінді қазақшаға аударуындағы кемшіліктер туралы сұрақ қойдық.
Google сияқты платформаға біз қазақ тілінің бар байлығын бере алмаймыз. Сол себептен, онда қазақ тілінің сөздік қоры аз. Мәтінді басқа тілден қазақшаға аударғанда кемшіліктердің болатынын көріп жүрміз, - деп жауап берді М. Жұмабай.
Орталық мамандары ашық кодпен жарияланған Қазақстанда жиі қолданылатын сервистерді қазақшалауға (7zip, moodle, Nextcloud, т.б.) білек сыбанып кірісіпті. Бұдан бөлек, «Тіл-Қазына» мамандары тәуелсіз көлемді тіл моделін (large language model) құру, қазақ тілі корпустарының бірыңғай базасын қалыптастыру, мемлекеттік органдар базасында қазақ тілінің қорын жинақтау, смартфондар мен шағын дербес компьютерлер арқылы жүзеге асатын микро LLM жүйесін жасауға кірісіпті. Басқосуда модератор болған сенатор Бибігүл Жексенбай «Цифрландыру заманында «Тіл-Қазына» әзірлеген қазақ тілін дамыту бағытындағы жобалар мен түрлі платформаларды мектеп, жоғары оқу орындарында оқу-тәрбие үрдісіне енгізу, көпшілік пайдаланатын түрлі интернет ресурстарда қолжетімді ету аса маңызды» деген пікірін айтып, балабақшадағы балаларға арналған лексикалық минимум жасау мәселесін көтерді. Басқа әріптестеріміз де ой-пікірлерін ортаға салды.
Контенттің үлесін қалай арттырамыз?
Қазіргі ең өзекті мәселенің бірі – балалар мен жасөспірімдерге арналған контенттің үлесін арттыру. Бұл «Тіл-Қазынаның» ҚР-дағы тіл саясатын дамытудың 2023-2029 жылдарға арналған тұжырымдамасының 5 бағытының бірі екен. Осы бағытта орталық балаларға арналған мемлекеттік тілдегі мобильді ойын жасап шығармақ. Өйткені, қазір интернеттегі балалар ойнайтын ойындар орыс, ағылшын т.б. тілдерде. Желілік ойын арқылы балалардың қазақша сөйлеуіне ықпал ету үшін еліміздегі ең үздік IT мамандары қатысатын ауқымды хакатон ұйымдастырылады. Оның жеңімпазына ойын жасауға қаражат бөлінеді. Әрине, құптарлық жоба.
Мемлекет қазір назар аударатын саланың бірі – балалар контенті. Қазір теледидар көрмейтін балалар интернетте отыр. Орыстың «Маша мен аю», ағылшынның «Том мен Сойерін» көреді, қазақшадан «Теке мен қошқар» ғана бар. Балалардың бүгіні мен болашағына жанымыз ашыса, неге YouTube-ті қазақша контентке толтырып қоймаймыз? Мемлекеттік тапсырысқа жыл сайын бөлінетін миллиардтардың (55 млрд теңгенің 80 пайызын «Хабар», «Қазақстан» телеарнасы алады) азғантай ғана бөлігін балалар мен жасөспірімдер контентіне жұмсайтын болсақ, көп ұзамай интернет қазақша сөйлеп шығар еді. Балаларға қажетті мультфилм, кино, кітап, аудиокітап, комикс, ертегі, ойын т.б. қаптатып қойсақ, контент деген сол емес пе?
Жылышырайлы жүздесуде орталық мамандары қазақтілді басылымдардың сөз қолданысы, сөз формасы санына керемет зерттеу жүргізіп, газет-журналдардың сөздік қорының кедейлігін, шаблонның аясының тарлығын анықтағанын естіп-білдік. Бұл да назар аударарлық мәселе.
Төлен ТІЛЕУБАЙ