Когда заработает искусственный интеллект на казахском языке
16 июля на заседании правительства глава МЦРИАП Жаслан Мадиев рассказал о появлении искусственного интеллекта на казахском языке. Первую версию языковой модели KazLLM планируют представить в декабре, передает ArbatMedia.
По словам главы ведомства, лля развития исследований в области ИИ выбраны два направления: создание большой языковой модели на казахском языке (KazLLM) силами Назарбаев университета и АО «Национальные информационные технологии». Модель будет основана на 100 млрд токенов. Мадиев отметил, что критически важно собрать как можно больше данных на казахском языке, для чего будет проведена масштабная кампания по сбору данных на платформе Hugging Face.
Сейчас собрано 28 млрд токенов из открытых источников и около 100 терабайт данных из государственных и квазигосударственных органов, а также архивов и СМИ.
Модель KazLLM также будет разработана совместно с международными компаниями, при поддержке НИТ, и основана на 30-40 миллиардах токенов из открытых источников. Проект реализуется на безвозмездной основе, и первую версию KazLLM планируется представить в декабре.