Новая версия большой языковой модели Cotype Lite для работы с текстами на татарском языке была представлена на форуме Kazan Digital Week. Ее разработала MTS AI, которая является частью цифровой экосистемы МТС. Татарская версия языковой модели получила название Rehmet – что в переводе означает спасибо.
Российское цифровое решение от MTS AI способно обрабатывать документы объемом в 5 листов A4, извлекать и суммаризировать данные за несколько секунд. Cotype Rehmet может использоваться в архивах, библиотеках, в государственных и частных организациях – везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и данные заявителя, и передаст их в соответствующую базу данных.
«Наша экосистема создает современные цифровые решения для оптимизации бизнес-процессов. Языковая модель для работы с текстами на татарском языке поможет, к примеру, упростить обработку документов в администрациях поселений, где используется этот национальный язык. Уверен, что Cotype Rehmet будет востребован среди организаций Батыревского округа – именно в этой части республики татарский язык очень распространен. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России», — пояснил директор МТС в Чувашской Республике Алексей Сенкевич.
Чтобы модель Cotype Rehmet смогла понимать незнакомый язык, разработчики перевели большой массив данных с русского на татарский. После все ответы модели проверили специалисты-тюркологи и носители языка.