ICT Moscow представила обзор состояния дел с обучением LLM-моделей в России.

Значительные усилия по развитию собственных продуктов прилагают компании Яндекс (Yandex GPT 5 Lite) и Сбер (GigaChat 2 xxx). Их ИИ-экосистемы считаются самостоятельными, созданными с чистого листа.

МТС, «Т-Технологии» и VK используют в своих разработках иностранные решения с открытой лицензией, Qwen 2.5 и  Qwen 3 от китайского гиганта Alibaba Cloud. В 2025 г. в отечественный «клуб LLM» вступили «Озон» и «Авито». Их LLM также разработаны на основе Qwen 2.5. Зимой 2025 г. представлен YandexGPT 5 Pro, в котором в обучении  использовались веса Qwen 2.5. При этом меньшая модель, YandexGPT 5 Lite, обучалась с нуля  без привлечения китайских ресурсов.

Оба подхода имеют право на жизнь, считают эксперты. Собственные разработки позволяют компаниям сохранять независимость, развивать уникальные технологии, самостоятельно готовить кадры, что в итоге станет конкурентным преимуществом. С другой стороны, опора на готовые решения позволяет сэкономить время, вычислительные ресурсы, деньги, усилия на подготовку дата-сетов. Набирающий популярность ИИ-поисковик Perplexity AI создавался на основе OpenAI API и Llama 2.

Но в долгосрочной перспективе отказ от обучения ИИ-моделей на собственных ресурсах повышает риски зависимости от китайских технологий. Что будет с отечественным  ИИ, если однажды Китай перестанет бесплатно предоставлять Open Source-модели?

Кроме того, Open Source-модели обучались на англоязычных дата-сетах.  При решении задач русскоязычных пользователей они, переключаясь между языками в одном предложении, не знают реалии русской культуры и в итоге нередко дают неточные ответы.

Эксперты считают, что необходимо работать с компактными моделями, «прототипировать гипотезы и затем масштабировать их. Такой подход снижает риск отставания даже при использовании зарубежной открытой базы» (руководитель направления LLM-продуктов MTS AI Сергей Пономаренко).

Rate this item
(0 votes)
Read 601 times

О нас

Журнал IT News+ Чувашия — старейшее печатное издание посвященное высоким технологиям, выходящие более 10 лет на территории Поволжья.

Наши читатели — образованные платёжеспособные люди в возрасте от 30 до 45 лет. Руководители компаний или люди занимающие высокие посты, которые следят за новинками в мире высоких технологий как в нашем городе, так и в мире. Проживающие по большей части в Чебоксарах, Москве, Санкт-Петербурге, Новочебоксарске.

Рекламные материалы отмечены знаком "Р".

 
Top
We use cookies to improve our website. By continuing to use this website, you are giving consent to cookies being used. More details…