Значительные усилия по развитию собственных продуктов прилагают компании Яндекс (Yandex GPT 5 Lite) и Сбер (GigaChat 2 xxx). Их ИИ-экосистемы считаются самостоятельными, созданными с чистого листа.
МТС, «Т-Технологии» и VK используют в своих разработках иностранные решения с открытой лицензией, Qwen 2.5 и Qwen 3 от китайского гиганта Alibaba Cloud. В 2025 г. в отечественный «клуб LLM» вступили «Озон» и «Авито». Их LLM также разработаны на основе Qwen 2.5. Зимой 2025 г. представлен YandexGPT 5 Pro, в котором в обучении использовались веса Qwen 2.5. При этом меньшая модель, YandexGPT 5 Lite, обучалась с нуля без привлечения китайских ресурсов.
Оба подхода имеют право на жизнь, считают эксперты. Собственные разработки позволяют компаниям сохранять независимость, развивать уникальные технологии, самостоятельно готовить кадры, что в итоге станет конкурентным преимуществом. С другой стороны, опора на готовые решения позволяет сэкономить время, вычислительные ресурсы, деньги, усилия на подготовку дата-сетов. Набирающий популярность ИИ-поисковик Perplexity AI создавался на основе OpenAI API и Llama 2.
Но в долгосрочной перспективе отказ от обучения ИИ-моделей на собственных ресурсах повышает риски зависимости от китайских технологий. Что будет с отечественным ИИ, если однажды Китай перестанет бесплатно предоставлять Open Source-модели?
Кроме того, Open Source-модели обучались на англоязычных дата-сетах. При решении задач русскоязычных пользователей они, переключаясь между языками в одном предложении, не знают реалии русской культуры и в итоге нередко дают неточные ответы.
Эксперты считают, что необходимо работать с компактными моделями, «прототипировать гипотезы и затем масштабировать их. Такой подход снижает риск отставания даже при использовании зарубежной открытой базы» (руководитель направления LLM-продуктов MTS AI Сергей Пономаренко).
