ИИ стал частью повседневной жизни
Искусственный интеллект быстро перешел из лабораторий в повседневную жизнь. В 2023 году FDA одобрило 223 медицинских устройства с поддержкой ИИ, по сравнению с шестью в 2015 году. Беспилотные автомобили больше не являются экспериментальными: Waymo, один из крупнейших операторов в США, обеспечивает более 150 000 автономных поездок каждую неделю, а парк роботакси Apollo Go от Baidu обслуживает города по всему Китаю.

Производительность ИИ в сложных тестах растет
В 2023 году появились новые бенчмарки — MMMU, GPQA и SWE-bench — для проверки пределов передовых систем ИИ. Год спустя производительность резко возросла: оценки выросли на 18,8, 48,9 и 67,3 процентных пункта на MMMU, GPQA и SWE-bench соответственно. Помимо бенчмарков, системы ИИ добились значительных успехов в создании высококачественного видео, а в некоторых ситуациях агенты языковых моделей превзошли людей в задачах программирования при ограниченном бюджете времени.

Бизнес делает ставку на ИИ
В 2024 году частные инвестиции в ИИ в США выросли до $109,1 млрд — почти в 12 раз больше, чем в Китае ($9,3 млрд) и в 24 раза больше, чем в Великобритании ($4,5 млрд). Особенно сильный импульс показал генеративный ИИ, привлекший $33,9 млрд инвестиций — на 18,7% больше, чем в 2023 году. Использование ИИ в бизнесе ускоряется: 78% организаций сообщили об использовании ИИ в 2024 году, что на 55% больше, чем годом ранее. Между тем, все больше исследований подтверждают, что ИИ повышает производительность и помогает сократить разрыв по навыкам в сравнеии с рабочей силой.
США в лидерах, Китай быстро догоняет
В 2024 году американские институты выпустили 40 значимых моделей ИИ, значительно опережая китайские(15) и европейские (3). Сегодня США сохраняют лидерство по количеству, но китайские модели стремительно сократили разрыв в качестве: различия в производительности по основным бенчмаркам, таким как MMLU и HumanEval, сократились до почти паритета в 2024 году. Китай продолжает лидировать по публикациям и патентам в сфере ИИ.
Разработка LLM становится все более глобальной, с заметными ивентами в этой сфере на Ближнем Востоке, в Латинской Америке и ЮВА (помимо КНР).

Экосистемы доверенного ИИ развиваются неравномерно
Число инцидентов, связанных с ИИ, резко выросло, и новые бенчмарки (HELM Safety, AIR-Bench и FACTS) стали предлагать инструменты для оценки безопасности ИИ-моделей. Среди компаний сохраняется разрыв между признанием рисков ИИ и принятием значимых мер. Напротив, правительства демонстрируют озабоченность проблемой безопасности ИИ: в 2024 году глобальное сотрудничество в области управления ИИ усилилось, ОЭСР, ЕС, ООН и Африканский Союз выпустили фреймворки, ориентированные на прозрачность, надежность и другие основные принципы доверенного ИИ.
Глобальный оптимизм относительно ИИ растет, но есть глубокие региональные разногласия
В Китае (83%), Индонезии (80%), Таиланде (77%), ряде других стран подавляющее большинство населения считает, что продукты и услуги ИИ полезны. Напротив, в Канаде (40%), США (39%) и Нидерландах (36%), оптимизм касательно ИИ значительно ниже. В целом, оптимизм в странах Европы также несколько вырос (на 10-15%).
Меньшие модели обеспечивают более высокую производительность.
В 2022 году самой малой моделью, достигшей более 60% на MMLU, была PaLM с 540 млрд параметров. К 2024 году Microsoft’s Phi-3-mini с 3,8 млрд параметров достигла того же порога, что представляет собой 142-кратное уменьшение за два года.
ИИ все более доступен, но...
Стоимость запроса к модели ИИ, которая достигает эквивалентного уровня GPT-3.5 (64.8) на MMLU, снизилась с $20 за миллион токенов в ноябре 2022 года до $0.07 в октябре 2024 года (Gemini-1.5-Flash-8B)—снижение более чем в 280 раз за 18 месяцев. В зависимости от задачи, цены на вывод LLM снизились от 9 до 900 раз в год. На уровне оборудования расходы снижались на 30% в год, в то время как энергоэффективность повышалась на 40% каждый год. Модели с открытым весом также сокращают разрыв с закрытыми моделями, сокращая разницу в производительности с 8% до всего лишь 1,7% в некоторых тестах за год.
Но вычислительные затраты на обучение моделей удваиваются каждые пять месяцев, объемы наборов данных для LLM увеличиваются каждые восемь месяцев. Мощность моделей растет ежегодно, и у этого прогресса есть своя цена.
Полный отчет — по ссылке https://hai.stanford.edu/ai-index/2025-ai-index-report