Искусственный интеллект, Технологии | Олег Брагинский, Марина Строева
Основатель «Школы траблшутеров» Олег Брагинский и ученица Марина Строева расскажут, как рост вычислительных мощностей, снижение стоимости инференса и развитие ИИ ведут к распространению технологий, вовлечению пользователей и разработчиков. А рост стоимости обучения моделей делает монетизацию и получение прибыли всё более сложной задачей.
Утверждать, что мир меняется с беспрецедентной скоростью – ничего не сказать. Внедрение быстрых и трансформирующих инновации лежат в основе тектонических сдвигов парадигм:
- миссия Facebook (2004): «дать людям возможность делиться и сделать мир более открытым и связанным».
- миссия Google (1998): «организовать мировую информацию и сделать её универсально доступной и полезной».
- миссия Alibaba (1999): «сделать бизнес простым в любой точке мира».
Две мощные силы – технологическая и геополитическая всё больше переплетаются. Нынешнее состояние артилекта – новая космическая гонка. Лидерство в ИИ может привести к геополитическому господству и взаимному сдерживанию.
Магия того, как артилект выполняет работу за нас, напоминает ранние дни электронной почты и веб-поиска – технологий, которые изменили мир. Влияние ИИ кажется таким же волшебным, но развивается ещё быстрее.
Для одних эволюция ИИ станет падением ко дну, для других – восхождением к вершине. Спекулятивные и бурные силы капитализма и креативного разрушения безвозвратно меняют ландшафты рынков и индустрий. Несомненно, «игра началась», особенно между США и Китаем.
За 8 лет производительность дата-центров выросла в 225 раз, при 4-кратном снижении числа GPU. Годовая пропускная способность по токенам выросла в 27’500 раз, теоретическая выручка – в 30’000 раз. Энергопотребление снизилось на 43%, энергоэффективность выросла в 50’000 раз.
За 6 лет глобальный запас вычислительной мощности NVIDIA вырос в 100+ раз (+130% в год). Компания получает всё большую долю мировых капитальных затрат на дата-центры: в 2024 году – 25% и продолжает расти.
Доля расходов на R&D у «большой шестёрки» (Apple, Nvidia, Microsoft, Alphabet, Amazon, Meta) выросла с 9% до 13% выручки за 10 лет. Свободный денежный поток (FCF) взлетел на 263% за 10 лет, достигнув $389 млрд. Запасы наличности за 10 лет выросли на 103% до $443 млрд.
Основная часть затрат на разработку больших языковых моделей (LLM) – вычисления для обучения и работы сред. Стоимость обучения одной модели уже превышает $100 млн, а некоторые стоят до $1 млрд. В 2025 году могут появиться модели с затратами в $10 млрд.
Всё больше расходов уходит на инференс (работу моделей в реальном времени), который становится постоянной статьёй затрат по мере роста использования. Снижение стоимости инференса приводит к росту общего спроса на вычисления и инфраструктуру.
В 2024 году мировые капитальные затраты на дата-центры достигли $455 млрд и продолжают расти. Дата-центр xAI Colossus в Мемфисе (750’000 кв. футов, как 418 средних домов в США) построен за 122 дня – вдвое быстрее, чем строится обычное здание. Xai Colossus увеличил число GPU с 0 до 200’000 за 7 месяцев, при плане в 1 млн GPU.
В 2024 году дата-центры потребляли 1,5% всей электроэнергии в мире. С 2017 года потребление электроэнергии дата-центрами росло на 12% в год – в 4 раза быстрее, чем общее потребление. США – 45% мирового потребления, Китай – 25%, Европа – 15%. В развивающихся странах (кроме Китая) – 50% интернет-пользователей, но менее 10% мощности дата-центров.
Обучение мощных LLM становится одной из самых дорогих и капиталоёмких задач в истории. Стоимость обучения выросла в 2’400 раз за 8 лет. Цена инференса (работы модели) падает: новые GPU (NVIDIA Blackwell 2024) потребляют в 105’000 раз меньше энергии на токен, чем Kepler 2014.
За два года стоимость инференса для клиентов снизилась на 99,7%. Это ведёт к росту числа разработчиков и пользователей, а также к сближению производительности разных моделей. Доля разработчиков, использующих ИИ в работе, выросла с 44 до 63% за год (по данным Stack Overflow).
Число AI-репозиториев на GitHub выросло на 175% за 16 месяцев. В экосистеме Google за год обработка токенов выросла в 50 раз (с 9,7 трлн до 480 трлн в месяц). В Microsoft Azure AI Foundry – рост в 5 раз за год (до 100 трлн токенов в квартал).
Монетизация ИИ: чипы, облако, инфраструктура, данные:
- продажи Google TPU выросли на 116% до $8,9 млрд, Amazon AWS Trainium – на 216% до $3,6 млрд.
- CoreWeave (облачные вычисления для ИИ) – взлёт выручки на 730% до $1,9 млрд.
- Astera Labs (инфраструктура для соединения чипов) – рост на 242% до $396 млн.
- Tesla Dojo (суперкомпьютер для обучения ИИ) – подъём мощности в 8,5 раза.
- Scale AI (разметка и оценка данных) – рост выручки на 160% до $870 млн.
- Выручка NVIDIA за год выросла на 78% до $39 млрд, за 10 лет – в 28 раз.
- VAST Data (хранение и обработка данных) – с 0 до $2 млрд за 6 лет.
- Oracle AI Infrastructure – рост в 50 раз до $948 млн за 2 года.
У OpenAI в 2024 году расходы на вычисления приблизились к выручке $4–5 млрд. У Microsoft, Amazon, Alphabet, Meta затраты растут, маржа свободного денежного потока снижается.
Крупные ИИ-компании (OpenAI, Anthropic, xAI, Perplexity) показывают рост выручки, большие инвестиции, высокие мультипликаторы оценки. Apple, Amazon, Google, Uber, Tesla – все проходили через периоды огромных убытков и инвестиций, прежде чем выйти в плюс и стать лидерами рынка.
Стоимость обучения моделей растёт, цена инференса падает, конкуренция усиливается. Для пользователей это благо: доступ к мощному ИИ становится дешевле. Для провайдеров – вызов: как монетизировать, если обучение дорого, а инференс дешевеет?
Появляются новые бизнес-модели: подписки ChatGPT Plus, Gemini Pro, оплата за API (стоимость за 1 млн токенов – от центов до десятков долларов).
Рост выручки у OpenAI – +1’050% в год до $3,7 млрд, у Anthropic – +20x до $2 млрд за 18 месяцев, у Perplexity – +7,6x до $120 млн за 14 месяцев, у Glean – +10x до $100 млн за 2 года.
Развитие артилекта стало одним из факторов глобальных изменений, затрагивающих экономику, энергетику, инфраструктуру, бизнес-модели. Возрастают вызовы: стоимость обучения моделей растёт, монетизация становится всё более сложной, конкуренция галопирует.
Пользователи получают доступ к мощным инструментам по низкой цене, компании вынуждены искать баланс между инвестициями, инновациями и монетизацией. В ближайшие годы именно способность адаптироваться к изменениям определит новых лидеров цифровой эпохи.