Если вы выпускали софт в последние три года, то наверняка заметили, как ваша должностная инструкция тихо переписывалась сама собой. Вы перешли от написания кода к написанию кода с автодополнением, затем к написанию кода с коллаборатором, а теперь всё чаще пишете спецификацию и наблюдаете, как агент пишет, тестирует и выкладывает код за вас.

Это не случилось в одночасье. Это последняя глава 70-летней истории, начавшейся с попыток научить машины играть в шашки. Давайте пройдём по ней не как по сухой хронологии, а как по истории того, как «интеллект» каждый раз переопределялся, как только машины осваивали предыдущее определение.

1. Символическая эра: интеллект как логика (1950–1980)

Основная ставка ИИ, официально оформленная на Дартмутском семинаре 1956 года, была проста и дерзка: мышление — это вычисление. Если представить знания в виде символов и правил и правильно манипулировать ими, получится интеллект.

Это дало нам:

Logic Theorist (1956) — доказывал математические теоремы перебором логических утверждений.
ELIZA (1966) — подбирала ваши фразы и убеждала людей, что понимает их. Первый чат-бот и первый случай, когда человек спроецировал понимание на систему, у которой его не было.
Экспертные системы (1970–80) — программы вроде MYCIN кодировали правила эксперта как операторы IF-THEN. MYCIN диагностировал бактериальные инфекции почти как человек-специалист, используя несколько сотен ручных правил.

Это был слабый, узкий интеллект в самом буквальном смысле: система-гений в одной коробке и ничего не знающая за её пределами. Фатальный недостаток — масштабирование: каждое правило приходилось писать вручную эксперту. Знания не обобщались и не учились на данных. Когда финансирующие организации поняли, что эти системы не справляются с неупорядоченностью реального мира, деньги иссякли. Наступила первая зима ИИ.

2. Статистика тихо съедает символы (1990–2000)

Пока «ИИ» был грязным словом в грантовых заявках, набирала силу другая идея: вместо того чтобы говорить машине правила, покажите ей примеры и позвольте найти правила самой.

Нейронные сети существовали с 1950-х (перцептрон), но были широко списаны со счетов после того, как Минский и Пейперт показали их математические ограничения в книге «Перцептроны» (1969). Обратное распространение ошибки, популяризированное в 1986 году, дало многослойным сетям настоящий способ обучения, но сети всё равно проигрывали более простым методам ещё два десятилетия. Существования алгоритма было недостаточно: не хватало размеченных данных и вычислительной мощности, чтобы показать его возможности. Он сидел полувоскресший — многообещающая идея, которую никто не мог запустить в масштабе.

Метод опорных векторов, деревья решений и байесовские методы доминировали в практическом машинном обучении: фильтры спама, рекомендательные системы, обнаружение мошенничества. Deep Blue от IBM победил Гарри Каспарова в 1997 году, но в основном за счёт грубого перебора шахматных позиций, а не обучения. Всё ещё узко, всё ещё впечатляюще.

Интеллект этой эры был статистическим, а не логическим: распознавание образов по размеченным данным. Он хорошо работал на узких, чётко определённых задачах, но требовал горы размеченных вручную примеров и ручной разработки признаков. «Интеллект» всё ещё был в основном в человеке, проектирующем признаки; модель просто подгоняла кривую.

3. Глубокое обучение пробивает потолок (2012–2017)

Ингредиенты для следующего скачка лежали на поверхности десятилетие: больше данных (интернет), больше вычислений (GPU, изначально для видеоигр) и алгоритмические трюки для обучения более глубоких сетей без коллапса в шум. Ничто из этого не выглядело неизбежным. Большинство исследователей уже отошли от нейросетей; глубокие сети были маргинальной ставкой, которую поддерживала горстка лабораторий, которым постоянно говорили, что они зря тратят карьеру.

Искрой стал AlexNet (2012) — глубокая свёрточная нейронная сеть, разгромившая конкурс классификации изображений ImageNet, сократив ошибку вдвое по сравнению со следующим лучшим подходом. Этот результат сказал полю нечто важное: наложите достаточно слоёв, скормите им достаточно данных — и сеть найдёт свои собственные признаки, без ручной разработки. Это был не плавный ход развития; это был переворот. В течение пары лет техники, бывшие шуткой, стали отправной точкой почти для каждой статьи по компьютерному зрению.

Далее последовала пятилетняя гонка:

Word2Vec (2013) / GloVe (2014): слова стали векторами, а «смысл» — чем-то, с чем можно делать арифметику.
Генеративно-состязательные сети (2014): две сети соревнуются, одна генерирует подделки, другая их обнаруживает, вместе обучаясь создавать пугающе убедительные изображения.
AlphaGo (2016): победила лучшего игрока мира в Го, используя глубокое обучение, обучение с подкреплением и поиск по дереву в игре, которая считалась слишком интуитивной для машин.

Каждая из этих систем всё ещё была привязана к задаче: модель для зрения не могла написать предложение, модель для Го не могла узнать кота, — но навык внутри каждой уже не передавался человеком; модель сама находила своё представление задачи. Этот сдвиг в механизме, а не какой-то отдельный результат, сделал возможным следующий прыжок.

4. Трансформер и рождение «почти общего» интеллекта (2017–2022)

В 2017 году статья Google «Attention Is All You Need» представила архитектуру трансформера. Вместо последовательной обработки текста, как в старых рекуррентных сетях, трансформер позволяет каждому слову «внимать» каждому другому слову одновременно. Это был лучший способ моделирования последовательностей, и он оказался прекрасно масштабируемым.

Это архитектурное решение в сочетании с осознанием, что можно предобучить одну гигантскую модель на огромном куске интернета, а затем адаптировать к любой языковой задаче, породило линейку GPT:

GPT (2018) → GPT-2 (2019) → GPT-3 (2020): каждое поколение показывало, что масштабирование параметров и данных даёт качественно новые способности, а не просто маргинальный прирост точности. GPT-3 мог писать код, переводить, суммаризировать и вести беседу, хотя никогда не обучался этим задачам явно.
Инструктивное дообучение и RLHF (2021–2022): сырые языковые модели предсказывают следующий токен; они не хотят быть полезными. Техники вроде обучения с подкреплением на основе обратной связи от человека превратили сырые предсказатели токенов в ассистентов, которые следуют инструкциям и отклоняют вредные запросы.
ChatGPT (ноябрь 2022): Сэм Альтман объявил о нём в X с энергией минорного релиза: «сегодня мы запустили ChatGPT. попробуйте поговорить с ним». Сдержанный текст для момента, когда закончилась старая эра и началась новая история. Исследования вышли из лаборатории; ваши не технические родственники появились. Сто миллионов пользователей за два месяца. Тест Тьюринга перестал быть мысленным экспериментом и стал тем, на что люди натыкались случайно за завтраком.

Это точка, где ИИ перестал означать «глубокий в одной коробке, пустой везде» и начал означать композиционный: единый набор весов, который может комбинировать навыки, никогда не обучаясь их комбинации. Одна модель может написать сонет, отладить Python и объяснить размер сонета — не потому, что это три разные системы, а потому что язык оказался удивительно хорошим универсальным интерфейсом к огромному спектру человеческих задач.

5. От чат-бота к коллеге: агентный поворот (2023 — сегодня)

Языковая модель, которая просто отвечает на вопросы, — это мощный автокомплит. Следующая фаза истории — дать этой модели руки: способность вызывать инструменты, писать и выполнять код, просматривать веб, запоминать состояние между шагами и выстраивать собственные рассуждения в многошаговые планы.

Здесь сошлось несколько нитей:

Использование инструментов / вызов функций позволило моделям не просто описывать действия, а выполнять их: запросить базу данных, вызвать API, запустить вычисление — вместо того чтобы угадывать ответ.
Дополненная генерация (RAG) дала моделям доступ к информации за пределами их обучающих данных, обосновывая ответы реальными документами вместо замороженной памяти.
Цепочка рассуждений и модели рассуждений показали, что если позволить модели «думать вслух» перед ответом, а затем обучить её рассуждать дольше над сложными задачами, результаты по математике, логике и многошаговому планированию резко улучшаются.
Агентные фреймворки сшивают это в циклы: план → действие → наблюдение → корректировка. Обёрнутые в оркестрационный код, логику повторных попыток и хорошо спроектированные инструменты, модель может преследовать цель через много шагов, а не ответить один раз и остановиться. Предоставленная самой себе, она всё ещё дрейфует или сбивается с пути; инфраструктура существует, чтобы это ловить. «Агент» описывает систему, а не самодостаточный разум.
Многоагентная оркестрация: модели, которые запускают другие экземпляры модели для параллельной работы, каждый с более узкой ролью, а затем объединяют результаты. Специалист символической эры вернулся, но теперь это трансформер, играющий роль в рое, координируемом другим трансформером, а не человеком, пишущим правила.

Это мир, в котором живёт разработчик в 2026 году. Код не просто предлагается строка за строкой; он планируется, пишется в нескольких файлах, тестируется и отлаживается в цикле, требующем всё меньше ручного управления, хотя всё ещё нужен настоящий ревью, настоящие ограждения и настоящее человеческое суждение о том, когда доверять результату. Тот же паттерн вне кодинга: исследовательские агенты, которые просматривают, синтезируют и цитируют источники на десятках страниц; операционные агенты, которые читают тикет, проверяют календарь и набрасывают ответ; дизайн-агенты, которые берут бриф и возвращают рабочий прототип. Пока это не автономия в сильном смысле. Это интерактивная способность: модель в цикле с инструментами и сигналом обратной связи — и она мощна именно благодаря тому, насколько плотно спроектирован этот цикл, а не вопреки.

Легко упустить, глядя на графики производительности: каждый скачок был ещё и экономической историей. Экспертные системы умерли, потому что время эксперта не масштабировалось. Статистическое ML ездило на дешёвых размеченных данных и хранилищах. Глубокое обучение — на игровых GPU. LLM — на интернет-масштабных данных и параллелизме трансформеров. Агенты переживают свой момент, потому что инференс подешевел настолько, что можно запускать модель в цикле сотни раз на задачу, не смеясь. Повторяющийся вопрос не «можем ли мы это построить?», а «можем ли мы позволить себе запускать это достаточно много раз, чтобы быть полезными?» Это узкое место сдвинулось; оно не исчезло.

Так что же изменилось на самом деле?

Если отойти на шаг, история ИИ — это история о том, где живёт интеллект:

Эра	Где жили «мозги»
Символический ИИ	В правилах, написанных экспертом вручную
Статистическое ML	В признаках, выбранных инженером
Глубокое обучение	В представлениях, которые модель выучила сама
Большие языковые модели	В паттернах, выученных из большей части публичного интернета
Агентные системы	В собственном планировании модели, использовании инструментов и самокоррекции во времени

Каждая эра не заменяла предыдущую, а скорее поглощала её. Сегодняшние агенты всё ещё делают статистическое распознавание паттернов под капотом; они всё ещё иногда терпят неудачу хрупким, самоуверенным образом, как старые экспертные системы, — просто реже и менее предсказуемо.

Если сжать пять эр, остаётся только три разрыва, которые действительно имели значение:

Запрограммированный вручную интеллект: правила, написанные человеком (символический ИИ).
Выученные представления: паттерны, найденные моделью в данных, со всё меньшей человеческой структурой (статистическое ML → глубокое обучение → LLM).
Интерактивные системы: модели, которые действуют, наблюдают последствия и корректируют, а не просто выдают один ответ (агенты).

Пятиэрная версия рассказывает лучшую историю; трёхэрная компрессия — это то, что на самом деле изменилось под капотом.

Сдвиг первый: кто пишет правила — человек или данные. Сдвиг второй: как модель представляет задачу — через заданные признаки или через самообученные представления. Сдвиг третий: как модель взаимодействует с миром — одноразовый ответ или непрерывный цикл действия и наблюдения.

Каждый сдвиг не отменял предыдущий, а надстраивался над ним. И каждый сдвиг делал ИИ чуть более полезным, чуть более общим и чуть более похожим на то, что мы интуитивно называем интеллектом.

Практический вывод: Прямо сейчас вы можете начать использовать агентные инструменты в своей работе. Попробуйте дать задачу написать тесты или рефакторинг кода агенту в цикле: напишите спецификацию, запустите, проверьте результат. Наблюдайте, где он ошибается, и улучшайте свои промпты и инструменты. Эра агентов уже здесь — учитесь с ней работать.

Краткая история ИИ: от символов к агентам

1. Символическая эра: интеллект как логика (1950–1980)

2. Статистика тихо съедает символы (1990–2000)

3. Глубокое обучение пробивает потолок (2012–2017)

4. Трансформер и рождение «почти общего» интеллекта (2017–2022)

5. От чат-бота к коллеге: агентный поворот (2023 — сегодня)

Так что же изменилось на самом деле?

Читать также

Agent = Model × Harness: будущее разработки AI

Ajah SDK: Python и Node.js для LLM-наблюдаемости

Семантический поиск: как ИИ понимает смысл, а не слова