ГлавнаяБлогКраткая история ИИ: от символов к агентам
AI / Нейросети

Краткая история ИИ: от символов к агентам

Проследите эволюцию ИИ: от экспертных систем и статистического обучения до глубоких нейросетей и современных агентов. Узнайте, как менялось определение интеллекта и что ждёт нас дальше.

Al
Редакция Algolitalgolit.ru
12 мин чтения22 июня 2026 г.

Если вы выпускали софт в последние три года, то наверняка заметили, как ваша должностная инструкция тихо переписывалась сама собой. Вы перешли от написания кода к написанию кода с автодополнением, затем к написанию кода с коллаборатором, а теперь всё чаще пишете спецификацию и наблюдаете, как агент пишет, тестирует и выкладывает код за вас.

Это не случилось в одночасье. Это последняя глава 70-летней истории, начавшейся с попыток научить машины играть в шашки. Давайте пройдём по ней не как по сухой хронологии, а как по истории того, как «интеллект» каждый раз переопределялся, как только машины осваивали предыдущее определение.

1. Символическая эра: интеллект как логика (1950–1980)

Основная ставка ИИ, официально оформленная на Дартмутском семинаре 1956 года, была проста и дерзка: мышление — это вычисление. Если представить знания в виде символов и правил и правильно манипулировать ими, получится интеллект.

Это дало нам:

  • Logic Theorist (1956) — доказывал математические теоремы перебором логических утверждений.
  • ELIZA (1966) — подбирала ваши фразы и убеждала людей, что понимает их. Первый чат-бот и первый случай, когда человек спроецировал понимание на систему, у которой его не было.
  • Экспертные системы (1970–80) — программы вроде MYCIN кодировали правила эксперта как операторы IF-THEN. MYCIN диагностировал бактериальные инфекции почти как человек-специалист, используя несколько сотен ручных правил.

Это был слабый, узкий интеллект в самом буквальном смысле: система-гений в одной коробке и ничего не знающая за её пределами. Фатальный недостаток — масштабирование: каждое правило приходилось писать вручную эксперту. Знания не обобщались и не учились на данных. Когда финансирующие организации поняли, что эти системы не справляются с неупорядоченностью реального мира, деньги иссякли. Наступила первая зима ИИ.

2. Статистика тихо съедает символы (1990–2000)

Пока «ИИ» был грязным словом в грантовых заявках, набирала силу другая идея: вместо того чтобы говорить машине правила, покажите ей примеры и позвольте найти правила самой.

Нейронные сети существовали с 1950-х (перцептрон), но были широко списаны со счетов после того, как Минский и Пейперт показали их математические ограничения в книге «Перцептроны» (1969). Обратное распространение ошибки, популяризированное в 1986 году, дало многослойным сетям настоящий способ обучения, но сети всё равно проигрывали более простым методам ещё два десятилетия. Существования алгоритма было недостаточно: не хватало размеченных данных и вычислительной мощности, чтобы показать его возможности. Он сидел полувоскресший — многообещающая идея, которую никто не мог запустить в масштабе.

Метод опорных векторов, деревья решений и байесовские методы доминировали в практическом машинном обучении: фильтры спама, рекомендательные системы, обнаружение мошенничества. Deep Blue от IBM победил Гарри Каспарова в 1997 году, но в основном за счёт грубого перебора шахматных позиций, а не обучения. Всё ещё узко, всё ещё впечатляюще.

Интеллект этой эры был статистическим, а не логическим: распознавание образов по размеченным данным. Он хорошо работал на узких, чётко определённых задачах, но требовал горы размеченных вручную примеров и ручной разработки признаков. «Интеллект» всё ещё был в основном в человеке, проектирующем признаки; модель просто подгоняла кривую.

3. Глубокое обучение пробивает потолок (2012–2017)

Ингредиенты для следующего скачка лежали на поверхности десятилетие: больше данных (интернет), больше вычислений (GPU, изначально для видеоигр) и алгоритмические трюки для обучения более глубоких сетей без коллапса в шум. Ничто из этого не выглядело неизбежным. Большинство исследователей уже отошли от нейросетей; глубокие сети были маргинальной ставкой, которую поддерживала горстка лабораторий, которым постоянно говорили, что они зря тратят карьеру.

Искрой стал AlexNet (2012) — глубокая свёрточная нейронная сеть, разгромившая конкурс классификации изображений ImageNet, сократив ошибку вдвое по сравнению со следующим лучшим подходом. Этот результат сказал полю нечто важное: наложите достаточно слоёв, скормите им достаточно данных — и сеть найдёт свои собственные признаки, без ручной разработки. Это был не плавный ход развития; это был переворот. В течение пары лет техники, бывшие шуткой, стали отправной точкой почти для каждой статьи по компьютерному зрению.

Далее последовала пятилетняя гонка:

  • Word2Vec (2013) / GloVe (2014): слова стали векторами, а «смысл» — чем-то, с чем можно делать арифметику.
  • Генеративно-состязательные сети (2014): две сети соревнуются, одна генерирует подделки, другая их обнаруживает, вместе обучаясь создавать пугающе убедительные изображения.
  • AlphaGo (2016): победила лучшего игрока мира в Го, используя глубокое обучение, обучение с подкреплением и поиск по дереву в игре, которая считалась слишком интуитивной для машин.

Каждая из этих систем всё ещё была привязана к задаче: модель для зрения не могла написать предложение, модель для Го не могла узнать кота, — но навык внутри каждой уже не передавался человеком; модель сама находила своё представление задачи. Этот сдвиг в механизме, а не какой-то отдельный результат, сделал возможным следующий прыжок.

4. Трансформер и рождение «почти общего» интеллекта (2017–2022)

В 2017 году статья Google «Attention Is All You Need» представила архитектуру трансформера. Вместо последовательной обработки текста, как в старых рекуррентных сетях, трансформер позволяет каждому слову «внимать» каждому другому слову одновременно. Это был лучший способ моделирования последовательностей, и он оказался прекрасно масштабируемым.

Это архитектурное решение в сочетании с осознанием, что можно предобучить одну гигантскую модель на огромном куске интернета, а затем адаптировать к любой языковой задаче, породило линейку GPT:

  • GPT (2018) → GPT-2 (2019) → GPT-3 (2020): каждое поколение показывало, что масштабирование параметров и данных даёт качественно новые способности, а не просто маргинальный прирост точности. GPT-3 мог писать код, переводить, суммаризировать и вести беседу, хотя никогда не обучался этим задачам явно.
  • Инструктивное дообучение и RLHF (2021–2022): сырые языковые модели предсказывают следующий токен; они не хотят быть полезными. Техники вроде обучения с подкреплением на основе обратной связи от человека превратили сырые предсказатели токенов в ассистентов, которые следуют инструкциям и отклоняют вредные запросы.
  • ChatGPT (ноябрь 2022): Сэм Альтман объявил о нём в X с энергией минорного релиза: «сегодня мы запустили ChatGPT. попробуйте поговорить с ним». Сдержанный текст для момента, когда закончилась старая эра и началась новая история. Исследования вышли из лаборатории; ваши не технические родственники появились. Сто миллионов пользователей за два месяца. Тест Тьюринга перестал быть мысленным экспериментом и стал тем, на что люди натыкались случайно за завтраком.

Это точка, где ИИ перестал означать «глубокий в одной коробке, пустой везде» и начал означать композиционный: единый набор весов, который может комбинировать навыки, никогда не обучаясь их комбинации. Одна модель может написать сонет, отладить Python и объяснить размер сонета — не потому, что это три разные системы, а потому что язык оказался удивительно хорошим универсальным интерфейсом к огромному спектру человеческих задач.

5. От чат-бота к коллеге: агентный поворот (2023 — сегодня)

Языковая модель, которая просто отвечает на вопросы, — это мощный автокомплит. Следующая фаза истории — дать этой модели руки: способность вызывать инструменты, писать и выполнять код, просматривать веб, запоминать состояние между шагами и выстраивать собственные рассуждения в многошаговые планы.

Здесь сошлось несколько нитей:

  • Использование инструментов / вызов функций позволило моделям не просто описывать действия, а выполнять их: запросить базу данных, вызвать API, запустить вычисление — вместо того чтобы угадывать ответ.
  • Дополненная генерация (RAG) дала моделям доступ к информации за пределами их обучающих данных, обосновывая ответы реальными документами вместо замороженной памяти.
  • Цепочка рассуждений и модели рассуждений показали, что если позволить модели «думать вслух» перед ответом, а затем обучить её рассуждать дольше над сложными задачами, результаты по математике, логике и многошаговому планированию резко улучшаются.
  • Агентные фреймворки сшивают это в циклы: план → действие → наблюдение → корректировка. Обёрнутые в оркестрационный код, логику повторных попыток и хорошо спроектированные инструменты, модель может преследовать цель через много шагов, а не ответить один раз и остановиться. Предоставленная самой себе, она всё ещё дрейфует или сбивается с пути; инфраструктура существует, чтобы это ловить. «Агент» описывает систему, а не самодостаточный разум.
  • Многоагентная оркестрация: модели, которые запускают другие экземпляры модели для параллельной работы, каждый с более узкой ролью, а затем объединяют результаты. Специалист символической эры вернулся, но теперь это трансформер, играющий роль в рое, координируемом другим трансформером, а не человеком, пишущим правила.

Это мир, в котором живёт разработчик в 2026 году. Код не просто предлагается строка за строкой; он планируется, пишется в нескольких файлах, тестируется и отлаживается в цикле, требующем всё меньше ручного управления, хотя всё ещё нужен настоящий ревью, настоящие ограждения и настоящее человеческое суждение о том, когда доверять результату. Тот же паттерн вне кодинга: исследовательские агенты, которые просматривают, синтезируют и цитируют источники на десятках страниц; операционные агенты, которые читают тикет, проверяют календарь и набрасывают ответ; дизайн-агенты, которые берут бриф и возвращают рабочий прототип. Пока это не автономия в сильном смысле. Это интерактивная способность: модель в цикле с инструментами и сигналом обратной связи — и она мощна именно благодаря тому, насколько плотно спроектирован этот цикл, а не вопреки.

Легко упустить, глядя на графики производительности: каждый скачок был ещё и экономической историей. Экспертные системы умерли, потому что время эксперта не масштабировалось. Статистическое ML ездило на дешёвых размеченных данных и хранилищах. Глубокое обучение — на игровых GPU. LLM — на интернет-масштабных данных и параллелизме трансформеров. Агенты переживают свой момент, потому что инференс подешевел настолько, что можно запускать модель в цикле сотни раз на задачу, не смеясь. Повторяющийся вопрос не «можем ли мы это построить?», а «можем ли мы позволить себе запускать это достаточно много раз, чтобы быть полезными?» Это узкое место сдвинулось; оно не исчезло.

Так что же изменилось на самом деле?

Если отойти на шаг, история ИИ — это история о том, где живёт интеллект:

ЭраГде жили «мозги»
Символический ИИВ правилах, написанных экспертом вручную
Статистическое MLВ признаках, выбранных инженером
Глубокое обучениеВ представлениях, которые модель выучила сама
Большие языковые моделиВ паттернах, выученных из большей части публичного интернета
Агентные системыВ собственном планировании модели, использовании инструментов и самокоррекции во времени

Каждая эра не заменяла предыдущую, а скорее поглощала её. Сегодняшние агенты всё ещё делают статистическое распознавание паттернов под капотом; они всё ещё иногда терпят неудачу хрупким, самоуверенным образом, как старые экспертные системы, — просто реже и менее предсказуемо.

Если сжать пять эр, остаётся только три разрыва, которые действительно имели значение:

  1. Запрограммированный вручную интеллект: правила, написанные человеком (символический ИИ).
  2. Выученные представления: паттерны, найденные моделью в данных, со всё меньшей человеческой структурой (статистическое ML → глубокое обучение → LLM).
  3. Интерактивные системы: модели, которые действуют, наблюдают последствия и корректируют, а не просто выдают один ответ (агенты).

Пятиэрная версия рассказывает лучшую историю; трёхэрная компрессия — это то, что на самом деле изменилось под капотом.

Сдвиг первый: кто пишет правила — человек или данные. Сдвиг второй: как модель представляет задачу — через заданные признаки или через самообученные представления. Сдвиг третий: как модель взаимодействует с миром — одноразовый ответ или непрерывный цикл действия и наблюдения.

Каждый сдвиг не отменял предыдущий, а надстраивался над ним. И каждый сдвиг делал ИИ чуть более полезным, чуть более общим и чуть более похожим на то, что мы интуитивно называем интеллектом.

Практический вывод: Прямо сейчас вы можете начать использовать агентные инструменты в своей работе. Попробуйте дать задачу написать тесты или рефакторинг кода агенту в цикле: напишите спецификацию, запустите, проверьте результат. Наблюдайте, где он ошибается, и улучшайте свои промпты и инструменты. Эра агентов уже здесь — учитесь с ней работать.

#история ИИ#символический ИИ#глубокое обучение#трансформеры#агенты
Al
Редакция Algolit

Пишем про алгоритмы, подготовку к собеседованиям и карьеру в IT — так, чтобы было понятно и полезно.

Хочешь закрепить знания на практике?

Решай задачи на Algolit — интерактивная платформа для обучения

Начать бесплатно →