Проследите эволюцию ИИ: от экспертных систем и статистического обучения до глубоких нейросетей и современных агентов. Узнайте, как менялось определение интеллекта и что ждёт нас дальше.
Если вы выпускали софт в последние три года, то наверняка заметили, как ваша должностная инструкция тихо переписывалась сама собой. Вы перешли от написания кода к написанию кода с автодополнением, затем к написанию кода с коллаборатором, а теперь всё чаще пишете спецификацию и наблюдаете, как агент пишет, тестирует и выкладывает код за вас.
Это не случилось в одночасье. Это последняя глава 70-летней истории, начавшейся с попыток научить машины играть в шашки. Давайте пройдём по ней не как по сухой хронологии, а как по истории того, как «интеллект» каждый раз переопределялся, как только машины осваивали предыдущее определение.
Основная ставка ИИ, официально оформленная на Дартмутском семинаре 1956 года, была проста и дерзка: мышление — это вычисление. Если представить знания в виде символов и правил и правильно манипулировать ими, получится интеллект.
Это дало нам:
Это был слабый, узкий интеллект в самом буквальном смысле: система-гений в одной коробке и ничего не знающая за её пределами. Фатальный недостаток — масштабирование: каждое правило приходилось писать вручную эксперту. Знания не обобщались и не учились на данных. Когда финансирующие организации поняли, что эти системы не справляются с неупорядоченностью реального мира, деньги иссякли. Наступила первая зима ИИ.
Пока «ИИ» был грязным словом в грантовых заявках, набирала силу другая идея: вместо того чтобы говорить машине правила, покажите ей примеры и позвольте найти правила самой.
Нейронные сети существовали с 1950-х (перцептрон), но были широко списаны со счетов после того, как Минский и Пейперт показали их математические ограничения в книге «Перцептроны» (1969). Обратное распространение ошибки, популяризированное в 1986 году, дало многослойным сетям настоящий способ обучения, но сети всё равно проигрывали более простым методам ещё два десятилетия. Существования алгоритма было недостаточно: не хватало размеченных данных и вычислительной мощности, чтобы показать его возможности. Он сидел полувоскресший — многообещающая идея, которую никто не мог запустить в масштабе.
Метод опорных векторов, деревья решений и байесовские методы доминировали в практическом машинном обучении: фильтры спама, рекомендательные системы, обнаружение мошенничества. Deep Blue от IBM победил Гарри Каспарова в 1997 году, но в основном за счёт грубого перебора шахматных позиций, а не обучения. Всё ещё узко, всё ещё впечатляюще.
Интеллект этой эры был статистическим, а не логическим: распознавание образов по размеченным данным. Он хорошо работал на узких, чётко определённых задачах, но требовал горы размеченных вручную примеров и ручной разработки признаков. «Интеллект» всё ещё был в основном в человеке, проектирующем признаки; модель просто подгоняла кривую.
Ингредиенты для следующего скачка лежали на поверхности десятилетие: больше данных (интернет), больше вычислений (GPU, изначально для видеоигр) и алгоритмические трюки для обучения более глубоких сетей без коллапса в шум. Ничто из этого не выглядело неизбежным. Большинство исследователей уже отошли от нейросетей; глубокие сети были маргинальной ставкой, которую поддерживала горстка лабораторий, которым постоянно говорили, что они зря тратят карьеру.
Искрой стал AlexNet (2012) — глубокая свёрточная нейронная сеть, разгромившая конкурс классификации изображений ImageNet, сократив ошибку вдвое по сравнению со следующим лучшим подходом. Этот результат сказал полю нечто важное: наложите достаточно слоёв, скормите им достаточно данных — и сеть найдёт свои собственные признаки, без ручной разработки. Это был не плавный ход развития; это был переворот. В течение пары лет техники, бывшие шуткой, стали отправной точкой почти для каждой статьи по компьютерному зрению.
Далее последовала пятилетняя гонка:
Каждая из этих систем всё ещё была привязана к задаче: модель для зрения не могла написать предложение, модель для Го не могла узнать кота, — но навык внутри каждой уже не передавался человеком; модель сама находила своё представление задачи. Этот сдвиг в механизме, а не какой-то отдельный результат, сделал возможным следующий прыжок.
В 2017 году статья Google «Attention Is All You Need» представила архитектуру трансформера. Вместо последовательной обработки текста, как в старых рекуррентных сетях, трансформер позволяет каждому слову «внимать» каждому другому слову одновременно. Это был лучший способ моделирования последовательностей, и он оказался прекрасно масштабируемым.
Это архитектурное решение в сочетании с осознанием, что можно предобучить одну гигантскую модель на огромном куске интернета, а затем адаптировать к любой языковой задаче, породило линейку GPT:
Это точка, где ИИ перестал означать «глубокий в одной коробке, пустой везде» и начал означать композиционный: единый набор весов, который может комбинировать навыки, никогда не обучаясь их комбинации. Одна модель может написать сонет, отладить Python и объяснить размер сонета — не потому, что это три разные системы, а потому что язык оказался удивительно хорошим универсальным интерфейсом к огромному спектру человеческих задач.
Языковая модель, которая просто отвечает на вопросы, — это мощный автокомплит. Следующая фаза истории — дать этой модели руки: способность вызывать инструменты, писать и выполнять код, просматривать веб, запоминать состояние между шагами и выстраивать собственные рассуждения в многошаговые планы.
Здесь сошлось несколько нитей:
Это мир, в котором живёт разработчик в 2026 году. Код не просто предлагается строка за строкой; он планируется, пишется в нескольких файлах, тестируется и отлаживается в цикле, требующем всё меньше ручного управления, хотя всё ещё нужен настоящий ревью, настоящие ограждения и настоящее человеческое суждение о том, когда доверять результату. Тот же паттерн вне кодинга: исследовательские агенты, которые просматривают, синтезируют и цитируют источники на десятках страниц; операционные агенты, которые читают тикет, проверяют календарь и набрасывают ответ; дизайн-агенты, которые берут бриф и возвращают рабочий прототип. Пока это не автономия в сильном смысле. Это интерактивная способность: модель в цикле с инструментами и сигналом обратной связи — и она мощна именно благодаря тому, насколько плотно спроектирован этот цикл, а не вопреки.
Легко упустить, глядя на графики производительности: каждый скачок был ещё и экономической историей. Экспертные системы умерли, потому что время эксперта не масштабировалось. Статистическое ML ездило на дешёвых размеченных данных и хранилищах. Глубокое обучение — на игровых GPU. LLM — на интернет-масштабных данных и параллелизме трансформеров. Агенты переживают свой момент, потому что инференс подешевел настолько, что можно запускать модель в цикле сотни раз на задачу, не смеясь. Повторяющийся вопрос не «можем ли мы это построить?», а «можем ли мы позволить себе запускать это достаточно много раз, чтобы быть полезными?» Это узкое место сдвинулось; оно не исчезло.
Если отойти на шаг, история ИИ — это история о том, где живёт интеллект:
| Эра | Где жили «мозги» |
|---|---|
| Символический ИИ | В правилах, написанных экспертом вручную |
| Статистическое ML | В признаках, выбранных инженером |
| Глубокое обучение | В представлениях, которые модель выучила сама |
| Большие языковые модели | В паттернах, выученных из большей части публичного интернета |
| Агентные системы | В собственном планировании модели, использовании инструментов и самокоррекции во времени |
Каждая эра не заменяла предыдущую, а скорее поглощала её. Сегодняшние агенты всё ещё делают статистическое распознавание паттернов под капотом; они всё ещё иногда терпят неудачу хрупким, самоуверенным образом, как старые экспертные системы, — просто реже и менее предсказуемо.
Если сжать пять эр, остаётся только три разрыва, которые действительно имели значение:
Пятиэрная версия рассказывает лучшую историю; трёхэрная компрессия — это то, что на самом деле изменилось под капотом.
Сдвиг первый: кто пишет правила — человек или данные. Сдвиг второй: как модель представляет задачу — через заданные признаки или через самообученные представления. Сдвиг третий: как модель взаимодействует с миром — одноразовый ответ или непрерывный цикл действия и наблюдения.
Каждый сдвиг не отменял предыдущий, а надстраивался над ним. И каждый сдвиг делал ИИ чуть более полезным, чуть более общим и чуть более похожим на то, что мы интуитивно называем интеллектом.
Практический вывод: Прямо сейчас вы можете начать использовать агентные инструменты в своей работе. Попробуйте дать задачу написать тесты или рефакторинг кода агенту в цикле: напишите спецификацию, запустите, проверьте результат. Наблюдайте, где он ошибается, и улучшайте свои промпты и инструменты. Эра агентов уже здесь — учитесь с ней работать.
Хочешь закрепить знания на практике?
Решай задачи на Algolit — интерактивная платформа для обучения
Начать бесплатно →