История нейросетей: от перцептрона до GPT-4 [таймлайн]

История нейронных сетей — это история взлётов и падений, «зим AI» и неожиданных прорывов. От первой математической модели нейрона до ChatGPT прошло 80 лет. В этой статье — ключевые вехи, люди и технологии, которые привели нас к эпохе генеративного AI.

Таймлайн ключевых событий

Год	Событие	Значение
1943	Нейрон Маккалока-Питтса	Первая математическая модель нейрона
1957	Перцептрон Розенблатта	Первая обучаемая нейросеть
1969	Книга Минского и Пейперта	Начало первой «зимы AI»
1986	Backpropagation (Хинтон)	Эффективное обучение глубоких сетей
1997	LSTM	Решение проблемы длинных зависимостей
1998	LeNet-5 (Ян ЛеКун)	Свёрточные сети для распознавания цифр
2012	AlexNet / ImageNet	Революция глубокого обучения
2014	GAN (Гудфеллоу)	Генеративно-состязательные сети
2017	«Attention Is All You Need»	Архитектура трансформера
2018	BERT (Google)	Революция в NLP
2020	GPT-3 (OpenAI)	175B параметров, few-shot learning
2021	DALL-E, Stable Diffusion	Генерация изображений по тексту
2022	ChatGPT	AI становится массовым продуктом
2023	GPT-4	Мультимодальность, новый уровень качества
2024	Claude 3, Llama 3, Gemini	Конкуренция и open source
2025-2026	GPT-4o, Claude Opus, агенты	Мультимодальность и автономность

1943: Начало — нейрон Маккалока-Питтса

Нейрофизиолог Уоррен Маккалок и математик Уолтер Питтс опубликовали статью «Логическое исчисление идей, относящихся к нервной деятельности». Они предложили математическую модель биологического нейрона — простую функцию, которая принимает входные сигналы, суммирует их и «срабатывает», если сумма превышает порог.

Это была чистая теория, без компьютерной реализации. Но идея о том, что мышление можно моделировать математически, заложила фундамент всего, что последовало.

1957: Перцептрон — первая обучаемая нейросеть

Фрэнк Розенблатт из Корнеллского университета создал перцептрон — первую нейросеть, которая могла обучаться. Перцептрон состоял из одного слоя нейронов и мог классифицировать простые паттерны. New York Times написала, что ВМС США создали «электронный мозг».

Ажиотаж вокруг перцептрона породил нереалистичные ожидания. Люди верили, что через 10–15 лет машины будут думать как люди.

1969: Первая «зима AI»

Марвин Минский и Сеймур Пейперт опубликовали книгу «Перцептроны», в которой математически доказали ограничения перцептронов — они не могут решить даже задачу XOR (исключающее ИЛИ). Хотя многослойные сети теоретически могли это решить, не существовало эффективного алгоритма их обучения.

Финансирование AI-исследований резко сократилось. Наступила первая «зима AI», которая продлилась до середины 1980-х.

1986: Backpropagation — возрождение

Джеффри Хинтон, Дэвид Румельхарт и Рональд Уильямс опубликовали работу об эффективном применении обратного распространения ошибки (backpropagation) для обучения многослойных нейросетей. Это решило главную проблему: теперь можно было обучать глубокие сети.

Хинтон, которого позже назовут «крёстным отцом AI», получит за эту работу Нобелевскую премию по физике 2024 года.

1997—1998: LSTM и свёрточные сети

Зепп Хохрайтер и Юрген Шмидхубер предложили LSTM (Long Short-Term Memory) — архитектуру рекуррентной нейросети, способную запоминать длинные зависимости. LSTM станет стандартом для обработки последовательностей (текст, речь) на 20 лет.

Ян ЛеКун продемонстрировал LeNet-5 — свёрточную нейросеть, которая распознавала рукописные цифры с высокой точностью. Эта технология использовалась для распознавания чеков в банках.

2012: AlexNet — глубокое обучение побеждает

Алекс Крижевский, Илья Суцкевер и Джеффри Хинтон создали AlexNet — глубокую свёрточную сеть, которая выиграла конкурс ImageNet с огромным отрывом. Секрет: обучение на GPU вместо CPU, что ускорило процесс в десятки раз.

Этот момент считается началом «революции глубокого обучения». За несколько лет нейросети стали доминировать в компьютерном зрении, распознавании речи и NLP.

2014: GAN — машины учатся создавать

Ян Гудфеллоу предложил архитектуру GAN (Generative Adversarial Network): два нейросети соревнуются друг с другом — генератор создаёт изображения, дискриминатор отличает настоящие от поддельных. Результат: впечатляюще реалистичные сгенерированные изображения.

GAN открыли эру генеративного AI, хотя их впоследствии вытеснят диффузионные модели.

2017: «Attention Is All You Need» — рождение трансформера

Группа исследователей Google (Васвани и др.) опубликовала статью, которая изменила всё. Они предложили архитектуру трансформер, основанную целиком на механизме внимания, без рекуррентных и свёрточных слоёв.

Преимущества трансформера:

Параллелизм — обрабатывает все слова одновременно (LSTM — последовательно)
Масштабируемость — легко увеличивать размер модели
Качество — лучше улавливает длинные зависимости

Именно трансформер стал основой GPT, BERT, и всех современных LLM.

2018: BERT — Google меняет NLP

Google представил BERT (Bidirectional Encoder Representations from Transformers) — модель, которая «читает» текст в обоих направлениях. BERT произвёл революцию в задачах понимания текста: поиск, классификация, ответы на вопросы.

2020: GPT-3 — масштаб решает

OpenAI выпустил GPT-3 с 175 миллиардами параметров. Модель продемонстрировала феномен few-shot learning: она могла решать задачи, увидев всего несколько примеров в промпте, без какого-либо дополнительного обучения.

GPT-3 показал, что масштаб (больше параметров + больше данных) = новые способности. Это запустило «гонку масштабирования» среди AI-компаний.

2021: Генерация изображений

OpenAI представил DALL-E — модель, генерирующую изображения по текстовому описанию. В том же году появился Stable Diffusion от Stability AI — первая мощная open source модель генерации изображений.

Это был момент, когда AI вышел за пределы текста и начал творить визуально.

2022: ChatGPT — AI становится массовым

30 ноября 2022 года OpenAI выпустил ChatGPT — чат-бот на базе GPT-3.5 с интерфейсом в виде диалога. За 5 дней сервис набрал 1 миллион пользователей. За 2 месяца — 100 миллионов. Это стало самым быстрым ростом пользовательской базы в истории технологий.

ChatGPT изменил всё: от бизнес-процессов до образования, от программирования до журналистики. AI перестал быть технологией для гиков и стал инструментом для каждого.

2023: GPT-4 и конкуренция

OpenAI выпустил GPT-4 — мультимодальную модель, способную работать с текстом и изображениями. Качество прыгнуло на новый уровень: GPT-4 сдавал юридические экзамены в топ-10% и решал олимпиадные задачи по математике.

В ответ Google выпустил Gemini, Anthropic — Claude, Meta открыла Llama 2. Началась настоящая конкуренция.

2024: Open Source революция

Meta выпустила Llama 3 до 405B параметров в открытом доступе. Mistral AI представила высококачественные модели из Европы. Google открыл Gemma. Alibaba — Qwen.

Open source модели достигли качества, сопоставимого с GPT-3.5, и начали приближаться к GPT-4. Впервые мощные LLM стали доступны каждому для скачивания и запуска.

2025—2026: Мультимодальность и агенты

Современный этап характеризуется:

Мультимодальные модели — GPT-4o работает с текстом, изображениями и аудио одновременно
Огромные контексты — Claude до 1M токенов, Gemini до 2M
AI-агенты — модели начинают выполнять многошаговые задачи автономно
Российские модели — YandexGPT 4, GigaChat Max достигают конкурентного уровня
Генерация видео — Sora (OpenAI), Runway Gen-3 создают видео из текста

Люди, которые создали AI

Имя	Вклад	Организация
Джеффри Хинтон	Backpropagation, глубокое обучение	Университет Торонто, Google
Ян ЛеКун	Свёрточные сети	NYU, Meta
Йошуа Бенджио	Нейронные языковые модели	MILA, Университет Монреаля
Илья Суцкевер	AlexNet, GPT, со-основатель OpenAI	OpenAI → SSI
Сэм Альтман	CEO OpenAI, ChatGPT	OpenAI
Дарио Амодеи	CEO Anthropic, Claude	Anthropic
Демис Хассабис	DeepMind, AlphaGo, AlphaFold	DeepMind (Google)
Андрей Карпатий	Tesla Autopilot, популяризация AI	Tesla, OpenAI

Что дальше?

История нейросетей показывает, что прорывы часто случаются неожиданно. Трансформер в 2017 году никто не считал революцией — а он изменил мир. Следующий прорыв может прийти из области нейроморфных вычислений, квантовых компьютеров или принципиально новых архитектур.

Одно можно сказать точно: мы живём в самом начале эпохи AI. То, что мы видим сегодня — это первая глава длинной истории.

История нейросетей: от перцептрона до GPT-4