Читаете новости про AI и половина слов непонятна? Эта статья — для вас. Собрали 30 терминов, которые чаще всего встречаются в разговорах про нейросети, и объяснили каждый человеческим языком.
Базовые понятия
Искусственный интеллект (AI / ИИ)
Общий термин для технологий, которые имитируют человеческий интеллект: распознают речь, видят на картинках, понимают текст, принимают решения. Нейросети — один из видов AI.
Нейросеть (Neural Network)
Компьютерная программа, вдохновлённая устройством человеческого мозга. Состоит из «нейронов» (математических функций), соединённых между собой. Нейросеть не программируется напрямую — она обучается на примерах.
Машинное обучение (Machine Learning, ML)
Раздел AI, где программа учится на данных, а не на чётких правилах. Вместо «если фото кота — скажи кот», модель смотрит на миллион фото котов и сама понимает, как выглядит кот.
Глубокое обучение (Deep Learning)
Подраздел машинного обучения с многослойными нейросетями. «Глубокое» — потому что много слоёв. Именно это лежит в основе ChatGPT, Midjourney и других современных AI.
Языковые модели
LLM (Large Language Model)
Большая языковая модель — нейросеть, обученная на огромном массиве текстов. Понимает и генерирует текст. ChatGPT, Claude, Gemini — всё это LLM.
GPT (Generative Pre-trained Transformer)
Архитектура языковых моделей от OpenAI. «Генеративный» — создаёт текст. «Предобученный» — обучен заранее на больших данных. «Трансформер» — тип нейросети. GPT-4o, GPT-5 — версии этой архитектуры.
Токен
Единица текста, с которой работает языковая модель. Это не слово — примерно 3/4 слова на английском или чуть больше на русском. «Привет, как дела?» — около 6 токенов. Важно для понимания цен на API: сервисы берут деньги за количество токенов.
Контекстное окно (Context Window)
Сколько текста нейросеть «помнит» в рамках одного разговора. Если контекст 128К токенов — это примерно 100 000 слов или небольшая книга. Когда текст выходит за контекст — нейросеть «забывает» начало разговора.
Промпт (Prompt)
Запрос или инструкция, которую вы пишете нейросети. «Напиши статью про котов» — это промпт. Качество промпта сильно влияет на качество ответа. Отсюда появилась профессия «промпт-инженер».
Промпт-инжиниринг
Искусство составлять запросы к нейросети так, чтобы получить максимально полезный ответ. Это не программирование — просто умение правильно объяснять задачу.
Обучение моделей
Обучение (Training)
Процесс, когда нейросеть «учится» на данных. ChatGPT обучался на огромном количестве текстов из интернета. Это занимает недели на тысячах мощных GPU и стоит миллионы долларов.
Дообучение (Fine-tuning)
Дополнительное обучение уже готовой модели на специфических данных. Например, взяли GPT-4 и дообучили его на юридических текстах — получили юридического AI-ассистента.
RLHF (Reinforcement Learning from Human Feedback)
Метод обучения, когда люди оценивают ответы нейросети и «учат» её отвечать лучше. Именно RLHF сделал ChatGPT таким удобным в общении — до него языковые модели писали странно.
Параметры модели
«Весовые коэффициенты» нейросети — числа, которые хранят всё, что она выучила. GPT-4 имеет ~1.8 триллиона параметров. Больше параметров — обычно умнее модель, но дороже запуск.
Типы задач
Генеративный AI (Generative AI)
AI, который создаёт новый контент: текст, изображения, видео, музыку. ChatGPT, Midjourney, Sora — генеративный AI. В отличие от классического AI, который только анализирует.
Мультимодальность
Способность AI работать с разными типами данных одновременно: текст + изображения + звук. GPT-4o мультимодален — понимает текст, видит картинки, слышит голос.
RAG (Retrieval-Augmented Generation)
Технология, когда нейросеть перед ответом ищет информацию в базе знаний. Решает проблему устаревших данных: модель находит актуальные факты и включает их в ответ. Так работают «умные» корпоративные чат-боты.
AI-агент
Нейросеть, которая может самостоятельно выполнять задачи: искать в интернете, управлять файлами, делать покупки, отправлять письма. В отличие от обычного чат-бота — действует, а не только отвечает.
Качество и безопасность
Галлюцинации (Hallucinations)
Когда нейросеть уверенно сообщает неверную информацию. Называет несуществующие источники, путает даты, придумывает биографии реальных людей. Это не «ложь» — модель просто генерирует правдоподобный текст, не «зная» что он неверный.
Бенчмарк (Benchmark)
Стандартный тест для сравнения моделей. MMLU, HumanEval, SWE-bench — наборы задач, по результатам которых оценивают умность нейросети. Как ЕГЭ, только для AI.
ELO-рейтинг
Система рейтинга из шахмат, адаптированная для AI. В Arena Leaderboard пользователи сравнивают ответы двух моделей — победитель получает очки. Более объективно, чем бенчмарки.
Цензура и NSFW-фильтры
Ограничения, встроенные в модели. Запрещают генерировать вредный контент: насилие, незаконные инструкции, дипфейки реальных людей. Иногда эти фильтры слишком строгие — отказывают в легитимных запросах.
Крупные понятия
AGI (Artificial General Intelligence)
Искусственный общий интеллект — гипотетический AI, который умеет всё, что умеет человек, и в любой области. Текущие модели — нет AGI: они мощные, но узкоспециализированные. Споры о том, когда появится AGI, идут постоянно.
Open Source AI
Модели с открытым кодом, которые любой может скачать и запустить. Llama (Meta), Mistral, Qwen (Alibaba) — открытые. ChatGPT и Claude — закрытые. Открытые модели можно запустить локально на своём компьютере.
API (Application Programming Interface)
Интерфейс для программистов, чтобы встроить нейросеть в своё приложение. Разработчики платят за API по количеству токенов и добавляют AI в свои продукты.
Инференс (Inference)
Процесс, когда уже обученная модель отвечает на запросы. В отличие от обучения — это быстро и дёшево. Когда вы пишете в ChatGPT — запускается инференс.
Embedding
Преобразование текста в набор чисел (вектор), которые отражают смысл текста. Похожие по смыслу тексты → похожие векторы. Основа для семантического поиска и RAG-систем.
📘 Расширенный глоссарий: Все AI-термины →
🚀 Попробовать нейросети: Каталог →