Словарь AI: 30 терминов, которые нужно знать каждому

Читаете новости про AI и половина слов непонятна? Эта статья — для вас. Собрали 30 терминов, которые чаще всего встречаются в разговорах про нейросети, и объяснили каждый человеческим языком.

Базовые понятия

Искусственный интеллект (AI / ИИ)

Общий термин для технологий, которые имитируют человеческий интеллект: распознают речь, видят на картинках, понимают текст, принимают решения. Нейросети — один из видов AI.

Нейросеть (Neural Network)

Компьютерная программа, вдохновлённая устройством человеческого мозга. Состоит из «нейронов» (математических функций), соединённых между собой. Нейросеть не программируется напрямую — она обучается на примерах.

Машинное обучение (Machine Learning, ML)

Раздел AI, где программа учится на данных, а не на чётких правилах. Вместо «если фото кота — скажи кот», модель смотрит на миллион фото котов и сама понимает, как выглядит кот.

Глубокое обучение (Deep Learning)

Подраздел машинного обучения с многослойными нейросетями. «Глубокое» — потому что много слоёв. Именно это лежит в основе ChatGPT, Midjourney и других современных AI.

Языковые модели

LLM (Large Language Model)

Большая языковая модель — нейросеть, обученная на огромном массиве текстов. Понимает и генерирует текст. ChatGPT, Claude, Gemini — всё это LLM.

GPT (Generative Pre-trained Transformer)

Архитектура языковых моделей от OpenAI. «Генеративный» — создаёт текст. «Предобученный» — обучен заранее на больших данных. «Трансформер» — тип нейросети. GPT-4o, GPT-5 — версии этой архитектуры.

Токен

Единица текста, с которой работает языковая модель. Это не слово — примерно 3/4 слова на английском или чуть больше на русском. «Привет, как дела?» — около 6 токенов. Важно для понимания цен на API: сервисы берут деньги за количество токенов.

Контекстное окно (Context Window)

Сколько текста нейросеть «помнит» в рамках одного разговора. Если контекст 128К токенов — это примерно 100 000 слов или небольшая книга. Когда текст выходит за контекст — нейросеть «забывает» начало разговора.

Промпт (Prompt)

Запрос или инструкция, которую вы пишете нейросети. «Напиши статью про котов» — это промпт. Качество промпта сильно влияет на качество ответа. Отсюда появилась профессия «промпт-инженер».

Промпт-инжиниринг

Искусство составлять запросы к нейросети так, чтобы получить максимально полезный ответ. Это не программирование — просто умение правильно объяснять задачу.

Обучение моделей

Обучение (Training)

Процесс, когда нейросеть «учится» на данных. ChatGPT обучался на огромном количестве текстов из интернета. Это занимает недели на тысячах мощных GPU и стоит миллионы долларов.

Дообучение (Fine-tuning)

Дополнительное обучение уже готовой модели на специфических данных. Например, взяли GPT-4 и дообучили его на юридических текстах — получили юридического AI-ассистента.

RLHF (Reinforcement Learning from Human Feedback)

Метод обучения, когда люди оценивают ответы нейросети и «учат» её отвечать лучше. Именно RLHF сделал ChatGPT таким удобным в общении — до него языковые модели писали странно.

Параметры модели

«Весовые коэффициенты» нейросети — числа, которые хранят всё, что она выучила. GPT-4 имеет ~1.8 триллиона параметров. Больше параметров — обычно умнее модель, но дороже запуск.

Типы задач

Генеративный AI (Generative AI)

AI, который создаёт новый контент: текст, изображения, видео, музыку. ChatGPT, Midjourney, Sora — генеративный AI. В отличие от классического AI, который только анализирует.

Мультимодальность

Способность AI работать с разными типами данных одновременно: текст + изображения + звук. GPT-4o мультимодален — понимает текст, видит картинки, слышит голос.

RAG (Retrieval-Augmented Generation)

Технология, когда нейросеть перед ответом ищет информацию в базе знаний. Решает проблему устаревших данных: модель находит актуальные факты и включает их в ответ. Так работают «умные» корпоративные чат-боты.

AI-агент

Нейросеть, которая может самостоятельно выполнять задачи: искать в интернете, управлять файлами, делать покупки, отправлять письма. В отличие от обычного чат-бота — действует, а не только отвечает.

Качество и безопасность

Галлюцинации (Hallucinations)

Когда нейросеть уверенно сообщает неверную информацию. Называет несуществующие источники, путает даты, придумывает биографии реальных людей. Это не «ложь» — модель просто генерирует правдоподобный текст, не «зная» что он неверный.

Бенчмарк (Benchmark)

Стандартный тест для сравнения моделей. MMLU, HumanEval, SWE-bench — наборы задач, по результатам которых оценивают умность нейросети. Как ЕГЭ, только для AI.

ELO-рейтинг

Система рейтинга из шахмат, адаптированная для AI. В Arena Leaderboard пользователи сравнивают ответы двух моделей — победитель получает очки. Более объективно, чем бенчмарки.

Цензура и NSFW-фильтры

Ограничения, встроенные в модели. Запрещают генерировать вредный контент: насилие, незаконные инструкции, дипфейки реальных людей. Иногда эти фильтры слишком строгие — отказывают в легитимных запросах.

Крупные понятия

AGI (Artificial General Intelligence)

Искусственный общий интеллект — гипотетический AI, который умеет всё, что умеет человек, и в любой области. Текущие модели — нет AGI: они мощные, но узкоспециализированные. Споры о том, когда появится AGI, идут постоянно.

Open Source AI

Модели с открытым кодом, которые любой может скачать и запустить. Llama (Meta), Mistral, Qwen (Alibaba) — открытые. ChatGPT и Claude — закрытые. Открытые модели можно запустить локально на своём компьютере.

API (Application Programming Interface)

Интерфейс для программистов, чтобы встроить нейросеть в своё приложение. Разработчики платят за API по количеству токенов и добавляют AI в свои продукты.

Инференс (Inference)

Процесс, когда уже обученная модель отвечает на запросы. В отличие от обучения — это быстро и дёшево. Когда вы пишете в ChatGPT — запускается инференс.

Embedding

Преобразование текста в набор чисел (вектор), которые отражают смысл текста. Похожие по смыслу тексты → похожие векторы. Основа для семантического поиска и RAG-систем.

📘 Расширенный глоссарий: Все AI-термины →

🚀 Попробовать нейросети: Каталог →