Токен — это базовая единица, которой «мыслит» и тарифицируется языковая модель. Это не слово и не символ, а фрагмент текста, определяемый токенизатором модели.
| Текст | Примерное количество токенов |
|---|---|
| 1 слово (англ.) | ~1.3 токена |
| 1 слово (рус.) | ~2–3 токена |
| 4 символа кода | ~1 токен |
| Файл 500 строк | 3 000 – 5 000 токенов |
| Диалог 10 сообщений | 5 000 – 15 000 токенов |
Русский текст занимает в 2–3 раза больше токенов, чем английский. Это важно учитывать при написании промптов и правил.
Генерация ответа (output) стоит в 3–8 раз дороже, чем обработка входных данных (input). Контроль объёма ответа — самый эффективный рычаг экономии.
| Параметр | Значение |
|---|---|
| Номинальный размер | ~200k токенов |
| Практический предел | ~120k токенов (до деградации качества) |
| Max Mode | Расширяет окно, но +20% к стоимости |
| Субагенты | Каждый = отдельное контекстное окно |
При каждом сообщении в контекст загружается:
alwaysApply: trueЧем длиннее чат, тем больше контекста расходуется на историю, и тем меньше «внимания» модель уделяет свежей информации.
Каждое сообщение в длинном чате = вся предыдущая история + новое сообщение. Стоимость растёт экспоненциально с длиной диалога.