Как составить запрос

1. Сокращайте запросы без потери смысла¶

Проблема:

Длинные промты увеличивают количество токенов и могут ухудшить качество ответа.

Решение:

Избегайте «воды» – убирайте лишние слова.
- ❌ "Можешь ли ты, пожалуйста, объяснить мне, как работает искусственный интеллект, желательно простыми словами?" (~15 токенов)
- ✅ "Объясни, как работает ИИ, простыми словами." (~7 токенов)
Используйте ключевые слова вместо полных предложений.
- ❌ "Напиши список из 10 лучших книг по маркетингу с кратким описанием каждой." (~14 токенов)
- ✅ "10 лучших книг по маркетингу + краткое описание." (~8 токенов)

2. Контролируйте длину контекста (истории диалога)¶

Проблема:

Если чат долгий, модель «забывает» ранние сообщения или упирается в лимит токенов.

Решение:

Периодически очищайте историю (особенно в длинных диалогах).
Резюмируйте важное перед новым вопросом.
- ❌ "Продолжи обсуждение с того места, где мы остановились." (модель может потерять контекст)
- ✅ "Раньше мы говорили про нейросети. Теперь объясни, как работает GPT." (явное указание темы)

3. Используйте форматирование для сложных запросов¶

Проблема:

Модель может неправильно интерпретировать многослойные вопросы.

Решение:

Нумеруйте пункты, если запрос содержит несколько частей.

1. Объясни разницу между CNN и RNN.  
2. Приведи примеры использования.

Разделяйте запросы, если они слишком разные.
❌ "Напиши пример искового заявления и напиши в какая что нужно спросить у клиента для искового заявления" (слишком широко)
✅ Запрос 1: "Напиши пример искового заявления по банкротству физических лиц"
Запрос 2: "Напиши структуру вопросов клиенту для составления искового заявления по банкротству физических лиц."

4. Проверяйте токены перед отправкой¶

Проблема:

Неожиданно длинные запросы могут «съесть» лимит токенов.

Решение:

Используйте токенизаторы:
- Для YandexGPT / GigaChat:
  - API Yandex Cloud
- Для DeepSeek / OpenAI-подобных моделей:
  - Онлайн-токенизатор (аналог BPE).

5. Оптимизируйте ответы модели¶

Проблема:

Иногда ИИ генерирует избыточный текст.

Решение:

Указывайте желаемый формат ответа:
- ❌ "Расскажи про ИИ." (может получиться длинное эссе)
- ✅ "Перечисли 3 главных принципа ИИ кратко."
Ограничивайте длину:
- "Ответь в 1-2 предложениях."
- "Список из 5 пунктов."

6. Избегайте дублирования и повторов¶

Проблема:

Если модель не поняла вопрос, пользователи часто переспрашивают тем же текстом, увеличивая число токенов.

Решение:

Переформулируйте вопрос, если ответ неточен.
- ❌ "Как работает GPT?" → (непонятно) → "Как работает GPT?" (повтор)
- ✅ "Объясни пошагово, как GPT генерирует текст."

Итоговая таблица оптимизации¶

Что делать?	Пример плохого запроса	Пример оптимизированного	Экономия токенов
Сокращать текст	"Напиши очень подробно..."	"Кратко объясни..."	~30% меньше
Чистить историю	Длинный диалог без очистки	Резюме + новый вопрос	До 50%
Форматировать запрос	"Сделай то и это"	1. Сделай то. 2. Сделай это.	Четче ответ
Проверять токены	Отправка «наугад»	Точный расчёт через API	Избегает ошибок

Оптимизация запросов к ИИ-чатам помогает:

✅ Снижать затраты (если API платный).
✅ Улучшать качество ответов (модель фокусируется на важном).
✅ Обходить ограничения контекста (особенно в длинных диалогах).

Главное правило: Чем короче и конкретнее запрос — тем точнее и полезнее ответ!

Как составить запрос

Рекомендации по оптимизации запросов к YandexGPT и другим ИИ-чатам¶

1. Сокращайте запросы без потери смысла¶

2. Контролируйте длину контекста (истории диалога)¶

3. Используйте форматирование для сложных запросов¶

4. Проверяйте токены перед отправкой¶

5. Оптимизируйте ответы модели¶

6. Избегайте дублирования и повторов¶

Итоговая таблица оптимизации¶