Перейти к содержанию

Как составить запрос

Рекомендации по оптимизации запросов к YandexGPT и другим ИИ-чатам

Чтобы эффективно использовать языковые модели (YandexGPT, GigaChat, DeepSeek и аналоги) и минимизировать затраты на токены, следуйте этим рекомендациям:


1. Сокращайте запросы без потери смысла

Проблема:

Длинные промты увеличивают количество токенов и могут ухудшить качество ответа.

Решение:

  • Избегайте «воды» – убирайте лишние слова.
    • "Можешь ли ты, пожалуйста, объяснить мне, как работает искусственный интеллект, желательно простыми словами?" (~15 токенов)
    • "Объясни, как работает ИИ, простыми словами." (~7 токенов)
  • Используйте ключевые слова вместо полных предложений.
    • "Напиши список из 10 лучших книг по маркетингу с кратким описанием каждой." (~14 токенов)
    • "10 лучших книг по маркетингу + краткое описание." (~8 токенов)

2. Контролируйте длину контекста (истории диалога)

Проблема:

Если чат долгий, модель «забывает» ранние сообщения или упирается в лимит токенов.

Решение:

  • Периодически очищайте историю (особенно в длинных диалогах).
  • Резюмируйте важное перед новым вопросом.
    • "Продолжи обсуждение с того места, где мы остановились." (модель может потерять контекст)
    • "Раньше мы говорили про нейросети. Теперь объясни, как работает GPT." (явное указание темы)

3. Используйте форматирование для сложных запросов

Проблема:

Модель может неправильно интерпретировать многослойные вопросы.

Решение:

  • Нумеруйте пункты, если запрос содержит несколько частей.
    1. Объясни разницу между CNN и RNN.  
    2. Приведи примеры использования.  
    
  • Разделяйте запросы, если они слишком разные.
  • "Напиши пример искового заявления и напиши в какая что нужно спросить у клиента для искового заявления" (слишком широко)
  • Запрос 1: "Напиши пример искового заявления по банкротству физических лиц"
    Запрос 2: "Напиши структуру вопросов клиенту для составления искового заявления по банкротству физических лиц."

4. Проверяйте токены перед отправкой

Проблема:

Неожиданно длинные запросы могут «съесть» лимит токенов.

Решение:


5. Оптимизируйте ответы модели

Проблема:

Иногда ИИ генерирует избыточный текст.

Решение:

  • Указывайте желаемый формат ответа:
    • "Расскажи про ИИ." (может получиться длинное эссе)
    • "Перечисли 3 главных принципа ИИ кратко."
  • Ограничивайте длину:
    • "Ответь в 1-2 предложениях."
    • "Список из 5 пунктов."

6. Избегайте дублирования и повторов

Проблема:

Если модель не поняла вопрос, пользователи часто переспрашивают тем же текстом, увеличивая число токенов.

Решение:

  • Переформулируйте вопрос, если ответ неточен.
    • "Как работает GPT?" → (непонятно) → "Как работает GPT?" (повтор)
    • "Объясни пошагово, как GPT генерирует текст."

Итоговая таблица оптимизации

Что делать? Пример плохого запроса Пример оптимизированного Экономия токенов
Сокращать текст "Напиши очень подробно..." "Кратко объясни..." ~30% меньше
Чистить историю Длинный диалог без очистки Резюме + новый вопрос До 50%
Форматировать запрос "Сделай то и это" 1. Сделай то. 2. Сделай это. Четче ответ
Проверять токены Отправка «наугад» Точный расчёт через API Избегает ошибок

Оптимизация запросов к ИИ-чатам помогает:

Снижать затраты (если API платный).
Улучшать качество ответов (модель фокусируется на важном).
Обходить ограничения контекста (особенно в длинных диалогах).

Главное правило: Чем короче и конкретнее запрос — тем точнее и полезнее ответ!