Как составить запрос
Рекомендации по оптимизации запросов к YandexGPT и другим ИИ-чатам¶
Чтобы эффективно использовать языковые модели (YandexGPT, GigaChat, DeepSeek и аналоги) и минимизировать затраты на токены, следуйте этим рекомендациям:
1. Сокращайте запросы без потери смысла¶
Проблема:
Длинные промты увеличивают количество токенов и могут ухудшить качество ответа.
Решение:
- Избегайте «воды» – убирайте лишние слова.
- ❌ "Можешь ли ты, пожалуйста, объяснить мне, как работает искусственный интеллект, желательно простыми словами?" (~15 токенов)
- ✅ "Объясни, как работает ИИ, простыми словами." (~7 токенов)
- Используйте ключевые слова вместо полных предложений.
- ❌ "Напиши список из 10 лучших книг по маркетингу с кратким описанием каждой." (~14 токенов)
- ✅ "10 лучших книг по маркетингу + краткое описание." (~8 токенов)
2. Контролируйте длину контекста (истории диалога)¶
Проблема:
Если чат долгий, модель «забывает» ранние сообщения или упирается в лимит токенов.
Решение:
- Периодически очищайте историю (особенно в длинных диалогах).
- Резюмируйте важное перед новым вопросом.
- ❌ "Продолжи обсуждение с того места, где мы остановились." (модель может потерять контекст)
- ✅ "Раньше мы говорили про нейросети. Теперь объясни, как работает GPT." (явное указание темы)
3. Используйте форматирование для сложных запросов¶
Проблема:
Модель может неправильно интерпретировать многослойные вопросы.
Решение:
- Нумеруйте пункты, если запрос содержит несколько частей.
1. Объясни разницу между CNN и RNN. 2. Приведи примеры использования.
- Разделяйте запросы, если они слишком разные.
- ❌ "Напиши пример искового заявления и напиши в какая что нужно спросить у клиента для искового заявления" (слишком широко)
- ✅ Запрос 1: "Напиши пример искового заявления по банкротству физических лиц"
Запрос 2: "Напиши структуру вопросов клиенту для составления искового заявления по банкротству физических лиц."
4. Проверяйте токены перед отправкой¶
Проблема:
Неожиданно длинные запросы могут «съесть» лимит токенов.
Решение:
- Используйте токенизаторы:
- Для YandexGPT / GigaChat:
- Для DeepSeek / OpenAI-подобных моделей:
- Онлайн-токенизатор (аналог BPE).
5. Оптимизируйте ответы модели¶
Проблема:
Иногда ИИ генерирует избыточный текст.
Решение:
- Указывайте желаемый формат ответа:
- ❌ "Расскажи про ИИ." (может получиться длинное эссе)
- ✅ "Перечисли 3 главных принципа ИИ кратко."
- Ограничивайте длину:
- "Ответь в 1-2 предложениях."
- "Список из 5 пунктов."
6. Избегайте дублирования и повторов¶
Проблема:
Если модель не поняла вопрос, пользователи часто переспрашивают тем же текстом, увеличивая число токенов.
Решение:
- Переформулируйте вопрос, если ответ неточен.
- ❌ "Как работает GPT?" → (непонятно) → "Как работает GPT?" (повтор)
- ✅ "Объясни пошагово, как GPT генерирует текст."
Итоговая таблица оптимизации¶
Что делать? | Пример плохого запроса | Пример оптимизированного | Экономия токенов |
---|---|---|---|
Сокращать текст | "Напиши очень подробно..." | "Кратко объясни..." | ~30% меньше |
Чистить историю | Длинный диалог без очистки | Резюме + новый вопрос | До 50% |
Форматировать запрос | "Сделай то и это" | 1. Сделай то. 2. Сделай это. | Четче ответ |
Проверять токены | Отправка «наугад» | Точный расчёт через API | Избегает ошибок |
Оптимизация запросов к ИИ-чатам помогает:
✅ Снижать затраты (если API платный).
✅ Улучшать качество ответов (модель фокусируется на важном).
✅ Обходить ограничения контекста (особенно в длинных диалогах).
Главное правило: Чем короче и конкретнее запрос — тем точнее и полезнее ответ!