Перейти к содержанию

Настройка приложения

Настройки приложения «AI для извлечения данных из документов в Битрикс24»

Для работы с приложением «AI для извлечения данных из документов в Битрикс24» доступны настройки:

Настройка типов документов

menu-setup

Настройки AI Документы

Приложение AI Документы автоматически обрабатывает документ (распознает из графического или текстового документа все данные, которые будут указаны в настройках и сохранит в полях CRM Битрикс24 в соответствии с указанными настройками)

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Настройка типов документов

setup В таблице представлены все типы документов, для которых выполнены настройки:

  • 1-я колонка Тип документа — устанавливается при создании настройки
  • 2-я колонка Привязка к смарт-процессу — наименование смарт-процесса, к которому привязаны данная настройка

Добавить новый тип документа

  1. Нажать на кнопку Добавить (см. рис выше) add-new-type
  2. В открывшейся форме в первой секции Обязательно задайте наименование типа документа, которое будет отображаться в первой колонке таблицы просмотра типов документов.
  3. Во второй секции выполните настройку полей:

Выбор настройки типа документа

Доступны два варианта настройки типа документа:

  • Настроить самостоятельно — Нажмите на надпись для раскрытия блока самостоятельной настройки
  • Использовать готовые настройки — Нажмите на надпись для раскрытия блока для загрузки готовых настроек сложных документов
Самостоятельная настройка типов документов

add-new-type2

  • Нажать кнопку Добавить поле
  • Указать название поля понятное для пользователя (например: дата выдачи документа)
  • Указать инструкцию для искусственного интеллекта (инструкция для ИИ должна кратко и четко формулировать какие ключевые слова должен искать искусственный интеллект, чтобы извлечь данные: например - дата рождения или дата выдачи документа. Не указывайте неполные данные, например: дата - ИИ не поймет какую дату искать. )
  • Укажите тип данных из раскрывающегося списка: (Дата, Дата и время, Текст, Число, Массив, Деньги)
  • Укажите ключ JSON для формирования ответа от ИИ в JSON формате.

Ответ ИИ в JSON формате

Ключ JSON это специальная настройка имени поля для JSON формата. При возврате ответа от ИИ поле с найденным значением будет помечено установленным ключом. Ключ может состоять из латинских букв, цифр, знаков - и _

Например при установке ключа равным issue_date, ИИ вернет ответ в JSON: { "issue_date": "20.10.2018" }

Тонкая настройка

Рекомендуется специалистам

Данная настройка рекомендуется для специалистов, знающих тонкости настроек промтов для искусственного интеллекта, которые позволяют выполнить более сложную выборку из многостраничных документов или документов в специфических форматах.

add-new-type5

  1. Нажмите кнопку Тонкая настройка
  2. Выберите режим конфигурации для извлечения текста из документов (Данные могут быть извлечены в виде текста или виде JSON, соответственно выберите настройки в левой или правой колонке:)

Параметры extractor-G, vision-G и т.д. — это названия моделей распознавания (model) и настройки внутри спецификации, которые вы указываете в теле этого запроса.

extractor-G, vision-G, vision-Q — Модели распознавания (model)

Они определяют, какая именно нейросетевая модель будет использоваться для обработки вашего изображения.

  1. vision-G

    • Назначение: Универсальная модель для распознавания плотного текста с печатных или рукописных носителей (книги, документы, листы).
    • Что делает: Отлично справляется с текстом, разбитым на строки и абзацы. Идеальна для документов.
  2. extractor-G

    • Назначение: Модель для извлечения структурированных данных из таблиц.
    • Что делает: Не просто распознает текст внутри ячеек, но и понимает структуру таблицы, возвращая данные с привязкой к строкам и колонкам.
  3. T — Языки для распознавания (language_codes) в конфигурации вы явно указываете, тексты на каких языках нужно искать.

    • Назначение: Список языков, которые модель должна учитывать при распознавании.
    • Пример: "language_codes": ["ru", "en"]
  4. NS — Отключение корректировки текста

    • Назначение: Запрещает модели исправлять слова, которые она считает опечатками, основываясь на своем словаре.
    • Когда использовать: Критично важно для распознавания номеров (VIN, серийные номера), специфичных аббревиатур, названий компаний, где любая "корректировка" будет ошибкой.

Сводная таблица соответствий

Термин Описание
vision-G Универсальная модель для сплошного текста (документы).
extractor-G Модель для извлечения структурированных данных (таблицы).
T "languageCodes": ["ru", "en", ...] Языки, на которых написан текст.
NS Запрет на автоматическое исправление распознанного текста.
Использовать готовые настройки для сложных документов

add-new-type3

  1. Выберите раздел Использовать готовые настройки для сложных документов
  2. В нижней части раздела раскроется интерфейс с возможностью выбора готовых настроек для сложных форм, имеющихся в библиотеке приложения.
  3. Выберите необходимую настройку из списка
  4. Сохраните результат.
  5. Добавленная настройка отобразится в списке типов документов.
Привязать документ к смарт-процессу

add-new-type4

Смарт-процессы

Приложение позволяет извлекать данные из документов и сохранять в структурах смарт-процессов.

  1. Выберите из раскрывающегося списка название смарт-процесса в котором будут сохранены данные (предварительно необходимо создать смарт-процесс для организации хранения данных по настраиваемому документу)
  2. Выберите поле смарт-процесса с типом документа (если все элементы смарт-процесса относятся к одному типу, то оставьте поле пустым)
  3. Выполните привязку полей смарт-процесса к полям CRM Битрикс24
  4. Сохраните результат настройки

add-new-type6

Привязка полей смарт-процесса

Напротив наименования поля в смарт-процессе выберите из раскрывающегося списка наименование поля в CRM Битрикс24. После завершения привязки, нажмите кнопку Сохранить.

Изменить настройки типов документов

Для изменения настроек типа документа:

menu-setup

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Настройка типов документов
  2. Кликните мышкой по названию типа документа, настройку которого необходимо изменить (подробнее)
  3. В открывшемся окне внесите необходимые изменения в наименование документа, настройку полей и привязку к смарт-процессу
  4. Сохраните внесенные изменения

edit-set1

Режим редактирования

При внесении изменений в настройки типа документа доступны для редактирования:

  • Наименование типа документа
  • название извлекаемых полей
  • инструкции для ИИ
  • типы данных полей
  • ключ JSON
  • тонкая настройка инструкций для ИИ
  • добавление новых полей для выборки
  • удаление существующих полей с настройками

Удалить настройку типа документа

del-set2 Для удаления настройки типа документа:

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Настройка типов документов
  2. Кликните мышкой по названию типа документа, настройку которого необходимо удалить
  3. В открывшемся окне в нижней части рабочего экрана нажмите на кнопку Удалить
  4. В открывшемся новом окне подтвердите удаление или отмените удаление. del-set

Настройка сжатия

Какое значение сжатия оптимально

Для хранения исходных документов в базе данных CRM Битрикс24 используется сжатие файла с применением специальных алгоритмов. При использовании сжатия выбирайте оптимальную модель: при увеличении сжатия файлов вы экономите в объеме хранения фалов в системе CRM Битрикс24, но для обеспечения большего сжатия требуется больше вычислительных ресурсов, а это увеличивает время на обработку хранящихся файлов для выдачи по запросам пользователей и некоторые алгоритмы добиваются увеличения сжатия исходных файлов за счет снижения качества хранящихся данных.

Выбирайте оптимальные коэффициенты сжатия.

menu-setup

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Настройка сжатия
  2. Установите признак Сжимать pdf файлы для более компактного хранения документов
  3. Установите значение Качество сжатия файла (от 0 до 75)* Оптимально 65-70, данное значение предназначено для сжатия JPEG файлов, чем меньше значение, тем больше сжатие и соответственно хуже качество сохраняемого оригинала.

compress

  1. Установите параметр Минимальный размер файла в мегабайтах для сжатия* обозначает размер файла, для которого будет запускаться алгоритм сжатия автоматически (например: если размер файла будет 2 мб, то при установленном значении 7Мб процедура сжатия выполняться не будет)
  2. Сохраните результат

Подключение аккаунта Open AI

Подключение OpenAI API

Для подключения сервиса OpenAI API с собственным адресом входа и токеном, необходимо указать параметры в данной форме и поиск и распознавание данных из документов будет происходить с помощью ИИ подключенного OpenAI API, а не модели ИИ подключенной к приложению по умолчанию.

menu-setup

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Настройки OpenAI API
  2. Установите значение Собственного эндпоинта (URL с адресом API, поддерживающего OpenAI, например, https://openrouter.ai/api/v1)
  3. Установите Тонкен, полученный для доступа к OpenAI API

openai

  1. Укажите наименование модели искусственного интеллекта, используемого в приложении: например, gpt-3.5-turbo или gpt-4. При использовании Яндекса модель необходимо указывать в формате gpt://{folder_id}/yandexgpt/latest

Настройки Yandex Vision

Подключение Yandex Vision

Yandex Vision OCR (Optical Character Recognition) — это облачный сервис от Яндекса, который использует машинное обучение для распознавания текста на изображениях.

Если не заполнять значения в данной форме, то будут использованы значчения по умолчанию настроенные в приложении в соответствии с вашим тарифом.

menu-setup

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Настройки Yandex Vision
  2. Установите значение API-ключ — это секретный токен, который идентифицирует ваш аккаунт в Yandex Cloud и проверяет ваши права на использование сервиса.
  3. Установите ID каталога — это уникальный идентификатор вашего "виртуального рабочего пространства" (каталога) в Yandex Cloud.

yandex

  1. Установите наименование Модели алгоритма распознавания, которую вы хотите использовать.

Статистика использования

Статистика использования

Для просмотра количества использованных и оставшихся запросов для распознавания документов применяется данный раздел

menu-setup

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Статистика использования
  2. В открывшейся форме загружается статистическая информация по объему выполненных работ приложением и оставшемуся лимиту документов для распознавания.

stat

Тарифы

Тарифы

Раздел отображает текущий тариф и доступные тарифы для подключения

menu-setup

  1. Запустите приложение AI Документы из основного меню CRM Битрикс24 и в открывшемся окне выберите раздел меню Настройки/Тарифы

tarif