Упаковка документов

 

Поточная обработка

 

При поточной обработке каждый файл, полученный с устройства, рассматривается модулями упаковки как страница документа. Ввод документа при поточной обработке может происходить следующим образом:

·         при вводе из файловой системы в каталог поступают образы различных файлов, например, образы многостраничных документов в формате TIFF, образы отдельных страниц документа в графических форматах: TIFF, JPG, PNG и т.п.

·         при вводе с факса служба Microsoft Fax Server считывает все страницы факсимильного сообщения и передает службам ввода полученный документ;

·         при вводе с электронной почты модуль ввода может получать с каждым входящим сообщением все файлы вложения сообщения.

Для формирования пакетов в поточном режиме предназначен модуль упаковки изображений. Модуль упаковки изображений может работать с любым модулем ввода.

В поточном режиме на основании экземпляров захвата формируется очередь единиц упаковки. Единица упаковки определяет минимальную порцию данных, на которую может быть разделен поток.

Существует три типа единиц упаковки:

·         экземпляр захвата – все изображения внутри одного экземпляра захвата рассматриваются как одно целое;

·         файл - поток рассматривается как последовательность файлов, из которых состоят экземпляры захвата. Каждый файл обрабатывается отдельно;

·         страница - поток рассматривается как последовательность страниц многостраничных изображений. Если файл с изображением не является многостраничным, то он рассматривается как одна станица.

Способ разделения потока на пакеты настраивается в конфигурационном файле служб ввода (см. в главе «Файлы служб ввода», раздел «Настройки модуля упаковки»). Существуют следующие способы разделения потока - триггеры:

·         Новый экземпляр захвата. Формируется новый пакет, как только попадается единица упаковки, принадлежащая новому экземпляру захвата. Экземпляры захвата отличаются идентификаторами;

·         Количество единиц упаковки. Формируется новый пакет, как только количество обработанных единиц упаковки достигает заданного значения;

·         Чистая страница. Формируется новый пакет, как только в единице упаковки обнаруживается пустая страница;

·         Штрих-код. Формируется новый пакет, как только в единице упаковки обнаруживается штрих-код указанного в настройках типа со значением, соответствующим заданным в настройках маске или регулярному выражению;

·         Тайм-аут. Формируется новый пакет, если после обработки единицы упаковки на вход упаковщика в течение времени, заданного в настройках, не поступают единицы упаковки.

Над единицей упаковки, которая была разделана способом «Чистая страница» или «Штрих-код», может быть выполнено одно из следующих действий:

·         единица упаковки добавляется в текущий пакет, следующая за ней единица упаковки будет считаться началом нового документа;

·         единица упаковки добавляется в начало нового пакета;

·         единица упаковки считается не относящейся ни к одному пакету и удаляется.

 

 

 

 

 

См. также:

·         Общие сведения;

·         Подокументная обработка;

·         Пример упаковки документов.