ExcelReader

Фаза ExcelReader используется для чтения файлов в формате Excel.

Синтаксис:

- ExcelReader $in=ReadSource $code=Source [0] (0=(Skip=5))

Параметры:

  • Sheets — указывает, какие страницы/листы Excel-документа необходимо прочесть. Требуемые листы можно указать названием листа, либо индексом (индексы в ETL начинаются с нуля), а если же не указывать параметр Sheets, то будут прочитаны все листы документа.

  • SheetOptions — задает параметры чтения страниц.

    Есть следующие опции:

    • Skip — указывает кол-во строк, которые нужно пропустить.

    • HasHeader — тип boolean, по умолчанию True, указывает ETL, как нужно воспринимать первую строку файла, шапкой таблицы, или создать свою.

  • HandleMerged — тип boolean, по умолчанию False, позволяет обрабатывать соединенные ячейки.

  • Encoding — позволяет изменять кодировку документа.

Скрытые листы

По умолчанию скрытые листы не обрабатываются. Для того, чтобы включить обработку скрытых листов, у стадии ExcelReader включаем опцию IncludeHidden=true.

HasHeader для всех листов

При указании опции HasHeader у стадии ExcelReader для всех листов файла вместо этого длинного кода.

Синтаксис:

stages: - ExcelReader $out [@,1,2,3,4] (@=(HasHeader=false) 1=(HasHeader=false) 2=(HasHeader=false) 3=(HasHeader=false) 4=(HasHeader=false) )

Можно использовать опцию HasHeader без указания определенного листа.

Пример:

stages: - ExcelReader HasHeader=false $out