Первичная классификация

Средства первичной классификации предназначены для оценки содержимого исходных данных с целью подбора оптимального классификатора и его настройки для выполнения импорта данных.

Первичная классификация включает:

- формирование статистики по содержимому входных данных;

- формирование списка уникальных значений отдельной атрибутивной характеристики;

- автоматическое дополнение цифрового классификатора.

Формирование статистики по содержимому входных данных и (или) автоматическое дополнение цифрового классификатора выполняется средствами отдельного диалогового окна, которое активизируется после нажатия кнопки «Классификация» основного диалога.

Формирование списка уникальных значений отдельной атрибутивной характеристики выполняется путем нажатия правой кнопки мыши над предварительно выбранным столбцом («клик» левой кнопкой мыши) в таблице атрибутов набора.

Для формирования статистики по содержимому входных данных следует выбрать файл, в который будет записан сформированный протокол и настроить содержимое протокола:

- Список наборов (перечень загружаемых имен наборов);

- Список полей (перечень уникальных названий атрибутивных характеристик, встречающихся во всех исходных наборов);

- Атрибуты наборов (будет выполнено формирование списка наборов данных с комплектами относящихся к ним полей атрибутов);

- Нумерация строк (строки протокола будут пронумерованы);

- Соответствия (после названия атрибутивного поля после «=» будет дописано название семантической характеристики, если такое соответствие предварительно было установлено автоматически по ключам или вручную);

- Только без соответствий (в список атрибутов будут включены только поля, не имеющие соответствия с семантикой).

Автоматическое дополнение цифрового классификатора заключается в автоматическом формировании в классификаторе, указанном на основной вкладке главного диалога, семантик, соответствующих атрибутивным полям, для которых еще не назначено соответствие и объектов для наборов данных, для которых еще не назначено соответствие.

Добавление новых семантик и объектов выполняется начиная с заданного кода.

В случае, если при добавлении очередной семантики (или объекта) обнаружится, что такой код в классификаторе уже есть, будет выполнен поиск очередного «свободного» кода.

При добавлении семантики в классификатор учитывается тип и размерность поля атрибутов, в качестве ключа и имени семантики записывается название поля.

При добавлении объекта в классификатор учитывается тип набора данных (локализация), в качестве ключа и имени записывается название набора.

Таким образом для первичной оценки содержимого неизвестных наборов данных можно создать новый классификатор (при выборе классификатора указать несуществующее имя), выполнить классификацию и загрузить данные. Далее путем визуального анализа загруженной карты можно либо определить оптимальный из существующих классификаторов и выполнить настройку соответствия, или назначить автоматически добавленным характеристикам правильные названия (не трогать ключи семантик), а объектам - соответствующее изображение.