Структурирование информации для запоминания. Структурирование информации: понятие и виды, модели и примеры

29.07.2019 Фото и видео

Определение 1

Структурирование –это выделение важных элементов в информационных сообщениях и установление связей между ними.

Цели структурирования –облегчение восприятия и поиска информации, выявление закономерностей.

Пример 1

Для раскрытия понятия «структурирование» сравним четыре информационных сообщения.

Первое:

«Для того чтобы добраться до села Дудкино, нужно сначала долететь на самолете до Иванова. Далее - на электричке до Орехова. Затем пересесть на паром и переправиться через реку Слоновую в поселок Ольховка, а оттудауже на попутной машине ехать в село Дудкино».

Второе:

Как ехать в село Дудкино?

1. До Иванова на самолете.

1. До поселка Ольховка на пароме.

1. До села Дудкино на попутной машине.

Третье:

Рисунок 1. Связи между населенными пунктами

Четвертое:

Рисунок 2.

Все четыре информационных сообщения несут одинаковую информацию, но они разные по форме представления информации, и по форме восприятия информации. Очевидно, что четвертая форма представления информации наиболее удачна для понятийного восприятия. А из первой формы представления нужную информацию добыть сложнее всего.

Во втором, третьем и четвертом примерах представления информации выделена структура, этапы поездки в село Дудкино.

Пример 2

Другим примером структурирование информации может быть оглавление в книгах. Книга имеет главы и разделы, затем, чтобы выделить основные мысли, разделы разбивают на абзацы. При такой структуре улучшается передача информации от автора книги к читателю.

Электронные книги индексируют, т.е. создают списки основных терминов с указанием ссылок на страницы, где эти термины встречаются.

Структуры информации можно разделить на классы:

  • множество -класс, в котором перечислен весь набор элементов и их характерные признаки (Например, множество, состоящее из Хризантем, Тюльпанов; Нарцисов определено характерным признаком – что это растения и цветы).
  • линейный класс или линейный список - множество, состоящее из конечного числа элементов и его элементы расположены в строго определенном порядке. В отличие от множества элементы в списке могут повторяться и должны быть отсортированы по определенному правилу, например по алфавиту.
  • таблицы - класс структуры позволяет установить связь между несколькими элементами. Например, в таблице 2 элементы каждой строки связаны между собой и отвечают за один объект. Таким образом хранится вся информация в базах данных. Строка таблицы называется записью, а столбец-полем (свойства записи).

Рисунок 3.

Линейных списков и таблиц иногда недостаточно для того, чтобы представить все связи между элементами.

Определение 2

Иерархия – класс структуры, в котором одни элементы подчиняются другим. Например, в некоторой фирме есть директор, ему подчиняются главный инженер и главный бухгалтер, у каждого из них есть свои подчиненные. Если мы захотим нарисовать схему управления этой фирмы, она получится многоуровневой.

Рисунок 4. 1 иерархия

В информатике иерархию называют деревом.

Такое название закрепилось из-за того, что если перевернуть схему вверх ногами, она становится похожа на дерево (точнее, на куст, см. рисунок справа). Несколько деревьев образуют лес.

Дерево состоит из узлов и связей между ними (они называются дугами ). Самый первый узел, расположенный на верхнем уровне (в него не входит ни одна стрелка‐дуга) – это корень дерева. Конечные узлы, из которых не выходит ни одна дуга, называются листьями. Все остальные узлы, кроме корня и листьев – это промежуточные узлы.

Из двух связанных узлов тот, который находится на более высоком уровне, называется «родителем», а другой – «сыном». Корень – это единственный узел, у которого нет «родителя»; у листьев нет «сыновей».

Используются также понятия «предок» и «потомок». «Потомок» какого‐то узла – это узел, в который можно перейти по стрелкам от узла‐предка. Соответственно, «предок» какого‐то узла – это узел, из которого можно перейти по стрелкам в данный узел.

Определение 3

Графы - класс структуры, где определен набор узлов (вершин) и связей между ними (рёбер). Приведем пример инфорации, которую обычно представляют в виде графа.

«От пос. Васюки три дороги идут в Солнцево, Грибное и Ягодное. Между Солнцевым и Грибным и между Грибным и Ягодным также есть дороги. Кроме того, есть дорога, которая идет из Грибного в лес и возвращается обратно в Грибное».

Структурирование информации

Информация подается нам в определенном виде. Для качественного запоминания нам нужно ее сгруппировать по определенному признаку. Например, если нам дан ряд чисел, то нужно решить, как его лучше запомнить. Ведь числа можно запоминать однозначные, двузначные и трехзначные. Все зависит от того, как мы их сгруппируем, и каким приемом мнемотехники владеем для перевода их в образы.

Допустим, нам нужно запомнить список неправильных глаголов английского языка. С чего вы начнете? Если вы начнете их запоминать по порядку, то очень скоро у вас «разболится» голова, слова плохо запомнятся, и потом наступит и отвращение ко всему английскому языку. С чем же это связано? Дело в том, что соседние слова списка мало, чем отличаются друг от друга, ведь они начинаются с одной буквы. Это так называемая гомогенная (однородная) интерферирующая деятельность. А для лучшего запоминания информации лучше ее сгруппировать так, чтобы соседние слова начинались на разные буквы (гетерогенная интерферирующая деятельность). Подробнее об этом мы поговорим ниже. Другой причиной, вызывающей “неприятности” является то, что отсутствует принцип группирования по определенным закономерностям. Например, можно заметить, что в одном случае во 2-х и в 3-х формах неправильных глаголов изменяется гласная внутри слова, в другом случае все три формы совпадают и т.д. Сгруппировав неправильные глаголы по этим закономерностям можно легко и быстро запомнить весь список с помощью мнемотехники.(Подробнее с техникой запоминания неправильных глаголов английского языка вы можете познакомиться в книге «Секреты запоминания неправильных глаголов»).

Если же нам нужно запомнить таблицу Менделеева, энциклопедические сведения или статьи закона, т.е. более сложный материал, где принцип группирования не применяют вообще (за редким исключением), то нужно использовать структурирование. Под структурированием информации мы понимаем выделение вертикальных и горизонтальных последовательностей. Например, чтобы быстро и качественно запомнить таблицу Менделеева, ее нужно представить в виде структуры, содержащей вертикальную последовательность – первый столбец и горизонтальные последовательности, – отдельные строчки. Хотим заметить, что вертикальная последовательность участвует в формировании “ключа” к информации.

Подводя итог всему сказанному выше, можно заключить, что для быстрого и качественного запоминания точной информации нужно ее сначала проанализировать, выявить закономерности и по ним сгруппировать, или структурировать в виде вертикальной и горизонтальных последовательностей.

2 этап – перевод каждой единицы информации в конкретный образ

Первичную информацию об окружающем мире, - как пишет известный психолог А.Г.Маклаков, - мы получаем с помощью ощущения и восприятия. Возбуждение, возникающее в наших органах чувств, не исчезает бесследно в то самое мгновенье, когда прекращается действие на них раздражителей. После того возникают и в течение некоторого времени сохраняются так называемые последовательные образы. Однако роль этих образов для психической жизни человека сравнительно невелика. Намного большее значение имеет тот факт, что и спустя длительное время после того, как мы воспринимали какой-либо предмет, образ этого предмета может быть снова – случайно или намеренно – вызван нами. Это явление получило название “представление”.

Таким образом, представление – это психический процесс отражения предметов или явлений, которые в данный момент не воспринимаются, но воссоздаются на основе нашего предыдущего опыта.

В основе представления лежит восприятие объектов, имевшее место в прошлом. Можно выделить несколько типов представлений. Во-первых, это представления памяти , т.е. представления, которые возникли на основе нашего непосредственного восприятия в прошлом какого-либо предмета или явления. Во-вторых, это представления воображения . На первый взгляд этот тип представлений не соответствует определению понятия “представление”, потому что в воображении мы отображаем то, чего никогда не видели, но это только на первый взгляд.

РИСУНОК 95

Воображение не рождается на пустом месте, и если мы, например, никогда не были в тундре, то это не значит, что мы не имеем представления о ней. Мы видели тундру на фотографиях, в фильмах, а также знакомились с ее описанием в учебнике географии или природоведения и на основе этого материала можем представить образ тундры. Следовательно, представления воображения формируются на основе полученной в прошлом информации, и ее творческой переработки. Чем богаче прошлый опыт, тем ярче и полнее может быть соответствующее представление.

Представления возникают не сами по себе, а в результате нашей практической деятельности. Они имеют огромное значение не только для процессов памяти и воображения, но и для всех психических процессов, обеспечивающих познавательную деятельность человека. Другими словами, процессы восприятия, мышления и письменной речи тесно связаны с представлениями.

Исследование вторичных образов (представлений), - как пишет известный психолог Л.М.Веккер в своей книге “Психика и реальность: единая теория психических процессов”, - сталкивается с существенными трудностями как в исходном пункте анализа – при описании их основных эмпирических характеристик, так и на этапе теоретического поиска закономерностей, определяющих организацию данной категории “первых сигналов”. Эти методические трудности вызваны в первую очередь отсутствием наличного, непосредственно действующего объекта – раздражителя, с которым может быть прямо соотнесено актуальное содержание представления. Помимо того, из-за отсутствия непосредственного воздействия представляемого объекта само представление является трудно поддающейся фиксированию “летучей” структурой. В связи с этим экспериментально-психологическое исследование вторичных образов вопреки его теоретической и прикладной актуальности, несоизмеримо отстает от изучения первичных, сенсорно-перцептивных образов. Здесь очень мало “устоявшегося” эмпирического материала, а имеющиеся данные чрезвычайно фрагментарны и разрознены. Кроме того, одной из важных проблем является определение образа как понятия. До сих пор нет единого определения образа.

По определению А.В.Запорожца, “образы – это субъективные феномены, возникающие в результате предметно – практической, сенсорно – перцептивной и мыслительной деятельности”; образ – это целостное, интегральное отражение действительности, в котором одновременно представлены такие основные перцептивные категории, как пространство, время, движение, цвет, форма…” (1986, с 152).



А.А.Смирнов дает следующее уточнение: “Образ не есть застывшая фотография, в отличие от нее он обычно все время изменяется” (1987, с.25).

При всей широте спектра различных подходов к пониманию образа, его роли и места в ряду других психических явлений в качестве основополагающих для психологии выступают два момента: вторичность образа по отношению к объективной реальности и активность субъекта в процессе формирования образа.

В последнее время в качестве основных характеристик вторичного образа выделяют яркость – четкость и контролируемость. Факторный анализ 36 измерений вторичных образов, проведенный Б.М.Петуховым (1982), выявил существование трех основных характеристик: это живость, яркость, контролируемость. Результаты исследования А.А.Гостева (1987), полученные на материале различных опросников, подтверждают данные Б. М. Петухова.

Яркость – четкость представлений как обобщенная формальная характеристика указывает на степень приближения вторичного образа к результату визуального отображения метрических, модальностных и интенсивностных свойств объекта. Под контролируемостью понимается способность к манипулированию, оперированию представлениями, произвольному их формированию и удержанию в “уме”.

А.А.Гостев ввел понятие “образной способности” (ОС), которую в узком смысле определяет как способность к быстрому формированию адекватных реальности вторичных образов, оперированию ими, а также легкость перехода с одного образа на другой. А.А.Гостев (1989), анализируя индивидуальные особенности представлений испытуемых, выделил пять основных типов, различающихся своеобразием сочетания характеристик яркости – четкости и контролируемости вторичных образов:

1) яркие, четкие контролируемые представления (45%);

2) бледные, смутные контролируемые представления (21%);

3) бледные, смутные не контролируемые представления (22%);

4) яркие, четкие неконтролируемые представления (10%);

5) не визуальные представления в отсутствие визуальной картинки перед “мысленным взором”, т.е. абстрактно – логические представления (2%).

Психолог обнаружил закономерность, проявляющуюся в зависимости процесса формирования пространственного образа по знаковой информации от индивидуальных особенностей: различия в успешности формирования пространственного образа могут быть связаны с обнаруженным индивидуальным стилем визуализации, проявляющимся в способах перекодирования знаковой информации.

Факторный анализ результатов исследований, полученных с помощью разных опросников и тестов, проведенный А.А.Гостевым и Б.М.Петуховым, подтвердил вывод о существовании трех основных факторов как основных характеристик вторичного образа: яркость, контролируемость, живость.

Общий анализ результатов исследований А.А.Гостева показал необходимость рассмотрения сочетаний яркости – четкости и контролируемости представлений применительно к различным аспектам когнитивного (нем. kognitiv – понимать, сознавать) поведения. Максимальную успешность решения задач показывают люди, имеющие тип контролируемых представлений высокой степени яркости – четкости, менее успешными являются люди с типом контролируемых представлений низкой степени яркости – четкости, минимальную успешность показывают люди с типом контролируемых представлений различной степени яркости – четкости и не визуальным типом представлений.

Основное внимание в исследовании И.Н.Натальиной (1992) было уделено изучению связи характеристик вторичных образов со свойствами личности. Психолог исходила из наличия трех общих основных характеристик вторичного образа: подвижности, контролируемости, яркости и пришла к следующим выводам:

· люди, у которых представления яркие, четкие, живые, даже при некоторых затруднениях с их контролируемостью успешнее в формировании пространственного образа по знаковой информации;

· для лиц с высокими значениями фактора “депрессии” характерны низкие показатели яркости – четкости представлений;

· лица с низким уровнем способности к контролю, произвольному оперированию и манипулированию вторичными образами;

· высокому уровню способности к контролю, произвольному оперированию и манипулированию представлениями соответствует высокое значение фактора “пластичности”;

· для лиц с высокими значениями фактора “депрессии” характерны низкие показатели успешности формирования пространственного образа по знаковой информации в условиях динамичности ее предъявления.

Проблема образа принадлежит к числу важнейших проблем психологии. Ее разработка имеет исключительное значение для развития, как общей теории психологии, так и теоретической базы специальных психологических дисциплин. Не менее актуальна она для решения многих практических задач, таких как психологическое обеспечение процессов обучения человека, проектирование его деятельности, согласование технических устройств с характеристиками и возможностями человека.

По словам Р.Хольта (1971), изучение образной среды может помочь найти ключ к сказочной сокровищнице памяти, если мы научимся извлекать пользу из этой незаслуженно забытой способности. И действительно, вернитесь на несколько дней назад. Вполне вероятно, что даже самое обыденное кажется более запоминающимся, чем-то, что не имеет отношения лично к вам или реальной жизни. Конечно, по мере того как вы уходите все глубже в прошлое, дни все больше сливаются, подробности теряются. Но определенные дни, определенные моменты сохраняются в памяти живо и ясно, и почти всегда это те случаи, когда вы были главным действующим лицом или находились в центре внимания.

Мы помним, что происходит в дни рождения, мы вспоминаем отпуск, профессиональные успехи, победы в состязаниях, инциденты. Чем важнее для нас то или иное событие, тем с большей вероятностью мы запоминаем его, и очень часто важность события определяется нашей эмоциональной реакцией на него.

Просмотрев в течение нескольких минут свои самые яркие воспоминания, вы поймете, что в них присутствуют какие-либо из следующих ощущений: радость, страх, замешательство, возбуждение, боль, грусть, разочарование, облегчение. Пережитые в детстве моменты, например, обычно вспомнить гораздо проще, чем-то, что вы ели на завтрак в прошлый четверг.

РИСУНОК 96

Создается впечатление, что память работает на основе личного опыта. И если мы хотим, чтобы наш мозг работал на нас, мы должны учесть эту его природную способность. Но какая от всего этого польза, если надо запоминать что-то сухое, безжизненное – числа, даты, иностранные слова или голые факты? Ответ состоит в том, что с помощью воображения подобные вещи могут стать частью вашей жизни, и поэтому хорошо запомнятся. А “воображение – это процесс преобразования представлений, отражающих реальную действительность, и создание на этой основе новых представлений” (А.Г.Маклаков, 2002 г.). Значит, чтобы запоминать точную информацию, нужно научиться управлять воображением, т.е. произвольно вызывать и изменять нужные представления (вторичные образы). Как протекает процесс создания образов воображения, мы подробнее рассмотрим в 4 этапе алгоритма запоминания точной информации. А сейчас достаточно понять, что “языком мозга” являются образы, т.е. простые зрительные представления. И для того, чтобы “разговаривать с мозгом на его языке” нужно научиться переводить любую точную информацию в образы. Для этого и существует большое количество разнообразных мнемотехнических приемов, с которыми мы подробно познакомимся ниже.

Мыслительную операцию перевода точной информации в образ мы будем называть приемами мнемотехники .

Информатизация - это обеспечение структурированной информацией (знаниями, фактами), имеющей практическое значение при обосновании и решении задач , связанных с определенной деятельностью.  


Информатизация - это увеличение количества структурированной информации в бизнесе, т. е. данных и знаний, имеющих смысл для предпринимательства.  

Принадлежность менеджера к тому или иному типу может накладывать значительные неформальные ограничения на состав и структуру предоставляемых ему учетно-аналитических данных. Так, руководители, склонные к проактивным действиям, достаточно свободно ориентирующиеся в сложных ситуациях, как правило, отличаются хорошей логикой, способностью и стремлением к анализу, поэтому нуждаются в объемной, хорошо структурированной информации. Их не пугают приводимые в отчетах альтернативные варианты действий, применение в аналитических расчетах достаточно сложных алгоритмов и методов.  

Трудно говорить о будущем отчетов о добавленной стоимости в Новой Зеландии (или где-либо еще). Однако в соответствующих социальных и экономических условиях они могут сыграть важную роль в представлении широкой публике дополнительной или по-новому структурированной информации о предприятии. Такие формы занимают свое место и в отчетах для сотрудников, обсуждавшихся выше.  

Более совершенный способ подготовки документов связан с применением персональных электронно-вычислительных машин (ПЭВМ). По некоторым оценкам, в информационном потоке структурированная информация в электронном виде составляет около 10%. Она хранится в базе данных и размещена по полочкам (полям). Доступ к ней осуществляется с помощью ранее рассмотренных приемов, заложенных в системах управления базами данных.  

В переговорах с потенциальными западными партнерами необходимо придерживаться еще одного важного правила -быстро и по существу отвечать на вопросы, обосновывая ответы хорошо продуманной и тщательно подготовленной структурированной информацией.  

Наиболее распространен на практике подход, основанный на жесткой фиксации логической структуры информационного ресурса в соответствии с выбранным порядком критериев структурирования (например, по тематике документов или их источникам). Такая схема работоспособна и эффективна, если состав и порядок критериев структурирования информации потребителями совпадает с составом и упорядочением критериев структурирования, применявшимися на этапе проектирования логической структуры хранилища и его независимых элементов. Практика показывает, что такое соответствие достигается далеко не всегда. Потребность пользователя зачастую состоит в том, чтобы получить информацию из хранилища, интегрированную и структурированную в соответствии с его системой критериев , которая может не совпадать (иногда кардинально) с системой структурирования, использованной при создании информационного ресурса.  

Первый подход состоит в том, что содержание документа, а также его характеристики (дата издания документа, автор и т. п.) отображаются в некую структурированную информацию, представляющую собой, например, запись реляционного файла. В этом случае поиск документа сводится к поиску структурированной информации средствами СУБД (см. предыдущие главы).  

Наличие достаточно полной и должным образом структурированной информации о рисках является основой для выработки эффективных мер по управлению ими. При оценке промышленных рисков соответствующие сведения должны содержаться и в декларации промышленной безопасности, о которой пойдет речь в главе 11.  

Далее происходит структурирование, т.е. внесение в соответствующие форматы (таблицы). На основе этой структурированной информации создается финансовая модель предприятия и прогнозные балансы доходов и расходов, активов и пассивов, поступлений и платежей (рис. 5.1). Полученные балансы и есть база для принятия решений.  

Прежде всего, - это обслуживание процедур принятия решения . Исходную информацию для анализа ситуации и последующего принятия решения в ряде случаев можно найти, только обратившись в соответствующую фирму, которая систематически и профессионально собирает требуемую информацию. Кроме того, информационные фирмы , ориентируясь на современный уровень технологии, поставляют, как правило, структурированную информацию в электронном виде. Это создает предпосылки для своевременного получения актуальной информации и ее последующего локального накопления и электронной обработки.  

Располагающая обширным объемом хорошо структурированной информации, информационная система , безусловно, реализует функции базы знаний в ТУ. Однако для выхода на качественно более высокий уровень организации информационных потоков необходимо выстраивание технологических цепочек работы с информацией, позволяющих, с одной стороны, организовать информационное наполнение ресурсов действительно востребованной информацией, а с другой - как руководителям, так и специалистам выработать и реализовать определенные приемы получения этой информации для обеспечения своей деятельности. Создание таких информационных ресурсов является результатом совместной деятельности подразделений, выпускающих информационный продукт, и подразделений в нем заинтересованных. Целью их создания является выявление типовых повторяющихся запросов на информацию, подготовка ее ответственным подразделением в согласованном формате и ее размещение в определенном месте иерархической структуры в срок до того, когда она должна быть использована заинтересованными подразделениями. В этом случае заинтересованные подразделения получают информацию в нужное им время в информационной системе , не инициируя запросов подготовившем ее подразделению. Как размещение информации, так и ее получение становятся естественным технологическим звеном в процессах завершения работы специалистов одного подразделения (выпускающего данный информационный продукт) и начала работы специалистов других подразделений, для которых данная информация является входной. Затраты времени и на размещение, и на поиск данных минимальны - 1-3 минуты, что позволяет сократить непроизводительные потери рабочего времени, связанные с поиском нужных сведений, в десятки раз. Важным моментом для поддержания высокого уровня востребованности информационного ресурса , обеспечение его надежного функционирования в качестве элемента технологической цепи передачи информации является его актуализация. Это подразумевает не только своевременное обновление данных, но и постоянное выявление как невостребованных материалов, так и новых запросов на информацию с отведением ей соответствующего места в иерархии и выбором оптимальных сроков и форм ее предоставления.  

Традиционное хранилище бумажных документов Неструктурированная информация (файлы) Структурированная информация (базы данных)  

Процесс приспособления форматов и значений данных к нуждам автомата, т. е. устранение произвола в представлении длины и (или) значений, мы можем условно назвать структурированием информации. Другими словами, структурирование - это просто введение каких-то соглашений о способах представления данных.  

Что такое структурирование информации  

Чем принципиально отличается система со структурированной информацией от системы с неструктурированной информацией  

Закон информированности и упорядоченности означает, что любая социальная организация способна к выживанию только в том случае, если она обеспечена полной достоверной и упорядоченной (структурированной) информацией.  

Первым этапом структурирования информации является определение цели отбора информации из общего потока. Выявив цель, производят сбор необходимой информации.  

Третий этап упорядочения или структурирования информации должен обеспечить ее хранение. Этот этап предусматривает также разработку системы признаков, по которым нужная информация может быть найдена. Целесообразно в качестве одного из признаков использовать показатель ценности информации , в этом случае особо ценная информация всегда может быть под рукой. 5 131  

При сборе, обработке и структурировании информации принимаются во внимание следующие характеристики объем , достоверность, ценность, насыщенность и гриф информации (рис. 4.14).  

Б. Наибольшими возможностями устойчивого, поступательного развития обладает организация, обеспеченная полной, достоверной, структурированной информацией.  

Функция обеспечения информацией включает координацию потребности в информации с ее предложением, а также обработку и подготовку оперативных данных. Для этого используются внутренняя информация предприятия, о рынке, факторах окружающей среды . Структурирование информации осуществляется в рамках требований бухгалтерского учета , производственного учета и установленных показателей , а также индексов отчетности. Получен-  

Ключевые решения Цели и задачи. Стратегия диверсификации . Стратегия расширения. Административная стратегия. Финансовая стратегия . Метод роста. Время роста Организация структурирование информации, полномочий и ответственности. Структура потребления ресурсов рабочие потоки, система распределения , расположение помещений и оборудования. Приобретение и развитие ресурсов финансирование, помещения и оборудование, персонал, сырье Оперативные цели и задачи. Уровни цен и выпуска продукции . Оперативные уровни графики производства, уровни запасов, складирование. Маркетинговые мероприятия и стратегия. Исследования и разработки. Контроль  

Характерной особенностью конца семидесятых годов стало существенное расширение понимания ситуационного управления . Фактически ситуационное управление стало рассматриваться с единых позиций семиотического моделирования и управления. Причиной этого послужило бурное развитие в теории искусственного интеллекта той области, которая носит название представление знаний . Ситуационное управление на десяток лет предвосхитило развитие этой области, впервые начав работать со структурированной информацией. В ситуационном управлении были созданы первые модели представления знаний и языков представления и манипулирования знаниями. Поэтому новые веяния в области искусственного интеллекта , активное развитие теории семантических сетей и фреймовых представлений были восприняты коллективами, накопившими большой опыт в области ситуационного управления с ходу, позволили воспринять новые идеи и использовать их в своих разработках. Столь же безболезненно произошел переход к языкам программирования нового типа (ЛИСП и его расширения ФРЛ). В этом плане специалисты, овладевшие принципами ситуационного управления , оказались на передовых рубежах работ в области искусственного интеллекта.  

Чем больше и более структурированной информации дать венчурному инвестору, тем больше шансов получить от него необходимые фонды.  

Чем сильнее информационная нагрузка, тем выше ценность грамотно структурированной информации разного рода справочников (рекламных, телефонных, товарных, отраслевых), словарей, энциклопедий, рубрикаторов и каталогов и т. п. Сама же реклама, включенная в некую структуру, будет эффективнее той, которая выпадает из структурного контекста. И рекламу кирпичей будут искать в рубрике строительных материалов, а рекламу рыбы - в продуктах моря. Так работает наш мозг.  

В отличие от предыдущих, уже по названию разделов Анкеты мебельного торгового дома (примечательно, что она едина для всех предприятий Баварии, торгующих мебелью) (приложение 11) достаточно хорошо прослеживается намерение ее авторов оценить претендента как торгового работника . Сохраняя в анкете заинтересованность в ознакомлении с подробными семейно-личностными обстоятельствами претендента, справляясь о военных ранениях и судимостях, а также характере жилья, работники кадровой службы запрашивают объемную профильно-структурированную информацию о его образовании. Для этого в анкете выделены как самостоятельные разделы Учеба в школе, который, являясь традиционным, вместе с тем среди другого предусматривает необходимость оговорить возможный факт обучения в торговой школе (п. 2а), Торгово-коммерческое обучение и Выпускные экзамены. То есть, предполагая сбор данных об этапах получения необходимых знаний и навыков по конкретному профилю, Торговый дом справляется и о результатах, показанных кандидатом при имевших место испытаниях, а затем (что тоже традиционно) сопоставляет полученную информацию с реалиями практической деятельности кандидата, выясняя, где и в качестве кого он был занят.  

Имея много общего с вопросами собеседования, биографическое анкетирование тем не менее от этого метода отличается. По Ришару, различия состоят в том, что собранные данные можно оценить статистически, для претендента есть возможность избежать антипатий со стороны интервьюера, негативная реакция не может быть переоцененной. По Шанцу, путем структурирования информации в анкетах можно избежать возникающих в интервью помех для объективной оценки кандидата.  

Например, авиадиспетчер видит мир сквозь экран радара, через это информационное окно с делениями он получает нужным образом структурированную информацию для принятия решений.  

В условиях современного Интернета проблема поиска информации о товаре, который хочет приобрести покупатель, решается, в основном, с будут становиться все более и более персонализированными. Уже сейчас любая компания-производитель получает огромный поток плохо структурированной информации о своих покупателях, которую просто не в силах правильно организовать и обработать. В партнерстве с другими компаниями, осуществляющими обслуживание этих потребителей (магазинами, банками, сервисными центрами и т.д.), компании в состоянии собрать всю необходимую информацию для того, чтобы получить полное представление о возможностях и потенциале потребителя и оптимальным образом стимулировать его к совершению покупки.  

Для облегчения доступа к подобной структурированной информации на Web-сайтах размещают списки часто задаваемых вопросов - ЧАВО и организуют навигацию таким образом, чтобы следовать логике пользователя, зашедшего на сайт.  

В дополнение к прямой и инвертированной схемам в ИПС используется атрибутный индекс. Он позволяет хранить данные о документе, не содержащиеся непосредственно в его тексте, например, имя автора, дату создания , наименование темы и другие фактические данные. Данные могут автоматически извлекаться из документа либо вноситься вручную при вводе документа в систему. Структура атрибутного индекса соответствует стандарту представления структурированной информации, т. е. это таблица с заранее заданными полями. На рис. 20.3 представлен пример организации поискового файла - атрибутного индекса, в котором все документы характеризуются одним и тем же набором реквизитов-полей автор документа, виддокумента и его номер, дата издания, название. Поиск по атрибутному индексу осуществляется средствами обработки запросов СУБД - выдаются только те документы, значения атрибутов которых удовлетворяют условиям запроса.  

Отсюда ясно, что описанные выше текстовые файлы (и документы Word) содержат неструктурированную или в лучшем случае плохо структурированную информацию, не пригодную для эффективной обработки автоматом.  

Чем сильнее информационная нагрузка, тем выше ценность грамотно структурированной информации разного рода справочников (рекламных, телефонных, товарных, отраслевых), словарей, энциклопедий, рубрикаторов, каталогов и т. д. Все, что способно облегчить работу мозгу, воспринимается как сверхценное (поэтому так соблазнительны обещания о научении с помощью 25-го кадра, о скорочтении и т. п.).  

Не стоит думать, что самообслуживание через Интернет эффективно только для поиска специализированной информации, такой, например, как статус прохождения посылки. Большие объемы структурированной информации (инструкции, правила, списки выбора) проще воспринимаются при чтении, нежели на слух. Попробуйте выбрать кинотеатр на вечер (нужный фильм, сеанс, близость к дому), пользуясь только телефонными автоинформаторами, - это займет в лучшем случае час. Та же операция через Web-сайт займет пару минут.  

Многообразие методов структурирования информации обусловлено тем, что способов ее представления и организации существует масса, да и информация, сама по себе, бывает весьма различного свойства. Например, весьма существенно то, какие средства отображения/каналы восприятия задействуются при выводе/вводе данных, потенциально содержащих информацию, каков исходный уровень организации этих данных, относятся ли они к разряду числовых, текстовых, графических, видео, аудио и т. д. Очень важную роль играют те цели, которые преследуются при выполнении процедуры структурирования данных (информации).

Краткое отступление: ранее мы уже указывали на различие между данными и информацией, говоря о том, что понятие «данные» связано с представлением информации на материальных носителях, а также о том, что данные для конкретного потребителя могут вообще не содержать информации, поскольку информация - это те новые знания, которые приобретает получатель данных. Здесь мы считаем нелишним напомнить об этом и, по привычке оперируя словом «информация», будем подразумевать, что структурируем мы все-таки данные (хотя в голове мы можем структурировать и информацию, пытаясь мысленно систематизировать, упорядочить имеющиеся знания).

Для начала введем классификацию целей структурирования информации . Здесь могут быть выделены следующие классы целей:

    получение качественно нового знания о системе/процессе;

    установление факта и локализация неполноты и/или противоречивости совокупности знаний;

    систематизация, упорядочение некоторой совокупности знаний;

    акцентирование или выделение одного или нескольких аспектов информации (например, временного, пространственного, функционального и т. д.);

    сокращение избыточности представления информации;

    согласование представления информации с некоторой системой обработки и интерпретации;

    повышение наглядности отображения информации;

    смена уровня общности/абстракции описаний.

В зависимости от класса цели меняются методы и технологии структурирования информации. Но мы уже указывали на то, что цель - это не единственный фактор, определяющий выбор метода структурирования информации. По этой причине необходимо рассмотреть виды информации, подлежащей структурированию, а также способы ее представления.

Введем классификацию видов информации по ее сущности/содержанию и способу ее использования:

    информация о ценностях и целях (информация целеполагания), используемая при планировании/прогнозировании;

    информация о функциях системы/процесса;

    информация о структуре системы/процесса;

    информация о динамике системы/процесса;

    информация о состоянии системы/процесса;

    информация о задачах системы/процесса.

В приведенной классификации виды информации размещены в порядке убывания периода стабильности/актуальности. Однако два класса информации, описывающей ценности, цели и задачи, являются относительно независимыми от состояния, динамики, структуры и функций системы/процесса, поскольку связаны с реализацией функции целеполагания. Впрочем, можно считать, что решение об использовании именно такой схемы размещения этих классов информации вполне обоснованно, поскольку позволяет решать многие прикладные задачи.

Кроме всего прочего, следует учитывать еще и такие классификационные признаки, как:

    отношение информации к объекту:

    информация, относящаяся к объекту;

    информация, относящаяся к классу объектов;

    информация, относящаяся к среде;

    отношение информации к некоторому моменту времени:

    информация, относящаяся к прошлому;

    информация, относящаяся к настоящему;

    информация, относящаяся к будущему;

    отношение информации к классу структурной организации:

    информация неструктурированная;

    информация структурированная;

    информация упорядоченная;

    информация формализованная.

Теперь, после того как мы определились с тем, что же, собственно, нам предстоит структурировать, можно перейти к рассмотрению методов структуризации .

Можно ли сказать, что структуризация информации/данных - это нечто новое или незнакомое нам? - Конечно, нет. Собственно, все те действия, которые мы проделывали в начале этого подраздела, представляли собой одну из множества ипостасей процесса структуризации информации. В нашем случае мы занимались структурированием знаний - мы решали задачу изменения уровня организации знаний, пытаясь построить компактную систему знаний, которая могла бы выступать в качестве основы для дальнейшего развития теории (американцам очень нравится слово «скелет/skeleton», которым они пользуются в таких случаях).

Следует признать, что у американцев язык науки гораздо более метафоричен, нежели чем у нас, а ведь метафора, как мы указывали, - это ступень к новому знанию. Если мы знаем, с чем можно сравнить нечто, то вполне вероятно, что на это нечто могут быть перенесена некоторая часть наших знаний об объекте, с которым мы сравниваем это нечто. Наш «великий и могучий русский язык» гораздо более академичен, а процесс словообразования достаточно сложен и не всегда приводит к желаемому результату (закреплению нового, более «экономного» слова). Это довольно грустно, поскольку одним из первых признаков научного и культурного застоя является прекращение словотворчества и преобладание процесса приращения словаря за счет иноязычных заимствований. Надо сказать, что даже предмет национальной «гордости» россиян - русский мат - по запасу ругательных слов, оказывается, уступает большинству языков мира. Зато мы чаще пользуемся этими словами - запальчиво возразит «патриот»... что ж, возможно, но это тоже аргумент не в нашу пользу.

Итак, зачем мы так старательно расклассифицировали цели структурирования информации? Да затем, чтобы создать тот самый скелет, который нам предстоит в дальнейшем оснастить «сухожилиями», «мышцами» и обтянуть «кожей» - то есть дополнить более конкретными знаниями. Что ж, скелет мы уже смастерили - пора приступать к следующему этапу.

В основе большинства процедур структурирования лежит метод классификации. Классификация - это иерархически организованная система информационных элементов, обозначающих объекты/процессы реального мира и упорядоченных по признаку сходства/различия классификационных признаков, отражающих избранные свойства объектов . Как правило, процедура классификации (классифицирование) осуществляется для удобства исследования некоторой предметной области (фрагмента реального мира). Принято различать следующие виды классификации:

    искусственную, осуществляемую по внешним признакам, не выражающим сущности объектов/процессов, и служащую для упорядочения некоторого их множества;

    натуральную (естественную), осуществляемую по существенным признакам, характеризующим внутреннюю (сущностную) общность объектов/процессов.

Натуральная классификация является инструментом и результатом научного исследования, поскольку выражает результаты изучения закономерностей классифицируемых объектов/процессов. В то время как искусственная классификация обладает исключительно прикладной ценностью в рамках решения конкретной задачи. Например, спелое/неспелое яблоко - натуральная классификация, красное/зеленое яблоко - искусственная.

От качества выполнения процедуры классификации на ранних этапах исследований сложных систем (да и не только сложных) зависит результативность и качество всей работы. Поэтому при осуществлении процедуры классификации необходимо придерживаться следующих принципов :

    при выполнении каждой операции разделения на классы (акт деления) допускается применение только одного классификационного основания;

    совокупный объем полученных в результате разделения на классы понятий должен равняться объему делимого понятия;

    понятия, полученные в результате деления должны взаимно исключать друг друга;

    деление должно быть последовательным.

Классификации делятся на следующие виды:

    простые (одноуровневые), например - дихотомия, когда одно понятие верхнего уровня (А) делится на два таких (В и С), что для них выполняются условия А = В + С и В = не С (С = не В);

    сложные (многомерные) обычно, представляемые в виде таблиц сложной организации, где строкам и столбцам соответствуют различные классификационные признаки, например - периодическая таблица химических элементов Д.И. Менделеева;

    иерархическая (древовидная), едва ли нуждающаяся в примерах и пояснениях.

Метод классификации в том или ином виде используется при решении самых разнообразных задач, связанных со структурированием информации. Неорганизованные информационные элементы подвергаются процедурам группирования, связывания, обобщения, в результате чего структура или проявляется (при натуральной классификации), или образуется (при искусственной классификации). В книге В.Ф. Турчина «Феномен науки: Кибернетический подход к эволюции» 71 момент смены уровня организации системы именуется метасистемным переходом (возникновения системы более высокого уровня иерархии), который и рассматривается как эволюционный процесс. Соответственно, процессы синтеза новой классификации и структурирования информации можно рассматривать, как процесс эволюции знаний . Это не означает, что в результате выполнения процедур классификации или структурирования появляется новое знание, но означает, что в результате выполнения этих процедур создается новая система управления знаниями , существенно упрощающая различные манипуляции с ними, в том числе - и поиск ранее не выявленных закономерностей и законов.

Заметим, что процедура классификации не имеет собственной ценности и приобретает ее только, если она способствует достижению некоторого комплекса целей. Созданная в результате выполнения классификационной процедуры система управления знаниями должна быть полезной - что означает, что выбор классификационных критериев не может быть произвольным, а должен осуществляться с учетом решаемой задачи. Они должны отвечать целям деятельности. При этом следует различать два вида/аспекта деятельности :

    деятельность, направленную на достижение конечной (генеральной или глобальной) цели;

    деятельность, направленную на решение задач обеспечения этой деятельности.

К последней категории может быть отнесена деятельность, направленная на решение задач построения адекватной модели предметной области, ее тезауруса, создания инструментальных средств, используемых для достижения конечной цели.

При структурировании информации должна учитываться специфика потребителя полученного информационного продукта . Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.

Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).

В зависимости от исходного уровня структурной организации обрабатываемых данных, могут быть выделены следующие классы задач (классы задач по уровню структурной организации информации на входе/выходе ):

    Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

    Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

    Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

    Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

    Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня) . В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию равносильные перечисленным .

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования , воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

    осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

    интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней (чаще всего - экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики, теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации. Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило 72 , эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом (George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта ).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства» . Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности - тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения 73 . В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича 74 , написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных - это тоже модели , описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации - от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации. Стратегия опроса экспертов (в том числе - проведения мозговых атак или деловых игр) может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

В одном случае (при анкетировании и управлении процедурой опроса или стратегией игры) информация извлекается в соответствии с заранее установленной рубрикацией. В другом случае (при оценивании вариантов) структура организации информации не изменяется и остается в рамках заранее установленной формы любого уровня структурной организации. В частности, варианты, предложенные для оценивания, могут быть сформулированы на основе исследований, предварительно проведенных на имитационных моделях, или полученных в результате собеседования с другими группами или с той же группой экспертов.

Для выделения логической структуры описаний, предварительно разделенных на рубрики (относящиеся к одним и тем же группам объектов, процессам, временным и пространственным областям) применяются различные методы, обеспечивающие возможности:

    выделения «дискретных» состояний (для текстовых описаний - это связано с определением множества терминов, используемых для описания некоторого, существенного для решаемой задачи, состояния);

    упорядочивания их во времени (построение сценариев типа «раньше - позже»);

    причинно-следственного связывания (построение сценариев типа «причина - следствие»);

    пространственного связывания и иные.

На следующем этапе в зависимости от целей деятельности подобные модели могут быть подвергнуты процедуре декомпозиции (детализации) или агрегации (композиции или свертке), в результате чего формируется описание необходимого уровня абстракции/детализации.

Дальнейшие этапы выполняются за счет введения специальных систем именования элементов модели, приписывания им поименованных атрибутов, описания функциональных зависимостей и так далее. Например, в качестве функциональных зависимостей для ряда задач могут быть рассмотрены зависимости ресурс-время-результат и иные, которые на начальных этапах могут быть использованы для маркирования дуг графа, а впоследствии - воплощены в программные коды имитационных моделей. Особый класс составляют модели ситуаций, используемые для распознавания объектов, их состояний, тенденций и процессов. В таких моделях может абсолютизироваться либо статический, либо динамический аспект существования/функционирования системы. Однако подробно рассматривать эти процедуры мы здесь не будем, тем более, что некоторые аспекты этой деятельности нами уже были описаны при рассмотрении соответствующих классов моделей.

МЕТОДЫ ПОЭТАПНОЙ СТРУКТУРИЗАЦИИ ЗАДАЧ И ГРУППА МОРФОЛОГИЧЕСКИХ МЕТОДОВ

Особый класс задач структурирования информации представляют собой задачи структурирования целей и задач в условиях, характеризующихся различным уровнем неопределенности. Для их решения существует ряд методов, к числу которых относятся методы поэтапной структуризации задач и группа морфологических методов . Оба класса методов адаптированы к применению в условиях высокой неопределенности. Но те способы, какими решается задача устранения неопределенности, различаются коренным образом: первая группа методов ориентирована на управление процессом постепенного снижения неопределенности, а вторая - на решение задачи синтеза модели за одну итерацию (но в результате может быть получен целый массив альтернативных моделей). Характерно, что при использовании морфологического метода уровень неопределенности может сохраниться прежним, а исходная неопределенность будет перенесена на другой уровень формального описания (хотя, благодаря переходу к формальному представлению, решение задачи понижения неопределенности в некоторых случаях удается поручить средствам автоматизации).

Однако на этом различия не кончаются. Уровень формализации первичной модели, с которой начинается работа каждого их классов методов, также является индивидуальным для разных групп методов. Для методов поэтапной структуризации этот уровень может быть произвольным, а для морфологических методов необходимо, чтобы детальная декомпозиция предметной области уже была произведена и были сгенерированы матричные модели специального строения. И, наконец, последнее различие: метод поэтапной формализации - это метод поэтапного приближения к формальной модели или этапу логически обоснованного выбора решения, а морфологический метод - это метод синтеза альтернатив, подлежащих анализу и оценке. То есть первая группа методов связана с процедурами логического вывода решения, а вторая - с комбинаторным анализом, процедурами перебора решений, в общем случае, полученных без логического вывода.

Методы поэтапной структуризации задач нацелены на проведение процедуры постепенного повышения уровня абстракции и структурной организации описаний (моделей) . Этот класс методов широко распространен при решении задач различного типа (от синтеза формальной модели до синтеза прогноза). Существует два толкования термина «поэтапная структуризация задачи» . В первом случае под задачей понимается задача синтеза модели, и внимание концентрируется на обеспечении и планировании процесса синтеза модели и схемы проведения исследования. В другом случае под задачей понимается некоторая цель управленческой деятельности (в этом случае речь идет именно о процессе структурирования совокупности задач, подлежащих решению в интересах достижения цели, то есть о цели, как объекте формализации).

Поскольку проблему структурирования информации мы достаточно детально рассмотрели, постольку основное внимание сконцентрируем именно на проблеме синтеза и структуризации некоторой совокупности целей и задач.

Особо актуальны эти методы при проведении комплексных междисциплинарных исследований и проведении работ по синтезу планов и прогнозов. К числу этих методов могут быть причислены методы планирования экспериментов и иные методы, имеющие другую отраслевую специфику (например, методы планирования пропагандистских кампаний и т. п.). Еще раз подчеркнем: это не какие-то теоретические абстракции, а методы ведения самых разнообразных, и, прежде всего, прикладных исследований, методы, актуальные в самых разных отраслях деятельности человека.

Процесс поэтапной структуризации задач можно сравнить с кропотливым процессом выращивания фруктового дерева - только в нашем случае дерево вырастает необычное - дерево целей и задач. Это дерево растет кроной вниз - корень (глобальная цель) размещается вверху, а ветви, отображающие различные связи с подчиненными задачами, функциями и т. д., растут вниз.

Действительно, процесс этот весьма сложен и состоит из многих этапов, из которых первым и наиважнейшим является выбор корректной формулировки глобальной цели . Впрочем, и все дальнейшие процедуры, связанные с построением дерева целей не менее ответственны, но глобальная цель задает направление всей дальнейшей деятельности, а значит, ее выбор и ясность формулировки определяют успех не только процедуры синтеза дерева целей и задач, но и всей последующей деятельности.

Перечислим наиболее существенные требования, предъявляемые к получаемой в результате работы древовидной иерархической модели. К числу этих требований относятся:

    полнота и достаточность для описания основных критериев принятия решения;

    компактность (минимальный уровень декомпозиции при заданной полноте);

    конкретная цель, функция, задача или объект, расположенные в узлах модели, должна появляться в дереве только один раз;

    лицо, принимающее решение, должно быть в состоянии представлять и анализировать отдельные ветви дерева независимо.

Причины, по которым выдвинуты такие требования, очевидны: наличие дублирования модельных элементов препятствует однозначной интерпретации и способно привести к некорректному установлению количества потребных ресурсов и иным нежелательным последствиям. По своей идеологии модели типа деревьев целей и задач наследуют свойства классификаций, стратифицированных моделей и моделей иерархических систем.

Существует несколько подходов к построению дерева целей и задач или, как его часто называют в отечественной литературе, прогнозного графа . Одна часть подходов рассчитана на краткосрочную перспективу , то есть, разработчики исходят из предположения, что за период реализации замысла окружающая обстановка не претерпит существенных изменений, либо эти изменения не затронут основных тенденций развития обстановки. Другая часть адаптирована к решению задач стратегического планирования , для которого интервал времени реализации замыслов существенно превышает интервал сохранения стабильной обстановки, а сохранение тенденций изменения обстановки не может быть гарантировано.

Кроме того, многое зависит от «направления» конструирования дерева (оно может строиться сверху вниз, снизу вверх, существует также и метод встречного проектирования) . В первом случае от глобальной цели вниз начинает последовательно развертываться древовидная структура, в которой с переходом от уровня к уровню поэтапно снижается неопределенность функционального, операционного и иных видов, в результате чего на самом нижнем уровне могут быть сформулированы конкретные требования к составу и количеству ресурсов, инструментальных средств и методик. Во втором случае речь идет о том, что состав ресурсов, инструментальных средств и методик не подлежит коррекции, а дерево выстраивается снизу вверх с соблюдением введенных в качестве критериев приемлемости решений базовых ценностей. Для второго подхода характерно, что цель существует как некий идеал, а структура подзадач, задач и функций, а также методы их решения примерно установлены и могут претерпевать изменения в некоторых, достаточно жестко заданных, рамках. Строгие количественные критерии на начальном этапе, как правило, не заданы: числа появляются как результат постепенного подъема по иерархии, а наибольшая неопределенность существует именно на верхнем уровне (как оценка степени близости к поставленной цели). Такой подход был характерен для осуществления планирования в СССР - он однозначно «экологичнее» рыночного и исключает кризисы перепроизводства, но мало способствует совершенствованию системы (она просто настраивается). Метод встречного проектирования пригоден для решения задач, связанных с разрешением ситуаций, вызванных изменением внешней ситуации, когда реконструкции (реинжинирингу) подлежит средний слой иерархии (то, что в народе принято называть «сведением концов с концами»).

Остановимся на подходе к построению дерева целей и задач, рассчитанных на краткосрочную перспективу. В этом случае условия полагаются известными, в результате чего глобальная цель подлежит декомпозиции на совокупность функций, задач и подзадач без учета многообразия вариантов обстановки, в которой они будут решаться. Для оценивания того, решена ли та или иная задача (подзадача) определяется перечень свойств, которыми должны обладать те материальные объекты, посредством которых может быть получено решение задачи, а также вводятся мера качества решения задачи (например, стоимостная эффективность) и функция оценивания (вычисления меры качества). Далее определяются потребности в ресурсах, инструментальных средствах и методиках, обеспечивающих решение поставленных задач. В условиях действия системы ограничений и на случай непредвиденного перерасхода ресурсов в подобную модель вводятся весовые коэффициенты, отражающие систему приоритетов и соответствующие системе ценностей субъекта целеполагания.

В случае, когда синтезируется дерево целей и задач на период, превышающий период параметрической, структурной и функциональной стабильности системы, прибегают к приемам стратегического планирования . Отличием такого подхода является то, что этапу синтеза дерева целей и задач предшествует этап построения пространства альтернатив - то есть, пространства в котором некоторая группа избранных параметров образует «систему координат», определяющую топологию системы, функции и состояние ее элементов в некоторый момент времени. Достоинством такого подхода является то, что в такой системе координат могут быть выбраны экстремальные точки, в которые система может перейти в случае развития тех или иных тенденций - для таких точек с необходимой степенью детализации прописываются параметры системы, обеспечивающие разработчиков модели достаточной для синтеза дерева целей и задач информацией. Для каждой из точек (альтернативных миров) выстраивается адекватная конфигурация дерева (по схеме, аналогичной той, которая используется при синтезе дерева целей и задач, рассчитанных на краткосрочную перспективу). После этого предпринимается попытка сведения полученных деревьев к единой конфигурации, для каждого из узлов и операций оцениваются риски, как вероятность скатывания к негативным сценариям развития ситуации, а также назначаются веса элементов дерева, отражающие степень их важности для достижения поставленной глобальной цели.

Рисунок 2.6 - Фрагмент реального дерева целей и задач с весами, проставленными в результате экспертного опроса 75 .

На рис. 2.6 приведен фрагмент дерева целей и задач, на котором проставлены веса относительной важности достижения целей. Заметим, что сумма весов целей одного уровня иерархии равна 1 (в случаях же, когда веса выставляются в процентной мере, сумма будет равна 100 %). В нашем примере, где числа представлены в виде десятичных дробей, очевидна вероятностная природа оценок. Веса могут быть как вычислены аналитически, так и получены в ходе экспертного опроса.

Чаще всего на этапе расстановки весовых коэффициентов прибегают к методам экспертной оценки, в том числе - с применением метода Дельфи. Заметим, что изначально метод Дельфи применялся именно для определения приоритетов, то есть, для расстановки весовых коэффициентов. Причем такой подход в равной степени применим как в отношении краткосрочных задач, так и в отношении задач перспективного планирования.

При синтезе дерева целей и задач методом встречного проектирования процедура состоит в согласовании верхнего и нижнего уровней иерархии целей, для чего рассматриваются варианты согласования целей и задач, перераспределения ресурсов и инструментов между субъектами деятельности. Этот подход представляет собой, пожалуй, наиболее интересный вариант решения проблем в сфере, связанной с решением социальных проблем, организацией коллективной деятельности в интересах достижения корпоративной цели. Здесь целесообразно рассматривать различные подходы к социализации целей (их доведения до прочих субъектов деятельности), созданию коалиций, выделению корпоративного ресурса, созданию организационного ресурса и иные аспекты управленческой деятельности. Кроме того, эти методы могут использоваться и в сфере проектирования сложных технических комплексов, информационных систем и иных систем искусственного происхождения.

Основной задачей такой деятельности является гармонизация отношений, повышение эффективности процессов потребления ресурсов, оптимизация информационных процессов и материально-преобразовательной деятельности в целом. При использовании этих методов основными объектами исследования являются цели и мотивы деятельности отдельных субъектов, их групп и объединений, а также ресурсы, связанные с ними. Отраслью применения метода встречного проектирования являются управление социальными, организационно-техническими, экономическими и иными системами, включающими в себя элементы, наделенные способностью к целеполаганию.

Все перечисленные методы чрезвычайно интересны, однако их подробное рассмотрение в рамках этого раздела не представляется возможным. Тем не менее, к этой проблеме в рамках нашего повествования мы еще вернемся.

Морфологические методы представляют собой особый класс методов решения сложных проблем в условиях высокой неопределенности. Даже те вводные замечания, которые мы дали, характеризуя эту группу методов, говорят об их специфичности.

Сразу оговоримся, что морфологический анализ, который мы упоминали в подразделе, посвященном теоретическим основам системного анализа, не имеет почти ничего общего с тем, что нам предстоит рассматривать здесь. Когда мы говорили о морфологическом анализе, то речь шла о возможности выведения многих свойств системы из ее структуры и возможности обратной процедуры, понимая под структурой системы описание системы отношений между элементами, выполняющими сходные функции, системы управления ими - то есть, осуществляли агрегацию или декомпозицию с тем, чтобы вывести из полученной модели свойства системы. На уровне определения отделить морфологический анализ от морфологических методов сложно, поскольку в основе лежат методы исследования структуры и топологии, но различие в другом - в уровне неопределенности и способе ее проявления.

В случае морфологического анализа типовые вопросы к аналитикам звучат так:

    «Ребята, вот, смотрите какую штуку я вам приволок! Интересно, что там внутри? Но только, чур, не разбирать - у меня одна такая!»

    «Тут нашим удалось вот такую схему добыть... Мне сказали, что вы с похожими уже работали. Что бы это могло быть?»

В случае же с морфологическими методами вопросы иные:

    «На месте аварии этой штуки мы обнаружили вот такие обломки... Соберете что-нибудь, способное передвигаться под водой, по воде, над водой и по земле - озолочу!»

    «Председатель сказал, чтоб к завтрему была косилка. Я тут приволок, что в гараже валялось... Сможете?»

Как видим, морфологические методы - это совсем иное: с их применением решается задача синтеза системы с заданными свойствами, но обладающей неизвестной структурой и/или составом. В качестве элементов такой системы могут выступать объекты различной природы: от материальных объектов различной сложности до идеальных (модельных) объектов типа сценариев, целей и задач.

Сущность морфологических методов - в использовании комбинаторного анализа для синтеза сложных систем с заданными свойствами в условиях существования ограничений (объективных и/или субъективных) на сочетаемость элементов, входящих в некоторое базовое множество. В классической форме метод был предложен швейцарским астрономом Ф. Цвикки и состоял в реализации следующей совокупности этапов:

    Описание желаемых функциональных свойств системы;

    Составление исчерпывающего перечня основных функций системы;

    Составление перечня альтернативных способов реализации каждой функции;

    Генерирование множества возможных вариантов реализации системы, каждый из которых представляет собой цепочку, включающую по одному способу реализации каждой из перечисленных функций;

    Оценивание рисков и эффективности вариантов;

    Выбор предпочтительного варианта.

После того, как перечень основных функций составлен, для синтеза вариантов их реализации составляется морфологическая таблица, содержащая перечень альтернативных способов реализации каждой функции. Далее наступает очередь проблемы в целом, для которой также выстраивается морфологическая таблица.

В чем смысл морфологической таблицы? Смысл в том, что данная таблица в наглядной форме отображает все возможные варианты решения проблемы, для чего в каждой строке помещается вариант решения проблемы, хотя бы в одной из деталей реализации отличающийся от прочих, а в столбцах же содержится полное множество вариантов реализации каждой из функций. Это похоже на полный перечень комбинаций, набор которых возможен на дисковом кодовом замке, с тем лишь отличием, что количество щелчков-вариантов для каждого колесика может быть своим.

Общее число теоретически возможных вариантов в этом случае равно произведению числа способов реализации отдельных функций, что уже при сравнительно небольшом количестве функций и вариантов их реализации может приводить к «комбинаторному взрыву» (операция умножения коварна - вариантов может быть получено столько, что их анализ в рамках имеющихся временных ограничений не представится возможным). Во избежание этого в алгоритмах анализа предусматривается возможность введения ограничений на использование запрещенных (непродуктивных) комбинаций элементов.

В принципе, уровень детализации описаний определяется спецификой проблемы: в одних случаях функции подвергаются дальнейшему дроблению на элементарные операции, характеризующиеся набором вариантов их реализации, в других - довольствуются меньшей степенью детализации. То есть, метод может оперировать с описаниями различной степени «прорисовки» деталей, но при этом следует помнить о проблеме размерности.

Позже Ф. Цвикки существенно расширил арсенал методов морфологического анализа, дополнив его следующими методами:

    методом систематического покрытия поля;

    методом отрицания и конструирования;

    методом морфологического ящика;

    методом экстремальных ситуаций;

    методом сопоставления совершенного с дефектным;

    методом обобщения.

Каждый из методов имеет свою область применения, однако в их основе - все те же процедуры, обеспечивающие максимально полное привлечение знаний о системе для синтеза нового знания путем структурирования и упорядочения имеющихся. Весьма широко применяется метод отрицания и конструирования, позволяющий, в том числе, проверить полноту заполнения морфологической таблицы (ящика) на предмет наличия в ней как утверждения, так и его отрицания (в противном случае таблица не полна, хотя это и не всегда необходимо). Метод отрицания и конструирования исходит из предположения, что не все ограничения, используемые в некоторой предметной области, являются универсальными или обоснованными.

Морфологические методы получили широкое распространение в области изобретательской и рационализаторской деятельности и легли в основу ТРИЗ (теории рационализаторской и изобретательской деятельности) и АРИЗ (теории алгоритмизации рационализаторской и изобретательской деятельности). А подходы последних были распространены на многие отрасли, связанные с творческой деятельностью.

Многообразие методов структурирования информации обусловлено тем, что способов ее представления и организации существует масса, да и информация, сама по себе, бывает весьма различного свойства. Например, весьма существенно то, какие средства отображения/каналы восприятия задействуются при выводе/вводе данных, потенциально содержащих информацию, каков исходный уровень организации этих данных, относятся ли они к разряду числовых, текстовых, графических, видео, аудио и т. д. Очень важную роль играют те цели, которые преследуются при выполнении процедуры структурирования данных (информации).

Краткое отступление: ранее мы уже указывали на различие между данными и информацией, говоря о том, что понятие «данные» связано с представлением информации на материальных носителях, а также о том, что данные для конкретного потребителя могут вообще не содержать информации, поскольку информация - это те новые знания, которые приобретает получатель данных. Здесь мы считаем нелишним напомнить об этом и, по привычке оперируя словом «информация», будем подразумевать, что структурируем мы все-таки данные (хотя в голове мы можем структурировать и информацию, пытаясь мысленно систематизировать, упорядочить имеющиеся знания).

Для начала введем классификацию целей структурирования информации . Здесь могут быть выделены следующие классы целей:

Получение качественно нового знания о системе/процессе;

Установление факта и локализация неполноты и/или противоречивости совокупности знаний;

Систематизация, упорядочение некоторой совокупности знаний;

Акцентирование или выделение одного или нескольких аспектов информации (например, временного, пространственного, функционального и т. д.);

Сокращение избыточности представления информации;

Согласование представления информации с некоторой системой обработки и интерпретации;

Повышение наглядности отображения информации;

Смена уровня общности/абстракции описаний.

В зависимости от класса цели меняются методы и технологии структурирования информации. Но мы уже указывали на то, что цель - это не единственный фактор, определяющий выбор метода структурирования информации. По этой причине необходимо рассмотреть виды информации, подлежащей структурированию, а также способы ее представления.



Введем классификацию видов информации по ее сущности/содержанию и способу ее использования:

Информация о ценностях и целях (информация целеполагания), используемая при планировании/прогнозировании;

Информация о функциях системы/процесса;

Информация о структуре системы/процесса;

Информация о динамике системы/процесса;

Информация о состоянии системы/процесса;

Информация о задачах системы/процесса.

В приведенной классификации виды информации размещены в порядке убывания периода стабильности/актуальности. Однако два класса информации, описывающей ценности, цели и задачи, являются относительно независимыми от состояния, динамики, структуры и функций системы/процесса, поскольку связаны с реализацией функции целеполагания. Впрочем, можно считать, что решение об использовании именно такой схемы размещения этих классов информации вполне обоснованно, поскольку позволяет решать многие прикладные задачи.

Кроме всего прочего, следует учитывать еще и такие классификационные признаки, как:

- отношение информации к объекту:

Информация, относящаяся к объекту;

Информация, относящаяся к классу объектов;

Информация, относящаяся к среде;

- отношение информации к некоторому моменту времени:

Информация, относящаяся к прошлому;

Информация, относящаяся к настоящему;

Информация, относящаяся к будущему;

- отношение информации к классу структурной организации:

Информация неструктурированная;

Информация структурированная;

Информация упорядоченная;

Информация формализованная.

Теперь, после того как мы определились с тем, что же, собственно, нам предстоит структурировать, можно перейти к рассмотрению методов структуризации .

Можно ли сказать, что структуризация информации/данных - это нечто новое или незнакомое нам? - Конечно, нет. Собственно, все те действия, которые мы проделывали в начале этого подраздела, представляли собой одну из множества ипостасей процесса структуризации информации. В нашем случае мы занимались структурированием знаний - мы решали задачу изменения уровня организации знаний, пытаясь построить компактную систему знаний, которая могла бы выступать в качестве основы для дальнейшего развития теории (американцам очень нравится слово «скелет/skeleton», которым они пользуются в таких случаях).

Следует признать, что у американцев язык науки гораздо более метафоричен, нежели чем у нас, а ведь метафора, как мы указывали, - это ступень к новому знанию. Если мы знаем, с чем можно сравнить нечто, то вполне вероятно, что на это нечто могут быть перенесена некоторая часть наших знаний об объекте, с которым мы сравниваем это нечто. Наш «великий и могучий русский язык» гораздо более академичен, а процесс словообразования достаточно сложен и не всегда приводит к желаемому результату (закреплению нового, более «экономного» слова). Это довольно грустно, поскольку одним из первых признаков научного и культурного застоя является прекращение словотворчества и преобладание процесса приращения словаря за счет иноязычных заимствований. Надо сказать, что даже предмет национальной «гордости» россиян - русский мат - по запасу ругательных слов, оказывается, уступает большинству языков мира. Зато мы чаще пользуемся этими словами - запальчиво возразит «патриот»... что ж, возможно, но это тоже аргумент не в нашу пользу.

Итак, зачем мы так старательно расклассифицировали цели структурирования информации? Да затем, чтобы создать тот самый скелет, который нам предстоит в дальнейшем оснастить «сухожилиями», «мышцами» и обтянуть «кожей» - то есть дополнить более конкретными знаниями. Что ж, скелет мы уже смастерили - пора приступать к следующему этапу.

В основе большинства процедур структурирования лежит метод классификации. Классификация - это иерархически организованная система информационных элементов, обозначающих объекты/процессы реального мира и упорядоченных по признаку сходства/различия классификационных признаков, отражающих избранные свойства объектов . Как правило, процедура классификации (классифицирование) осуществляется для удобства исследования некоторой предметной области (фрагмента реального мира). Принято различать следующие виды классификации:

Искусственную, осуществляемую по внешним признакам, не выражающим сущности объектов/процессов, и служащую для упорядочения некоторого их множества;

Натуральную (естественную), осуществляемую по существенным признакам, характеризующим внутреннюю (сущностную) общность объектов/процессов.

Натуральная классификация является инструментом и результатом научного исследования, поскольку выражает результаты изучения закономерностей классифицируемых объектов/процессов. В то время как искусственная классификация обладает исключительно прикладной ценностью в рамках решения конкретной задачи. Например, спелое/неспелое яблоко - натуральная классификация, красное/зеленое яблоко - искусственная.

От качества выполнения процедуры классификации на ранних этапах исследований сложных систем (да и не только сложных) зависит результативность и качество всей работы. Поэтому при осуществлении процедуры классификации необходимо придерживаться следующих принципов :

При выполнении каждой операции разделения на классы (акт деления) допускается применение только одного классификационного основания;

Совокупный объем полученных в результате разделения на классы понятий должен равняться объему делимого понятия;

Понятия, полученные в результате деления должны взаимно исключать друг друга;

Деление должно быть последовательным.

Классификации делятся на следующие виды:

Простые (одноуровневые), например - дихотомия, когда одно понятие верхнего уровня (А) делится на два таких (В и С), что для них выполняются условия А = В + С и В = не С (С = не В);

Сложные (многомерные) обычно, представляемые в виде таблиц сложной организации, где строкам и столбцам соответствуют различные классификационные признаки, например - периодическая таблица химических элементов Д.И. Менделеева;

Иерархическая (древовидная), едва ли нуждающаяся в примерах и пояснениях.

Метод классификации в том или ином виде используется при решении самых разнообразных задач, связанных со структурированием информации. Неорганизованные информационные элементы подвергаются процедурам группирования, связывания, обобщения, в результате чего структура или проявляется (при натуральной классификации), или образуется (при искусственной классификации). В книге В.Ф. Турчина «Феномен науки: Кибернетический подход к эволюции» момент смены уровня организации системы именуется метасистемным переходом (возникновения системы более высокого уровня иерархии), который и рассматривается как эволюционный процесс. Соответственно, процессы синтеза новой классификации и структурирования информации можно рассматривать, как процесс эволюции знаний . Это не означает, что в результате выполнения процедур классификации или структурирования появляется новое знание, но означает, что в результате выполнения этих процедур создается новая система управления знаниями , существенно упрощающая различные манипуляции с ними, в том числе - и поиск ранее не выявленных закономерностей и законов.

Заметим, что процедура классификации не имеет собственной ценности и приобретает ее только, если она способствует достижению некоторого комплекса целей. Созданная в результате выполнения классификационной процедуры система управления знаниями должна быть полезной - что означает, что выбор классификационных критериев не может быть произвольным, а должен осуществляться с учетом решаемой задачи. Они должны отвечать целям деятельности. При этом следует различать два вида/аспекта деятельности :

Деятельность, направленную на достижение конечной (генеральной или глобальной) цели;

Деятельность, направленную на решение задач обеспечения этой деятельности.

К последней категории может быть отнесена деятельность, направленная на решение задач построения адекватной модели предметной области, ее тезауруса, создания инструментальных средств, используемых для достижения конечной цели.

При структурировании информации должна учитываться специфика потребителя полученного информационного продукта . Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.

Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).

В зависимости от исходного уровня структурной организации обрабатываемых данных, могут быть выделены следующие классы задач (классы задач по уровню структурной организации информации на входе/выходе ):

1. Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

2. Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

3. Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня) . В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию равносильные перечисленным .

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования , воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

Осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

Интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней (чаще всего - экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики, теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации. Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило, эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом (George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта ).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства» . Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности - тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения. В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича, написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных - это тоже модели , описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации - от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации. Стратегия опроса экспертов (в том числе - проведения мозговых атак или деловых игр) может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

В одном случае (при анкетировании и управлении процедурой опроса или стратегией игры) информация извлекается в соответствии с заранее установленной рубрикацией. В другом случае (при оценивании вариантов) структура организации информации не изменяется и остается в рамках заранее установленной формы любого уровня структурной организации. В частности, варианты, предложенные для оценивания, могут быть сформулированы на основе исследований, предварительно проведенных на имитационных моделях, или полученных в результате собеседования с другими группами или с той же группой экспертов.

Для выделения логической структуры описаний, предварительно разделенных на рубрики (относящиеся к одним и тем же группам объектов, процессам, временным и пространственным областям) применяются различные методы, обеспечивающие возможности:

Выделения «дискретных» состояний (для текстовых описаний - это связано с определением множества терминов, используемых для описания некоторого, существенного для решаемой задачи, состояния);

Упорядочивания их во времени (построение сценариев типа «раньше - позже»);

Причинно-следственного связывания (построение сценариев типа «причина - следствие»);

Пространственного связывания и иные.

На следующем этапе в зависимости от целей деятельности подобные модели могут быть подвергнуты процедуре декомпозиции (детализации) или агрегации (композиции или свертке), в результате чего формируется описание необходимого уровня абстракции/детализации.

Дальнейшие этапы выполняются за счет введения специальных систем именования элементов модели, приписывания им поименованных атрибутов, описания функциональных зависимостей и так далее. Например, в качестве функциональных зависимостей для ряда задач могут быть рассмотрены зависимости ресурс-время-результат и иные, которые на начальных этапах могут быть использованы для маркирования дуг графа, а впоследствии - воплощены в программные коды имитационных моделей. Особый класс составляют модели ситуаций, используемые для распознавания объектов, их состояний, тенденций и процессов. В таких моделях может абсолютизироваться либо статический, либо динамический аспект существования/функционирования системы. Однако подробно рассматривать эти процедуры мы здесь не будем, тем более, что некоторые аспекты этой деятельности нами уже были описаны при рассмотрении соответствующих классов моделей.