ДОКЛАДЫ

А.Г. Варфоломеев, Ю.В. Сидоров (Петрозаводск)

ОБ ЭФФЕКТИВНОСТИ АЛГОРИТМОВ СВЯЗЫВАНИЯ ЗАПИСЕЙ

Одним из важных направлений исследований в исторической информатике традиционно является связывание записей (record linkage). Чаще всего связывание записей применяется для поиска идентичных объектов в разных базах данных, хотя аналогичные задачи могут возникать и в рамках одной таблицы - например, при поиске родственных связей. Общим требованием к методам связывания записей, выделяющим их из круга стандартных средств поиска систем управления базами данных, является устойчивость к информационным помехам различной природы: искажению информации, использованию смысловых и фонетических вариантов, и т.д.

Для эффективного связывания записей необходимо учитывать особенности информационных помех, свойственных тому или иному полю базы данных (т.е. признаку объекта). При этом связывание записей превращается во взвешенное применение различных методов обработки полей, которые можно разделить на две группы:

1) Методы устранения помех, основанные на стандартизации значений признаков. Примером стандартизации может служить алгоритм Soundex-кода, заменяющий слова некими фонетическими инвариантами. Известны примеры алгоритмов Soundex-кода для разных языков.

2) Методы поиска одинаковых значений в двух различных полях, основанные на алгоритмах сравнения строк символов. Такие методы работают намного медленнее Soundex-кода, так как перебирают всевозможные пары значений из двух полей. С другой стороны, они учитывают не только фонетические, но и орфографические ошибки. Примером таких методов может служит Guth-алгоритм, состоящий в том, что для каждого символа одной строки проводится серия тестов по поиску подходящего символа в другой строке. Если тестирование дает положительный результат, то строки считаются эквивалентными. Набор тестов можно менять, поэтому Guth-алгоритм имеет множество модификаций.

На Западе связывание записей широко применяется в исторических и социологических исследованиях, а также в административных и медицинских целях. В России в последнее время тоже появляется все больше проектов, в которых такие методы могут оказаться полезными. В нашем докладе сравнивается эффективность алгоритма Soundex-кода и нескольких модификаций Guth-алгоритма в задаче связывания записей двух баз данных, созданных в ПетрГУ под руководством С.Н. Филимончик [1]. Одна база данных содержит 1154 записи о рабочих и служащих Онежского металлического завода - градообразующего предприятия Петрозаводска по материалам профессиональной переписи 1918 г., другая создана на основе семейных карт переписи населения СССР 1926 г. и содержит сведения о 6724 индивидах - главах семей петрозаводчан.

Для оценки эффективности алгоритмов вручную было выбрано эталонное множество связанных записей. Эффективность оценивалась с помощью двух параметров - p (доля алгоритмически связанных записей, не входящих в эталонное множество), и q (доля записей эталонного множества, не связанных алгоритмом). Чем меньше p и q, тем эффективнее алгоритм. Связывание происходило по полю "Фамилия" при условии, что стандартизованные значения полей "Имя" и "Отчество" полностью совпадали, а значения поля "Возраст" имели соответствующую разницу с небольшой допустимой погрешностью. Эксперименты показали, что вариант Soundex-кода, предложенный в [2], имеет показатели p=8% и q=9%, для классического Guth-алгоритма [3] p=53% и q=0%. Нам удалось подобрать такую комбинацию тестов Guth-алгоритма и Soundex-кода, у которой p=7% и q=1%. Наш вариант метода связывания записей реализован в виде программной надстройки над СУБД Microsoft Access и позволяет применять различные алгоритмы обработки полей, предоставляя пользователю удобный инструмент исследования.

ЛИТЕРАТУРА

  1. Варфоломеев А.Г., Филимончик С.Н. Инф. бюлл. АИК. №17. М., 1996. С. 29.
  2. Тяжельникова В., Леверманн В. Источнико-ориентированная обработка данных. KLEIO. Руководство для пользователя. М., 1995. С. 255.
  3. Guth G. Historical Methods Newsletter. 1997. V. 10. P. 10-19.

 

А.Ф. Оськин (Полоцк)

ТЕХНОЛОГИИ БАЗ ДАННЫХ И INTERNET

Подводя итоги работы секции "Базы данных и информационные системы" на VI конференции АИК, один из руководителей секции, И.Ф. Юшин, пишет [см. 1]: "По поводу баз данных как направления исторической информатики. Имеет смысл в дальнейшем говорить о них в рамах развития сети информационных электронных ресурсов, доступных исследователям" (курсив И.Ф. Юшина).

В настоящее время можно смело утверждать, что информационный ресурс доступен исследователям, только в случае, если он выставлен в Internet.

В связи с этим весьма актуальной становится разработка публикаций баз данных в Internet. Рассмотрению этих технологий и посвящается настоящий доклад.

Архитектура Web-узлов, работающих с базами данных (БД).

Web-технологии и технологии БД – это два отдельных направления, разрабатывавшихся независимо друг от друга. Общим для этих двух технологий является архитектура "клиент-сервер", используемая как при создании Web-узлов, так и при разработке современных сетевых БД [2]. Отличают два эти направления подходы к реализации – если в WWW имеет место четкое разграничение функций между Web-сервером и Web-клиентом, то в сетевых БД такое разграничение между серверной и клиентской частями гораздо менее различимо.

В связи со сказанным становится понятным, почему при решении задачи публикации базы данных на Web используется трехуровневая архитектура построения приложения [2]. Дополнительный третий уровень включает в себя программу-расширение серверной части, реализующую интерфейс между сервером БД и Web-сервером. Существуют различные программы-расширения серверной части, обладающие своими достоинствами и недостатками. Рассмотрим некоторые из них.

CGI (Common Gateway Interface) – Общий шлюзовой интерфейс.

CGI был первым протоколом, поддерживающим разработку программ, расширяющих функции Web-сервера. Основные преимущества CGI:

Главные недостатки:

ActiveX.

Технология ActiveX – это развитие широко распространенной в среде Windows технологии OLE (Object Linking and Embedding – связывание и внедрение объектов). Стандарт ActiveX позволяет компонентам взаимодействовать в сети независимо от языка и среды, в которой они созданы.

Компоненты ActiveX разделяются на серверную и клиентскую части.

Клиентская часть реализуется с помощью программных библиотек, поставляемых вместе с MS Internet Explorer, или дополнительно загружаемых с серверов компании MicroSoft, которая разработала и поддерживает этот стандарт.

Серверная часть реализуется с помощью MicroSoft Internet Information Server (IIS). Воспользовавшись технологией ActiveX, можно на сервере получить доступ к БД, при условии, что данная БД поддерживает стандарт ODBC.

Основные достоинства этого подхода - простота разработки и удобство отладки. Основной недостаток – зависимость от используемого сервера.

Java и JDBC.

Для организации доступа к БД с клиентской машины может быть использована технология, базирующаяся на языке Java. Java – это объектно-ориентированный язык, разработанный для поддержки распределенных вычислений. Технология использования Java достаточно проста.

Java- программы компилируются в так называемые Java-апплеты, которые размещаются на сервере. Встретив в HTML-документе ссылку на Java-апплет, браузер запрашивает у сервера все мобильные коды и начинает их выполнение. Так как Java-апплет – внешняя программа, она может работать с различными БД. Взаимодействие с БД осуществляется через специальный протокол Java Data Base Connectivity (JDBC). Основное достоинство этого подхода – простота подключения новых апплетов. Не нужно проводить перекомпиляцию программы, как это было в случае CGI, достаточно изменить текст HTML документа.

Основной недостаток – низкая скорость. Java – это интерпретатор и он работает заметно медленнее, чем откомпилированная программа.

В заключение в докладе приведены рекомендации по выбору подхода для публикации БД на Web, и рассмотрены инструментальные средства, применяемые для этих целей.

ЛИТЕРАТУРА

1. Информационный бюллетень ассоциации "История и компьютер" № 24, июль 1999. М., 1999.

2. К. Ланг, Дж. Чоу. Публикация баз данных в Интернете. СПб., Символ-Плюс, 1998.

 

О.С. Поршнева, С.В. Поршнев (Нижний Тагил)

К ХАРАКТЕРИСТИКЕ МЕНТАЛИТЕТА НАРОДНЫХ МАСС РОССИИ:
РЕВОЛЮЦИЯ 1917 г. В ФОКУСЕ МАССОВОГО СОЗНАНИЯ

РАБОЧИХ, КРЕСТЬЯН И СОЛДАТ
(Опыт многомерного статистического анализа писем
в центральные органы советов рабочих и солдатских депутатов)

Антропологический подход к изучению исторических процессов предусматривает реконструкцию содержания человеческого сознания, ментальности социальных слоев и групп исследуемого общества в ту или иную эпоху. Задачами проведенного нами исследования массовой корреспонденции рабочих, солдат и крестьян в редакцию газеты “Известия”, Петроградский Совет рабочих и солдатских депутатов, ВЦИК Советов I и II созыва [1] были: реконструкция содержания массового сознания указанных общественных слоев, определение его приоритетов, структуры, базовых ментальных установок масс; выявление взаимосвязей признаков в каждом источнике информации и всей их совокупности, системы взаимоотношений каждого показателя с другими.

Контент-анализ всех хранящихся в делах писем солдат, крестьян и рабочих мы рассматривали как количественный анализ естественной выборки, образованной методом случайного отбора. Был проведен контент-анализ 330 писем путем выделения смысловых единиц – признаков или категорий, представляющих собой высказывания авторов по социальным, политическим, экономическим и культурным проблемам. Корреспонденция была разделена хронологически на три группы: весна, лето, осень, что отражает, на наш взгляд, наличие качественных особенностей в развитии революции на каждом из указанных этапов. Содержание писем наглядно демонстрирует эволюцию приоритетов массового сознания низов в период развития революции 1917 г.

Для выявления взаимообусловленности отдельных суждений, представлений, высказываний (категорий) была использована методика количественного анализа взаимосвязей смысловых категорий на основе вычисления коэффициента линейной корреляции, позволяющая смоделировать структуру массового сознания, выявить его доминирующие “пласты” и отношения между ними. В результате проведенного исследования установлено, что в структуре массового сознания рабочих, крестьян и солдат в период развития революции можно выделить четыре основных пласта: традиционалистский, демократический (революционно-оборонческий), радикально-антивоенный (с преобладанием политических требований) и социалистический.

Была определена доля диффузного сознания (около половины всех писем), интерпретировано наличие значительной доли писем, содержащих категории, относящиеся к более чем одному пласту сознания. Самый высокий уровень диффузности отмечается у революционно-оборонческого (демократического) и радикально-антивоенного пластов сознания масс. Мы объясняем это тем, что происходило “развертывание” бунтарского архетипа ментальности масс: эволюция соответствующих форм сознания и определяемого ими поведения в конкретной исторической ситуации весны – осени 1917 г.

Важнейшей задачей многомерного статистического анализа корреспонденции было воссоздание структуры массового сознания каждой из рассматриваемых социальных групп, реконструкция системы приоритетов и взаимосвязей смысловых категорий в их сознании. Контент-анализ писем с четко обозначенной социальной принадлежностью позволил выявить существенные качественные отличия в структуре сознания различных социальных групп.

На основании данных многомерного статистического анализа массовой корреспонденции рабочих, солдат и крестьян в центральные органы Советов был определен характер типичных вербальных реакций и доминирующих в массовом сознании и общественной психологии различных социальных групп народа моделей решения насущных общественных проблем в период развития революции 1917 г. Это позволило, в частности, сделать вывод о том, что массовое сознание народа было достаточно противоречивым и многослойным. В то же время было установлено, что на протяжении весны – осени 1917 г. происходила эволюция массового сознания низов в направлении возрастающей радикализации, мобилизации традиционных крестьянских (общинных) установок мировосприятия, ценностей социальной справедливости и равенства.

 

СООБЩЕНИЯ

И.В. Дивный (Киев)

ПЕРСПЕКТИВЫ ПРИМЕНЕИЯ СОВРЕМЕННЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ
В БИОГРАФИЧЕСКОЙ НЕКРОПОЛИСТИКЕ УКРАИНЫ

Биографическая некрополистика – весьма динамично развивающееся направление современной исторической науки, во многих вопросах еще не обретшее должного теоретического обоснования, но уже имеющее достаточно серьезные практические результаты. Традиции такого рода исследований – именно как планомерной научной программы – были заложены на стыке XIX – XX вв. группой российских историков (В.И. Саитов, В.В. Шереметевский, Б.Л. Модзалевский) под патронатом известного культурного и общественного деятеля Великого князя Николая Михайловича. Именно в указанный период были составлены доныне не имеющие аналогов по широте охвата фундаментальные многотомные справочники "Московский Некрополь", "Петербургский Некрополь" и "Русский Провинциальный Некрополь". До сих пор указанные работы, вышедшие в печати, увы, далеко не в полном объеме собранных материалов, остаются не только уникальным собранием исторической информации (подчас безальтернативным источником ввиду утери многих памятников), но и классическими некрополистическими работами с точки зрения методологии исследований и способа подачи (изложения) материала.

Украинская некрополистика в лице самого яркого своего представителя – известного киевского историка Л.А. Проценко – сумела не просто продолжить научную традицию российских исследователей, но и творчески ее развить, придать новые, более современные черты, открыть новые исследовательские перспективы. Сегодня можно смело утверждать, что собственно биографической современная некрополистика стала именно в Украине, где в последние годы разработана и воплощена в конкретной издательской серии новая модель некрополистической научной публикации – биографического справочника-некрополя. Не углубляясь в ее детальный анализ, отметим лишь, что принципы построения указанной модели по сути своей являются результатом творческого слияния двух методологических рабочих схем классического справочника-некрополя, разработанного группой Николая Михайловича, и всем привычного биографического справочника. В результате появилось новое качественное образование, открывающее доныне не предполагавшиеся перспективы, как сугубо академического, так и популяризаторского плана.

Следует признать, что до самого последнего времени все работы в данной области проводились без учета возможностей современных компьютерных технологий. Электронная техника применялась (и продолжает применяться) преимущественно как элемент доредакционной подготовки конкретной работы к печати, причем в большинстве случаев, как элемент чисто механический – в т.н. "режиме печатной машинки".

Вместе с тем, даже предварительный анализ позволяет предполагать серьезные и глубокие возможности применения электронной техники для обработки и подачи биографической некрополистической информации именно на программном уровне. С одной стороны, уже традиционная здесь унификация всего материала, его максимальная универсализация заведомо облегчает и делает логичным обращение к электронным формам. С другой – очевидные перспективы интенсификации распространения и обмена информацией, что представляется особенно важным в контексте развития биографической некрополистики как современной просопографической дисциплины.

Следует особо подчеркнуть, что как и всякое новое исследовательское направление, биографическая некрополистика открывает новые качественные возможности даже в разработанных моделях. Так, одна из самых популярных сегодня электронных форм – база данных – работая на уровне некрополистической "конкретики", вполне способна утратить привычную и несколько безликую универсальную форму, став также весьма "конкретной" и удобной единицей информационного обмена на более низких уровнях исторического исследования (вплоть до любительского краеведения). Говоря о собственно некрополистических задачах, добавим, что в отличие от общей биографистики, такого рода база данных может рассматриваться в качестве оригинальной персонифицированной модели конкретного (в историческом и географическом отношении) предмета исследования – своего рода "виртуальным некрополем в биографиях".

Ныне украинскими специалистами проводится апробация различных электронных форм на материалах биографической некрополистики, в т.ч. создание баз данных по различным регионам и социальным группам разных исторических эпох.

 

И.В. Журбин, Г.А. Степанова (Ижевск)

КОМПЬЮТЕРНОЕ КАРТОГРАФИРОВАНИЕ В АРХЕОЛОГИИ:
ИСТОЧНИКИ, МЕТОДИКА И ТЕХНОЛОГИЯ

Процесс создания и использования цифровых карт в каждой из областей исторического знания имеет свою специфику с точки зрения определения базы источников, выбора методики и технологии формирования цифровой карты, а так же методов их анализа.

Задача компьютерного картографирования заключается в реконструкции хронологии развития и функционально-исторической интерпретации археологических объектов на основе пространственного моделирования процесса формирования культурного слоя объекта. Решение поставленной задачи включает в себя три основных этапа.

Формирование источника. Основной задачей этого этапа является извлечение и документирование археологической информации в форме, удобной для ввода в компьютер.

Решение этой задачи связано с методикой раскопок и форматом полевой документации. Обязательные элементы разработанной методики – инструментальные замеры, начиная от дневной поверхности раскопа, и единая трехмерная система координат. Это позволяет сформировать исходные данные для представления археологических слоев, локальных 3D-объектов (напластования, прослойки) и точечных объектов (отдельные находки) в единой системе координат. Разработанный формат полевой документации определяет структуры баз данных слоев и находок.

Этап компьютерного картографирования предполагает создание компьютерной модели, максимально полно имитирующей пространство культурного слоя. Слои карты выделяются на основе цветности и состава почв. Отдельным слоем карты является слой находок. В процессе формирования компьютерной карты происходит преобразование набора "плоскостных" исходных данных (планиграфические срезы) до 3D-образа каждого объекта. Это позволяет максимально сохранить суть источника – пространственно-организованный культурный слой объекта.

Этап интерпретации предполагает анализ развития и пространственно-временную реконструкцию объекта на основе модели накопления культурного слоя. При этом возможно выделение хронологических периодов развития археологического объекта и дополнительный анализ отдельного периода. Набор находок, пространственно привязанный к структуре слоя, обеспечивает решение в рамках данной модели задачи функционально-исторической реконструкции.

Применение технологии компьютерного картографирования археологического объекта позволяет решить ряд принципиальных задач:

  1. Полное извлечение, копирование и хранение информации об археологическом объекте. Создание его виртуального образа решает противоречие между исследованием памятника и его полным уничтожением в процессе раскопок.
  2. Формирование полиинформативного источника за счет источнико-ориентированной технологии преобразования полевой информации в машиночитаемую форму.
  3. Возможность изучения археологического объекта не только на основе визуально фиксируемой информации, но и структурной (скрытой), выраженной во взаимном расположении элементов культурного слоя.

 

А.С. Иванов (Даугавпилс)

МЕТОДОЛОГИЧЕСКИЕ ПРОБЛЕМЫ СОЗДАНИЯ БАЗЫ ДАННЫХ
ДЛЯ РЕГИОНАЛЬНЫХ ИССЛЕДОВАНИЙ.
(Пример Латгальского края)

1. Региональный подход в исторических исследованиях отвечает основным тенденциям в современной методологии истории. Регионализм подразумевает интенсивное исследование исторически сложившихся локальных социокультурных систем, что возможно лишь при комплексном, всестороннем подходе к истории региона.

2. Потенциал комплексного подхода к региональной (локальной) истории можно реализовать двумя способами: или через последовательное применение методов комплексного источниковедения в контексте традиционной истории, или через создание источнико-ориентированной базы данных по истории региона. Наиболее эффективным инструментом комплексного изучения региональной истории следует признать именно методы исторической информатики, так как источнико-ориентированная база данных может (и должна) стать компактной и адекватной моделью исторического региона, которая может практически бесконечно пополняться конкретной источниковой информацией.

3. Тезис о больших возможностях исторической информатики в проведении региональных исследований подтверждает практика комплексного изучения истории Латгалии, которое проводится историками Даугавпилсского педагогического университета и Института исследования Латгалии в рамках программы по созданию базы данных "Latgales Dati" (адрес в Интернете: http://www.dpu.lv/LD/ ). Латгалия – один из исторических регионов Латвии, расположенный на востоке республики, – является полноценным и самодостаточным объектом комплексного исторического исследования, так как политические, социальные, экономические, культурные и религиозные аспекты истории края обнаруживают ясно выраженную специфику, которая довольно четко отграничивает регион от остальных частей Латвии.

4. В процессе создания базы данных "Latgales Dati" выявились некоторые проблемы, которые имеют общеметодологическое значение для любого регионального исследования, ведущегося при помощи инструментария исторической информатики.

Первая проблема связана с четким определением идентичности исторического региона, особенно в случае, когда база данных является динамической моделью региона, который постоянно меняет свои границы, свои существенные характеристики. Другими словами, речь идет о представительности базы данных, которая достигается не столько за счет увеличения объема информации, сколько через многоаспектность и адекватность отражения специфики (идентичности) региона в базе данных для каждого периода его истории.

Тем самым, задачей исследователя является реконструкция идеального образа региона как необходимого условия, основы для формирования структуры базы данных. Однако, здесь выявляется вторая методологическая проблема – соотношение эмпиризма (и, в определенной степени, – стихийности) и умозрения в определении содержания базы данных для регионального исследования. Это, в сущности, гносеологическая проблема, ибо должна быть определена роль личности историка и его творческой самостоятельности и независимости в реконструкции прошлого региона, а также в создании его динамической модели.

Решение указанных проблем возможно через последовательную реализацию принципа стадиальности в формировании базы данных: прежде всего выделяются временные промежутки (в основных чертах совпадающие с периодизацией истории региона в традиционной историографии), затем осуществляется конкретизация образа региона и соответствующей этому образу базы данных для каждого хронологического среза. При этом некоторые аспекты региональной идентичности будут величинами переменными, другие – постоянными. Именно черты идентичности, сохраняющие свою значимость во всех периодах истории региона, следует считать системообразующими для моделирования базы данных.

 

К.А. Карчевский, В.Л. Носевич, Ю.П. Рудько

ЭЛЕКТРОННЫЙ АТЛАС–СПРАВОЧНИК "ГУБЕРНИЯ"

В статье предлагается опыт представления исторических данных конца XVIII – начала XX века средствами геоинформационной системы (ГИС). Цель проекта – отразить административную структуру белорусских губерний Российской империи, границы территориальных единиц, состав и принадлежность населённых пунктов.

Система включает в себя реляционную базу данных, сопряженную с несколькими растровыми слоями – "подложками", а также создаваемые на их основе векторизованные слои с локализованными населенными пунктами и границами территориальных единиц. Для отражения исторической динамики содержимое базы данных и векторные слои соотнесены с тремя хронологическими периодами: 1) конец XVIII – начало XIX в.; 2) середина XIX в.; 3) конец XIX – начало ХХ в. Основным растровым слоем для всех периодов служит военно-топографическая карта Российской империи масштаба 1:126000 (трёхвёрстка) разных лет издания. Кроме того, имеется четвертый период – современный, содержащий растровую карту территории Республики Беларусь масштаба 1:200000, векторизованные границы областей и районов, полный список современных населенных пунктов и их векторные привязки к карте.

Объекты базы данных принадлежат к двум основным классам: территориальные структуры (губерния, уезды, волости, приходы, имения) и населенные пункты (включая центры территориальных единиц). Общая структура исторических данных быть представлена следующим образом:

Для каждого из трех исторических периодов эта структура повторяется с необходимыми поправками (первый слой не содержит данных о волостях, третий – об имениях, т. к. волости были созданы, а принадлежность селений к имениям упразднена в ходе реформы 1861 г.). Кроме того, программное обеспечение позволяет оперировать с виртуальными "сквозными" объектами, содержащими данные об объекте из трех исторических периодов и современности.

Данные о населенных пунктах каждого периода включают: название поселения, его тип (город, местечко, фольварк, деревня, хутор и т.п.), количество жителей, количество дворов, связи и соподчиненность с другими объектами, а для городов и уездов – также геральдика (описание и изображение герба). Кроме того, база данных содержит текстовые сведения обо всех учреждениях губернского и уездного уровня, которые функционировали в тот или иной период (эта информация соотнесена с объектами классов "губерния" и "уезд").

База данных реализована на платформе SQLBase Server 7.0, что позволяет работать с ней нескольким пользователям одновременно. Программные средства поддержки картографической информации представляют собой оригинальную разработку на базе системы Dragon. Проект ГИС "Губерния" был разработан временным научным коллективом при Белорусском научно-исследовательском институте документоведения, археографии и архивного дела (БелНИИДАД) в 1997 – 1998 гг. Заполнение и поддержка системы с весны 1999 г. осуществляется Белорусским научно-исследовательским центром электронной документации (БелНИЦЭД).

На первом этапе начато заполнение системы данными по Минской губернии, как самой большой по площади (около 40%) на территории современной Республики Беларусь). В настоящее время введена информация обо всех губернских и уездных учреждениях трех хронологических периодов, созданы векторные границы уездов. Завершается создание слоев для первого периода – уже введены сведения о 8682 поселениях Минской губернии по данным "Экономических примечаний к Генеральному межеванию" за 1800 г. Осуществляется локализация поселений на растровой карте и создание векторных объектов на каждое поселение. Для удобства пользования они разнесены по слоям "центры имений", "центры приходов", "прочие поселения".

По завершении этой работы будет начато заполнение второго хронологического периода, параллельно ведется создание структуры и растровых слоев для Могилевской губернии. Дальнейшее продолжение видится в создании справочников по другим губерниям. Учитывая, что губернии Российской империи имели однотипную структуру, система может быть использована на всей ее территории.

 

В.М. Кириллов, С.В. Поршнев (Нижний Тагил)

К ПРОБЛЕМЕ СОЗДАНИЯ ВСЕРОССИЙСКОГО БАНКА ДАННЫХ
ЖЕРТВ ПОЛИТИЧЕСКИХ РЕПРЕССИЙ

Политические репрессии в годы советской власти стали одним из наиболее трагических событий уходящего ХХ века. Жертвами репрессий стали миллионы граждан России. Воссоздание памяти о них – долг ныне живущих россиян.

Задача создания Всероссийского банка данных жертв репрессий является сложной как в научном, так и в организационном плане. Сегодня мы находимся в начальной стадии ее решения. Формирование уникального по своим масштабам банка данных, содержащего информацию по персоналиям миллионов людей, вызывает целый ряд проблем. Мы сконцентрируемся лишь на одной из них – проблеме единой унифицированной программы создания БД.

В настоящее время нами создана база данных "Тагильчане – репрессированные по контрреволюционным делам (58 статья)" на 3000 чел. В конце 1999 г. началось осуществление проекта "Разработка-спасение материалов архива Тагиллага, массовая реабилитация узников лагерей Урала и проблемы создания Всероссийского банка данных жертв репрессий". В результате его осуществления будет создана база данных по советским немцам-"трудармейцам" (в рамках специализированной базы данных "Депортированные народы"), содержащая информацию о 35000 чел. и издана соответствующая "Книга памяти".

В ходе работы над проектом в Н. Тагиле запланировано проведение международного научно-практического семинара по проблеме создания Всероссийского банка данных жертв репрессий, в работе которого будут участвовать ведущие разработчики электронных баз данных по проблемам репрессий. На семинаре предполагается формирование рабочей группы и определение приоритетов в этой долговременной деятельности.

Анализ опыта создания и обработки базы данных "Репрессированные тагильчане", позволил выявить ряд проблем, которые, как показывает знакомство с работами других авторов, являются самыми общими, т.е. возникают при создании и практической обработке БД, содержащих сведения, относящиеся к различным историческим явлениям. К таковым, по нашему мнению, относятся, во-первых, проблема выбора программной среды, используемой для создания и обработки БД, во-вторых, проблема автоматизации обработки информации, содержащейся в БД, а также ее наглядное представление.

Из большого количества систем управления базами данных (СУБД), представленных в настоящее время на российском рынке программных средств, нами, вместе с другими исследователями, отдано предпочтение пакету АССESS, являющемуся высокопроизводительной 32-х разрядной системой управления реляционными базами данных (СУРБД). Пакет АССЕSS предназначен для разработки настольных БД и создания приложений БД архитектуры клиент – сервер, работающих под управлением операционных систем WINDOWS95, WINDOWS NT, WINDOWS98. Этот выбор был определен тем, что этот пакет, с одной стороны, включает в себя сложные функции и является прекрасным инструментом для профессионального разработчика приложений БД, с другой стороны, его использование не вызывает проблем и у непрофессиональных пользователей и даже тех, кто раньше не работал с СУБД. Средства визуального программирования, встроенные в Access, позволяют легко создавать различные экранные формы облегчающие пользователю ввод информации в БД.

Вторая проблема – проблема автоматизации обработки информации, содержащейся в БД, является с нашей точки значительно более сложной. Наш опыт обработки БД "Репрессированные тагильчане" показывает, что для упрощения процесса обработки следует разделять и максимально полно применять цифровое кодирование информации на этапе ее ввода. Например, информацию о месте рождения репрессированных (деревня, город, уезд, волость, область, страна (республика)) представляется целесообразным разделить, т.е. создать отдельные поля, содержащие сведения о названии области и страны. Это позволит вынести названия областей и стран в отдельные таблицы и, задав ключевые поля, создать реляционные связи между этими таблицами и основной таблицей, содержащей полную информацию, и упростить ввод и обработку информации, содержащейся в БД.

Вряд ли можно признать удовлетворительным подход, в котором для более углубленного количественного анализа данных и качественного представления и оформления результатов запросов в виде диаграмм рекомендуется экспорт данных и их обработка с помощью пакета MS Excel. Во-первых, можно использовать средства построения диаграмм пакета Exсel, напрямую обращаясь к ним из пакета ACCESS. Во-вторых, пакет ACCESS имеет собственную систему построения запросов, позволяющую теоретически конструировать запросы любой сложности. В-третьих, при необходимости для построения запросов и выводов результатов обработки можно использовать язык программирования Visial Basic, встроенный в пакет Access.

Проблемы, связанные с созданием баз данных по репрессированным, неоднократно рассматривались нами теоретически. В этих работах выделена информация, подлежащая сохранению в базе данных, разработан кодировальный лист с перечнем возможных значений полей БД. Теоретические положения и выводы были проверены и уточнены на практике в ходе создания БД "Репрессированные тагильчане". В частности, было предложено расширить число полей за счет добавления новых: "Номер архивного дела", "Подданство", "Социальное происхождение и социальное положение", "Семейное положение", "Вероисповедание", "Занятия членов семьи", "Дата прекращения дела", "Опись имущества", "Предыдущие судимости", "Источник данных", "Составители документов о репрессии", "Дополнительные сведения", а также дополнить список возможных значений следующих полей кодировального листа: "Национальность", "Место работы", "Образование", "Судебный орган, вынесший приговор", "Формулировка приговора", "Наименование реабилитирующего органа", "Реабилитирован при жизни или посмертно". Анализ информации, находящейся в БД позволил выявить динамику численности арестов, осужденных и приговоренных к расстрелу по годам, получить данные о распределении репрессированных и приговоренных к расстрелу по возрастным группам, национальности, сфере деятельности, месту рождения, а также данные о репрессивных органах вынесших приговор.

Вышеизложенные подходы к решению ряда конкретных проблем являются во многом дискуссионными. Однако коллективное обсуждение их в процессе создания единой унифицированной программы формирования Всероссийского электронного банка данных жертв репрессий совершенно необходимо.

 

Е.Н. Кириллова (Москва)

НЕКОТОРЫЕ ОСОБЕННОСТИ АНАЛИЗА НОМИНАЛЬНЫХ ДАННЫХ

  1. Средневековые ремесленные уставы не относятся к числу документов, имеющих строгий формуляр, но они подаются формализации. Данные уставов ("Книга ремесел" – Париж XIII в. и ремесленные уставы Реймса XVI-XVII вв.) были формализованы и представлены в виде таблиц, где через 1/0 обозначено наличие/отсутствие условий в текстах. Условие – это одно требование.
  2. Для определения структуры текстов уставов был использован коэффициент квадратичной сопряженности (Х2). Подсчеты коэффициентов позволяют, во-первых, подтвердить (доказать) верность первоначальных наблюдений, во-вторых, перейти от отдельных сочетаний признаков к выявлению структуры документа, которая по сути является отражением структуры организации ремесел – когда одна норма неизбежно влечет за собой появление другой и исчезновение третьей.
  3. Для каждого источника были определены группы условий. В каждой группе имеется "ядро" – детерминирующие ее условия. Затем, в зависимости от специфики профессии или от места данной специальности в городской иерархии ремесел (что может быть связано со снабжением города, армией, двором и т.д.) формируется "второй круг" – условия, наиболее часто встречающиеся с теми, которые составляют "ядро" группы. "Третий круг" формируется из условий, сочетающихся в основном с условиями "второго круга" данной группы, причем сами условия "третьего круга" могут входить в любую другую группу условий.
  4. Жесткие, сильно связанные структуры выявляются в тех случаях, когда центральные условия группы представляют собой детально разработанные близкие по содержанию нормы (ученики – в "Книге ремесел"; шедевр – в реймских уставах). Но это не означает, что принципиальная важность для ремесленных организаций какого-то одного вопроса (на данном этапе развития) и усиленная проработка его в регламентах заслоняла все остальное. Даже в этих случаях в состав жестких структур входят требования иного содержания: время работы для Парижа и количество учеников, назначение присяжных по списку – для Реймса. Эти структуры отражают массовый характер входивших в них требований (как для Парижа, так и для Реймса).
  5. Жесткие структуры могут быть присущи также условиям, встречающимся в небольшом количестве текстов. В этом случае выявляются сильные связи между требованиями, относящимися к разным разделам (ученики, подмастерья, качество, время работы, штрафы и наказания и т.д.). Это "свободный" и "жесткий" варианты для Парижа; "новый" и "древний" для Реймса. Своеобразный вариант – нормы, которые подверглись значительной унификации со стороны властей.
  6. Парижские уставы представляют собой (с учетом всех исторических характеристик) "тотальную" перепись регламентов. Это нашло отражение не только во внешних характеристиках уставов (определенный порядок записи требований, штампы и формулы и др.), но проявилось и при количественном анализе. Во-первых, была выявлена группа уставов, не несущих положенной уставам регламентирующей нагрузки. Все требования этих уставов, за исключением повинностей, представляют собой разрешения. Во-вторых, были обнаружены условия, которые записывались от случая к случаю, "необязательно" – когда составители, стараясь зафиксировать все возможные правила, добавляли к "обязательным" условиям "естественные", само собой разумеющиеся. Такую характеристику можно дать условию, определяющему одинаковый размер штрафов для мастера и подмастерья, требованию контроля за качеством привозных изделий. И, как это ни странно, к ним очень близки требования знать ремесло и иметь средства для того, чтобы стать мастером.
  7. Эти условия имеют небольшое количество связей, не имеют их вовсе, или же имеют в основном слабые связи, близкие к критическому значению коэффициента. В то время как подавляющее большинство требований довольно значительное количество связей. Условия, имеющие много связей (а тем более – много сильных связей), показывают сцепления структуры текста – внутренней, неосознаваемой его структуры. Они играют роль связующих узлов этой структуры.
  8. Условия с небольшим количеством связей демонстрируют свою слабую "жизнеспособность". У них меньше "привязок" в тексте – значит, меньше привязок на сознательном и подсознательном уровнях. Зато больше вероятность того, что именно эти условия "забудут" в следующий раз, потому что не возникнет ни одной ассоциативной связи (опять же – на сознательном или подсознательном уровне).
  9. С другой стороны, слабые связи показывают возможность изменений. А значит обязательные к выполнению нормы, определяющие центр структуры, имеют возможность приспособиться к особенностям профессий, к изменяющимся обстоятельствам. И таким образом развиваясь и изменяясь, сохраняются в своей основе.

 

А.Л. Кобринский (Москва)

АНАЛИЗ ВЫСТУПЛЕНИЙ ЛИДЕРОВ ДЕПУТАТСКИХ ОБЪЕДИНЕНИЙ
ГД ФС РФ ПЕРВОГО СОЗЫВА

Настоящим исследованием продолжено изучение стенографических отчетов пленарных заседаний Государственной Думы Федерального Собрания Российской Федерации первого созыва.

В центре внимания данной работы выступления лидеров думских фракций на пленарных заседаниях ГД ФС РФ 1993 – 1995 гг. 13 января 1994 г. в Государственной Думе были официально зарегистрированы восемь фракций и одна депутатская группа. Позже были образованны еще несколько депутатских групп, однако, в силу различных причин, не все они были зарегистрированы в установленном регламентом Думы порядке. Как известно, решением Думы статус фракции получают депутаты, избранные в Государственную Думу на основе избирательного объединения, независимо от того количества мест, которое получило избирательное объединение. Таким образом, фракция создается на основе избирательного объединения, блока или партии. Статус депутатской группы получает объединение депутатов, сформированное непосредственно в Думе, насчитывающее не менее 35 членов. Несмотря на то, что депутатские группы в Государственной Думе первого созыва выступали также как субъекты парламентской деятельности, в настоящей работе анализу подвергнуты выступления руководителей восьми фракций: "Выбор России" (Е. Гайдар), ЛДПР (В. Жириновский), Аграрная партия России (М. Лапшин), "Женщины России" (Е. Лахова), "Явлинский – Болдырев – Лукин" (Г. Явлинский), Партия российского единства и согласия (С. Шахрай), Коммунистическая партия Российской Федерации (Г. Зюганов), Демократическая партия России (Н. Травкин, а после его ухода в кабинет министров В.С. Черномырдина, фактически главой фракции ДПР становится С. Глазьев) и первой из созданных депутатских групп под названием "Новая региональная политика" (В. Медведев). Предварительный анализ показал, что роль других депутатских групп в деятельности и политической жизни Государственной Думы первого созыва оказалась малозаметной.

В целом, представляется удачным сравнение ситуации, сложившейся в ГД ФС РФ 1993 – 1995 гг., с равнобедренным треугольником, углами которого, являлись фракции КПРФ, ВР и ПРЕС, а по сторонам его следующим образом располагались фракции: сторона КПРФ – ВР фракции АПР и "Женщины России"; по стороне КПРФ – ПРЕС находились ДПР и депутатская группа НПР; и по стороне ВР – ПРЕС фракция "ЯБЛ". ЛДПР находилась, как бы внутри этого треугольника, периодически смещаясь в сторону одного из углов, но все же она располагалась несколько левее от центра треугольника.

Анализ выступлений лидеров фракций позволил получить более полное и четкое представление о позиции фракции, об ее участии в обсуждении того или иного вопроса. Анализ дал возможность выявить фракционные приоритеты в законотворческой деятельности. Установлена частота и интенсивность выступлений руководителей фракций и основные акценты, расставленные ими при обсуждении различных проблем. Изучен контекст отдельных высказываний и дана его оценка. Показана частота встречаемости различных терминов имеющих важное значение для законодательной деятельности, и сделан их сравнительный анализ у руководителей депутатских объединений в Государственной Думе первого созыва.

Особый интерес представляют выступления руководителей КПРФ, ЛДПР и ЯБЛ (ныне известной нам как Яблоко). 19 декабря 1999 г. состоялись выборы в Думу третьего созыва и сегодня можно констатировать, что этим трем фракциям в третий раз (с разным успехом) удалось преодолеть 5% барьер. Учитывая тот факт, что лидеры у них остались неизменными, настоящая работа создает основу для последующего сравнительного анализа насколько остались неизменными приоритеты фракций высказанные их руководителями, а так же, какие изменения произошли в позициях самих лидеров и имелись ли таковые. АПР хотя и потеряла фракцию, но в ГД ФС РФ второго созыва работала аграрная депутатская группа, а в Думу третьего созыва прошел лидер АПР М. Лапшин и вероятнее всего будет сформирована депутатская группа состоящая из депутатов аграрников. Так что все вышесказанное о трех фракциях можно отнести и к фракции АПР.

Источниковую базу исследования составили стенограммы пленарных заседаний Государственной Думы первого созыва.

Предметом исследования явились стенографические отчеты заседаний ГД ФС РФ 1993 – 1995 гг. в их электронной версии.

Из имеющегося массива стенографических отчетов, а в электронной версии это около 25 мегабайт, что приблизительно равно 40 полноценным 600 страничным томам в печатной форме, содержащих материалы 140 заседаний, были выделены части стенограмм, которые непосредственно касались интересующих нас выступлений. Из них был составлен единый файл, который и был подвергнут изучению. Для данной работы анализу были подвергнуты все выступления лидеров означенных депутатских объединений сделанных ими за два года работы в Государственной Думе первого созыва.

В работе приводятся результаты компьютеризированного контент-анализа, выполненного при помощи программы "ТАСТ".

 

Ю.А. Лихтер (Москва)

ОТ РАБОТАЮЩЕГО ПРИЗНАКА
К РАБОТАЮЩЕЙ ПОДСИСТЕМЕ

Одной из наиболее важных операций при описании археологического источника является отбор признаков. Наибольшее внимание уделяется выбору диагностических, или, как их еще называют работающих, признаков, по которым можно сгруппировать артефакты (Каменецкий и др. с. 226).

Большинство исследователей рассматривает эту задачу как статистическую - (Федоров-Давыдов, с. 7). При этом признано, что неправильный выбор признаков существенно искажает реальные связи между объектами. Однако критерием правильности оказывается результат. Если он не удовлетворяет исследователя, рекомендуется "корректировать список признаков и их значений" (Федоров-Давыдов, с. 132). Таким образом, получается, что результат задан до статистической обработки материала.

Осложняет выделение признаков и то, что, по всей видимости, каждый признак является диагностическим, в противном случае нет смысла его фиксировать. (Каменецкий и др. с. 26). При этом, как правило, не определяется, для какой цели группируются объекты.

По всей вероятности, статистическому определению веса признака необходимо предпослать его логический анализ. Известно, что "все многообразие и структура взаимосвязей между параметрами, описывающими явление извне, и поддающимися непосредственному измерению (признаками), обусловлены некими скрытыми, но объективно существующими причинами, так называемыми факторами, измерить которые непосредственно нельзя" (Бородкин и др. с. 257-259).

При поиске скрытых факторов многое зависит от того, в какой форме исследователь отображает информацию. "Чтобы не потерять самого главного, нужно научиться строить модели этих фрагментов и научиться работать с ними. (Бешенков и др. с. 29).

Наряду со статистической моделью, которая видит мир как совокупность балансов, средних и инвариантов, во второй половине XX века все большую роль играет системная модель (Чайковский, с. 48-50).

Принятие системной модели позволяет рассматривать объект исследования как целостность, состоящую из взаимосвязанных элементов (подсистем), которые развивается по своим законам и в то же время связаны между собой. (Щапова и др. 1990 с.5). С точки зрения теории эволюции в каждый момент времени развиваться может только одна из подсистем.

Исходя из этого, можно предложить следующий алгоритм действий: определить, какую задачу исследователь перед собой ставит и в рамках какой из подсистем она может быть решена; выделить признаки, позволяющие исследовать эту подсистему; и лишь затем проводить статистический анализ связей и корреляций выделенных признаков.

ЛИТЕРАТУРА

Бешенков С.А., Гейн А.Г., Григорьев С.Г. Информатика и информационные технологии. Екатеринбург, 1995.

Белова Е.Б., Бородкин Л.И., Гарскова И.М., Изместьева Т.Ф., Лазарев В.В. Историческая информатика. М., 1996.

Каменецкий И.С., Маршак Б.И., Шер Я.А. Анализ археологических источников. М., 1975.

Федоров-Давыдов Г.А. Статистические методы в археологии. М., 1987.

Чайковский Ю.В. Алеатика – наука о случайности. // Ценологические исследования. М., 1996 с. 42-63.

Щапова Ю.Л., Лихтер Ю.А., Столярова Е.К. Морфология древностей. Киев, 1990.

 

А.М. Маркевич (Москва)

ПЕРЕПИСКА СОЛДАТ С ЦЕНТРАЛЬНЫМИ СОВЕТАМИ В 1917 г.

Современная историография российской истории ХХ в. много внимания уделяет таким источникам как письма, особенно "письмам во власть". При этом они обычно рассматриваются как источники, отражающие общественные настроения соответствующего периода, менталитет масс. Однако необходимо заметить, что "письма во власть" создавались, прежде всего, для установления связи, контакта "простого человека" с политической элитой, с целью повлиять на нее, в условиях неразвитости других форм влияния общества на власть. Поэтому такие письма также отражают представления людей об органах власти, процесс взаимоотношений между массами и властью. В связи с этим важно рассматривать целые комплексы однородных писем, изучая не только содержание писем, настроения их авторов, но и процесс взаимодействия масс и власти, исследуя интенсивность переписки в зависимости от времени, состав авторов писем.

В этом аспекте была рассмотрена и проанализирована переписка солдат с Петросоветом и ВЦИКом 1-го созыва в марте – октябре 1917 г. Из комплекса солдатских писем были сделаны выборки, организованные в виде базы данных [1].

Было установлено, что солдаты, если учитывать общую численность этой группы по отношению ко всему населению страны, направляли особенно много корреспонденции в центральные Советы в 1917 г. Это говорит о высокой активности солдат, усилении среди них традиционных для России иллюзий низов по отношению к власти.

При этом интенсивность переписки солдатских масс с центральными советами на протяжении всего восьмимесячного периода марта – октября 1917 г. оставалась приблизительно на одном и том же уровне. Несколько меньше писем, чем в другие месяцы, было получено Петросоветом в марте 1917 г., что объясняется слабой информированностью солдат, прежде всего солдат фронта, о событиях произошедших в стране, повлекшей запоздалое их включение в переписку. Наибольшее количество писем было оправлено солдатами в июле 1917 г., что указывает на пик доверия, заинтересованности солдат в центральных советах в 1917 г.

Подавляющее большинство солдатских писем имеют какую-либо подпись. Небольшое количество анонимных писем говорит о доверии солдат к советам, они не боялись подписывать свои письма, скорее просто "забывали".

Две трети писем были написано солдатами единолично, однако, в большинстве солдатских писем их авторы выступали или считали возможным выступать от имени целых групп солдат, ведя повествование не от единственного, а от множественного числа. Это лишний раз подтверждает вывод о распространенности коллективистской психологии среди солдат, в большинстве своем вчерашних крестьян.

Состав авторов писем чрезвычайно широк. В 1917 г. в армии, фактически, не существовало такой группы солдат, чьи бы представители не писали во ВЦИК 1-го созыва или Петросовет, однако степень вовлеченности различных групп солдат в процесс взаимодействия с центральными советами в 1917 г. несколько различалась, в зависимости звания, рода войск, места службы и т.д.

Важно отметить, что распределения писем по различным признакам, характеризующих их авторов, полученные на основании двух разных выборок, относящихся одна к июню – июлю 1917 гг., а другая к марту – октябрю, не сильно различаются между собой. Состав солдат, писавших в центральные советы между мартом и октябрем 1917 г. был стабилен.

Так, вовлеченность в переписку с центральными советами фронтовиков была больше, нежели тыловиков. Последние имели возможность принимать участие в местной политической жизни, в работе местных советов, тогда как для фронтовиков письма нередко являлись единственной формой выражения своего мнения. Кроме того, условия, в которых находились фронтовики, чаще заставляли их "искать правду" на самом верху непосредственно у центральных Советов.

С точки зрения рода войск большинство писем принадлежит естественно пехотинцам. Однако, их процент среди авторов всех писем существенно меньше общего количества пехоты относительно других родов войск в это время, что во многом объясняется более низким уровнем грамотности. Артиллеристы, железнодорожники, солдаты инженерных частей писали значительно чаще. Активны также были солдаты всевозможных вспомогательных частей, частей обеспечения, солдаты нестроевых рот, куда влияние революции, новые порядки и веяния проникали в первую очередь.

Среди авторов, указавших свое звание, преобладают рядовые. Но процент унтер-офицеров среди авторов писем выше, чем их доля положенная в части по штату военного времени. Это позволяет говорить о несколько большей степени активности характерной для унтер-офицеров. Но в целом они не были отделены от рядовых солдат: и те и другие участвовали достаточно активно в одном и том же процессе.

Активно хотели взаимодействовать с центральными Советами члены местных солдатских комитетов, чья доля среди авторов писем, превышает их количество относительно всей русской армии.

Попытка выявить зависимости между всеми вышерассмотренными признаками, характеризующими авторов писем, потерпела неудачу. Попарные коэффициенты квадратичной сопряженности Хи-квадрат незначимы, что говорит о нормальном независимом распределении этих признаков относительно друг друга. Это указывает на известное единство солдат русской армии, их массовую вовлеченность в переписку с центральными Советами, одинаковое отношение к ним. В Петросовет и ВЦИК 1-го созыва хотели писать и писали все группы солдат русской армии в 1917 г.

 

П.П. Медведев (Петрозаводск)

ПРИМЕНЕНИЕ МАТЕМАТИКО-МОДЕЛЬНЫХ МЕТОДОВ АНАЛИЗА
В АРЕАЛЬНЫХ ИССЛЕДОВАНИЯХ НАРОДНОГО ЗОДЧЕСТВА РОССИЙСКОГО СЕВЕРА

Первые шаги по применению новых информационных технологий в исследовании памятников отечественной народной архитектуры были предприняты еще в 80-х годах XX в. Так, за период 1979-1986 гг. в процессе изучения народного зодчества Беломорского Поморья автором было обследовано 135 сельских поселений и более 3500 крестьянских жилищно-хозяйственных построек и средствами системы статистического анализа SAS-79/84.2 удалось разрешить в комплексе две группы задач: информационно-поискового характера с территориальным ареалированием историко-архитектурных объектов и статистическо-типологического характера с подсчетом элементарных статистик территориально-этнического распределения архитектурно-типологических признаков-атрибутов. По результатам исследования автору удалось сформулировать основы ряда новых предметно-методологических подобластей. Направление по изучению проблем создания многоцелевых программных комплексов с историко-архитектурной информацией получило финансовую поддержку со стороны Российского гуманитарного научного фонда (Грант РГНФ, № 96-04-12022в) и Института "Открытое общество" (Грант №IEA788u-w, http://www.soros.karelia.ru/projects/1998/ladoga), а разработка проблем историко-архитектурной статистики и математического моделирования традиционных архитектурно-пространственных систем и объектов народного зодчества Российского Севера была поддержана Российским фондом фундаментальных исследований (Грант РФФИ, № 98-06-80364).

Примером комплексного изучения традиционных объектов народной архитектуры, проведенного с использованием методов архитектурно-типологического и математико-модельного анализов, может служить исследование 107 групповых систем населенных мест (ГСНМ – архитектурно-природных территориально-пространственных образований, сформировавшихся из тяготеющих друг к другу населенных пунктов), обследованных автором на территории трех смежных историко-архитектурных субрегионов – Беломорского Поморья, Архангельского Поонежья и Восточного Обонежья, расположенных у границ Республики Карелия, Мурманской и Архангельской областей.

В процессе предметно-содержательного и разведочного анализов с применением архитектурно-типологического кодификатора и возможностей табличного процессора Excel-97 автору удалось установить бытование на территории упомянутых субрегионов ГСНМ, дифференцирующихся: на 2 класса по характеру трудовой деятельности проживающего в них населения (сельские и смешанные поселково-сельские), на 2 подкласса по социально-экономическим и эволюционно-генетическим закономерностям их возникновения (сформировавшиеся путем отпочкования новых населенных пунктов от старого селения-ядра и путем механической концентрации населенных пунктов, не имеющих общих генетических корней), на 3 типа по объемно-планировочной структуре (со зрительно разобщенными, а также с частично- и с полностью слившимися структурными частями), на 4 подтипа по форме пятна застройки (с линейной, ядерно-центричной, ковровой и смешанной формами), на 4 вида по композиционным особенностям (без структурообразующих элементов, а также с естественными природно-ландшафтными, искусственными и комбинированными структурообразующими элементами), на 4 подвида по характеру акцентировки пятна застройки архитектурно-природными доминантами (нейтральные, периферийно-, центрично- и смешанно-акцентированные) и на 4 разновидности по особенностям взаимодействия жилой застройки с природным окружением (с активным и пассивным использованием ландшафта, а также с его искажением и с комбинацией упомянутых композиционных приемов). Далее с целью изучения внешне скрытых зависимостей был проведен корреляционный анализ парных связей между ведущими типологическими признаками и через коэффициент корреляции Пирсона построены региональная и субрегиональные корреляционные граф-модели.

Результаты проведенного исследования свидетельствуют о наличии в ГСНМ упомянутых выше субрегионов как общих, характерных для всего Российского Севера черт (преобладание сельских ГСНМ (85,8%), сформировавшихся путем отпочкования новых поселений от старого селения-ядра (79,4%), имеющих зрительно разобщенные структурные части-поселения (61,8%), линейную форму пятна застройки (55,5%), комбинированные структурообразующие элементы (54,0%), центричную акцентировку архитектурно-природными доминантами (36,5%) и активно использующих ландшафт с усилением его композиционных качеств (72,9%)), так и специфических особенностей, сформировавшихся под влиянием сложного комплекса природно-климатических, исторических, социально-экономических и этнических факторов.

 

В.А. Перевертень (Москва)

ЯЗЫК ИНФОЛОГИЧЕСКОГО МОДЕЛИРОВАНИЯ
ДЛЯ ПРОЕКТИРОВАНИЯ ПРОСОПОГРАФИЧЕСКИХ БАЗ ДАННЫХ АНКЕТНОГО ТИПА
[
1]

Для несложных анкет и при достаточной квалификации историка в области технологии баз данных конструирование структуры базы данных (БД) возможно непосредственно в терминах избранной системы управления базами данных (СУБД). В общем же случае предпочтительнее предварительное инфологическое моделирование, т.е. описание необходимых для проектирования БД аспектов предметной области в понятиях близких историку и безотносительно конкретных средств компьютерной реализации БД. Инфологическая модель (ИЛМ) позволяет изложить сведения, требуемые для построения БД, человеку, не обремененному знаниями каких-либо СУБД. Она может выступать в качестве интерфейса между заказчиком проекта БД (историком) и его разработчиком (специалистом в области компьютерных БД), избавляя историка от необходимости изучать премудрости технологии проектирования БД.

Ниже дается описание языка инфологического моделирования, специально предназначенного для формализованного представления исходных данных для проектирования просопографических баз данных анкетного типа. В описании конструкций языка инфологического описания используются традиционные приемы представления синтаксиса. Заключение конструкции в квадратные скобки означает необязательность ее употребления, а в фигурные – альтернативность. Многоточие означает возможность повторения предшествующей конструкции.

Инфологическое описание анкеты социальной группы состоит из следующих модулей: идентификации анкеты, определения раздела, определения пункта, структурных отношений между разделами и пунктами, отношений между значениями пунктов, идентификации экземпляра анкеты.

Модуль идентификации анкеты имеет формат:

Анкета <имя_анкеты>;

Разработчики <Ф.И.О. разработчиков анкеты>;

С этого модуля начинается описание состава и структуры анкеты социальной группы.

Модуль определения раздела имеет формат:

Раздел <идентификатор> с именем <наименование_раздела>

{простой/составной {неповторяющийся/повторяющийся}};

Раздел, состоящий только из пунктов, называется простым, а включающий другие разделы – составным. Если раздел предполагает более чем одну реализацию в каждой реализации составного раздела, то он считается повторяющимся, в противном случае – неповторяющимся.

Модуль определения пункта имеет формат:

Пункт <идентификатор> с именем <наименование_пункта>

{однозначный/многозначный}, значения {полные/коды}, тип значений <имя_типа>, [особые значения <список особых значений>,

[максимальная длина значений <длина в символах>,

[значения {равны {<список значений>/

словарю <имя_словаря_значений>}/

лежат в диапазоне от <значение> до <значение>},

пропуск значений {допускается/не допускается};

В качестве примеров особых значений пункта можно привести следующие: "XXXXXXX" (значение неизвестно), "_______" (значение известно, но пока не введено), "0000" (для года начала), "9999" (для года окончания) и т.д.

Следуя непосредственно за модулем идентификации анкеты, экземпляры последних двух модулей могут располагаться в произвольной последовательности.

Модуль структурных отношений между разделами и пунктами имеет формат:

Анкета <имя_анкеты> включает

[{+/-}]{раздел/пункт} <идентификатор> [при условии <условие>]

[, {+/-}]{раздел/пункт} <идентификатор> [при условии <условие>]]...;

Раздел <идентификатор> включает

[{+/-}]{раздел/пункт} <идентификатор> [при условии <условие>]

[, {+/-}]{раздел/пункт} <идентификатор> [при условии <условие>]]...;

Данный модуль определяет возможные структуры анкет. Он располагается после модулей описания разделов и пунктов. Предложение "Анкета" употребляется только один раз. На количество предложений "Раздел" ограничения не накладываются. Порядок следования этих предложений в принципе может быть произвольным, но лучше, если он каким-либо образом отражает древовидность структур анкет.

С изменением условий просопографических исследований изменяется и состав рассматриваемых характеристик членов социальной группы. Необходимость отразить эти изменения в инфологическом описании требует модификации его текущей модели. В предлагаемой ИЛМ это выражается в добавлении новых определений разделов и/или пунктов и изменении описания структурных отношений между разделами и пунктами. Синтаксически добавляемые в описание структуры анкеты разделы/пункты помечаются знаком "+", а удаляемые разделы/пункты – знаком "–". Разделы/пункты, помеченные знаком "–" удаляются из описания лишь логически. При последующих модификациях они могут быть восстановлены заменой "–" на "+".

Модуль отношений между значениями пунктов имеет формат:

[Значения пункта <идентификатор>

{{больше/больше или равны} значений пункта <идентификатор>/

{меньше/меньше или равны} значений пункта <идентификатор>/

{больше/больше или равны} значений пункта <идентификатор> и

{меньше/меньше или равны} значений пункта <идентификатор>};]

Это необязательный модуль. В основном он может использоваться для спецификации ограничений, связанных с контролем непротиворечивости времен свершения событий и протекания процессов. Его экземпляры следуют за последним экземпляром предыдущего модуля.

Модуль идентификации экземпляра анкеты имеет формат:

Анкета идентифицируется {пунктами <идентификатор1[, идентификатор2, ...> [или пунктами <идентификатор1[, идентификатор2, ...>] ...

[ и внутрисистемно]/внутрисистемно}.

Этот модуль обязателен, имеет единственный экземпляр и является последним в описании анкеты социальной группы. Под внутрисистемной идентификацией подразумевается уникальная автоматическая нумерация анкет.

После любого предложения можно добавить поясняющий его текст, следующим образом: $ <произвольный текст> $;

В качестве иллюстраций к докладу на конференции будут представлены описания средствами рассмотренного языка исходных данных для создания просопографических БД "Российские историки" и "Командармы".

 

М.И. Петров (Новгород)

МОДЕЛЬ РЕКОНСТРУИРОВАННОГО РЕЛЬЕФА
КАК МЕТАИСТОЧНИК ДЛЯ ИСТОРИКО-АРХЕОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ
[
1]

Проблема возникновения крупных городских поселений нередко ставит задачу определения местоположения древнейшего поселения. Подобная задача приобретает особую сложность в том случае, если археологический памятник расположен в черте современного города, территория которого сильно искажена антропогенным вмешательством (Новгород, Псков, Тверь, Москва). Наиболее важным источником для решения задачи локализации древнейшего поселения становится модель погребенного рельефа.

Методика построения модели палеорельефа для городской территории опробована при исследовании территории Новгородского кремля. В ходе работы выяснились некоторые особенности использования данных инженерно-геологических исследований для построения модели. Построенная при использовании геостатистических методов модель подвергается двум стадиям критического анализа.

На первой стадии материалы буровых журналов, как и традиционные источники, требуют критического источниковедческого анализа. Ошибки при измерениях, субъективная и нередко некомпетентная интерпретация культурных напластований геологами, внесение корректив в Балтийскую систему высот, нивелировочные работы на территории современного города в некоторых случаях требуют исключения данных скважины для построения конечной модели.

На второй стадии построенная модель подвергается геологическому анализу. Некоторые скважины исключаются по причине нарушенной геологической стратиграфии или несоответствия типологии форм местного рельефа.

Итоговая модель становится метаисточником для историко-археологических исследований. Сопоставление и дополнение итоговой модели с материалами археологических раскопок Новгорода позволят построить модель оптимального расселения на территории современного Новгорода и его ближайшей округи, модель оптимальных транспортных путей, модель гидрологической ситуации на момент освоения территории. Важным направлением исследований могут стать степень влияния исходного ландшафта на хозяйственную деятельность городского населения и выяснение зависимости градообразовательных процессов от условий местности. Кроме того, построенная модель может оказать существенное влияние на изучение динамики освоения территории средневекового Новгорода.

 

М.И. Петров, С.В. Трояновский (Новгород)

ЭЛЕКТРОННАЯ ПУБЛИКАЦИЯ
"НАУЧНОЕ НАСЛЕДИЕ М.Х.АЛЕШКОВСКОГО"
[
1]

Систематизация и обобщение накопленных в течение XX столетия исторических и археологических материалов является характерной чертой современных научных исследований. Наряду с традиционными формами публикаций в этой области исследований на приоритетные позиции выходят электронные издания (CD-ROM, on-line публикации, ГИС, СУБД).

Электронное издание обладает значительными преимуществами перед традиционными формами:

Оснащенная поисковой системой электронная публикация становится новым видом исследовательского инструментария, где на первый план выходит не столько концепция автора, сколько содержащаяся в публикации информация.

По нашему мнению, наиболее приоритетным направлением является перевод источников в электронную форму и последующая их публикация. Особенно полезным это направление является для археологии, поскольку между полевыми исследованиями и публикацией их материалов проходит значительное количество времени (до нескольких десятилетий), что негативно сказывается на продуктивном использовании археологических данных. В особенности это касается материалов многолетних исследований на уникальных памятниках.

Научное наследие М.Х. Алешковского (1933 – 1974) в значительной мере связано с изучением двух известнейших памятников древнерусской фортификации: Новгородский кремль и Окольный город Новгорода. Материалы его систематических раскопок (1956-1960, 1971 гг. – Новгородский кремль; 1968-1972 гг. – вал Окольного города), лишь частично были опубликованы автором, но уже эти немногие публикации стали поворотным пунктом в истории изучения новгородских оборонительных сооружений. Важность публикации материалов его полевых исследований заключается еще и в том, что они явились основой для формирования убедительной теории происхождения Новгорода (Янин В.Л., Алешковский М.Х., 1970), не потерявшей своей актуальности и поныне.

Характерной чертой электронной публикации "Научное наследие М.Х. Алешковского" (Часть I. Археология и история новгородских крепостных сооружений) является применение HTML. Это вызвано следующими причинами: независимость электронного издания от платформы, простота и удобство использования, возможность быстрого размещения на Интернет-сервере или сменном носителе.

Подготовка издания велась по двум направлениям: разработка HTML-оболочки и перевод данных в электронный формат. При условии качественной подготовки HTML-оболочки (разрабатывалась с применение языка программирования PHP), создание конечного продукта не представляет особой сложности.

Подготовленный нами к публикации корпус материалов состоит из нескольких категорий. Наиболее крупной являются археологические отчеты (свыше 500 машинописных страниц текста, более 100 чертежей и 350 фотографий). Кроме того, в публикацию включены статьи (14 наименований) и неопубликованные работы (6 наименований) М.Х. Алешковского. Отдельно размещены оцифрованные изображения с высоким разрешением.

Работа выносится на обсуждение широкой научной общественности и, по замыслу авторов, должна стать апробацией нового типа издания.

 

М.Г. Смагин (Ижевск)

ПРОСТРАНСТВЕННОЕ ПРЕДСТАВЛЕНИЕ КУЛЬТУРНОГО СЛОЯ
АРХЕОЛОГИЧЕСКИХ ПАМЯТНИКОВ С ИСПОЛЬЗОВАНИЕМ ГИС-ТЕХНОЛОГИЙ

Создание компьютерной модели, имитирующей археологический источник, включает в себя три этапа: документирование полевого материала, компьютерное картографирование и создание 3D-образа источника, интерпретация. Задача второго этапа состоит в разработке технологии создания многослойной цифровой карты на основе данных полевых исследований для его последующего пространственного анализа.

Для достижения поставленной задачи необходимо комплексное использование компьютерных технологий: компьютерная картография (ГИС-пакет MapInfo), технология создания баз данных (БД) и 3D-графика (специальные приложения под MapInfo или AUTOCAD).

Имея должным образом документированные полевые данные (планиграфическая информация, текстовая информация), средствами пакета MapInfo создается БД археологических слоев.

В основе создания слоя карты – характеристики культурного слоя. Каждый слой карты аналогичен одному выделенному и атрибутированному почвоведами и датированному на основании вещевого материала археологическому слою (напластования, прослойки). Обращение к данному параметру создания слоя карты обосновано тем, что любой археологический объект состоит из набора отличных друг от друга слоев и прослоек, которые являются структурными составляющими культурного слоя археологического объекта.

Текстовая информация (полевая опись) организуется в отдельную БД артефактов, которая в дальнейшем используется как независимо, так и в качестве внешней базы данных в MapInfo. При этом создается отдельный слой карты, включающий точечные объекты и определяющий пространственное расположение артефактов.

Созданный таким образом набор слоев карты используется в качестве исходного материала для создания тематических карт в рамках ГИС-пакета, и создания 3D-образа культурного слоя.

Информация, содержащаяся в БД артефактов и БД картографических материалов, в дальнейшем используется в пакетах, поддерживающих 3D-графику (специальные приложения под MapInfo или AUTOCAD), для создания объемной модели археологического источника.

Многослойная цифровая карта, созданная по результатам полевых исследований, является основой для последующих функциональных, хронологических и др. интерпретаций и реконструкций археологического объекта.

 

Г. Сменцарев (Москва)

СИСТЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
И АВТОМАТИЗАЦИЯ АНАЛИЗА НЕРЕГУЛЯРНЫХ ТРУДНОФОРМАЛИЗУЕМЫХ ДАННЫХ

Основная тенденция компьютерных вычислений – непрерывное повышение уровня их интеллектуальности. Свою специфику проблема интеллектуализации вычислений имеет при обработке нерегулярных трудноформализуемых данных, описывающих социальные, в том числе исторические процессы. Система обработки подобного рода данных должна обладать качествами, приближающими их к уровню естественного интеллекта, а именно:

  1. Восприятие на входе не данных, а знаний в виде фреймов.
  2. Внутренняя самоорганизация: возможность планирования своей целесообразной деятельности для достижения цели.
  3. "Самосознание" системы, возможность оценивать правильность своих действий по какому-либо критерию ошибок.
  4. Способность вести диалог с человеком на естественном языке.
  5. Хранимые в системе знания должны быть активным началом.

В области средств искусственного интеллекта (ИИ) в настоящее время выделяются следующие основные направления:

Системы для извлечения знаний из баз данных специалистами выделяются в самостоятельную категорию систем искусственного интеллекта, начиная с 1994 года. На эти системы возлагаются задачи обнаружения закономерностей в неструктурированных наборах чисел и символов, выделения из них значимых для пользователя закономерностей и принятия на основании них определенных решений.

Сама концепция баз данных в настоящее время претерпевает серьезные изменения. Намечается постепенная переориентация пользователей от реляционных баз данных в сторону объектно-ориентированных технологий.

Объектно-ориентированные банки данных (ООБД), имея более сложную структуру по сравнению с реляционными БД, требуют специфического подхода к их созданию. В качестве основы для разработки и проектирования ООБД целесообразно использовать метод объектно-ориентированного анализа и проектирования (OOA/OOD). Этот метод разработан применительно к объектно-ориентированному программированию, однако, он может быть адаптирован и к проектированию объектно-ориентированных банков данных.

Процесс проектирования объектно-ориентированной системы может быть представлен как процесс выполнения следующей последовательности действий:

Концептуализация позволяет установить основные требования к банку данных. Объектно-ориентированный анализ (OOA) выполняет следующие функции:

  1. служит формализации представления реальной системы,
  2. определяет взаимосвязи между элементами системы и их атрибутами.

Эволюция имеет целью наращивание и изменение реализации банка данных, его последовательного совершенствования. Сопровождение – деятельность по управлению эволюцией ООБД в ходе его эксплуатации.

Организация и представление информации в объектно-ориентированной СУБД позволяет формализовать анализ нерегулярных трудноформализуемых данных с использованием архива накопленных сведений. При этом аналитические возможности системы будут определяться ее "долговременной памятью", т.е. объемом информации, накопленной в структурированном архиве.

Технологически процесс анализа нерегулярных трудноформализуемых данных, представленных в объектом виде, организуется в виде следующей последовательности операций:

Операция синтеза применяется для следящих систем реального времени. Суть операции заключается в том, чтобы обеспечить строгое соответствие каждого фиксированного состояния объекта реальной системы одному и только одному информационному аналогу в хранилище информации.

Индуктивный вывод используется в основном для определения законов изменения отдельных атрибутов объектов изучаемых систем, а также в качестве вспомогательного метода для обеспечения сравнимости объектов в процессе выводов по аналогиям.

Аналогия – метод выводов, при которых обнаруживается подобие между несколькими заданными объектами. В рассматриваемой системе аналогия предполагает выполнение трех условий:

Аналогия по образцам предполагает сопоставление изучаемого элемента реальной системы, условий и истории его развития с последовательностью информационных объектов, описывающих смену состояний в некоторых замкнутых пространствах состояний типовых (модельных) элементов. Процедура анализа состояния элемента системы путем аналогии по примерам предусматривает сопоставление его состава и структуры, условий и истории развития с другими элементами системы такого же типа, либо того же самого элемента, но на более ранних стадиях его развития. Аналогия по примерам включает в себя процедуру оценки надежности вывода.

Полезность изложенного подхода применительно к задачам анализа слабоструктурированных исторических источников представляется достаточно очевидной.

 

И.О. Тарнопольская (Днепропетровск)

КОЛИЧЕСТВЕННЫЕ МЕТОДЫ И АВТОРСКИЙ СТИЛЬ:
степень влияния литературной манеры автора и переводчика
на литературные особенности переводного произведения

Переводная литература представляет собой очень важную часть современной космополитической культуры. Появление большого количества научной и художественной литературы, переведенной профессиональными переводчиками, привело к тому, что интеллектуалы ХХ в. придают меньшее значение знанию иностранных языков, чем это делали их предшественники. Однако если в научной литературе читателя в первую очередь интересует содержащаяся в ней информация, то его интерес к художественной литературе зависит в первую очередь от авторского таланта и индивидуального стиля. Вопрос о степени сохранения оригинального авторского стиля в переводных версиях представляется чрезвычайно существенным. Различные языки имеют собственные синтаксические и семантические системы, что не всегда дает возможность воспроизвести авторскую манеру средствами выражения иного языка. Данная работа является попыткой установить, чей литературный стиль – автора или переводчика, оказывает большее влияние на перевод. Для достижения этой цели берется отрывок из англоязычного художественного произведения (19 тыс. символов) и подготавливается 4 варианта перевода. Один из этих переводов выполнен компьютерным переводчиком "Stylus", второй – студентом группы, изучающей английский язык, третий и четвертый – двумя профессиональными переводчиками. Кроме того, отобран фрагмент из авторского русскоязычного текста одного из переводчиков. Всем текстам придан машиночитаемый вид и проведен сравнительный анализ с помощью программы "Enthropy", разработанной в Днепропетровском государственном университете и ориентированной на идентификацию авторского стиля через определения коэффициента диграмной энтропии (уровня хаотичности текста), индивидуального для каждого автора. При этом текст рассматривается как сложная система, основным элементом которой является буква, а коэффициент диграмной энтропии вычисляется на базе парной встречаемости тех или иных букв. При этом первой цифрой коэффициента всегда является 7, а определяющими выступают первые две цифры после запятой. Предшествующие эксперименты с русскоязычными текстами показали, что коэффициент диграмной энтропии изменяется с увеличением объема текста, пока не достигается определенный объем (также индивидуальный для каждого автора), после которого коэффициент сохраняет стабильность.

В процессе исследования было установлено, что коэффициент диграмной энтропии, для перевода, выполненного низко квалифицированным переводчиком равен 7, 6, для высоко квалифицированных переводчиков – 7, 4 и 7, 1. Для машинного перевода коэффициент диграмной энтропии установить невозможно. Коэффициент русскоязычного текста одного из переводчиков равен 7, 9. Сопоставление полученных результатов позволило прийти к ряду выводов: 1) была подтверждена возможность использования метода диграмной энтропии для определения индивидуального авторского стиля, поскольку при анализе машинного перевода, в котором отсутствует автор и черты его индивидуальности, коэффициент диграмной энтропии так и не проявился; 2) анализируя текст непрофессионального переводчика, слабо знающего английский язык, можно заметить, что определенная узость его словаря, незнание многих особенностей английского языка лишает его текст какой-либо выраженной стилистической привлекательности, сводит до минимума эмоциональное воздействие на читателя. Это отразилось и в коэффициенте энтропии, который приобретает стабильный характер много раньше, чем это происходит в высокоорганизованных художественных текстах; 3) сравнение коэффициентов диграмной энтропии трех версий переводов и сопоставление одного из этих коэффициентов с коэффициентом оригинального русскоязычного текста переводчика показал, что все вышеназванные коэффициенты отличны друг от друга. Это может быть объяснено только тем, что стиль переводного текста является синтезом творческой манеры автора оригинала и переводчика. С точки зрения стилистики каждый перевод – это новый текст некоего "синтетического автора".

 

Стендовые доклады

В.В. Осин (Днепропетровск)

ПРЕЗИДЕНТСКИЕ ВЫБОРЫ 1999 г. НА УКРАИНЕ.
КОНТЕНТ-АНАЛИЗ ПЕЧАТНЫХ СМИ

В конце 1999 г. на Украине состоялись третьи в ее новейшей истории президентские выборы, вызвавшие немало ожесточенных споров. Вместе с этим наблюдается прискорбное отсутствие попыток их разрешения путем научного анализа. Поэтому нами было проведено контент-аналитическое исследование, призванное в некоторой степени разрешить возникшие вопросы.

Проблемой нашего исследования вопрос соответствия прошедших выборов задекларированным демократическим нормам. Президентские выборы 1999 г. на Украине были объектом исследования. В качестве предмета исследования была взята проблема освещения выборов печатными СМИ.

Цель исследования – выяснение того, имели ли кандидаты в президенты равные возможности во всестороннем и объективном освещении со стороны различных СМИ. Были также поставлены следующие основные задачи: 1) определение "рейтинга" наиболее влиятельных политиков политических партий; 2) выявление взаимоотношений различных ветвей власти, а также отношения власти к народу. В качестве дополнительной задачи выносилась следующая: возможно ли выяснение основных черт выборной стратегии тех или кандидатов в президенты. В ходе процесса исследования цели и задачи уточнялись и дополнялись.

Для проведения исследования были отобраны семь ежедневных и три еженедельные газеты, претендующие на статус общенациональных. Временные рамки исследования: 1 января – 14 ноября 1999 г. В соответствии с категориальной моделью анализа, содержание текстового газетного массива было разбито на классы параметров: предмет содержания текста; отношение коммуникатора к предмету содержания текста; тип коммуниканта. В первом случае единицей наблюдения выступал параметр "политика", единицей наблюдения – газетный материал (статья, информация, статья-информация), единицей анализа – политический газетный материал, единицей контекста – абзац газетного материала, а единицей счета – частота появления. В качестве различных способов определения единицы анализа использовались: соотношение упоминаний (индикаторы единицы анализа), выделение субъекта и объекта; соотношение заголовка, фото и содержания и др. Относительно второго класса параметров, то мы выделили положительное, отрицательное и нейтральное отношения (с подробным перечнем способов такого выражения).Что касается типа коммуниканта, то выделялись такие категории, как журналист, эксперт, агентство и т.п. Исследование дополнялось анализом первых полос. Для фиксирования информации были разработаны кодировальные бланки. На специальной карточке также фиксировались площадь газетных материалов и наличие графических средств (рефрены, фото, заголовки и т.д.).В исследовании использовалась систематическая случайная выборка по нечетным номерам; при обработке данных применялись некоторые статистические приемы (выведение средних величин, дисперсии, коэффициентов корреляции, отклонение Джаниса).

В ходе проделанной работы были получены данные, позволяющие ответить на все поставленные перед исследованием цели и задачи, в частности, определены "рейтинги", пики усиления предвыборной борьбы в различных СМИ, коллизии во взаимоотношениях различных ветвей власти, степень их влияния на результаты выборов и т.п. В целом, на основании полученных результатов можно констатировать отсутствие равных возможностей для участвующих в выборах кандидатов и, соответственно, во многом формальный характер соблюдения демократических норм при их проведении. Выделены основные черты выборной стратегии Л.Д. Кучмы – применительно к печатным СМИ. Кроме того, данные исследования обосновывают отнесение Украины к т.н. опекунской модели демократии.

 

В.А. Перевертень (Москва)

МЕРЫ СХОДСТВА ПЕРСОНАЛИЙ
ПО КАЧЕСТВЕННЫМ ДИНАМИЧЕСКИМ ХАРАКТЕРИСТИКАМ

Сравнивая персоналии по качественным динамическим характеристикам, которые отражают некоторые события или процессы в их жизни относительно принятой хронологической шкалы или возраста, можно оценивать схожесть научного роста ученых, карьер военных, должностного продвижения служащих и т.п. Но такие оценки затруднительны из-за отсутствия адекватных мер сходства.

Ниже предлагаются интегральная sij и динамическая dsij меры степени сходства i-й и j-й персоналий некоторой социальной группы по качественным динамическим характеристикам их биографий, базирующиеся на введенном в предыдущем докладе автора понятии динамических множеств.

Интегральная мера степени сходства определяется следующим образом:

sij = | DPi DPj| / | DPi DPj| , где DPi М Pi ґ Ti – динамическое множество значений динамической характеристики i-й персоналии (Pi – классическое множество значений динамической характеристики, Ti – множество темпоров).

Если интегральную меру степени сходства sij выразить через сечения динамических множеств DPi и DPj по темпорам, то она будет иметь вид, где временной компонент выражен явно:

sij = | DPi(tk) DPj(tk)| / | DPi(tk) DPj(tk)| , для всех tk О p 2DPi p 2DPj.

Пользуясь далее представлением динамических множеств DPi и DPj через сечения по темпорам, естественным образом получаем динамическую меру степени сходства dsij как функцию вида:

sij(tk) = | DPi(tk) DPj(tk)| / | DPi(tk) DPj(tk)| , областью определения которой являются все tk О p 2DPi p 2DPj.

Примеры, демонстрирующие применение предложенных мер сходства, будут приведены в докладе.

 

Р.В. Топка (Днепропетровск)

КОНТЕНТ-АНАЛИЗ КАК ИНСТРУМЕНТ ОБНАРУЖЕНИЯ ВЛИЯНИЯ
ПАРТИЙНО-ПОЛИТИЧЕСКОЙ АГИТАЦИИ НА КРЕСТЬЯНСКОЕ СОЗНАНИЕ
(На примере наказов от южноукраинских губерний в I Государственную думу)

Используя стремление крестьянства заявить о своих нуждах в Государственную Думу, политические партии навязывали крестьянам собственные "нужды", чтобы в Думе они расценивались как крестьянские. Соответственно, крестьянские наказы и приговоры в Думу могут указывать на различную степень восприятия политической агитации. Нами был проведен контент-анализ наказов от южноукраинских губерний, одной из целей которого было выяснение значения и роли такой агитации в крестьянском общественном сознании.

В процессе выделения первичных содержательных единиц были обнаружены определенные закономерности, связанные с наличием политических требований в документе: высокая их плотность в тексте, почти полная идентичность требований одного наказа к требованиям другого, подобие формулировок наводило на мысль про единство происхождения текстов этих наказов. Один из вариантов первичного текста был обнаружен в листовке Херсонского губернского комитета сельских организаций РСДРП в качестве рекомендуемого крестьянам приговора. Какие бы условия ни сопутствовали принятию таких приговоров крестьянами, ясно одно: их тексты выражали интересы не крестьянства, а политических сил. Исходя из этого, мы исключили 8 документов подобного рода из 47 анализируемых наказов.

Однако другая часть крестьянских наказов указывает на то, что политическая агитация органически вписалась в характер крестьянских наказов (сюда можно отнести наличие политических категорий в прошении, соседство с политическими требованиями конкретных крестьянских нужд и т.д.). Именно эти наказы, наряду с теми, в которых отсутствовало влияние партийной агитации, были подвергнуты контент-анализу.

Полученные путем укрупнения 25 категорий (частота встречаемости от 4 до 35) образовали три подсистемы, обособленные одна от другой. Сила взаимосвязей между категориями учитывалась с помощью коэффициента контингентности Ф, значения которого находятся в пределах от 0, до 1.

Первую подсистему образуют категории, указывающие на конкретные крестьянские нужды (тяжелые условия жизни, жалобы на мало- и безземелье, на высокие арендные цены и т.д.). Связи между категориями этой подсистемы имеют простое и логическое объяснение, в отличие от связей между категориями во второй подсистеме, где собраны категории, отражающие влияние партийной политической агитации на южноукраинское крестьянство и его отношение к Думе. В этой подсистеме находится треугольник сильных связей (от 0, до 1), объединяющий требования и просьбы равноправия, свобод и земли, что свидетельствует о высокой частоте встречаемости этих категорий вместе в одном документе. Другими словами, он полностью отвечает традиционному крестьянскому лозунгу "Земли и воли!", который также использовался и в агитационных целях. Третья подсистема состоит всего из двух категорий: выражение негативного отношения к депутатам и суждения о богатстве землевладельцев.

Категории первой подсистемы – это составляющие общественного сознания той части крестьянства, которая равнодушна ко всему, что не касается их собственных проблем, целиком связанных с землей. Категории второй подсистемы, в свою очередь, являются элементами сознания тех крестьян, кто принимает на веру обещания, не касающиеся непосредственно земельного вопроса.