Индексирование юридической литературы в Научной библиотеке Алтайского государственного университета с использованием новых информационных технологий

Н.Н. Смагина, заместитель директора НБ Алтайского госуниверситета

Юридическая литература представляет собой ценный источник информации для юристов и специалистов различных областей знания. Она служит юридической базой предприимчивости, социальной активности и защиты интересов граждан. В нашем случае юридическая литература является еще и основой для организации учебного процесса и научной деятельности вуза.

Происходящие в стране перемены внесли существенные изменения в поток юридической литературы - изменился его качественный и количественный состав.

Спрос на юридическую литературу сегодня очень высок. Однако не всегда он оказывается удовлетворенным, и не только из-за отсутствия в библиотеке достаточного количества юридической литературы, но и порой из-за неполного отражения ее содержания в справочно-библиографическом аппарате библиотеки.

Индексирование - это основное средство раскрытия содержания документов и всего библиотечного фонда. Поэтому от качества индексирования зависит эффективность использования накопленных в библиотеке фондов.

Важнейшие требования, которые предъявляются к процессу индексирования юридической литературы, следующие:

  1. объективность отражения содержания документов. Это очень важно по отношению к юридической литературе, поскольку официальные правительственные и ведомственные документы подвержены постоянным изменениям и дополнениям;
  2. полнота и точность раскрытия содержания индексируемого документа. К числу объективных факторов, влияющих на процесс индексирования, относятся отраслевая принадлежность и особенности индексируемых документов. Существенные особенности юридической литературы - полнота и точность, которые являются не желательными, а обязательными требованиями при индексировании юридической литературы. Нарушение этих требований ведет к большим потерям информации;
  3. компактность создаваемых поисковых образов, что обусловлено природой процесса индексирования, являющегося разновидностью свертывания информации;
  4. единообразие (воспроизводимость) индексирования аналогичных по содержанию документов в целях полноты выдачи информации при поиске.

Индексирование выступает тем процессом, в ходе которого происходит реализация всех возможностей, заложенных в системе лингвистического обеспечения.

Лингвистическое обеспечение - это совокупность информационно-поискового языка системы, описание стратегии поиска информации, инструктивно-методических материалов по использованию информационно-поискового языка и проведению поиска. Одно из направлений лингвистического обеспечения автоматизированной информационно-библиотечной системы включает в себя лингвистическое обеспечение аналитико-синтетической обработки документов, в том числе индексирование.

Качество индексирования документов зависит от семантической силы информационно-поискового языка и от того, насколько полно, глубоко и точно отражается индексаторами содержание документов в пределах возможностей применяемых информационно-поисковых языков.

Сначала поговорим о семантической силе используемых информационно-поисковых языков.

Классификационный язык предназначен для индексирования документов и информационных запросов посредством понятий и кодов какой-либо классификационной системы (ББК, УДК, классификаторов, ГРНТИ и др.).

К сожалению, таблицы ББК далеко не всегда способны описать содержание современных документов юридического характера. За прошедшие 20 лет с момента издания семантическая сила ББК значительно уменьшилась. Видотипологические изменения, резкое увеличение количества юридической литературы и постоянно возрастающая потребность общества в правовых знаниях требуют новых таблиц ББК.

А пока мы внимательно следим за колонкой систематизатора в журнале "Библиотека". Все рекомендации, публикуемые в колонке, обсуждаются на заседаниях рабочей группы по индексированию документов. Рекомендации, утвержденные рабочей группой, используются при систематизации/классификации литературы юридического характера.

Для проверки правильности отнесения новых понятий и аспектов к тому или иному индексу ББК используем Общеправовой классификатор отраслей законодательства и классификатор правовых актов .

Кроме того, недавно мы получили ГРНТИ (5-е издание) и хотим попробовать использовать его. Дело в том, что, в отличие от органов НТИ, в библиотеках прежде не использовали ГРНТИ, но, по мнению разработчиков, он может претендовать на роль универсального информационно-поискового языка. А одна из заявленных функций этого рубрикатора - посредническая между другими классификационными языками (УДК, ББК, МКИ и т.д.), используемыми в автоматизированных информационных режимах. Кстати, в программу "Библиотека 5.0" (разработчик ООО "Библиотечная компьютерная сеть" Библиотека МГУ) наряду с ББК включен и ГРНТИ.

Дескрипторный язык предназначен для координатного индексирования документов и информационных запросов посредством дескрипторов и/или ключевых слов.

При индексировании ключевыми словами важно унифицировать этот процесс, используя соответствующие методические и регламентирующие документы. Поэтому мы начали с разработки методических рекомендаций по координатному индексированию. В основу рекомендаций были положены ГОСТ 7.66-92 "Индексирование документов. Общие требования к координатному индексированию" и рекомендации, разработанные Научной библиотекой Санкт-Петербургского университета экономики и финансов .

Методические рекомендации по координатному индексированию, разработанные нами, - это документ, открытый для дополнений и изменений. Сейчас мы пользуемся уже третьей редакцией рекомендаций, утвержденных в мае 2001 года.

Существует несколько источников для формирования ключевых слов/дескрипторов. Условно их можно объединить в две группы: первичные и вторичные источники.

  1. Первичными источниками лексики являются ключевые слова, использованные при реальном индексировании документа. Это - лексические единицы, либо непосредственно взятые из обрабатываемой юридической литературы, либо приписанные индексаторами.
  2. Ко вторичным источникам лексики мы относим:

Используя как первичные, так и вторичные источники лексики, ведем работу по созданию словника ключевых слов, который бы обеспечивал полноту представления понятийной структуры юридических наук.

Важнейшими показателями, позволяющими оценить качество индексирования, являются, кроме семантической силы информационно-поискового языка, глубина и полнота индексирования.

Глубина индексирования отражает степень детальности характеристик, с помощью которых описываются средствами информационно-поискового языка выделенные в тексте индексируемых документов объекты. При использовании классификационного информационно-поискового языка, в нашем случае таблиц ББК, глубина индексирования тем больше, чем большим количеством знаков располагает присвоенный документу классификационный индекс. В случае использования информационно-поискового языка координатного типа показатель глубины индексирования будет связан с количеством ключевых слов или дескрипторов, описывающих все значимые аспекты индексируемого текста.

Полнота индексирования - это степень отражения в поисковом образе аспектов содержания документа и (или) запроса. Она отражает широту тематического содержания индексируемого документа и связана с количеством характеристик, выделенных в ходе анализа документа и отраженных средствами информационно-поискового языка. Для индексирования, основанного на использовании классификационных информационно-поисковых языков, полнота индексирования воплощается в числе индексов, присвоенных документу. Полнота индексирования применительно к информационно-поисковому языку координатного типа будет воплощаться в количестве дескрипторов или ключевых слов, по которым возможно проведение поиска.

Совершенствование качества индексирования за счет повышения показателей глубины и полноты позволяет полнее раскрыть содержание документа и тем самым способствовать удовлетворению запросов и потребностей в юридической литературе. Усиление показателей полноты и глубины неразрывно связано с возрастанием затрат времени на индексирование документов. Однако неполнота или неточность индексирования юридической литературы влекут неизмеримо большие моральные и материальные потери, чем затраты на аналитико-синтетическую переработку этой литературы.

По нашему мнению, для обеспечения высокого качества индексирования юридической литературы необходимо:

  1. изучать информационные потребности и запросы читателей;
  2. изучать результаты информационного поиска, в первую очередь анализировать неудовлетворенные запросы читателей;
  3. контролировать качество индексирования;
  4. корректировать ранее созданные поисковые образы документов;
  5. совершенствовать лингвистическое обеспечение индексирования.

Раскроем подробнее некоторые направления работы по обеспечению качества индексирования.

Контроль качества индексирования осуществляет рабочая группа по индексированию документов, созданная в 1997 году. В нее вошли ведущие специалисты библиотеки из отделов комплектования, обработки, библиографии, методического, работник отдела автоматизации приглашается по мере необходимости. Возглавляет группу зам. директора по научной работе. Рабочая группа рассматривает сложные (спорные) случаи индексирования документов, контролирует выполнение правил общей и частной методик индексирования, обеспечивает единообразие индексирования документов отделами обработки и библиографии.

Кроме того, за качеством библиографических записей, в том числе индексов, рубрик, ключевых слов, следит редактор электронного каталога. Он проверяет все библиографические записи текущего счета, выявляя ошибки, опечатки до момента попадания этой записи в электронный каталог.

Работу по корректировке ранее созданных поисковых образов документов осуществляет рабочая группа по редактированию электронного каталога, в которую также вошли специалисты из разных отделов (обработки, автоматизации, библиографии). Группа создана в ноябре 2000 года. На сегодняшний день полностью отредактировано 2 590 библиографических записей, кроме того редактируются поля: Тип ФИО 0, 1, 2, 3;
Первый автор;
Сведения об ответственности;
Сигла;
Серия.

Совершенствование лингвистического обеспечения индексирования эффективно проводится только с использованием современных технологий и техники.

Лингвистическим обеспечением индексирования вплотную мы стали заниматься с 1997 года, но о создании автоматизированной системы словарного и лингвопроцессорного обеспечения (АССЛО) задумались в конце 1998 года.

Внедрение новых информационных технологий в работу библиотек не снижает трудоемкость обработки документов. Особенно это касается индексирования документов. Нагрузки индексаторов многократно возросли в связи с увеличением количества поисковых признаков, вводимых в машиночитаемые библиографические записи (по сравнению с традиционными/карточными каталогами) и повышением ответственности.

Но эти же самые информационные технологии можно использовать для облегчения работы индексаторов и улучшения качества индексирования документов.

Основными объектами АССЛО являются информационно-языковые и грамматические словари.

Словари организуются по формальному и содержательному принципу. Формальное (алфавитное) построение словаря обеспечивает оперативное сравнение машиной новых лексических единиц с уже имеющимися в словаре. Предметное, рубрикационное деление (т.е. по содержательному принципу) позволяет обеспечить научную обоснованность, дает возможность отразить не только тематическое содержание, но и степень разработанности рубрикатора.

Словари способствуют правильному и единообразному применению лексических единиц и тем самым обеспечивают качественное индексирование и поиск юридической литературы. Но создание таких словарей и поиск информации в них возможны только при активном использовании современной компьютерной техники. Это дает значительный эффект, поскольку ЭВМ способны проводить анализ и сравнение больших по объему информационных массивов, пополнять, обновлять словари.

Автоматизированный рубрикатор, созданный в НБ АГУ, относится к информационно-языковым словарям. Создание автоматизированного рубрикатора мы начали с определения рубрик. Индексаторы-отраслевики отделов обработки и библиографии проработали по таблицам ББК свои отделы и отобрали рубрики, которые следует включить в рубрикатор. Все варианты рубрик рассматривались рабочей группой по индексированию документов. После обсуждения рубрикатор был утвержден и подключен к электронному каталогу. Из утвержденных рубрик был сформирован двухуровневый рубрикатор. Рубрика первого уровня "Юридические науки" подразделяется на 54 рубрики второго уровня. Рубрикатор представляет собой перечень рубрик, индексов ББК и примечаний (например, "Патентное право" - используй "Изобретательское право"; "Исправительно-трудовое право" - используй "Исполнительно-трудовое право", есть еще и такого рода примечания: "Уголовно-процессуальное право" - используй ключевое слово "Уголовный процесс" - для того, чтобы не использовать одну и ту же лексическую единицу и для рубрики, и для ключевого слова). Можно выстроить рубрики по алфавиту, можно по индексам и распечатать.

С помощью рубрикатора стал возможен автоматизированный (не клавиатурный) ввод рубрик в библиографические записи.

Автоматизированный ввод рубрик позволяет:

Словник ключевых слов тоже относится к информационно-языковым словарям, используемым при индексировании документов.

Сотрудники отдела автоматизации разработали программу формирования и печати внутренних словарей.

Упорядочение массива лексических единиц в виде алфавитного и частотного списка очень помогает нам при редактировании словника ключевых слов. Распечатка этих списков позволяет контролировать качество индексирования, а также корректировать и дополнять ранее подготовленные поисковые образы документов. Анализ состояния словника позволил выявить типичные ошибки и определить приоритетные направления редактирования словника ключевых слов. Распечатка словника может применяться не только для индексирования, но и для поиска документов.

На данный момент наш словник ключевых слов еще полностью не автоматизирован. Это будет сделано после завершения его редактирования.

Решение этих и других проблем представляется возможным в процессе координации заинтересованных библиотек. Видимо, нам стоит обсудить возможность создания, например, единого рубрикатора по юридическим наукам библиотек - членов Ассоциации.

Другой объект АССЛО - грамматические словари. Они содержат сведения в форме нормативных записей. В НБ АГУ создано несколько грамматических словарей.

"Субъекты РФ" - включает официальные названия республик, краев, областей, округов. Содержит 90 лексических единиц. Словарь подключен к полю "Ключевые слова".

"Аббревиатуры учебных и научных учреждений". Содержит 147 лексических единиц. Словарь помогает индексатору разобраться с применением норм сокращений наименований учебных и научных учреждений и использовать официально установленные сокращения. Словарь подключен к полю "Сведения об ответственности".

"Персоны" - содержит 81 лексическую единицу. Это персоны русских царей, князей, венчанных на царство. Словарь подключен к полю "Ключевое слово".

"Сигла" - содержит 19 аббревиатур мест хранения документов: отделы библиотеки, кафедры и кабинеты университета. Словарь подключен к полю "Сигла".

Поскольку все словари подключены к электронному каталогу, это позволяет автоматизировать ввод данных сведений в библиографическую запись.

Фиксация в словарях допустимых способов выражения одного и того же понятия дает возможность обеспечить единообразие индексирования.

Кроме ввода в электронный каталог текущих поступлений, мы осуществляем ретроввод литературы читального зала юридических и экономических наук. Поэтому такому тщательному индексированию подвергаются не только новые поступления, но и юридическая литература, изданная до 1992 года, имеющаяся в фонде этого читального зала.

Комплексное использование новых информационных технологий позволяет облегчить индексирование юридической литературы, отличающейся поливидовой и политематической структурой, и обеспечить качество индексирования, и уже на этой основе вести электронный каталог, который будет отвечать всем предъявляемым к нему требованиям.

Результаты индексирования самым существенным образом связаны с качеством поиска в любой информационно-библиотечной системе и в значительной мере определяют перечень и качество предлагаемых библиотекой услуг. Поэтому повышение эффективности индексирования было и остается первостепенной задачей каждой библиотеки. И, может быть, в рамках нашей секции мы смогли бы организовать научно-практический семинар для индексаторов юридической литературы. На семинаре можно было бы познакомить индексаторов с видотипологической структурой современной юридической литературы, с частной методикой индексирования и т.п.

Влияние новых информационных технологий становится все более определяющим для всех сфер человеческой деятельности. Библиотеки как организации, неразрывно и органично связанные с процессами генерации, накопления и хранения знаний, находятся на переднем крае внедрения новых технологий. От того, как работники библиотеки смогут внедрить и использовать новые информационные технологии, зависит наше будущее.

Список литературы

  1. Общеправовой классификатор отраслей законодательства // Собрание законодательства РФ. - 1996. - №7. - Ст. 679.
  2. Классификатор правовых актов // Собрание законодательства РФ. - 2000. - №12. - Ст. 1260.
  3. ГОСТ 7.66-92. Индексирование документов. Общие требования к координатному индексированию. - М.: Госстандарт России, 1992. - 14 с.
  4. Методические рекомендации по координатному индексированию / Санкт-Петербургский университет экономики и финансов. - СПб, 1994. - 37с.