|
В LEXIS -NEXIS библиотека - это несколько десятков или сотен файлов, объединенных по тематическому признаку. В файл включена информация или из одного информационного источника, например, газета "The New York Times" с 1982 года, или, как в случае файла PROMT, информация из полутора тысяч информационных источников. Границы между файлами или библиотеками размыты, что создает как некоторое неудобство, так и гибкость при работе с системой. Файлы состоят из документов, а те, в свою очередь, из сегментов или параграфов.
В QUESTEL-ORBIT нет разделения на библиотеки. Пользователь работает только с файлами. При этом файл в QUESTEL-ORBIT почти всегда содержит практически все информационные источники по проблеме. Например, файл CAS - Chemical Abstract Services включает в себя все статьи, доклады на конференциях, пресс-релизы компаний и тому подобную информацию, связанную с научными и коммерческими вопросами химии. Всего CAS обрабатывает более 9000 информационных источников. В QUESTEL-ORBIT файл состоит из записей.
Перечень библиотек, файлов, их полные и сокращенные имена, сведения о том, какого рода информация входит в тот или иной файл, содержатся в специальных справочных руководствах. Эти руководства пользователь получает от компании, с которой он заключил контракт на информационное обслуживание.
Рассмотрим теперь последний компонент задания на поиск - поисковый запрос. В поисковом запросе формулируется и записывается по определенным правилам концепция поиска. В общем случае концепция поиска представляет собой достаточно сложное образование. Главным (иногда единственным) элементом концепции поиска и соответственно поискового запроса является ключевое слово или сочетание слов, которые определяют эту концепцию. Слова или их сочетания должны с большой степенью вероятности содержаться в тексте искомого документа.
Так, например, запись поискового запроса в виде software инициирует поиск всех документов, содержащих этот термин (software-программное обеспечение), а по запросу lazer (laser) technologies будет осуществляться поиск документов, где упоминаются лазерные технологии.
Для того, чтобы составить задание на поиск, необходимо владеть английской терминологией, характерной для данной предметной области, знать точные английские эквиваленты ключевых слов и понятий, которые будут использоваться при поиске необходимой информации. Например, интересуясь такой темой как "запоминающие устройства для ЭВМ" вам надлежит применять термины, принятые в английском языке для этого понятия - "memory" и "storage". При этом следует определиться, какой из них подходит для вашего случая. Точный выбор ключевого слова - непростая задача. В большинство баз данных документы (записи) поступают из многих источников, а в разных регионах (странах) разными авторами публикаций для воспроизведения одного и того же понятия могут быть использованы отличные друг от друга термины. Для облегчения этой задачи в некоторых онлайновых системах (LEXIS-NEXIS) применяются встроенные вспомогательные словари и тезаурусы, в других (QUESTEL-ORBIT) - реализована возможность просмотра словаря файла.
Важным инструментом для формулирования поисковой концепции являются знаки логических операций "and" (и - логическое умножение) и "or" (или - логическое сложение), которые служат для соединения двух или нескольких ключевых слов или концепций. Поясним их использование на примерах.
Поисковый запрос "small business" (малый бизнес) and "investments" (инвестиции) вызовет поиск документов (записей), в которых упоминаются оба записанных слова.
Запрос "small business" and "Petersburg or Moscow" приведет к поиску документов, в которых наряду со словами "малый бизнес" будут также встречаться название городов "Санкт-Петербург" или "Москва". Таким образом, с помощью <and> можно уточнить поиск, сузить его область, а по операции <or> расширить ее.
Кроме вышеперечисленных операций <and> и <оr> в поисковых запросах используются и другие средства, например, операция контекстной близости W. Эти операции составляют ядро любой поисковой системы и знание их уже достаточно для решения широкого класса задач. По мере того, как приобретается опыт, можно использовать более сложные элементы поисковых систем, позволяющие различать единственное и множественное число, строчные и заглавные буквы, контролировать частоту появления ключевых слов в документе, проводить статистический анализ и перекрестный поиск.
Существуют различные формы поиска: в виде стандартного логического поиска, в режиме меню (ответы на предлагаемые системой вопросы), формулировки задачи на естественном языке (английском), в технике вербальной формулировки задачи (речевой интерфейс).
Отметим, что в LEXIS-NEXIS язык поисковой системы достаточно прост, так как большинство файлов являются полнотекстовыми, но требования к корректной формулировке стратегии поиска здесь строже. В QUESTEL-ORBIT большую часть информации составляют патенты, товарные знаки, структурные химические формулы. Файлы обладают более сложной структурой и в целом язык поисковой системы сложней, чем в LEXIS -NEXIS. С другой стороны, он предоставляет пользователю большие возможности (например, средства для статистического анализа найденной информации, перекрестного поиска и т.д.).
Страницы: 1, 2, 3, 4, 5, 6, 7, 8
При использовании материалов активная ссылка на источник обязательна.