Назад | Вперед

Заключение

Ключевые этапы решения информационных задач в онлайн-режиме
Решение задачи
Оценка эффективности использования информационных ресурсов
Оценка оборотоспособности информационных ресурсов.

Несомненно, что технологии взаимодействия с мировыми ресурсами в сфере сервиса базируется на общих принципах работы информационных систем, а специфика информационных ресурсов социальной сферы, скорее всего, заключается в формировании специальных баз данных, посвященных этой предметной области. В связи с изложенным обстоятельством особую роль приобретают знания менеджера состава и структуры ИР в своей области, умения применять сервисные информационные технологии на практике и оценка эффективности использования информационных ресурсов.

Ключевые этапы решения информационных задач в онлайн-режиме

Задачи, решение которых требует проведения поиска, отбора и анализа информации, будем называть информационными.
Любая конкретная информационная задача в общем случае включает в себя следующие ключевые этапы решения [11], которые связаны между собой и проеделенной последовательностью их выполнения (рис. Z.1):

img1
Рис. Z.1. Этапы решения информационных задач в онлайн-режиме

Исходную постановку задачи формулирует заказчик (потребитель информации, пользователь). Часто пользователь смутно представляет себе, какая именно информация ему нужна. В силу этого он оказывается не способным четко и однозначно сформулировать существо вопроса. Для российских пользователей ситуация с формулировкой задачи усугубляется тем обстоятельством, что многие профессиональные БД являются англоязычными.
На этапе выбора информационной системы необходимо определить, какая онлайновая система вас больше всего устраивает. Выше были упомянуты наиболее известные системы - LEXIS-NEXIS, QUESTEL-ORBIT, STN. Более детальная информация содержится в справочнике Gale directory of databases. Его полная электронная версия доступна через QUESTEL-ORBIT.
К сожалению, все описания существующих информационных систем страдают серьезным недостатком: часто определить, есть ли в этой системе нужная информация можно лишь после того, как вы стали ее подписчиком и уже провели поиск в интересующей вас БД. Естественно, что при этом появляются определенные финансовые обязательства перед Вендором. Чтобы узнать, о чем рассказывает та или иная книга или статья, ее нужно прочитать. Аннотации бывает недостаточно. Поэтому, во избежание непроизводительных затрат, целесообразно обращаться к специалистам по информационному консультированию.
На этапе разработки стратегии поиска следует, прежде всего, выбрать БД или файлы (во всех крупных информационных системах база данных называется файлом), в которых целесообразно искать требуемую информацию и, которые доступны в рамках применяемой онлайновой системы. Здесь помогают справочно-информационные материалы с описанием структу­ры файлов и их предметного наполнения. Их обычно предоставляет Вендор после заключения контракта.
Затем следует наметить основные шаги информационного исследования и последовательность их выполнения (т.е. разработать стратегию поиска). Это наиболее сложная задача, требующая знания структуры и содержания файлов, методов работы с документами или записями, из которых состоит файл, знания ценовых факторов (формы контракта с Вендором). Далее необходимо по каждому шагу составить задание на поиск (см. ниже), конкретизировать составленный стратегический план в командах поисковой системы, используемой на Host-компьютере для поиска информации. Фактически разработанная стратегия поиска позволяет сделать понятными поисковой системе вербализованные и алгоритмизированные информационные потребности пользователя.
Это своего рода информационный фильтр. Всю эту работу необходимо выполнить, не соединяясь с Host-компьютером. После этого можно приступать непосредственно к решению задачи. Чем тщательнее была проведена подготовительная работа, тем точнее будут полученные результаты и тем меньше времени и средств будет затрачено на ее решение.
Стандартный формат задания на поиск имеет следующий вид:

Для

LEXIS –NEXIS
<имя библиотеки>
<имя файла>
<поисковый запрос>

для

QUESTEL-ORBIT

<имя файла>
<поисковый запрос>

В LEXIS -NEXIS библиотека - это несколько десятков или сотен файлов, объединенных по тематическому признаку. В файл включена информация или из одного информационного источника, например, газета "The New York Times" с 1982 года, или, как в случае файла PROMT, информация из полутора тысяч информационных источников. Границы между файлами или библиотеками размыты, что создает как некоторое неудобство, так и гибкость при работе с системой. Файлы состоят из документов, а те, в свою очередь, из сегментов или параграфов.
В QUESTEL-ORBIT нет разделения на библиотеки. Пользователь работает только с файлами. При этом файл в QUESTEL-ORBIT почти всегда содержит практически все информационные источники по проблеме. Например, файл CAS - Chemical Abstract Services включает в себя все статьи, доклады на конференциях, пресс-релизы компаний и тому подобную информацию, связанную с научными и коммерческими вопросами химии. Всего CAS обрабатывает более 9000 информационных источников. В QUESTEL-ORBIT файл состоит из записей.
Перечень библиотек, файлов, их полные и сокращенные имена, сведения о том, какого рода информация входит в тот или иной файл, содержатся в специальных справочных руководствах. Эти руководства пользователь получает от компании, с которой он заключил контракт на информационное обслуживание.
В поисковом запросе формулируется и записывается по определенным правилам концепция поиска. В общем случае концепция поиска представляет собой достаточно сложное образование. Главным (иногда единственным) элементом концепции поиска и соответственно поискового запроса является ключевое слово или сочетание слов, которые определяют эту концепцию. Слова или их сочетания должны с боль­шой степенью вероятности содержаться в тексте искомого документа.
Так, например, запись поискового запроса в виде software инициирует поиск всех документов, содержащих этот термин (software-программное обеспечение), а по запросу lazer (laser) technologies будет осущест­вляться поиск документов, где упоминаются лазерные технологии.
Важным инструментом для формулирования поисковой концепции являются знаки логических операций "and" (и - логическое умножение) и "or" (или - логическое сложение), которые служат для соединения двух или нескольких ключевых слов или концепций. Поясним их использование на примерах.
Поисковый запрос "small business" (малый бизнес) and "investments" (инвестиции) вызовет поиск документов (записей), в которых упоминаются оба записанных слова.
Запрос "small business" and "Petersburg or Moscow" приведет к поиску документов, в которых наряду со словами "малый бизнес" будут также встречаться название городов "Санкт-Петербург" или "Москва". Таким образом, с помощью <and> можно уточнить поиск, сузить его область, а по операции <or> расширить ее.
Кроме вышеперечисленных операций <and> и <оr> в поисковых запросах используются и другие средства, например, операция контекстной близости W. Эти операции составляют ядро любой поисковой системы и зна­ние их уже достаточно для решения широкого класса задач. По мере того, как приобретается опыт, можно использовать более сложные элементы поисковых систем, позволяющие различать единственное и множественное число, строчные и заглавные буквы, контролировать частоту появления ключевых слов в документе, проводить статистический анализ и перекрестный поиск.


Наверх

Решение задачи

Сеанс работы в онлайновом режиме начинается с соединения с узлом компьютерной сети, а затем с Host-компьютером выбранной информационной системы. После ввода своего пароля возможен доступ к информационным ресурсам системы. Методы решения задачи в онлайн режиме могут быть различными. Выбор метода зависит как от квалификации и опыта пользователя, так и формы контракта между пользователем и Вендором. Начинающему пользователю рекомендуется следующая простейшая схема. Прежде всего, надо позаботиться о сохранении на винчестере найденных в процессе решения задач документов. Это весьма просто и большинство коммуникационных программ, которые вы получаете при подписании контракта, имеют простые команды, позволяющие сохранять тексты, поступающие к вам на экран компьютера.
Затем следует шаг за шагом вводить задания на поиск, которые входят в предварительно составленный стратегический план. Введенное задание на поиск выполняется практически мгновенно. После каждого шага необходимо просмотреть полностью или частично найденные документы и сохранить их у себя на винчестере. Существует также форма сохранения найденных документов без их просмотра на экране компьютера. Это удобно при работе с большими отчетами, длина которых может составлять до нескольких сотен страниц.
Отметим, что при этом подходе минимизируется онлайновое время сеанса (иногда весьма дорогое), сама процедура поиска выполняется достаточно быстро. В итоге, после нескольких минут работы в онлайн режиме, можно получить солидную порцию информации, требующую для ее внимательного просмотра и анализа нескольких часов, или даже дней. Просмотрев полученные результаты, можно модифицировать свою стратегию, если она была не очень удачной, составить новый план и новые задания на поиск и повторить описанную выше процедуру в следующем онлайновом сеансе.
Как правило, только специалисты, хорошо знающие исследуемую предметную область и четко представляющие себе, какого рода информация им нужна и что является "лишним", могут себе позволить работу в полноценном интерактивном режиме по схеме типа: "запрос - ответ - беглый просмотр и анализ результатов - новый уточненный запрос и т.д.".
Иногда решение задачи не приводит к ожидаемому результату - найти нужную информацию не удается. Однако чаще всего это вовсе не свидетельствует об ее отсутствии в БД. Уточнив формулировку, изменив подход к решению задачи, скорректировав стратегию поиска, можно выйти на искомую информацию.
В любом случае, очевидно, что результативность, точность решения, затраченные время и средства, в конечном счете, определяются опытом и знаниями пользователя, его способностью квалифицированно сформулировать задачу, умением ориентироваться в информационном пространстве, навыками построения грамотной стратегии поиска, анализа получаемой информации.
Информация научно-технических баз данных (например, патентных) применяется, в том числе, при изучении рынка - при реализации метода деловой и конкурентной разведки.
Одной из составных частей маркетинга является сбор информации о стратегии конкурентов, в то время как получить эту информацию из аналитических отчетов или открытой печати достаточно трудно: рыночная стратегия компании, как правило, представляет собой коммерческую тайну. Для сбора подобной информации о своих конкурентах фирмы приме­няют различные методы коммерческой разведки. И здесь мощным инструментом могут стать БД с информацией об интеллектуальной собственности (патенты и товарные знаки).
Часто патент бывает первой публикацией о разработке, исследовании, изобретении. Анализ описаний патентов позволяет судить о направлениях инновационной деятельности фирмы-конкурента, которая обычно направле­на на создание нового продукта. По этим описаниям специалист вполне может составить представление о новом продукте задолго до его появления на рынке.
Согласно результатам исследований патентного ведомства ФРГ, около 30% всех затрат на исследование ежегодно тратятся на параллельные разработки и почти 18 млрд. марок ежегодно расходуются напрасно на продук­ты и процессы, которые уже запатентованы. Компании, использующие БД для тщательного контроля своих разработок, увеличивают выход своих исследовательских программ по меньшей мере, на 30 %.
Маркетинговую стратегию конкурентов анализируют, в первую очередь, по патентам, в которых фактически описано ноу-хау нового продукта. При этом название страны, в которой патент зарегистрирован, следует рассматривать, как символ того, что компания собирается работать на конкретной территории.
Большие компании для выхода на новые рынки или для продвижения нового продукта на уже освоенном рынке действуют скрытно, учреждая дочерние компании, иногда с новыми именами, для того, чтобы выяснить реакцию на новый продукт или оценить возможность работы на этих новых рынках. Классическими информационными средствами довольно трудно выявить такие скрытые намерения. Патентный поиск будет незаменимым и здесь.
При формировании файла WPATIWPIL производитель этой базы данных, компания Dewent, часто присваивает патентующим фирмам определенный универсальный код. Все дочерние подразделения этой компании, также будут иметь этот код, он-то и является тем средством, которое позволяет выявлять компании избегающие публичного освещения своей деятельности.
Ниже приводится список российских онлайновых баз данных [12], которые можно найти в Gale Directory of Databases. Большинство баз данных содержат новости (7 БД), информацию о компаниях, экономические проекты и деловые предложения (8 БД), а также информацию по определенным отраслям промышленности (10 БД). Наиболее крупные производители информации в России: Международный центр научной и технической информации (МЦНТИ) - 13 БД и агентство Russica - 8 БД. Продают российские БД на международном рынке LEXIS-NEXIS, MagnaTex Communicate, Wistlaw и др. Кроме онлайновых БД в Gale Directory приведены еще около 60 БД, распространяемых на CD-ROM, дискетах или других носителях.
Краткая характеристика некоторых БД, производимых в России и доступных пользователям в онлайновом режиме через системы LEXIS-NEXIS, Westlaw, MagnaTex Communicate, DataStar, DIMDI, STN:
BizEkon News-Soviet Business Directory. Содержит информацию о более чем 33 тыс. компаниях, вовлеченных в международный бизнес. (PDR - Russica; VE - LEXIS-NEXIS, GBI, MagnaTex Communicate);
GARANT. Тексты около 1500 законов и правительственных постановлений в различных областях экономики (PDR - Гарант-Сервис; VE - LEXIS -NEXIS);
RusLegisLine. Полные тексты торговых законов и декретов стран СНГ. Информация о патентах, лицензировании, недвижимом имуществе, торговых марках (PDR - Russica; VE - LEXIS -NEXIS , GBI, MagnaTex Communicatel, Westlaw);
Who is who in Russia and the Commonwealth of Independent States. Биографические данные более чем 500 политиков и военных, а также ученых, спортсменов, артистов и т.д. (PDR - Russica; VE - LEXIS -NEXIS, MagnaTex Communicate);
RUSMED Articles. Более 300 тыс. ссылок на "Российский биомедицинский журнал", материалы конференций и исследовательские статьи. (PDR - Центральная научно-медицинская библиотека; VE - DIMDI).


Наверх

Оценка эффективности использования информационных ресурсов

Создание системы государственной статистики в области информатизации, вообще, и в области ИР, в частности, признано одной из актуальных задач в области государственной политики в сфере информатизации [7].
Система статистики принципиально отличается от систем учета и регистрации тем, что основным инструментом статистического учета является показатель измеряемого объекта, в то время как для систем учета основным инструментом является идентификация объекта учета. Разработка системы показателей, хотя и тесно связана с проблемой определения объектов учета, но, тем не менее, имеет свою специфику.
При выборе системы статистических показателей для ИР необходимо также учитывать основные аспекты функционирования ИР. Можно выделить два таких аспекта:

В связи с этим методология оценка эффективности использования информационных ресурсов и предлагает формировать систему показателей. Встречается также подходы с применением финансовых показателей, как процессов формирования, так и использования ИР.
Не претендуя в рамках заключения данной дисциплины на полноту рассмотрения этого вопроса (более подробно о нем в специальной дисциплине «Мировые информационные ресурсы»), тем не мене отметим основные его позиции.
Так, в качестве показателей формирования ресурсов в настоящее время чаще используются (интегральном подход, разрабатываемый НТЦ "Информрегистр") [13]:

Количество БД, их объем и распределение по типам является общепринятым как для отечественного, так и для зарубежного опыта: подавляющее число исследований информационного производства и информационного рынка использует эти показатели. Примером является известное исследование [11].
Для архивных учреждений основным показателем является состав фондов, включающий:
а) Число фондов, имеющихся в данном учреждении, в том числе:

б) Число единиц хранения каждого фонда и в сумме для учреждения, в том числе по видам носителей.
в) Количество создаваемых электронных баз данных и их объем (в Мб).
Формирование ресурсов в традиционной форме отчасти отражается также в книгоиздательской статистике, которая имеет большую традицию.
Особенный интерес представляют системы учета, применяемые в интернете, особенно в российском. Приведем системы показателей объема ресурсов интернета, применяемые в наиболее известных порталах: Яндекс (раздел "Числа") и Рамблер (раздел "Руметрика").
Прямые величины:

Обратные величины:

Кроме вышеприведенных показателей, Яндекс предлагает различные количественные данные о составе ИР интернета, подсчитанные на основе каталога Яндекса. Каталог Яндекса включает ресурсы, обработанные вручную, что, естественно, составляет небольшую часть общих ресурсов интернета (по состоянию на июль 2002 г. каталог Яндекса включал около 40 тыс. ресурсов).
Каталог Яндекса включает распределение ИР по тематике, регионам, назначению, источникам информации и даже по форме собственности. Последний показатель включает 3 значения:

Государственные ИР, согласно данным этого каталога, составляют приблизительно 10% от общего числа каталогизированных ресурсов и приблизительно 30% от числа ресурсов, для которых в каталоге имеется какое-нибудь значение показателя "форма собственности".

В этой связи следует добавить, что действующая нормативная база не позволяет последовательно и однозначно разделять ИР по форме собственности. Поэтому действующие системы указывают форму собственности ИР субъективно - либо по заявлению владельца (НТЦ "Информрегистр"), либо на основании косвенных данных (Яндекс).
Другой известный портал - Рамблер - предлагает следующие показатели:

русских
английских
язык не определен

Указанные показатели, по мнению авторов, должны отразить динамику информационной индустрии.
Показатели использования ресурсов (т.е. показатели информационного обслуживания) еще менее разработаны, чем показатели формирования ресурсов.
Наиболее общими и известными показателями являются показатели библиотечного обслуживания, основные из которых приведены ниже [14].


Наименование показателя

Ед. измерения

Число читателей, в том числе по видам библиотек

Тыс.чел.

Число посещений

Тыс. чел.

Охват населения библиотечным обслуживанием

%

Обращаемость фондов

Коэффициент обращаемости

Книговыдача, том числе по видам изданий

Млн. экз.

Однако обычно библиотеки, особенно наиболее продвинутые, ведут более детальный анализ объемов и структуры информационного обслуживания:

Для архивных учреждений установлены следующие показатели обслуживания:

В качестве примера показателей информационного обслуживания для информационных центров приведем показатели, применяемые в ВИНИТИ [9] :

В результате приведенного анализа могут быть сделаны такие предварительные рекомендации по выбору системы показателей использования ресурсов.
В настоящее время использование ресурсов оценивается уже принятыми показателями для отдельных классов ресурсов (библиотечных, архивных, интернет-ресурсов и др.), способы расчета которых существенно отличаются между собой. Вероятно, целесообразно сохранить существующие показатели и в то же время рассчитывать интегральные показатели использования ресурсов, не опасаясь повторного счета.
Всего имеет смысл говорить о трех группах показателей:

Основным видом использования ресурсов следует считать обращение пользователей к документам, имеющимся в массивах. Поэтому обобщенными показателями можно считать:

Самостоятельными видами использования ресурсов следует считать:

Финансовые показатели формирования и использования ресурсов
В официальной статистике в настоящее время финансовые показатели ни формирования, ни использования ИР, видимо, не применяются вообще. В литературе и обзорах основными из применяемых показателей являются следующие:
- объем продаж информационных продуктов (печатных, аудио, видео, машиночитаемых);
- объем платных информационных услуг;
- объем доходов от рекламы;
- оборот фирм, действующих на информационном рынке (однако этот показатель может включать данные по смежным секторам, в том числе по вычислительным или телекоммуникационным услугам).
Практически никогда не применяются показатели затрат на формирование ресурсов, хотя из отдельных примеров очевидно, что такие затраты могут быть весьма велики. Так, например, сообщалось, что затраты на крупный информационный интернет-проект РУБРИКОН (где основная доля затрат - это затраты на информационное наполнение), составили $400 тыс.
Крайне плохо обстоит дело с учетом затрат на формирование ИР и на информационное обслуживание в государственном секторе.
В соответствии с поручением Правительства Минсвязи России работает над финансово-экономическим обоснованием Постановления Правительства о порядке учета информационных услуг, осуществляемых из государственных ИР бесплатно или за плату, не возмещающую в полной мере расходы на них. В ходе работы были запрошены все федеральные органы исполнительной власти, и выяснилось, что практически не ведется учет затрат на информационную деятельность. Чаще всего эти затраты скрыты в общих затратах на основную деятельность. Иногда выделяются отдельно затраты на информатизацию в целом, но чисто информационная компонента в структуре доходов и расходов не выделяется.
Поэтому показатели объема продаж информационных продуктов и иные показатели объема информационных услуг не имеют экономического смысла, так как доходы невозможно сопоставить с расходами, чтобы оценить рентабельность информационной деятельности.
Так, например, ценовая политика информационной полиграфической продукции в большинстве информационных центров может сопоставляться только с затратами на полиграфию, но не с основными затратами, связанными со сбором и обработкой информации.
Единственно осмысленным вариантом в настоящее время могут быть показатели фактических затрат субъектов хозяйственной деятельности на формирование ресурсов, сведения о формировании и использовании которых были учтены в натурных показателях. При этом под формированием следует понимать, в отличие от американского опыта, только прямые затраты на сбор и обработку информации, но не на производство документов и данных.


Наверх

Оценка оборотоспособности информационных ресурсов.

Нельзя не отметить еще один из подходов к оценке эффективности использования информационных ресурсов, который связан с понятием их оборота и введением показателя оборотоспособности ИР [5]. Причем оценка по этому показателю касается как создающихся ИР, так и собственно находящихся в обороте, так и находящихся на хранении в базах данных и т.д.

Под оборотоспособностью понимается время (возможно время цикла), в течение которого происходит полезная эксплуатация ИР.

Вводятся такие понятия как показатель оборотоспособности. Это чисто коммерческая характеристика и определяется как отношение затраченных средств на создание ИР к прибыли получаемой за время  полезной эксплуатации. Если это цикл, то необходимо устанавливать порог с учетом закона убывающей доходности. Оборотоспособность можно определить также (например, для фундаментальных ИР) и как время, в течение которого параметры деградации и обновления поддерживают необходимую полезность и оно больше или равно времени востребованности.
Критерием же оценки оборотоспособности определяется так называемая мощность ИР [11]
img2 ,
где:  ar - требуемое значение параметра, которое необходимо достичь с помощью данного ИР;
L - фактор, влияющий на f(…), а a и b- пределы его изменения;
ad - потенциально достижимое значение параметра,
Lt - текущее значение фактора,
Lr - значение фактора необходимое для достижения img3 .
Выше img4 определяется в версии убывающей мощности, т.е. по мере использования ИР мощность его убывает. При этом выполняются условия
img5
Аналогично можно рассмотреть версию возрастающей мощности. В этом случае при использовании ИР его мощность возрастает. Заметим также, что L – может быть как регулярной, так и случайной величиной.
Полезность ИР предлагается определять по таким признакам:


Востребованные ИР

Не востребованные ИР

Прибыльные ИР

Неприбыльные ИР

Утилизированные ИР

ИР на хранении
(Потенциально востребованные ИР)

Финансовая прибыль

Мотивационная прибыль

Причем степень востребованности ИР определяется как время нахождения в обороте. Необходимо отметить и  влияние такой характеристики, как вероятность востребованности, которая может быть близка к единице, но по законам рынка и/или  в силу асимметричности информации [11] степень востребованности будет равна нулю.
В отличие от свойств просто информации рассматриваемой в теории Шеннона, которая не увеличивается при преобразовании (количественная оценка), информация, преобразованная в ИР может увеличиваться в ценности. Это объясняется тем, что мощность ИР зависит от фактора [15], который, как правило, в свою очередь зависит от внешних и внутренних условий, что определяет увеличение или уменьшение мощности ИР. И здесь большую роль играет понятие достоверности информации, одним из направлений исследования которой является теория несимметричной информации.
Так Нобелевской премией 2001года по экономике был отмечен вклад в анализ рынков с асимметричной информацией, рынков на которых одни участники знают о предмете сделки существенно больше других [4]. Один из лауреатов Дж. Акерлоф проанализировал влияние неравномерно распределенной информации на рынок. К примеру, на рынке, где продавцы знают больше о товаре, чем покупатели, доминируют товары низкого качества. Теория несимметричной информации особенно актуальна на рынке научных программ и исследований, к примеру, в области создания  высокопроизводительных машин. Характерен, на наш взгляд, пример, когда широко рекламируются достижения в создании машины  на 1 терафлоп практически целиком на зарубежной элементной базе и матобеспечении [5].С другой стороны, существует проект машины на 100 терафлоп на отечественной элементной базе. Информация об этих проектах асимметрична для внутреннего рынка. И если ИР первого проекта будет оборачиваться в короткое время и может принести финансовую прибыль разработчикам, то  ИР  второго проекта будет иметь более длительный оборот и принесет мотивационную прибыль.


Наверх

Назад | Вперед