Технологии
В основу концепции функционирования Информационно-аналитической службы СИП РИА положен
принцип сведения процессов сбора, хранения и поиска не
структурированной информации - с одной стороны, и анализа информации - с другой стороны, в рамки единой
организованной человеко-машинной системы.
Помимо применения современных средств вычислительной техники,
эта концепция предполагает привлечение к работе большого числа сотрудников. К их числу относятся проблемные
специалисты, аналитики, программисты, региональные представители, технический персонал. Концепция требует точной
организации работы всего коллектива в соответствии с принятым разработчиками стандартом. Сложностям реализации
такой концепции функционирования системы противопоставляются преимущества завершенности процедуры
информационной поддержки: все ее этапы от получения разрозненной информации до формирования результатов
анализа целевой выборки реализуются в рамках единой системы и по единому стандарту.
Несмотря на большое количество
имеющихся на сегодняшний день справочных и поисковых систем, доступ к нужной информации зачастую
бывает затруднен в силу следующих обстоятельств:
- малое количество проблемно-ориентированных баз данных (БД), позволяющих заинтересованным лицам разумно
ограничить область поиска нужной информации и избежать обработки большого количества "балласта";
- малый объем информации в узко специализированных и тематических БД;
- не достаточно оперативное обновление содержащейся во многих БД информации;
- слабое развитие "интеллектуальных способностей" поисковых систем, формирующих выборку, и средств анализа
полученных выборок.
Учитывая постоянно возрастающую потребность подразделений СИП РИА и ЦП СЯС в актуальной
систематизированной информации по политическим и военно-техническим вопросам, несколько лет назад было принято
решение о разработке информационной системы (ИС), проблемно-ориентированной на потребности
этих подразделений, а также их соисполнителей и заказчиков.
Основу концепции создания ИС составило решение двух взаимосвязанных задач.
Во-первых, разработка базы данных с актуальной информацией по вопросам развития военно-промышленного
комплекса, обороны, конверсии, передовых технологий, а также по социальным и общественно-политическим вопросам.
Во-вторых, разработка поисковой системы, реализующей как поиск по ключевым словам и логическим выражениям,
так и латентно-семантический анализ, что позволяет реализовать автоматическую сортировку документов по
тематике, а также поиск аналогов.
Проблемная ориентация базы данных на указанные выше вопросы достигнута целевым выбором источников
информации и содержащихся в них разделов. К числу основных источников относятся:
- WEB-сайты российских и зарубежных информационных агентств;
- сайты предприятий военно-промышленного комплекса;
- электронные издания центральных и региональных СМИ;
- печатные периодические издания;
- отчеты о научных исследованиях;
- листовки и буклеты рекламной, политической и хозяйственной направленности;
- теле- и радиопередачи.
База данных формируется с учетом возможности расширения номенклатуры сопровождаемых источников
информации без адаптации к формату получаемых данных и структурных изменений самой базы. Это достигается
использованием единого стандарта представления данных в автоматическом режиме.
Актуальность базы данных при этом обеспечивается постоянным (в дежурном режиме) мониторингом электронных
источников информации с помощью программно-аппаратных средств системы, а также регулярным автоматизированным
вводом информации из иных источников. Последний способ реализуется техническим персоналом информационно-аналитической
службы с помощью средств оргтехники.
Схема информационно-аналитической системы представлена на рисунке.
В состав аппаратных средств входят:
www-сервер, содержащий массив документов в текстовом и HTML-форматах, поисковую систему
и средства пополнения базы данных;
сервер баз данных, поддерживающий работу поисковой системы и других служебных программ;
шлюз, обеспечивающий доступ удаленных пользователей к системе из Интернет и сети города
Юбилейного;
рабочее место оператора обработки неформатированной информации, укомплектованное
сканером, TV-тюнером, переносной телекамерой;
рабочее место администратора системы, предназначенное для управления системой в целом.
Серверы системы имеют следующие характеристики: процессор P!!! с тактовой
частотой 1200МГц; оперативная память SDRAM 512Мбайт; жесткие диски 60Гбайт
c IDE интерфейсом, операционная система ASPLinux 7.3.
Снижение затрат на разработку программного обеспечения достигается за счет
унификации протоколов доступа к ресурсам системы. Локальный (из офисной сети)
и удаленный (из Интернет и из "широкополосной сети" города Юбилейного) доступ
осуществляется по общепринятым протоколам http и https.
Это, кроме того, позволяет сократить затраты на техническую поддержку пользователей,
т.к. для работы с Информационно-аналитической системой на компьютере
пользователя требуется установка современного браузера и офисного пакета.
ИАС предусматривает многоуровневую систему полномочий пользователей, регулирующую
права их доступа к информации различного типа. Доступ удаленных пользователей к ресурсам
системы через Интернет и сеть города Юбилейного
осуществляется с использованием защищенного протокола https, что также препятствует
несанкционированному доступу к базе данных.
На начальном этапе разработки ИАС СИП РИА был проведен подробный анализ источников
информации, представляющих потенциальный интерес для подразделений СИП РИА и ЦП СЯС,
а также их соисполнителей. Для работы были отобраны информационные агентства,
СМИ и другие источники, публикующие информацию по вопросам политики, науки, экономики,
развития оборонно-промышленного комплекса, социальным проблемам общества.
Целевой выбор источников информации позволил исключить из ежедневных пополнений базы
данных заведомо лишние для Информационно-аналитической службы сведения.
После заключения соответствующих
соглашений с правообладателями ресурсов эти источники были включены в единую
систему мониторинга, которая в зависимости от характера помещаемой информации,
частоты ее обновления и формы представления предусматривает три уровня автоматизации
сбора и обработки: автоматический, автоматизированный, ручной.
Автоматический сбор и обработка информации производится через Интернет из тех источников,
которые ежедневно и в большом объеме пополняют свои информационные порталы.
Получаемая информация специальными программными средствами считывается,
форматируется по заданному стандарту и помещается в базу данных ИАС.
Сбор и обработка информации с редко обновляемых ресурсов производится в автоматизированном
(полуавтоматическом) режиме. В
этом случае получение информации производится с помощью программных средств,
а редактирование, форматирование и ввод в базу данных полученной информации - оператором
ИАС со своего рабочего места.
Ручной сбор и обработка в полном объеме выполняется оператором обработки информации.
Реализуется с использованием средств оргтехники для неформатированной информации,
например, информации, представленной на съемных носителях, в виде бумажных копий,
видео- , аудиозаписей и т.п.
Реализованная технология имеет важное достоинство: наиболее трудоемкие, рутинные операции по сбору, поиску и
систематизации информации в значительной степени автоматизированы, при этом на аналитиков СИП РИА возлагается только творческая часть
выполнения проекта. Кроме того, возможность удаленного доступа к информационным ресурсам
из Интернет и сети города Юбилейного открывает
широкие возможности для использования интеллектуального потенциала города и регионов
при формировании временных трудовых коллективов под выполнение заказов самой разнообразной направленности.
Мы всегда готовы к сотрудничеству.
Пишите нам.
|