«Г.Н. Смирнова Проектирование электронных систем управления документооборотом Учебное пособие Практикум по курсу Москва 2004 1 УДК 004.415 ББК 32.973 С 506 Смирнова Г.Н. ПРОЕКТИРОВАНИЕ ЭЛЕКТРОННЫХ СИСТЕМ УПРАВЛЕНИЯ ...»
Архитектура «клиент-сервер» позволяет осуществлять управление данными, обеспечивает разделение информации между пользователями, предоставляет единое администрирование для всей системы, обеспечивает высокую производительность и высокую безопасность хранения информации. К числу преимуществ можно отнести:
• высокую производительность системы, поскольку серверный компьютер не загружен выполнением приложений пользователей;
• обслуживание большего числа клиентов;
• разделение доступа к данным и высокий уровень защиты данных;
• пользователь может выбрать удобную для себя платформу (тип ПЭВМ).
• межрегиональные распределенные ИС (wide area distributed), охватывающие подразделения предприятия, распределенные на большом расстоянии друг от друга, но имеющие общую базу данных и объединенные локальной и региональной вычислительной сетью.
• очень большие и сверх большие межрегиональные распределенные ИС (very large и ultra large), охватывающие несколько предприятий, распределенных на нескольких континентах и на большом расстоянии друг от друга, но имеющие общую базу данных и объединенных глобальной вычислительной сетью со Последние три класса ИС относят к числу корпоративных экономических информационных систем (КИС), имеющих следующие отличительные свойства:
- использование архитектуры «клиент-сервер», которая позволяет распределить работу между клиентской и серверной частями системы и в которой единицей обработки информации является транзакция (единичное обращение к базе данных);
- иерархичность организационной структуры (централизованная обработка данных и единое управление ресурсами ИС на верхнем уровне сочетается с распределенной обработкой на нижнем уровне);
- модульная структура системы, в которой модулями являются функциональные подсистемы;
- интегрированная среда с коллективной работой пользователей в едином информационном пространстве;
- система представляет информацию для трех типов приложений:
• оперативной обработки транзакций, характерной для всех функциональных подсистем (OLTP-приложения);
• аналитической обработки информации, полученных от оперативной обработки приложений (OLAP-приложения);
• DSS – приложения, связанные с подготовкой принятия управленческих решений;
ОРГАНИЗАЦИЯ ПРОЕКТИРОВАНИЯ
ЭЛЕКТРОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ
- открытость системы для включения новых технических и программных средств за счет обеспечения поддержки в системе международных стандартов по обработке и передаче информации;- организация параллельных вычислений и обработки транзакций на нескольких серверах с использованием параллельных процессоров;
- распределенная обработка транзакций;
- надежность и высокая производительность работы системы;
- масштабируемость системы, т.е. обеспечение возможности наращивания системы без потери показателей надежности и производительности;
- интегрируемость разнообразных данных и приложений.
электронной системы \ управления документооборотом Одной из функциональных подсистем ИС является Электронная Система Управления Документооборотом (ЭСУД), целью разработки которой является повышение эффективности управления экономическими системами на основе автоматизации управления документооборотом и деловыми процессами, всех видов работ с документами, обеспечивающими и координирующими совместную деятельность всех участников процесса управления.
Существуют общие практически для всех организаций проблемы, которые приходится решать при реализации, внедрении и сопровождении систем электронного документооборота. Рассмотрим основные из них:
• Консерватизм персонала, низкая образованность, нежелание обучаться и переобучаться. Боязнь прозрачности собственной деятельности для руководства, которая возникает после внедрения системы электронного документооборота.
• Фактор директора, не желающего непосредственно работать с компьютером, просматривать и редактировать документы.
• Постоянные структурные изменения в организации, слабая формализация бизнес-процессов.
• Необходимость обеспечения юридической силы документов (после принятия закона об электронной подписи этот фактор начнет терять свою значимость).
• Необходимость взаимодействовать с внешним «бумажным» миром, в особенности если это касается параллельных структур в ассоциированных организациях или ведомствах, с которыми идет постоянная работа.
• Наличие специфических для каждой организации проблем, которые необходимо анализировать и учитывать.
Внедрение электронного документооборота позволяет достичь реализации следующих целей:
• интеграции профессиональной и информационной деятельности специалистов;
• интеграции всех информационных потоков и создании единого информационного ресурса, используемого для принятия управленческих решений;
• коллективного использования информационного ресурса, упрощение процесса • оптимизации работ сотрудников и сокращении затрат труда и времени на администрирование их совместной деятельности.
В настоящее время сложились три практики разработки электронных систем управления документооборотом:
ОРГАНИЗАЦИЯ ПРОЕКТИРОВАНИЯ
ЭЛЕКТРОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ
• автоматизация некоторых функций управления потоками документов на предприятии силами специалистов этого предприятия;• автоматизация делопроизводства и документооборота с использованием модулей, встроенных в состав ERP-системы;
• комплексная автоматизация всех операций, связанных с получением, обработкой, хранением и коллективным использованием документов с использованием универсальной системы.
В данном курсе рассматриваются проблемы построения универсальных систем, которые должны отвечать основным требованиям корпоративных экономических информационных систем (КИС):
Масштабируемость. Желательно, чтобы система электронного документооборота могла поддерживать как несколько единиц, так и несколько тысяч пользователей, и способность системы наращивать свою мощность определялась только мощностью соответствующего аппаратного обеспечения. Выполнение такого требования может быть обеспечено с помощью поддержки индустриальных серверов баз данных производства таких компаний, как Sybase, Oracle, Informix и др., которые существуют практически на всех возможных программно-аппаратных платформах, тем самым обеспечивая самый широкий спектр производительности.
Распределенность. Основные проблемы при работе с документами возникают в территориально-распределенных организациях, поэтому архитектура систем электронного документооборота должна поддерживать взаимодействие распределенных площадок.
Причем распределенные площадки могут объединяться самыми разнообразными по скорости и качеству каналами связи. Также архитектура системы должна поддерживать взаимодействие с удаленными пользователями.
Модульность. Вполне возможно, что заказчику может не потребоваться сразу внедрение всех компонентов системы документооборота, а иногда спектр решаемых заказчиком задач меньше, чем весь спектр задач документооборота. Тогда очевидно, что система электронного документооборота должна состоять из отдельных модулей, интегрированных между собой.
Открытость. Система электронного документооборота не может и не должна существовать в отрыве от других систем, например, когда необходимо интегрировать систему с другими прикладными системами, например, бухгалтерской программой. Для этого система документооборота должна поддерживать общие стандарты обработки и передачи данных и иметь открытые интерфейсы для возможной доработки и интеграции с другими системами.
Рассмотрим основные принципы построения ЭСУД.
Первый принцип создания ЭСУД – ориентация на работу с документами. Из этого принципа вытекает как следствие тот факт, что информационное обеспечение ЭСУД должно предоставлять возможность интегрированной обработки всех видов информации, циркулирующей в организации, в т.ч. документов, порожденных электронным и бумажным документооборотом: внешней и внутренней переписки, осуществляемой как в электронной, так и в бумажной форме.
Основной частью ИО ЭСУД должна быть база данных электронных документов (БДД), которая становится элементом централизованной базы данных всей организации или предприятия и формируется как централизованный электронный архив документов (включающий в т.ч. и бумажные оригиналы и электронные копии оригиналов бумажных документов).
ОРГАНИЗАЦИЯ ПРОЕКТИРОВАНИЯ
ЭЛЕКТРОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ
Система управления базой данных документов должна обеспечивать выполнение следующих функций:• централизованную регистрацию всех документов, которые циркулируют в организации;
• хранение документов в электронном виде в различных форматах;
• ведение централизованного каталога документов организации, обеспечивающего возможность их поиска (по ключевым атрибутам, с использованием полнотекстового поиска и т.д.);
• хранение полной истории работы с документами (кто, когда и как работал с документом), а также различных версий документов;
• надежную систему защиты документов, регламентацию доступа персонала к документам различного назначения;
• возможность поддержки архивов документов на всех видах внешних устройств, включая магнитооптические и библиотеки CD-ROM.
Прикладное программное обеспечение ЭСУД должно включать следующие ключевые компоненты:
• систему управления хранением документов – программное обеспечение, реализующие функции управления единым документарным фондом организации (централизованным архивом);
• систему управления документооборотом – программное обеспечение, реализующее администрирование документооборота, управление маршрутизацией и движением документов, координацию документопотоков, контроль за передвижением документов, за своевременной их обработкой и т.д.;
• набор стандартных бизнес-приложений, использующихся сотрудниками организации для подготовки документов – текстовых процессоров, электронных таблиц, и т.п., набор специализированных функциональных приложений, предназначенных для подготовки документов (в отличие от стандартных бизнесприложений, они взаимодействуют с базой данных, поддерживающей структурированную информацию);
• систему экспорта / импорта документов.
В качестве центрального управляющего блока программного обеспечения ЭСУД выступает система управления полномочиями пользователей, которая призвана осуществлять разграничение доступа пользователей к информации (в т.ч. к документам различной степени секретности) и регламентацию доступа пользователей к функциям, предоставляемым системой.
Первый принцип разработки ЭСУД позволяет определить состав основных функциональных модулей ЭСУД, к числу которых можно отнести (см. рис. 3.4):
• систему составления электронных документов (Система создания ЭД);
• систему организации массового ввода, преобразования бумажных документов в электронный вид и загрузки их в электронное хранилище (СМВ);
• система осуществления хранения, поиска и выдачи электронных документов по запросам пользователей (Система управления электронными документами – • система планирования маршрутизации и контроля исполнения документов и выполнения деловых процессов с целью своевременного документационного обеспечения управления (Система электронного документооборота – СЭДО).
ОРГАНИЗАЦИЯ ПРОЕКТИРОВАНИЯ
ЭЛЕКТРОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ
М1ПРЕОБРАЗОВАНИЯ
СИСТЕМА
БУМАЖНЫХ
СОЗДАНИЯ
ДОКУМЕНТОВ В
ЭЛЕКТРОННЫХ
ЭЛЕКТРОННЫЙ ВИД
ДОКУМЕНТОВ
ЭЛЕКТРОННОГО
ХРАНЕНИЯ И
ДОКУМЕНТООБОРОТА И
ПОИСКА
УПРАВЛЕНИЯ
ЭЛЕКТРОННЫХ
БИЗНЕС_ПРОЦЕССАМИ
ДОКУМЕНТОВ
Второй принцип создания ЭСУД – разработка «активного» программного обеспечения для ЭСУД. Работа с документами является основным способом выполнения функций для персонала организации. Цель автоматизации процессов движения документов и связанных с ними заданий – получение целостного механизма управления деятельностью предприятия, поэтому ПО ЭСУД должна выполнять следующие функции:• обеспечивать возможность руководству организации планировать состав работ, распределять эти работы по исполнителям и контролировать процесс их выполнения;
• до каждого исполнителя доводить информацию о том, какие работы, в какие сроки и в какой последовательности он должен выполнять;
• доставлять на рабочие места исполнителей документы и поручения;
• выстраивать список работ, которые должен выполнить исполнитель;
• обеспечивать исполнителю возможность после выбора из списка соответствующей работы, «погружения» его именно в то функциональное приложение, которое связано с соответствующим типом работы (или задания);
• оперативно изменять назначение исполнителей для отдельных работ, последовательность их исполнения и сроки исполнения.
Для достижения поставленной цели электронная система управления документооборотом должна разрабатываться на базе использования технологии «workflow», позволяющей планировать и контролировать выполнение потока работ, обеспечивая подключение к каждой работе своего программного обеспечения и необходимых электронных документов.
Модель «активного» программного обеспечения принципиально отличается от традиционной модели «пассивного» ПО, предоставляющего лишь возможность пользователю выполнить те или иные заранее предопределенные функции, а не планирующего и контролирующего, какие функции и когда необходимо выполнить. Для достижения поставленной цели электронная система управления документооборотом должна разрабатываться на базе использования технологии «workflow», позволяющей планировать выполнение потока работ и подключения к каждой работе своего программного обеспечения и необходимых электронных документов.
ОРГАНИЗАЦИЯ ПРОЕКТИРОВАНИЯ
ЭЛЕКТРОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ
Согласно третьему принципу разработки программное обеспечение ЭСУД должно легко адаптироваться к изменениям конкретных условий эксплуатации. Отсюда вытекает необходимость разрабатывать и внедрять ПО ЭСУД двумя методами:• методом компонентного проектирования;
• с использованием средств CASE – технологии проектирования ИС.
Метод компонентного проектирования основан на использовании готовых программных средств (коробочных программных продуктов), предназначенных для решения отдельных групп задач, например, получения и ведения системы электронных документов, хранения и поиска электронных документов, пересылки документов на исполнение и его контроль и т.д. Эти программные продукты на первом этапе – после установки подвергаются настройке на параметры предметной области и объединяются в единую систему, поскольку каждый из них обладает свойствами открытости.
В процессе эксплуатации такой системы – на втором этапе осуществляется постоянная адаптация ее отдельных компонент к изменениям условий функционирования:
изменению состава задач и состава функций, количества и видов документов, изменению аппаратной платформы, числа пользователей, путем изменения значений соответствующих параметров.
Использование CASE – технологии проектирования ИС дает возможность осуществлять адаптацию программного обеспечения к специфике его эксплуатации другим методом, который основывается создании совокупности информационных моделей системы и автоматической генерации на их основе программного кода и структуры базы данных.
Применение этого метода проектирования позволяет на этапе исследования предметной области и проблем совершенствования документооборота на предприятии создавать и поддерживать информационную модель всей системы. При этом решаются три основные задачи:
• Построение модели существующей в организации технологии работы, с помощью которой формулируются и описываются функции подразделений, решаемые ими задачи и технологии их выполнения.
• На основе анализа комплекса моделей существующей технологии определяются основные направления ее совершенствования.
• Разрабатывается информационные модели будущей (автоматизированной) информационной системы, в которых определяется набор автоматизируемых функций, структура единой автоматизированной базы организации, схемы и алгоритмы обработки информации и на их основе осуществляется генерация структур баз данных и программные кодов обработки.
На этапе эксплуатации полученной системы все изменения вносятся в информационные модели, на основе которых осуществляется повторная генерация структур баз данных и кодов, что позволяет осуществлять адаптацию системы к изменениям условий эксплуатации.
ОРГАНИЗАЦИЯ ПРОЕКТИРОВАНИЯ
ЭЛЕКТРОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ
Контрольные вопросы проверки знаний:1. Каково назначение экономических информационных систем?
2. Какие типы подсистем можно выделить в ЭИС?
3. Каков состав функциональных подсистем характерен для ЭИС?
4. Что такое информационное обеспечение ЭИС и его состав?
5. Что такое программное обеспечение ЭИС и его состав?
6. Что такое техническое обеспечение ЭИС и его состав?
7. Что такое технологическое обеспечение ЭИС и его состав?
8. Что такое АРМ и какова его структура?
9. Какие классы ЭИС Вы знаете?
10. Что такое корпоративная ЭИС и каковы ее свойства?
11. Каково назначение ЭСУД и ее место в ЭИС?
12. Какие принципы построения ЭСУД Вы знаете?
13. Какие функциональные модули можно выделить в ЭСУД?
14. Какими методами можно создавать и внедрять ЭСУД в ЭС?
ПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
ТЕМА 4. ПРОЕКТИРОВАНИЯ СИСТЕМ СОСТАВЛЕНИЯ
ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
4.1. Понятие электронного документа (ЭД). Виды ЭД.В соответствии с данными консалтинговых агентств, более 80% из всех деловых документов приходится на долю бумажных форм. Обработка традиционных печатных форм включает затраты на проектирование форм документов, печать, хранение данных, а также на рутинную обработку каждой созданной формы. По данным аналитиков Gartner Group, только на печать всех форм документов требуется 6 млрд долл., стоимость хранения, распространения и обработки достигает совокупно 40 млрд долл. Борьба со все возрастающим потоком бумажных форм ведется в двух направлениях:
• применение все более эффективных технологий извлечения данных из бумажных форм;
• переход от бумажных форм к электронным.
Все больше организаций признают важность включения электронных форм в глобальную инфраструктуру движения оборота электронной информации. Электронная форма документа (ЭД) – это страница с пустыми полями, оставленными для заполнения пользователем. Под электронной формой документа понимается не изображение бумажного документа, а электронная технология работы с формами, где бумажная форма появляется только по требованию в качестве твердой копии электронной. Технология обработки электронных форм позволяет уйти от рукописных и машинописных форм и иметь дело только с их электронным представлением.
Электронные формы могут допускать различный тип входной информации и содержать: командные кнопки, переключатели, выпадающие меню или списки для выбора.
После заполнения формы вы можете отправить ее. Обычно для этого нужно лишь нажать кнопку, поскольку электронный адрес получателя заранее определен.
Можно выделить следующие преимущества использования электронных документов:
• сокращается время обслуживания клиентов за счет сокращения времени на поиск документов и на реакцию на запрос;
• повышается эффективность управления информацией за счет получения более быстрого доступа к документам, выбора более оптимального способа хранения документов, получения возможности собирать и обрабатывать документы в большем количестве, чем раньше;
• принимаются быстрее более точные и обоснованные управленческие решения;
• повышается степень защищенности документа при хранении за счет компактности документа, быстроты и дешевизны копирования электронного документа в стольких копиях, сколько нужно;
• обеспечивается защита информации от несанкционированного доступа с помощью выполнения более быстрой и дешевой операции шифрования и дешифрования информации в электронном документе;
• увеличивается производительность труда за счет сокращения подготовительных операций над документами и увеличения времени на выполнение основных операций;
• введение доступа к документу одновременно нескольких пользователей из рабочей группы и обеспечение взаимодействия сотрудников всех подразделений предприятия, что позволяет избежать дублирования выполняемых функций и задач;
ПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
• уменьшение затрат на обработку документа (снижение расходов по распространению и сбору форм, а также по перемещению между исполнителями);• полный контроль над формой в момент ее движения между исполнителями, возможность определять сроки каждого этапа обработки формы и контроля исполнения.
К числу недостатков использования ЭД можно отнести:
• неполную юридическую проработку процесса «подписи формы»;
• сравнительную «молодость» технологий подписи формы и отсутствие абсолютно надежных технологий.
Можно выделить три типа форм электронных документов и технологий их применения:
1. Формы, предназначенные для сбора данных и последующей статистической обработки. При обработке бумажных форм из них извлекаются необходимые, заранее определенные данные для последующей обработки. При электронной технологии опрос осуществляется или по электронной почте, или через формы, размещенные на Webсерверах в Internet. В качестве преимущества последнего подхода нужно отметить отсутствие дорогостоящего оборудования для обработки, расходов по распространению форм, включая почтовые.
2. Формы, предназначенные для сбора информации как внутри, так и вне предприятия, но требующие процедуры ознакомления и подтверждения. К такого рода формам можно отнести заказы на покупку, счета, отчеты о командировочных расходах и т. п.
Отличительная особенность технологии их обработки – кроме извлечения собственно данных приходится маршрутизировать форму между сотрудниками, которые ответственны за принятие решения по этому документу. Так, например, счет может быть не утвержден финансовым директором, следовательно, бухгалтерия не будет его обрабатывать, и данные из этого счета (платежные реквизиты и сумма платежа) не поступят в бухгалтерскую систему. Электронная технология подразумевает не заполнение бумажных форм и их последовательную обработку, а работу с электронными формами сразу с этапа заполнения до этапа извлечения данных и их сбора в определенной базе данных (или экспорт этих данных в какое-либо специализированное приложение).
3. Создание форм, доступных удаленным пользователям Web, расширяет возможности групповой работы с партнерами, клиентами и заказчиками. Простой электронный доступ к общим формам, таким как кредитные приложения, заказ продуктов и регистрация лицензий, удерживает громадный потенциал для оптимизации объемных рабочих процессов, особенно если общие сетевые формы интеллектуальные.
Форма электронного документа состоит из полей, среди которых можно выделить поля нескольких типов:
• Поля с постоянными реквизитами, не изменяющимися среди экземпляров документа одного типа (например, наименование предприятия, эмблема предприятия, наименование документа и места его составления). Особенностью таких полей является необходимость занесения их в форму ЭД в процессе проектирования его структуры.
• Поля с наименованием переменных реквизитов, изменяющих свои значения при переходе от одного экземпляра документа к другому, и также требующие предварительного занесения в форму ЭД.
• Поля со значениями переменных реквизитов, которые могут быть двух типов:
заполняемые вручную и автоматически. Автоматически заполняемые поля могут быть двух классов: вычисляемые поля с помощью подключения стандартПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ ных статистических, математических, финансовых функций или макросов, и автоматически заполняемые поля из базы данных и из справочников.
Для сокращения числа вводимых ошибок применяют методы автоматического контроля правильности и целостности заполнения вводимой информации к числу которых, к примеру, относится проверка по шаблону поля, по списку значений из базы данных и др.
• Управляющие кнопки, предназначенные для инициирования каких-либо более сложных вычислений или отсылки в базу данных, по сети другому специалисту, по электронной почте или факсу.
• Поля для отметок, которые ставятся в документе в процессе его просмотра.
• Поля с электронными подписями.
Создание и обработка формы электронного документа обычно включает в себя выполнение нескольких операций (см. рис. 4.1):
Первая операция – проектирование структуры формы ЭД заключается в рисовании линий, создании графических элементов (например, логотипов), т. е. подготовке внешнего вида ЭД с помощью графических средств.
Поскольку переменные поля могут быть заполнены вручную или посредством выбора значений из какой-либо базы данных (в последнем случае должна быть установлена связь формы с базой данных), то второй операцией будет — проектирование содержания формы ЭД.
Содержанием этой операции является привязка переменных полей формы, которые будут заполняться, к инструментальным средствам заполнения, или вычисления, или автоматического контроля, т.е. на этой операции проектирования осуществляется придание форме свойства интеллектуальности. Почти все продукты обеспечивают удобные средства установления простых связей с соответствующими средствами, часть из них предоставляет высокоуровневые языки скриптов или макросы. Дизайнер форм также может указать, что при заполнении поля будут выполняться определенные задачи, такие как, например, вычисление суммы, проверка типов и т.д.
На третьей операции с целью повышения достоверности информации при заполнении форм ЭД устанавливаются связи между формами, что позволяет автоматизировать процессы актуализации сведений, заключенных в связанных формах.
На четвертом этапе осуществляется работа с готовой формой, путем ее заполнения из различных источников, автоматической проверки правильности заполнения переменных полей, в которые информация вводится вручную, проставления отметок о просмотре документа, выполнения дальнейшей пересылки его на рабочий стол другого специалиста или передачи его по электронной почте или факсу.
Наиболее проблематичным моментом при работе с ЭД является проставление электронной подписи. Очень часто при внедрении систем электронного документооборота
ПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
встает вопрос о том, чем заменить обычную подпись на бумажном документе в его электронном аналоге.Существует несколько способов реализации технологии электронной подписи:
• криптографическая методика открытых ключей защиты форм от последующих • использование биометрических характеристик специалистов;
• применение отпечатков пальцев и изображений лиц и др.
Наиболее часто используется криптографическая методика открытых ключей защиты форм от последующих изменений, основным недостатком которой является недостаточная степень защищенности от взлома или подделки.
4.2. Классификация средств автоматизации составления ЭД.
Требования к системам составления ЭД. Характеристика систем Использование формализованных документов является необходимым практически для любого бизнеса. Осуществление большинства деловых процедур (прием и выполнение заказов, подготовка счетов, учет кадров и т.д.) сопровождается генерацией бумажных документов, движением и последовательным заполнением различных бланков. С появлением и развитием персональных компьютеров многие компании пытаются сократить трудоемкость и расходы, связанные с распространением, хранением и обработкой формализованной информации, внедряя различные компьютерные системы в первую очередь заменяя бумажные документы на электронные.
Базовые функциональные возможности современного ПО разработки электронных форм должны включать следующие компоненты:
• гибкие средства создания и переналадки структуры форм;
• средства поддержки процесса заполнения форм и контроля вводимых данных;
• связь полей электронных форм с полями баз данных;
• средства автоматизации вычислений значений полей с переменной информацией;
• средства маршрутизации и администрирования прохождения форм как внутри организации, так и между компаниями.
Первые программные системы поддержки работы с электронными формами появились в конце 80-х годов и представляли собой инструмент для разработки шаблонов документов. Данный класс ПО быстро развивался, наращивая новые возможности по созданию форматов электронных документов, заполнению, маршрутизации и хранению данных. К первым средствам автоматизации создания документов можно отнести средства MS Office, с помощью которых выполняются следующие операции:
• подготовка и хранение в базах шаблонов текстовых и табличных документов;
• поиск шаблонов для заполнения;
• автоматизация процессов заполнения полей с переменной информацией из базы данных;
• автоматизация вычисления значений полей ЭД с переменной информацией;
• отсылку документов по электронной почте или по сети.
Вторую группу средств составляют программные средства проектирования функциональных приложений ЭИС:
• процедурно-ориентированные языки программирования;
• объектно-ориентированные языки программирования;
• объектно-ориентированные средства проектирования.
ПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
Эти программные средства позволяют выполнять следующие операции:• разрабатывать структуру и содержание формы ЭД;
• производить заполнение запрограммированных экранных форм документов при вводе информации с бумажных носителей;
• производить автоматический контроль правильности заполнения на основе информации баз данных, по шаблонам заполняемых полей и с использованием • автоматически выполнять вычисления в документах на основе информации, хранящейся в базах данных и алгоритмов расчета.
Помимо них, в настоящее время используют специализированные программные продукты, которые позволяют встраивать ЭД в подсистему электронного документооборота, включаемую как одну из функциональных подсистем проекта ЭИС для предприятия.
Эти программы составляют третью группу средств разработки ЭД и отличаются следующими свойствами:
• продукты, предназначены для проектирования ЭД и помогают быстро имитировать бумажные формы;
• большинство из них предоставляют таблицы, кнопки, просматриваемые списки, штриховые коды и другие функции автоматизации, включающие связи с различными базами данных;
• вносить элементы настройки типа «персонифицированных» командных кнопок, но базовые формы не могут быть изменены;
• для основных вычислений в электронных формах доступны как стандартные операции, так и специальные финансовые и статистические функции (применение таких средств напоминает построение формул для электронных таблиц).
На следующем уровне программы работы с формами ЭД могут использовать средства для установления связи между формами, макросы или языки высокого уровня, что позволяет опытным пользователям собирать сложные системы, такие как, например, процедуры последовательной обработки «Страховых требований».
Так как формы связаны с файлами данных, то эти программные средства позволяют включать операции обработки данных и функции запросов, например, создать кнопку для вывода на экран всех «Накладных», просроченных больше чем на 30 дней.
Кроме того, необходимо отметить, что практически все основные разработчики программного обеспечения обработки форм ЭД включают в такие системы возможность заполнения форм через Web-сервер, что повышает их доступность со стороны удаленных клиентов.
Для маршрутизации электронных форм в системах данного класса используются электронная почта и сетевой сервер, что делает программное обеспечение обработки форм необходимым приложением для коллективной обработки данных. Данные приложения как минимум имеют доступ к службе электронной почты, так что можно вручную выбирать адреса в момент отправки корреспонденции.
Все продукты предлагают один из способов маршрутизации форм. После создания формы можно назначать ее рассылку, а также указывать правила и условия, позволяющие миновать определенные почтовые маршруты.
Благодаря наличию таких простых инструментальных средств, дополненных модифицируемыми примерами, для разработки разнообразных приложений обработки форм ЭД практически не требуются навыки программирования. Например, интеллектуальный маршрутизатор компании «Jet Form» дает возможность посылать все заказы на обычные
ПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
покупки к ответственному за них менеджеру на подпись, в то время как все запросы на расходы из бюджета организации будут поступать на рассмотрение вице-президенту. Модули слежения позволяют пользователям получать информацию о том, что форма принята, и определять ее текущее состояние.Кроме заполнения и маршрутизации форм в системах данного класса обеспечивается хранение форм (не только данных из них, но собственно форм с результатами их прохождения между исполнителями), контроль доступа к ним и историю их обработки.
Для этого программное обеспечение обработки форм должно быть сопряжено с системами управления документами.
Эти специализированные средства можно классифицировать по масштабу разработки на программное обеспечение, разрабатываемое для ЭИС средних предприятий (например, «1С:Документооборот»), и средства, создаваемые для корпоративных ЭИС крупных предприятий.
Использование входящих в состав системы «1С: Документооборот» компонент «Дизайнер форм» и «Отладчик форм» имеет ряд преимуществ при выполнении автоматизации документопотоков предприятия перед системами вышеприведенных групп».
Основным преимуществом компоненты «Дизайнер форм» является то, что она служит средством разработчика и позволяет произвести настройку системы «1С: Документооборот» на автоматизацию конкретных технологических процессов управления на предприятии. Под автоматизацией технологического (бизнес) процесса в данной системе подразумевается составление формы ЭД, описывающей правила ее заполнения различными пользователями и регламент их обхода подразделений и исполнителей, т.е. его маршрут.
С помощью «Дизайнера форм» можно осуществить весь цикл операций подготовки автоматизации конкретного технологического (бизнес) процесса управления для каждого ЭД:
• создание формы ЭД, описывающей технологический процесс работы с ним;
• размещение на страницах формы информационных и вспомогательных полей, задающих регламентные действия исполнителей данного технологического • установка маршрутных характеристик будущих электронных документов (процессов) – порядок – регламент обхода участников, сроки работы для каждого участника, права и обязанности на внесение изменений в документ и пр.;
• программирование задач любой сложности, связанных как с какими-либо расчетами, так и с сложным управлением документом на маршруте;
• тестирование формы с помощью внешней компоненты «отладчик форм».
Помимо этой системы в настоящее время разработан большой класс систем разработки и ведения форм ЭД, проектируемых для крупных компаний и фирм. К их числу относятся программные системы «Lotus», «Jet Form» и другие.
«Jet Form», созданная американской компанией «Jet Form», которая предоставляет пользователю корпоративной информационной системы следующие возможности:
• хорошо структурированные средства проектирования форм ЭД;
• средства заполнения форм ЭД пользователем;
• клиент-серверную обработку;
• мощные средства централизованного управления выдачей информации из корпоративных баз данных и прикладных приложений в готовые формы на печать;
• отправку по электронной почте и по факсу и др.
ПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
Система «Jet Form» состоит из трех модулей, отражающих технологию разработки форм ЭД:Создание электронных форм. «Jet Form Design» позволяет создавать электронные формы, которые точно отображают существующие бумажные аналоги. «Jet Form Design» для Microsoft Windows включает все средства, которые необходимы для создания наиболее сложных форм. Это обеспечивает графические, сложные, легкие в программировании средства для моделирования бизнес-процессов и связи данных, которые плюс ко всему могут быть интегрированы с существующими системами документооборота.
Вывод форм. Для многих организаций первый шаг на пути использования электронных форм заключается в получении контроля над выводом: твердых бумажных копий, факсов, сообщений e-mail. «Jet Form» отличается использованием серверных приложений для управления выводом.
Центральным компонентом в выводе форм служит «Jet Form Central». Применяя «Jet Form Central», можно воспроизводить профессиональную и качественную лазерную печать данных, содержащихся в клиент-серверных базах и информационных системах.
Большинство организаций уже обладают значительным количеством компьютеризованной информации и ищут способы интегрировать эту информацию в системы электронных форм. Используя возможности «Jet Form» по встраиванию данных в печатные формы, компании могут усилить отдачу от инвестиций в информационные системы за счет добавления возможностей вывода форм в основные приложения.
Программы, встраивающие данные в печатаемые формы, берут информацию из организационных приложений, таких как системы автоматизации производства (SAP), переформатируют их для существующих форм и выводят на печать по требованию.
Без функций встраивания данных в печатаемые формы централизованные данные трудно извлечь и расположить – требуется работа программистов для правильного форматирования. Формы с функциями встраивания данных, с другой стороны, чрезвычайно гибкие – интеллектуальная разбивка по страницам и автоматически выравнивающиеся поля приспосабливают данные из других приложений без участия пользователя.
Функции встраивания данных при печати – только один пример технологии печати по требованию, использующей внутренние, заранее сконструированные, формы для большей эффективности. Аналогично производству в момент необходимости, печать по требованию уменьшает расходы, связанные с хранением форм.. Печать по требованию, выводящая формы столько раз, сколько потребуется, для множества разных пользователей в различных местах одновременно, избавляет от необходимости в формах, состоящих из многих частей и их твердых копий, кроме того, исключает возможность существования разных версий формы в организации.
Когда какие-либо данные заполняются на компьютере, форма становится естественно гибкой, так как данные в заполняемой форме могут быть теперь напечатаны с использованием различных представлений. Информация в форме о платежах, например, направляется для вывода в различные документы, такие как «Чек поставщика», форма обработки транзакций банка, «Накладная», содержащая обработанную запись. Кроме того, пакетная печать может отсортировать различные выходные представления для более быстрого управления, в частности размещение документов в последовательном порядке и регистрация копий по имени поставщика.
Подход «Jet Form» к выводу форм позволяет определить различные средства вывода, включая распределенную печать, инициацию факса, генерацию сообщений e-mail через программы совместной работы или Internet.
ПРОЕКТИРОВАНИЕ СИСТЕМ СОСТАВЛЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
Заполнение и связь с базами данных с помощью «Jet Form Filler». «Jet Form Filler» позволяет заполнять, подписывать, печатать и перенаправлять формы внутри организации. Возможность использования справочников баз данных гарантирует автоматический поиск информации в базе данных и в то же время заполнение формы. Правила проверки данных могут быть заранее установлены для поддержки правильности новых данных.Встроенное вычисление данных сохраняет время и предотвращает ошибки, которые могут быть сделаны вручную, автоматически вычисляя числовые значения в полях при заполнении формы. Средства примечаний дают возможность присоединять заметки, которые будут сопровождать форму в процессе маршрутизации.
Связь полей форм с базами данных осуществляется либо через стандарт ODBC, либо через свои драйверы. На сегодняшний день реализована поддержка практически всех ведущих форматов баз данных. Можно выделить следующие возможности при работе электронных форм с базами данных:
• поддержку многих баз данных в одной форме;
• чтение / запись / модификацию баз данных;
• полную гибкость, встроенные SQL-выражения;
• модификацию процессов для целой формы или выбранных полей;
• блокировку записей;
• списки выбора баз данных (которые могут проверять данные на соответствие корпоративным стандартам);
• модификацию индексных файлов баз данных.
Контрольные вопросы проверки итоговых знаний:
1. Что такое электронный документ и какие классы полей в нем выделяют?
1. Какие преимущества использования ЭД Вы знаете?
2. Каковы способы автоматического заполнения полей и каковы методы автоматического контроля правильности ручного заполнения полей в ЭД Вы знаете?
3. Каковы этапы разработки ЭД и их содержание?
4. Какие типы ЭД Вы знаете?
5. Какие требования предъявляются к программному обеспечению составления ЭД?
6. Какие классы ПО составления ЭД знаете, их отличия, приведите примеры.
ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
ТЕМА 5. ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА
ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
5.1. Назначение и технология работы системы массового ввода Одной из основных задач, связанных с технологиями документооборота, является массовый ввод бумажных документов в архивную систему или систему управления документами и организация последующего к ним доступа. Основное отличие массового ввода документов от простого сканирования состоит в том, что обрабатывается большое количество однотипных документов. В качестве примеров приложений данной технологии в конкретных предметных областях можно привести систему ввода и обработки «Платежных поручений» в банке, систему ввода «Налоговых деклараций», систему ввода и проверки бухгалтерских документов в Пенсионном фонде.Для организации обработки большого количества бумажных документов и перевода их в электронную форму необходимо разработать систему массового ввода документов (СМВ), которая будет способна работать как с одним, так и с несколькими тысячами бумажных документов в день. При реализации технологии массового ввода документов можно рассматривать два основных класса задач:
• извлечение данных из бумажных документов, когда пользователей интересуют только извлеченные структурированные данные, а собственно сами изображения документов их не интересуют, т.к. не используются для последующего хранения и доступа;
• извлечение данных из бумажных документов с сохранением изображения документа (например, «Платежное поручение» клиента), когда имеет смысл после извлечения данных сохранить изображение документа для того случая, при котором потребуется анализ исходного документа. При этом извлеченные данные можно использовать двояко: во-первых, эти данные имеет смысл напрямую загружать в банковскую систему, а во-вторых, их можно использовать для организации хранения и быстрого поиска изображений.
При проектировании системы ввода бумажных документов решается следующая совокупность проблем:
• определение состава операций, которая должна выполнять система;
• выбор технических средств реализации выполнения этих операций;
• выбор и настройка программного обеспечения;
• разработка технологической документации.
Рассмотрим содержание основных операций автоматизированного ввода бумажных документов.
Автоматизированное чтение и ввод документов на бумажном носителе включают в себя операции, которые можно объединить в два этапа:
1. подготовительный;
2. основной.
Подготовительный этап – очень важная фаза процесса ввода документов, которая обеспечивает получение достоверных отсканированных изображений, сохраняемых в системе, и включает в себя две операции:
• подготовку документов для сканирования;
• выполнение описания настроек системы на конкретную форму документа.
ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
Подготовка документов для сканирования предполагает выполнение следующих действий:• определение состава документов, подлежащих сканированию;
• выбор конкретных областей в каждом документе для сканирования;
• определение технологической цепочки движения документа по рабочим местам;
• открытие конвертов, удаление скрепок или других предметов, мешающих сканированию;
• подготовка пакетов документов для сканирования;
• выписка ярлыков на каждый пакет документов с указанием кода документа и количества документов каждого типа в пакете.
Выполнение описания настроек системы на конкретную форму документа предполагает выполнение трех операций:
• составление настройки на форму документа;
• разработка настройки на модель ввода;
• составление настройки соответствия полей формы документа и полей индексации для ввода в информационную базу или архив.
В основе выполнения настройки на форму документа лежит понятие форматированного (структурированного) документа (ФД). Типичными примерами форматируемых документов являются «Платежные поручения», «Прайс-листы», «Декларации о доходах», «Счета» и т.д. Основной структурной единицей форматируемого документа является поле, поэтому каждый форматируемый документ можно представить как сумму полей.
Каждое поле описывается в двух аспектах: визуально или геометрически, и содержательно. С изобразительной точки зрения каждое поле должно быть явно обособлено:
пустыми промежутками, разделительными линиями, оригинальным типом шрифта, уровнем фона, цветом и т.д.
Содержательная часть характеризуется назначением поля, словарным и алфавитным составом, а также некоторыми законами построения текста, например, в поле почтового адреса должны быть сведения о городе, улице, доме и проч.
Геометрические и содержательные характеристики полей могут быть как абсолютно независимыми, так и взаимосвязанными. Например, в приходном ордере рядом с полями «количество» и «цена» находится поле «сумма».
Документы, которые подлежат сканированию, могут быть объединены в группы по нескольким признакам. По способу нанесения информации можно выделить документы, в которых используются метки, печатный или рукописный тексты. Так, например, «Избирательные бюллетени» используют меточный способ, в то время как «Прайс-листы» – печатный, а первичные бухгалтерские документы – в основном рукописный.
Выполнение описания настроек системы на конкретную форму документа предполагает также выполнение разработки настройки на модель ввода документа в информационную базу или в электронный архив и составление настройки соответствия полей формы документа и полей индексации для ввода в информационную базу или архив. Построение этих настроек опирается на существование трех подходов к вводу данных в базу:
• Ввод ключевых слов. В этом случае одно или несколько ключевых слов будет использоваться в качестве индексов для конкретного изображения. В дальнейшем возможен быстрый доступ к изображению документа с применением введенных ключевых слов – индексов.
• Ввод всего текста документа. Производится ввод всех слов документа и после этого возможно осуществление полнотекстового поиска изображения докуменПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ та с помощью полнотекстового индекса, составляемого для этого документа.
Этот метод может применяться при необходимости получения текстового варианта документа.
• Формоориентированный ввод данных. Данный метод используется для полной замены ручного ввода данных в компьютерные системы и в основном применяется для ввода данных из форм (стандартных, однотипных документов). В этом случае атрибуты документа будут использованы для составления индекса документа для его поиска и хранения в базе или архиве.
Основной этап автоматизированного ввода бумажных документов включает в себя выполнение таких операций как:
• сканирование;
• контроль качества отсканированных изображений и повторное сканирование;
• предварительная обработка текста;
• основная обработка текста документа;
• контроль качества распознавания и редактирование;
• индексирование документа и загрузка.
Сканирование – это очень ответственная операция, и, следовательно, к выбору конкретной модели сканера необходимо подходить достаточно ответственно. При выборе следует учитывать следующие факторы: размеры документов, их состояние, является ли документ односторонним или двухсторонним, производительность сканеров, необходимое разрешение изображения, надежность получаемых изображений и другие.
В настоящее время на рынке технических средств предлагается достаточно большое количество различных моделей сканеров, которые можно классифицировать по производительности на следующие виды:
• персональные;
• высокопроизводительные потоковые.
По качеству сканирования, зависящего от разрешающей способности, их можно разделить на следующие группы (табл. 2):
• с низкой разрешающей способностью (200-400 точек на дюйм);
• со средней разрешающей способностью (600-800 точек / дюйм);
• с высокой разрешающей способностью (1600-2800 точек / дюйм);
• специально го назначения.
Ввод документов предъявляет достаточно низкие требования к качеству сканирования, обычно бывает достаточно разрешения 200-300 точек / дюйм. Профессиональные издательские сканеры имеют разрешение порядка 1600-2800 точек / дюйм и даже персональные сканеры имеют разрешение порядка 600-800 точек / дюйм. Единственная отличительная особенность – автоматическая подача страниц документов и высокая скорость сканирования (от 10 до 200 листов формата А4 в минуту). Данные высокоскоростные сканеры предназначены для ввода разброшюрованных документов.
Для ввода ветхих документов применяют сканеры с вакуумным прижимом документов, которые предъявляют весьма низкие требования к документу и обрабатывают его в щадящем режиме. В совсем редких случаях, когда документ настолько стар, что его нельзя помещать даже в планшетный сканер, применяют сканеры специального назначения. Такие сканеры позволяют сканировать не полностью раскрытые книги и документы плохого качества. Скорость ввода у таких устройств – 0,25-3 страницы в минуту.
ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
Обработка данных, содержащихся в документе, предполагает выполнение следующих основных операций:• предварительная обработка изображений;
• основная обработка изображений документа.
Предварительная обработка изображения документов используется для улучшения полученных изображений и необходима по следующим причинам:
• Улучшение читаемости изображения. Обработанные изображения более понятны при визуальном просмотре.
• Повышение точности распознавания. Применение специальных методов улучшения изображения может значительно повысить точность оптического распознавания символов.
• Уменьшение размера изображения. Размер файлов обработанных изображений может быть меньше первоначального размера на 80%. Под уменьшением размера понимается как простое сжатие файла, так и удаление ненужной информации.
Предварительная обработка изображения документов предусматривает использование следующих методов: очищение изображения применяется для снятия с изображений отдельных элементов (например, точки, пятна); снятие фона и выделений (например, с ценных бумаг); восстановление букв и символов – если они оказываются пересеченными элементами формы, например, линией, (для последующего распознавания символа необходимо удалить линию, таким образом, чтобы буква не пострадала); вращение изображения на произвольный угол; масштабирование изображения; регулирование уровня серого;
компрессия и декомпрессия изображения.
Процесс основной обработки документов предусматривают выполнение операций:
• нахождения полей (сегментация документа);
• распознавание текста документов.
Они могут быть выполнены последовательно и независимо, если поля полностью определены своими визуальными характеристиками. Такая ситуация характерна для машиночитаемых форм и документов с явными разделителями полей в виде линий или больших промежутков.
Распознавание документа, анализ содержания документа и извлечение данных может осуществляются с помощью следующих систем распознавания текстов, отличающихся по стоимости, качеству и скорости работы:
• OCR (Optical Character Recognition) – технология оптического распознавания печатных символов, т.е. перевода сканированного изображения печатных символов в их текстовое представление;
• ICR (Intelligent Character Recognition) – распознавание раздельных печатных символов, написанных от руки;
• OMR (Optical Mark Recognition) – распознавание отметок (обычно перечеркнутые крест-накрест либо галочками квадраты или круги);
• Стилизованные цифры – распознавание рукописных цифр, написанных от руки по шаблону, как на почтовых конвертах;
Существует несколько подходов к реализации технологий ввода рукописных символов:
• Распознавание on-line осуществляется в тот момент, когда человек пишет специальным пером на сенсорном экране, воспринимающем дополнительную информацию о траектории движения руки, наклоне пера, силе нажима и т.д. ПриПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ меняется в основном в персональных электронных записных книжках типа 3Com PalmPilot для рукописного ввода числовых и символьных данных.
• Распознавание off-line – распознавание произвольного рукописного текста, введенного в компьютер через сканер.
Распознавание рукопечатных символов является подмножеством технологии распознавания off-line. Этот метод применяется, как правило, для ввода стандартных форм.
Распознавание рукописного текста значительно сложнее, чем печатного, поскольку если в последнем случае мы имеем дело с ограниченным числом вариаций изображений шрифтов (шаблонов), то в рукописном варианте число шаблонов неизмеримо больше.
Для OCR-систем в основном используются три технологии распознавания напечатанного текста:
• матричная (Matrix-based);
• описательная (основана на описании правил построения символов);
• нейронная (основана на использовании нейронных сетей).
Строгое соблюдение стандарта внешнего вида формы существенно повышает точность распознавания полей документа.
Контроль распознанных данных является следующей операцией, реализуемой системой ввода.
Системы автоматического распознавания обычно вместе с результатом возвращают так называемую «степень уверенности». Для повышения надежности данных после распознавания применяются определенные пользователем автоматизированные методы проверки данных (например, можно проверить, имеется ли распознанная информация в базе данных, и если нет, то пометить поле как некорректное). Для повышения надежности данных используются дополнительные механизмы, такие как применение словарей и таблиц, определяемых пользователем. Помимо этого, системы включают специальные встроенные средства для определения специальных процедур проверки для каждого поля документа.
Если данные после распознавания помечены как не корректные, то они автоматически направляются на ручное редактирование. Во время редактирования оператор видит реальное изображение нераспознанного поля и имеет возможность откорректировать его.
После ввода оператором новых данных снова применяются правила проверки данных, т.е.
на всех этапах ввода, как автоматического, так и ручного, осуществляется проверка данных в соответствии с правилами, определенными пользователем.
Индексирование и загрузка данных. Заключительная операция процесса – это экспорт изображений документов и сопутствующих данных в конкретную систему документооборота или базу данных и индексирование. Основными требованиями к экспорту являются поддержка различных форматов данных и его скорость.
После того, как документ распознан, он поступает в базу данных или в систему управления документами, где проводится его индексирование. В отличие от обычной системы распознавания система ввода стандартных форм использует формальное описание исходной формы документа, описание модели ввода и модели соответствия полей ввода и индексирования. Это позволяет автоматически производить индексирование документов и загружать информацию в поля базы данных или архив без участия оператора.
В зависимости от конкретной задачи и типа документа, он может быть загружен в полнотекстовый модуль или информация из него извлеченная должна будет попасть в систему атрибутивной индексации (например, значения из полей формы попадают в карточку документа). При этом, может быть сохранено изображение документа.
ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
5.2. Требования, предъявляемые к СМВ. Характеристика систем Основной фактор при оценке эффективности систем распознавания заключается в стоимости исправления ошибок при распознавании, а не в точности и скорости системы.В некоторых случаях затраты на исправление ошибок при распознавании могут перекрыть все плюсы автоматизации и сделать ручной ввод по изображению более эффективным.
При разработке и использовании СМВ проектировщику требуется выполнить также большой объем работ по интеграции этой системы ввода в действующую или разрабатываемую информационную систему. На производительность системы очень большое влияние оказывают используемая технология ввода, ее настройка на текущую задачу и вид документов. Здесь нужно учитывать состав оборудования, программное обеспечение и совместимость формата распознанной информации с уже существующими системами.
Существует множество компаний, которые предлагают решения или компоненты систем обработки форм. Решение о внедрении системы обработки форм, а также выбор того или иного приложения должны производиться с учетом в первую очередь следующих факторов:
• тип обрабатываемых документов и вид содержащихся в них данных;
• точность распознавания;
• наличие эффективной системы редактирования;
• настраиваемость системы на требования конкретного заказчика и способность изменяться согласно меняющимся внешним условиям без программирования;
• наличие поддержки сканеров различных типов, а также разного рода плат обработки изображений документов;
• наличие редактора форм, настраивающего систему на новые формы или изменения старой формы, на которую система была предварительно ориентирована;
• наличие редактора схем обработки документов, открытого интерфейса подключения различных модулей распознавания (в зависимости от типа формы можно для повышения качества распознавания подключать тот или иной модуль, который наиболее подходит для данного типа формы);
• наличие редактора схем экспорта в базу данных (данные, которые извлекаются при обработке формы, должны быть переданы или в базу данных для хранения, или в другие бизнес-приложения для обработки).
Помимо этого к выбору ПО для СМВ можно предъявить совокупность общих требований:
• Открытость. Система должна позволять включать в себя различные технологии и программные продукты в зависимости от конкретного приложения, даже если эти продукты поставляются другими фирмами. Необходима возможность интеграции с различными workflow-системами и с системами документооборота.
• Возможность настройки. Пользовательский интерфейс должен быть настраиваемым для достижения максимальной эффективности работы операторов.
• Масштабируемость. Необходимо иметь возможность добавлять и уменьшать системные ресурсы при различных уровнях загрузки системы.
• Возможность администрирования. Пользователь должен иметь возможность гибкого управления системой. Необходимо иметь возможность контролировать используемые ресурсы и инструментарий для получения различных видов отчетов.
ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
Рассмотрим в качестве примера две системы класса СМВ – «Cognitive Forms» компании Cognitive Technologies и FineReader.«Cognitive Forms» – российская система промышленного (иногда говорят поточного) ввода стандартных форм документов, которая работает под управлением операционных систем Windows 95 / NT и MacOS. Система принадлежит к классу OCR / ICR / OMR и позволяет вводить в базы данных и информационные системы формы с печатным, рукописным заполнением и отметками (checkbox).
«Cognitive Forms» предназначена для автоматизированного ввода в информационные системы и базы данных произвольных, одно – и многостраничных форм документов, соответствующих определенным требованиям к оформлению и заполнению и подготовленных на лазерных, струйных и матричных принтерах или на стандартных бланках с использованием пишущих машинок.
Эта система позволяет осуществлять распределенную поточную обработку (сканирование, распознавание, редактирование и контроль) в сети с производительностью распознавания до 14 000 страниц А4 в смену на одном компьютере и осуществлением автоматического контроля результатов распознавания. Экспорт данных может осуществляться в базы данных, банковские системы типа «Операционный день» и системы создания электронных архивов и автоматизации документооборота.
Внедрение системы позволяет обеспечить ускорение ввода стандартных форм документов в 5-10 раз по сравнению с ручным вводом.
Сканированные образы могут быть сохранены в электронном архиве банка для ведения истории делопроизводства организации.
«Cognitive Forms» состоит из трех основных модулей:
• Cognitive FormDesigner отвечает за проектирование описания формы документа для программ распознавания и редактирования.
• Cognitive FormReader обеспечивает автоматическое распознавание потока стандартных форм, поступающих со сканера. В автоматическом режиме осуществляет поточное распознавание форм по заданному описанию и контекстную проверку результатов.
• Cognitive FormEditor предназначен для операторского контроля распознанных форм и сохранения информации из введенных форм в записи базы данных и позволяет оператору визуально контролировать и редактировать распознанные «Cognitive Forms» дает возможность осуществлять распределенную, в рамках локальной сети, обработку вводимых форм и добиться эффективного доступа к данным в режиме реального времени. Например, на Pentium II-233 время распознавания системой «Cognitive Forms» одного бланка составляет около 2 сек. Для промышленного ввода применяются высокопроизводительные сканеры: Kodak, Bell+Howell, BancTec, Fujitsu и др., а также сетевые устройства (Hewlett-Packard). Производительность некоторых моделей достигает сотен страниц в минуту.
Эффективность применения системы ввода бумажных документов в ЭИС основана, в первую очередь, на значительном сокращении участия человека во вводе данных.
Как следствие, можно наблюдать уменьшение времени ввода документов и количества ошибок. Для организаций, обрабатывающих большие потоки форм (центральные налоговые и почтовые ведомства, статистические организации, центры авторизации по расчетам за кредитные карты), использование описанных технологий позволит решить проблемы эффективности обработки сотен тысяч и даже миллионов форм в сжатые сроки.
ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
В основу системы «FineReader» разработанной компанией ABBYY, положены три принципа, распознавания сформулированные при наблюдении за поведением животных и человека: Целостность, Целенаправленность и Адаптивность позволившие получить решение, использующее в своей основе принципы распознавания, характерные для живых систем, – технология Целостностного Целенаправленного Адаптивного распознавания (IPA-технология).Целостность. Объект описывается как целое с помощью значимых элементов и отношений между ними. Объект признается объектом данного класса только при наличии всех элементов описания и нужных отношений между ними.
Целенаправленность. Распознавание строится как процесс выдвижения и целенаправленной проверки гипотез. Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменятся подходом, состоящем в целенаправленном поиске того, что ожидается на изображении.
Адаптивность. Способность системы к самообучению, т.е. сначала система «Fine Reader» выдвигает гипотезу об объекте распознавания (символе, части символа или нескольким склеенным символам), а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы в нужных отношениях. В качестве структурных используются элементы, значимые для восприятия объекта с точки зрения человека, – отрезки, дуги, кольца и точки.
Следуя принципу адаптивности, программа самостоятельно «настраивается» на новый шрифт (или на новый почерк), используя положительный опыт, полученный на первых уверенно распознанных символах.
Целенаправленный поиск и учет контекста позволяют распознавать разорванные и искаженные изображения, делая систему устойчивой к дефектам печати.
Эти принципы используются как при распознавании отдельных символов, так и при анализе раскладки страницы (выделении участков текста, картинок, таблиц). Благодаря использованию IPA-технологии «Fine Reader» демонстрирует высокое качество распознавания при малой чувствительности к дефектам печати, а безупречный анализ раскладки страницы отмечен в большинстве сравнительных тестов.
Система FineReader имеет следующие входные форматы файлов: BMP: чернобелые, серые, цветные; PCX, DCX: черно-белые, серые, цветные; JPEG: серые, цветные;
PNG: черно-белые, серые, цветные; TIFF: черно-белые, серые, цветные, многостраничные.
Система «Fine Reader» сохраняет результат распознавания в следующих форматах:
Microsoft Word 95, Microsoft Excel 95, Microsoft Word 97, Microsoft Excel 97, Microsoft Word 2000, Microsoft Excel 2000, Text, Rich Text Format, Unicode Text, DBF, HTML, Unicode HTML, PDF.
Требования к системе: операционная система Microsoft Windows 2000, Windows NT Workstation 4.0 или Windows 95 / 98.
Система поддерживает работу 19 типов сканеров, включая Acer, Samsung, Mitsubishi, Scanpaq, Canon, Syscan, E-Lux, Nikon, Silitek, Epson, Storm, Fujitsu, Packard Bell, HP, IBM, Xerox, Kodak и др. и более 100 моделей 100% TWAIN-совместимых сканеров других фирм.
ПРОЕКТИРОВАНИЕ СИСТЕМ ВВОДА ПОТОКОВ ВХОДЯЩИХ ДОКУМЕНТОВ
Контрольные вопросы итоговой проверки знаний:1. Каково назначение системы массового ввода бумажных документов?
2. Каков состав этапов и операций технологии массового ввода документов?
3. Назначение операции предварительной подготовки документов?
4. Какие методы составления моделей документов?
5. Какие методы ввода документов в электронный архив?
6. Какие методы составления индексов документов Вы знаете?
7. Что такое сканирование и какие требования предъявляются к сканерам?
8. Что такое распознавание образов и какие методы распознавания Вы знаете?
9. Что такое «интеллектуальный контроль» правильности распознавания документов?
10. Какие требования предъявляются к программному обеспечению СМВ?
11. Какие классы СМВ Вы знаете и дайте их характеристику.
ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
ТЕМА 6. ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
6.1. Понятие информационно-поисковой системы (ИПС).В работе современных предприятий важную роль играют его информационные ресурсы, под которыми можно понимать проектную документацию, переписку с партнерами, внутренние приказы и распоряжения, финансовые данные и другие документы, которые служат основой для принятия новых решений и используются в процессах управления предприятием. И если для хранения структурированных данных можно применять специализированные информационные системы (типа бухгалтерской или торговой системы или системы планового отдела), основанные, на использовании СУБД, то для неструктурированных данных нужны системы общего назначения – электронные архивы, работающие на принципах информационно-поисковой системы.
Информационно-поисковая система (ИПС) – это система, предназначенная для хранения и поиска документов с текстовой, графической, табличной информацией по атрибутам, ключевым словам документа и содержанию в какой-либо предметной области.
Выделяют ИПС двух типов: фактографические и документографические системы.
ИПС фактографического типа предназначены для хранения и поиска фактов, показателей, характеристик каких-либо объектов или процессов (например, сведения о работниках, о предприятиях, акционерах и т.д.).
Документографические ИПС отличаются тем, что объектом хранения и поиска в этих системах служат документы, отчеты, рефераты, обзоры, журналы, книги и т.д. Сценарий поиска документа при помощи ИПС обычно сводится к вводу запроса на поиск, состоящего из одного или нескольких слов, после чего предъявляется список имен найденных документов.
Пользователь может открыть любой из найденных документов и если поисковая система позволяет, вхождения искомых слов в документе выделяются – «подсвечиваются».
Можно выделить следующие особенности организации и функционирования документографической ИПС, отличающие ее от систем управления базами структурированных данных:
• Документы могут храниться на бумаге, микрографических носителях или существовать в электронных форматах. Микрографические форматы включают микрофильмы, микрофиши, слайды и другие микроформы, производимые разнообразными документными камерами. Электронные форматы еще многочисленнее, они включают документы, подготовленные в текстовых процессорах, системах электронной почты и других компьютерных программах, оцифрованные изображения прошедших сканирование документов и проч. При этом предполагается обязательное хранение как электронных копий документов, так • Если документы занимают большой объем и полные электронные копии выдавать на просмотр или хранить не возможно, то для таких документов создают и хранят электронные адреса их хранения.
• Поиск осуществляется нахождением документа по двум принципам: по атрибутам документа – дате создания, размеру, автору и пр. и по его содержанию (тексту). Обычно поиск по содержанию документа выполняется двумя способами: по ключевым словам и по всему тексту, который называют полнотекстовым, подчеркивая тем самым, что для поиска используется весь текст документа, а не только его реквизиты.
ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
• Для поиска документов создают и хранят их поисковые образы. Поисковый образ документа (ПОД) – совокупность кодов ведущих ключевых слов (дескрипторов), которые описывают смысл, содержание документа.• Ключевые слова и их коды хранятся в специальном словаре – тезаурусе.
• Для того, чтобы осуществлять поиск документов, нужно создать информационно-поисковый язык (ИПЯ), в состав которого входит тезаурус и грамматика языка, т.е. совокупность правил задания множества высказываний на множестве ключевых слов.
• Чтобы отыскать документ, нужно создать с помощью ИПЯ поисковый образ запроса (ПОЗ), который представляет собой совокупность закодированных ключевых слов, описывающие те документы, которые нужно найти.
Схема взаимодействия компонент ИПС представлена на рис. 6.1.
Документ БДА Рис 6.1. Схема взаимодействия компонент ИПС ИПС состоит из следующих обеспечивающих подсистем:
• лингвистическое обеспечение, включающее в свой состав информационнопоисковый язык;
• техническое обеспечение системы, включающее ЭВМ и устройства создания, хранения, чтения и размножения копий на бумажных носителях, в микроформатах и в электронной форме;
• информационное обеспечение, состоящее из БД документов (БД Док.), адресов (БД Адр.) и БД поисковых образов документов (БД ПОД) и списков дескрипторов и их кодов – тезауруса;
• программное обеспечение.
ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
Программное обеспечение ИПС предназначено для автоматизации следующих основных функций, которые должна выполнять эта система:• составления, кодирования и загрузки базы данных ПОД;
• загрузки БД документов и их адресов хранения;
• составления, кодирования ПОЗ;
• выполнение операции поиска и выдачи ответа на запрос в виде документа или адресов хранения документов на экран ЭВМ, на бумагу, в файл;
• актуализация баз данных ПОД, документов и адресов;
• актуализация тезауруса;
Рассмотрим основные понятия, употребляемые в сфере поиска документов.
Релевантность – степень соответствия найденного документа запросу. Найденный по запросу документ может иметь отношение к запросу, т.е. содержать нужную (искомую) информацию, а может и не иметь никакого отношения. В первом случае документ называется релевантным (по-английски relevant – «относящийся к делу»), во втором – нерелевантным, или шумовым.
Как правило, в любой поисковой системе по запросу выдается несколько (чаще много) найденных документов. Многие из них могут повествовать не о том. И наоборот, некоторые важные, релевантные, документы могут быть пропущены при поиске. Ясно, что количество тех и других определяет качество поиска, которое можно определить достаточно точно. Основными понятиями в мире поисковых средств являются идеи точности и полноты поиска.
Точность поиска (Т) определяется тем, какая часть информации, выданная в ответ на запрос, является релевантной, т.е. относящейся к этому запросу и является параметром, показывающим, какова доля релевантных документов в общем числе найденных. Этот показатель рассчитывается по формуле:
Т = ------------ * 100%, где Vнрел – количество найденных документов, релевантных запросу;
Vноб – общее количество найденных докумнетов.
Если, например, все выданные по запросу документы относятся к делу, то точность равна 100%; если, напротив, все документы шумовые, то точность поиска равна нулю.
Полнота поиска (П) – дополнительный параметр, показывающий, какова доля (или процент) найденных релевантных документов в общем количестве релевантных документов, т.е. характеризуется соотношением между всей релевантной информацией, имеющейся в базе, и той ее частью, которая включена в ответ и рассчитывается по формуле:
П = --------------- * 100, где Vнрел – количество найденных документов, релевантных запросу;
Vобрел – общее количество документов, релевантных запросу, хранящихся в системе.
Если в области поиска на самом деле имеется 100 документов, содержащих нужную информацию, а по запросу найдено из них всего 30, то полнота поиска равна 30%.
ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
Кроме этого при оценке поисковых систем учитывается, с какими типами данных может работать та или иная система, в какой форме представляются результаты поиска и какой уровень подготовки пользователей необходим для работы в этой системе.Следует отметить, что точность поиска и его полнота зависят не только от свойств поисковой системы, но и от правильности построения конкретного запроса, а также от субъективного представления пользователя о том, какая нужна ему информация. Если стоит проблема оценки нескольких систем и выбора наиболее эффективной, можно вычислить средние значения полноты и точности рассматриваемых конкретных систем, протестировав их на эталонной базе документов.
Индексация документов (т.е. составление ПОД), которая означает предварительную подготовку текстов для поиска и применяется главным образом для ускорения поиска; как правило, текстовые базы данных, предназначенные для многократного поиска, обрабатывают заранее, составляя так называемый индекс (ПОД). При индексации поисковая система составляет списки слов, встречающихся в тексте, и приписывает каждому слову его код – координаты в тексте (чаще всего номер документа и номер слова в документе). При поиске слово ищется в индексе, и по найденным координатам выдаются нужные документы. Если слов в запросе несколько, над их координатами производится операция пересечения. В том случае, если множество документов пополняется, приходится пополнять и индекс.
Единица поиска – это квант текста, в пределах которого в данной поисковой системе осуществляется поиск, от величины которого зависит показатель точности поиска, величина шума и время ответа на запрос. Единицей поиска может быть документ, предложение или абзац.
В технологии использования ИПС можно выделить три группы операций:
• операции, связанные с получением поисковых образов документов (ПОД), описывающих содержание документов и загрузкой их в базу данных (БД ПОД), а также загрузкой самих документов или их адресов хранения в БДДок и БДАдр.;
• операции составления поисковых образов запроса (ПОЗ) с использованием тезауруса, поиска и выдачи результатов на просмотр и отбор или файл или на печать найденных документов или списка адресов;
• операции ведения информационно-поисковой системы, включающие актуализацию БД ПОД, БДДок., БДАдр. и тезауруса вследствие возникновения и необходимости пополнения памяти системы новыми документами или ключевыми В состав операций ведения ИПС входит также процедура выдачи справок о работе системы, о ее структуре, методах поиска и классах и видах хранимых документах.
6.2. Понятие системы управления электронными документами (СУД).
На большинстве современных предприятий, где ведется активная работа с различными документами, рано или поздно встает проблема ввода, систематизации, обработки и безопасного хранения значительных объемов информации. Договора, приказы, деловая переписка, финансовая, проектная и другие виды документации беспорядочно накапливаются на рабочих столах сотрудников или в файловых системах их компьютеров, затрудняя поиск информации, коллективную работу над документами, их согласование и соблюдение конфиденциальности. Поэтому, требуется некое средство автоматизации, которое могло бы организовать не только хранение и поиск документов, но обеспечить высокую эффективность работы с документами в масштабах всей организации.
ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
Для решения этой задачи используется специальное программное обеспечение, работающее на принципах ИПС – системы управления электронными документами (СУД). В ряде изданий для их обозначения употребляются термины DMS (Document Management Systems).Система управления документами должна автоматизировать работу с документами практически на всех этапах, начиная от разработки и кончая удалением из архива, а также иметь возможность настройки на различные специфические участки работы, в том числе и технологические (например, разработка проектно-конструкторской документации).
Основными задачами, для решения которых предназначается СУД в дополнении к тем, которые реализуются средствами ИПС, являются следующие:
• создание и ведение единого электронного архива, способного аккумулировать данные любых типов, которые систематизируются с помощью гибко настраиваемых классификаторов документов и тематических иерархий проектов или папок;
• обеспечение быстрого и удобного поиска информации с возможностью немедленного вызова документа на редактирование в привычной для пользователя • ограничение возможности каждого конкретного пользователя по просмотру и модификации документов, обеспечивая необходимый уровень безопасности;
• обеспечение работы с несколькими версиями одного и того же документа, выписки документа для обработки вне системы и возврат его в библиотеку, а также экспорт и импорт документов;
• повышение надежности (целостности) хранения данных;
• обеспечение быстрого времени отклика электронной архивной системы вне зависимости от объемов хранящихся в ней данных и прозрачного доступа к информации, расположенной в различных территориально-разнесенных подразделениях предприятия;
• обеспечение коллективной обработки документов и их согласования.
С точки зрения пользователя, СУД предназначена для выполнения следующих функций:
• объединение разрозненных приложений, используемых в организации для обработки данных, в единую информационную систему, что дает унифицированный и простой, а потому эффективный способ манипулирования документами;
• индексация документов;
• хранение и поиск документов;
• автоматическое реферирование документов;
• осуществление нумерации версий документов;
• обеспечение многоуровневой системы защиты информации;
• администрирование учета и архивирования;
• работа с разнообразными формами документов;
• поддержка произвольных взаимосвязей между документами;
• автоматический перевод поискового запроса на другой язык;
• выдача и возврат документов библиотечного типа.
Организация СУД на предприятии связана с необходимостью решения ряда проблем, основными из которых являются следующие:
• выбор архитектуры системы (локальная организация или сетевая);
• выбор типа носителей для организации физического хранения документов;
ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
• обеспечение надежности хранения;• выбор системы методов поиска хранимой в СУД информации.
Выше были отмечены недостатки организации хранения больших объемов информации с использованием архитектуры «файл-сервер», поэтому для решения поставленных задач и проблем наиболее перспективным является выбор варианта архитектуры интегрированных систем управления документами – «клиент-сервер», который существенно увеличивают эффективность работы пользователей, поскольку системы данного класса обеспечивают не только быстрый поиск необходимых пользователям документов, но и помогают им организовывать и совместно использовать информацию. И, что особенно важно, СУД создают удобную для пользователя структуру представления всей информации, хранящейся в сети. Создатель документа будет избавлен от необходимости каждый раз придумывать, где его хранить, как защищать и какие права на него предоставлять коллегам.
Системы управления документами должны решать проблему с управлением большими объемами документов на следующих принципах:
1. Управление должно осуществляться над электронными документами, созданными в разных прикладных программах для персональных компьютеров, таких как: текстовые процессоры, электронные таблицы, электронная почта.
2. Замена концепции имен документов их регистрационными карточками, содержащими расширенную информацию (поисковый образ документа), используемую для их поиска и управления. СУД автоматически заполняет часть полей карточки, остальную информацию пользователь может быстро ввести самостоятельно. Карточки имеют настраиваемую форму.
3. Обеспечение пользователей мощными функциями поиска по информации карточек.
Они хранятся в SQL-базах данных, поэтому CУД может поддерживать работу с очень большим количеством карточек и использоваться как в небольших рабочих группах, так и крупных организациях.
4. Снабжение документов текстовым индексом, который позволяет искать их по контексту. Индекс обновляется после внесения в документ изменений.
5. Гарантирование тесной интеграции с основными приложениями. Команды File New, File Open, File Save, File Save As и File Close в этих системах используются для того, чтобы сделать для пользователя эту интеграцию максимально простой (например, новая карточка генерируется при выполнении команды File New; окно File Open заменяется специальным экраном поиска; при выполнении команды File Save документ автоматически пополняет СУД; File Save As позволяет создать новую карточку или новую версию старой карточки документа; File Close сохраняет карточку, так что теперь пользователи СУД могут получать к нему доступ).
6. Защита документов обеспечивается соответствующими расширенными функциями проверки пароля, прав доступа к документу, полю или операций над полем.
7. Контроль версий и ведение истории работы с документами.
8. Поддержка мобильных пользователей, предоставляя им возможности выписки и возврата документов.
9. Интегрированные СУД связывают карточки документов с их физическими файлами на сетевом сервере – пользователи имеют дело уже с ними, а не с именами файлов и сложными путями к директориям. Основные преимущества интегрированных СУД состоят в том, что сохраняются приложения, установленные в компаниях, они берут на себя определенные функции прикладных программ и просты в применении.
10. Создание систем управления документами в сетевой среде, что обусловлено следующими тенденциями:
ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
• С помощью приложений для персональных компьютеров производится большое количество документов, в связи с чем концепция «безбумажной технологии управления» становится актуальной.• Сетевые СУД – системы масштабируемые. Благодаря тому, что карточки документов хранятся в SQL-базах данных, СУД пригодны как для единиц, так и для десятков и даже десятков сотен пользователей. Большинство СУД поддерживают различные серверы баз данных (стандарт ODBC позволяет использовать SQL-базы данных различных производителей), поэтому выбрать наиболее оптимальную по функциональным возможностям и цене систему несложно.
• Производители приложений обеспечивают интеграцию своих продуктов с СУД, используя стандарт Open Document Management API (ODMA), что предоставляет производителям СУД возможность легко использовать новые прикладные программы.
• Продолжают совершенствоваться характеристики сетевых серверов и клиентских компьютеров, а цены, в свою очередь, по мере появления все более мощных компьютеров снижаются.
После того как определены задачи и архитектура СУД и известно, какого рода данные придется хранить и искать, должна решаться проблема выбора носителей информации.
Системы автоматизации делопроизводства, особенно если в них реализован комплекс обработки образов документов, характеризуются большим объемом хранимой информации (создаются архивы на сотни мегабайт и даже терабайт). Кроме того, к архиву должен быть обеспечен одновременный доступ значительного количества пользователей, причем достаточно быстрый. Именно эти требования, наряду со стоимостью, являются основными при выборе носителей и устройств хранения данных, функционирующих в составе систем документооборота.
Рассмотрение и выбор носителей необходимо производить с точки зрения жизненного цикла документа, который подразумевает период от создания или поступления документа на предприятие до его уничтожения или передачи на хранение. В течение этого времени к документу следует обеспечить своевременный доступ, удобное распространение, надежное хранение и оптимальный уровень затрат в стоимостном отношении. Жизненный цикл принято, в зависимости от частоты обращения к документу, подразделять на активную и неактивную стадии:
• на первой стадии документ используется в деловых процессах организации, поэтому здесь наиболее важный аспектом является быстрый и простой доступ к информации и носитель должен обеспечивать удобное предоставление документа пользователю для чтения, редактирования или маршрутизации другим • на второй стадии основным является хранение данных, следовательно, первоочередные предъявляемые к носителям требования – это надежное и выгодное в ценовом отношении обеспечение этого длительного процесса.