Macron Software » O firmě » Reference » Případové studie » MPO

Internetová prezentace Ministerstva průmyslu a obchodu

Charakteristika projektu

Výchozí stav

MPO ČR využívá pro interní správu dokumentů vytvářených v organizaci řešení firmy Corpus Solutions. Toto centrální datové úložiště (dále CDÚ) slouží k ukládání dokumentů, správě verzí jednotlivých dokumentů, přístupových práv k těmto dokumentům apod.

Na CDÚ bylo navázáno řešení publikace dokumentů jak na veřejně přístupné www prezentaci tak na intranetu. Pro toto řešení byl použit systém WebToDate, který sloužil jako nástroj pro správu prezentační vrstvy. Všechny procesy publikace byly řešeny automatizovanými procesy soustředěnými do integračního modulu propojujícího CDÚ a instalaci WebToDate.

Výsledná www prezentace úřadu pak byla v podstatě automaticky generovaným rozcestníkem pro dokumenty, kde tyto dokumenty bylo možné pouze stáhnout v původních formátech vložených do CDÚ (zpravidla MS Word, PDF, MS Excel apod.).

Požadavky na řešení

Základní požadavky na řešení lze shrnout následovně:

  • Autoři dokumentů musí pracovat v jim známém prostředí, konkrétně v aplikaci MS Word. Přímá práce s CDÚ (přes vlastní www rozhraní systému) je pro autory možná jen ve výjimečných případech, přímá práce s publikačním systémem spravujícím přímo www prezentaci není pro tyto uživatele vůbec žádoucí.
  • Při ukládání dokumentů do CDÚ musí automaticky vzniknout XML podoba dokumentu umožňující další strojové zpracování, tato XML podoba je základem pro vlastní prezentaci HTML stránek s dokumenty.
  • Struktura www prezentace je rozdělena na určité části, kde každá část je spravována co se týče obsahu jinou skupinou vybraných uživatelů. Tito uživatelé musí dostat automaticky jednotlivé dokumenty vytvořené autory již v publikačním systému v podobě připravené k publikaci, a to v HTML formátu.
  • Každý publikovaný dokument podléhá schválení na úrovni publikačního systému, kde pověřený uživatel rozhodne o konkrétní sekci, do které bude umístěn, může provést potřebné úpravy spočívající zejména ve úpravách formátování a struktury dokumentu (např. rozdělení na více kapitol zobrazovaných na samostatných stránkách) a pak dokument publikuje.
  • Je vyžadována podpora zpracování různých verzí stejného dokumentu a podpora časové platnosti - předchozí verze může být automaticky ve stanovený čas nahrazena novou schválenou verzí apod.
  • Možnost stažení dokumentu ve formě souboru v původním formátu zůstává zachována, primárně jsou ale dokumenty poskytovány ve formě HTML stránek.
  • HTML podoba prezentace musí splňovat technologické požadavky (XHTML, formátování pomocí CSS apod.), požadavky na logické členění struktury s možností jednoduše tuto strukturu měnit a snadnou orientaci návštěvníka na stránkách a dodržení pravidel přístupnosti.

Architektura řešení

Z pohledu workflow autoři dokumentů ukládají (přímo z prostředí MS Word) dokumenty do CDÚ, odkud jsou automaticky přenášeny do redakčního systému. Zde jsou tyto dokumenty schvalovány a publikovány do příslušné sekce webové prezentace.

Z pohledu výměny dat mezi aplikacemi se jedná o následující schéma:

  • Autorská aplikace v prostředí MS Word zajišťuje především ukládání dokumentů do CDÚ, zpětné načítání těchto dokumentů z CDÚ a vytváření nových verzí dokumentů. V průběhu ukládání dokumentu do CDÚ se kromě původního MS Word formátu vytváří i XML varianta dokumentu, která pak slouží jako základ pro výslednou HTML podobu.
  • CDÚ zasílá nové a změněné dokumenty do WebToDate. Předává se XML varianta včetně např. obrázků apod.
  • Ve WebToDate probíhá finální zpracování dokumentů a jejich publikace. Podporována je zde i příprava nových verzí - původní verze zůstává publikována, ale z CDÚ je již načtena nová verze, které se připravuje k publikaci.
  • Všechny zmíněné aplikace spolu komunikují přes protokol http nebo https a data si vyměňují v XML formátu.

Autorský nástroj

Autorský nástroj je v aplikace v prostředí Microsoft Word. Uživatelé mají připravenou šablonu, která definuje základní možnosti funkcí a formátování. Dokumenty vytvořené touto šablonou mohou obsahovat pouze definovaný výčet vložených objektů a formátování (odstavce, nadpisy, odrážky, tabulky, obrázky apod.), tento výčet se v zásadě shoduje s prvky podporovanými v XHTML.

Do dokumentu lze vkládat i obrázky a je podporováno i vkládání příloh - např. dalších souborů ve formátu XLS, DOC, PDF apod., které patří k danému dokumentu a mají být k dispozici ke stažení.

Jakmile je dokument vytvořen, spustí se průvodce uložením do CDÚ. Zde se specifikují vybraná metadata jako časová platnost, klíčová slova, anotace apod.

Před vlastním uložením do CDÚ je vytvořena XML podoba obsahu dokumentu. Pro popis obsahu se používá podmnožina XHTML elementů, takto konvertovaný obsah se spojí s dalšími informacemi jako jsou metadata, obrázky apod., vzniká XML dávka, která se pak odesílá do CDÚ.



Tato aplikace dále podporuje zejména:

  • Stažení dokumentu z CDÚ (opět včetně možných příloh apod.)
  • Vytvoření nové verze
  • Procházení složek CDÚ a vytváření nových složek

Správa dokumentů

CDÚ v tomto řešení figuruje jako dokumentové úložiště. Dokumenty se ukládají do hierarchie složek, jsou opatřeny metadaty a podporují různé varianty, tj. verze v čase a jazykové verze. Každý dokument může obsahovat více souborů, jeden se považuje za primární (v tomto řešení v podstatě původní soubor upravovaný v aplikaci MS Word), další pak za přílohy k dokumentu.

Systém samozřejmě spravuje přístupová práva, umožňuje prohledávání dokumentů apod. Do systému mohou být ukládány libovolné dokumenty, ty, které jsou speciálně označeny k publikaci na internet systém řadí do fronty a odesílá v XML formátu do WebToDate. Univerzální rozhraní umožňuje zaregistrovat k odběru těchto dat i další systémy, nemusí se nutně jednat jen o výstup na veřejnou webovou prezentaci.

CDÚ má i vlastní www rozhraní pro práci s obsahem úložiště, preferovanou metodou pro autory je ale v tomto řešení přímé připojení s autorské aplikace v prostředí MS Word a www rozhraní slouží pouze pro pokročilejší operace typu přesun složek apod.

Správa internetové prezentace

Prvotní zpracování dokumentů z CDÚ má na starosti integrační modul běžící na pozadí. Tento modul provádí zejména následující:

  • Pro každý dokument založí novou zprávu WebToDate, kterou zařadí na vhodné místo do hierarchie stromu kategorií. Pro zprávu se přebírá značná část metadat dokumentu (anotace, klíčová slova, časová platnost apod.).
  • Všechny "externí" entity patřící k dokumentu (obrázky, odkazy na přílohy apod.) jsou zařazeny do databáze zdrojů WebToDate, kde např. k obrázkům ihned vznikají náhledy apod.
  • Zdroje jsou odpovídajícím způsobem připojeny ke zprávě, tak aby automaticky v prezentační vrstvě vznikly objekty typu seznam souborů ke stažení či seznam používaných obrázků.
  • HTML tělo zprávy je vytvořeno na základě XML varianty souboru pomocí připravené XSLT transformace.
  • Uživatelé spravující danou část webové prezentace jsou informování e-mailem o novém dokumentu či nové verzi.

Odpovědní uživatelé pak dokument zkontrolují, případně upraví formátování nebo rozdělí dokument na více samostatných stránek (kapitol) a dokument publikují ve vybrané sekci.

Aplikace WebToDate byla v rámci tohoto rozšíření obohacena o některé nové funkce - jedná se zejména o systém správy verzí zpráv a jejich časové platnosti, o možnost flexibilní definici struktury zpráv (slouží např. pro více anotací používaných v různém kontextu) a o řadu vizuálních nástrojů zjednodušujících správu obsahu. Vizuální režim správy obsahu stránky je na následujícím otisku obrazovky, z dalších změn se jedná např. o nový XHTML kompatibilní WYSIWYG editor obsahu zpráv.

Správa intranetové prezentace

Intranetová prezentace je naopak co se týče zpracování obsahu zcela automatická. WebToDate zde slouží pouze jako nástroj pro správu prezentační vrstvy (šablon, formátovacích stylů apod.). Pomocí funkcí integračního modulu se na intranetu prezentuje hierarchie složek CDÚ a jejich obsah, tj. seznamy dokumentů a jejich metadat), intranetová prezentace automaticky kopíruje strukturu i obsah složek dokumentového úložiště.

Zásahy obsluhy na straně WebToDate jsou zde minimální a spočívají v podstatě v případných změnách grafiky či definice náplní některých stránek typu obsah jaké složky se na stránce prezentuje v pravém sloupci apod.

Ostatní

Součástí řešení bylo též zprovoznění RSS (Really Simple Syndication - technologie umožňující stahování informací o změnách na WWW stránkách ve strojově zpracovatelné podobě) kanálů, které bylo realizováno pomocí standardního modulu XML export/import a automaticky spouštěné plánované úlohy.

Celé řešení bylo, před spuštěním pro veřejné použití stránek, podrobeno penetračním testům ověřujícím zabezpečení proti útokům zvenčí.

Samozřejmě byl proveden i audit na přístupnost a validace stránek vůči normě XHTML 1.0 Strict.

Přínos

Výsledkem celého řešení je moderní a kvalitní www prezentace s přehlednou strukturou a grafikou. Dokumenty ke stažení jsou zde jen jako doplňková služba, primárně jsou informace poskytovány ve formě přehledných a přístupných HTML stránek.

Změny celé struktury prezentace, struktury jednotlivých stránek či grafiky prezentace jsou snadno realizovatelné, práce uživatelů spravujících vlastní obsah je redukována na minimum, přičemž je zde zachována plná kontrola nad publikovaným obsahem.

Řešení přitom zachovalo centrální dokumentové úložiště jako platformu pro správu a archivaci dokumentů instituce. Propojení použitých aplikací je volné, což znamená, že momentální selhání jednoho systému nijak zásadně neovlivňuje chod druhého systému.