Jak vyřešit neviditelný problém
Home ― Proč K-net ― Pro vás ― Časopis Login ― Články Loginu ― Jak vyřešit neviditelný problém
Práce IT techniků v jakékoliv firmě někdy může zavánět rutinou. Vyřizují stále stejné a opakující se požadavky svých zákazníků. Navýšení velikosti disku, restart zařízení, přidání či odebrání přístupů, instalace programu, aktualizace … a stále dokola. Čas od času naruší technikům jejich rutinu neobvyklý problém. Ne, že by nás v K-netu těšilo, když se u zákazníka něco porouchá. Máme rádi, když vše šlape jako hodinky. Ale jak je obecně známo – když se něco může pokazit, tak se to pokazí. Někdy je hledání příčiny skoro detektivka.
Začalo to nenápadně
Jak to většinou bývá, začátek byl rutinní. Obyčejný problém u zákazníka s nenadálým nedostatkem operační paměti ve virtuálním prostředí, jaký je technik běžně schopen opravit za 8 minut. Při velkém počtu úkolů, které technici každodenně řeší, se takový problém prostě jen přiřadí mezi ty ostatní.
Díky tomu, že v K-netu provádíme měsíční analýzy řešených úkolů, dokázali jsme hned zpočátku odhalit četnost nahodilého chování, kdy docházelo k vyčerpání paměti u pár uživatelů našeho zákazníka. Tedy ještě před tím, než to zpozoroval sám zákazník. Následná základní analýza systémového prostředí ale neobjevila žádnou anomálii nebo konfigurační vadu nějakého zařízení. Na to měl také vliv typ virtuálního prostředí zákazníka, kdy po odhlášení od virtuálního desktopuje software umožňující koncovému uživateli pracovat v operačním systému a se softwary, které nejsou součástí jeho fyzického počítače a které mohou výkonem překonat kvalitu tohoto fyzického… docházelo ke smazání všech nových údajů uživatele a desktop se vracel do původního systémového nastavení. Takže veškeré stopy byly odstraněny a my byli v tomto ohledu zpětně slepí.
Pak se to ale rozjelo
Protože nedocházelo k omezení činnosti zákazníka, řešili jsme operativně jen důsledek, nikoliv příčinu. Jenže v průběhu dalších 2–3 měsíců začal problém postupně eskalovat. Objevoval se u více uživatelů a u některých nakonec opakovaně skoro každé ráno. Toto již bylo samozřejmě pro zákazníka nepřijatelné. Sestavili jsme proto řešitelský tým, který vytvořil laboratorní prostředí s nasimulovanou situací a testoval různé cesty řešení. Možná paradoxně byla ku prospěchu vyšší četnost problému. Uživatel ihned nahlásil problém na helpdesk K-netu. Díky tomu jsme dostali možnost okamžité kontroly a analýzy virtuálního desktopuje software umožňující koncovému uživateli pracovat v operačním systému a se softwary, které nejsou součástí jeho fyzického počítače a které mohou výkonem překonat kvalitu tohoto fyzického….
Pomocníci v řešení
Základním prvkem při hledání příčiny problému byl náš dohledový systém netGuard – služba K-net, kterou náš zákazník již léta využívá. Nemuseli jsme tedy dohledové zařízení nasazovat až v čase po objevení problému, ale měli jsme již k dispozici analytická data z archivu. Tím se práce techniků na analýze zrychlila. A nejen to. Díky tomu byli technici schopni i zpětně zjistit některá typická chování. To vše následně spojili s prací v analytických programech (v tomto případě technici použili nástroje Microsoftu Proces Monitor a Proces Explorer). Pomocí všech těchto spojených dat technici rozklíčovali chování a dohledali příčinu. Pak už samotná oprava trvala ani ne hodinu a problém u všech uživatelů odezněl.
Nenápadný původce problému
Zjistili jsme, že velký problém může způsobit i taková banální věc, jako je změna internetového prohlížeče. A to paradoxně ne pro jeho neaktuálnost, ale právě naopak. Chtěl být „aktuální až moc“. Jednalo se o prohlížeč Google Chrome a jeho vlastnost, která vynucuje stahování svých aktualizací, i když byly našimi techniky běžnými postupy zakázány. Nicméně Chrome se i přes restrikci nevzdal a prováděl další pokusy a s novými a novými verzemi stahoval víc a víc dat z dalších častých záplat a následně se pokoušel o jejich skrytou instalaci. Když se toto Chrome nedařilo, operační systém Microsoftu zjistil, že něco není v pořádku a ten se pro změnu na pozadí pokoušel reportovat výsledky této nepovedené akce. Po tomto odhalení stačilo jen najít správné řešení, úplně zakázat jak aktualizace Chrome, tak i odesílání reportů operačního systému. Problémy ustaly.
Aktualizovat? Ano, ale…
V současnosti jsme ze všech stran bombardováni informacemi, že časté aktualizace a záplaty aplikací a systémů jsou nutné pro bezpečnost našich dat. To je jistě pravda.
Na obtíž mohou být aktualizace tehdy, když nejsou dobře vyrobeny nebo nedostatečně otestovány. Nevhodné mohou být také tehdy, když jsou firmami používány aplikace, které jsou v dnešním rychlém světě již zastaralé a jejich bezproblémový chod mohou právě aktualizace ohrozit, zamotat. A to byl právě tento případ. Existuje mnoho společností, které nechtějí, anebo z ekonomických důvodů nemohou používat nejnovější verzi aplikace, kterou potřebují k provozu. Pak jim ale právě tyto aktualizace mohou způsobit dost problémů.
Každý problém se dá vyřešit
Výše uvedené objevení problému a jeho následné vyřešení ukazuje, že provoz zastaralých aplikací je každodenní realitou a že jedna malá aktualizace nepříliš strategické části systému, jako je internetový prohlížeč, může způsobit velké potíže. Pro mnoho firem každodenní, ale vlastně neviditelný problém. Vše se naštěstí dá vyřešit. Chce to ale zkušenost, odbornost, chuť se s problémem poprat. A pak také trpělivost, kdy je problém prostě nutné „vysedět“.
Problémy podobného typu s neaktuálností systémů řešíme v K-net tak jednou do měsíce, je to náš denní chleba. Máme zkušenosti z prostředí, které dnes už není dodavateli technologií podporováno. Pomáháme našim zákazníkům provozovat a udržovat jejich IT prostředí v provozuschopném stavu do té doby, než jim jejich ekonomická situace dovolí systémy modernizovat.
Jaroslav Prokop
vedoucí oddělení IT techniků