11 TEMA

 

 

 

Duomenų sauga

 

          Išorinėje kompiuterio atmintyje saugomi duomenys gali būti sugadinti ar prarasti. Tai gali įvykti dėl įvairių priežasčių:

ü             fiziškai sugadinus diską ,

ü             neteisingai modifikavus ar atsitiktinai panaikinus saugomus duomenis,

ü             dėl įsiskverbusių į kompiuterį kenkė jų (programų (virusų) ar asmenų) piktavališkų veiksmų ir pan.

          Kaip išvengti informacijos praradimo nuostolių ar juos sumažinti? Atsakymas vienas: - reikia turėti naudojamų duomenų archyvines kopijas ir reguliariai atnaujinti besikeičiančių duomenų kopijas. Nors pastaruoju metu gerokai padidėjo kompiuterinių duomenų kaupiklių talpa ir duomenų perdavimo sparta, tačiau naudojamų duomenų apimtys padidėjo dar ženkliau. Todėl tiesiogiai saugoti, atnaujinti ir perduoti visus jų kopijas dažnai gali būti sunku, tai gali ir brangiai kainuoti. Duomenų apimtis sumažinama įvairiais suspaudimo (suglaudinimo) metodais ir juos realizuojančiomis programomis.

 

Duomenų suspaudimo prielaidos

 

          Suglaudinimas galimas dėl to, kad duomenų apimtis dažnai yra didesnė nei jų teikiama informacija. Pavyzdžiui, “1998 m.” ir “tūkstantis devyni šimtai devyniasdešimt aštuntieji metai” teikia tiek pat informacijos, tačiau pirmasis užrašas žymiai trumpesnis. Sukurta daug įvairių suglaudinimo metodų, kurie padeda surasti “perteklinius duomenis” ir pakeisti juos lakoniškesniais. Vienoje suglaudinimo programoje gali būti realizuotas ir vienas, ir keli metodai. Suglaudinimo metodai parenkami atsižvelgiant į duomenų pobūdį. Be to, ypač efektyvūs metodai, t.y. padedantys pasiekti didelį suglaudinimo laipsnį, gali būti pernelyg “lėti”, todėl jie netinkami praktikoje. Parenkant metodus ir juos realizuojančias programas, reikia rasti optimalų laiko ir sutaupytos atminties santykį.

          Duomenų suglaudinimo metodai. Nepriklausomai nuo didelio duomenų sutankinimo algoritmų skaičiaus, teoriškai galimi tik trys duomenų pertekliškumo sumažinimo būdai:

ü             Duomenų turinio pakeitimas;

ü             Duomenų struktūros pakeitimas;

ü             Viena ir kita kartu.

          Jei suglaudinant duomenis vyksta jų turinio pakeitimas, suglaudinimo metodas yra negrįžtamas ir juos atstatant iš suspausto failo visiškai pilnai jų sekos neatstatomos. Tokius metodus dar vadina suglaudinimo metodais su reguliuojamu duomenų praradimu. Jie naudojami ten, kur dalinis duomenų praradimas nepakenkia jų tolimesniam panaudojimui. Tai, visų pirma, multimedijos duomenys: videoeilutės, muzikiniai ir garso įrašai, paveikslai.

          Suglaudinimo metodai su reguliuojamu duomenų praradimu. Šie metodai pasiekia aukštesnį suglaudinimo laipsnį, nei grįžtamieji metodai be duomenų praradimo, bet jų negalima naudoti tekstų, duomenų bazių, o tuo labiau programinių modulių suglaudinimui. Tipiniai suglaudinimo su duomenų praradimu formatai yra:

ü             JPG – grafiniams duomenims;

ü             MPG, MPEG – videoduomenims;

ü             MP3 – muzikiniams (garso) duomenims.

 

 

          Grįžtamieji suglaudinimo metodai. Šiais metodais suglaudinus duomenis galima pilnai atstatyti jų pirminę būseną atvirkštiniais metodais. Jie naudojami suglaudinti įvairių tipų duomenis. Tipiški suglaudinimo be duomenų nuostolių failų formatai yra:

ü             .GIF, .TIF, .PCX ir kt. – grafiniams failams;

ü             .AVI – videoduomenims;

ü             .ZIP, .ARJ, .RAR, .LZH, .CAB ir kt. – bet kuriam duomenų tipui.

Yra nemažai grįžtamųjų suglaudinimo metodų, tačiau jie remiasi tik keletu teorinių algoritmų (žr.1 lentelę).

 

Lentelė 1

Algoritmas

 

Išėjimo struktūra

 

Pritaikymo sritis

 

Pastabos

RLE (Run- Length Encoding)

 

Sąrašas (duomenų vektorius)

Grafiniai duomenys

Algoritmo efektyvumas nepriklauso nuo duomenų apimties

 

KWE (Keyword Encoding)

Duomenų lentelė (žodynas)

Tekstiniai duomenys

 

Efektyvus dideliems duomenų masyvams

Chafmano algoritmas

 

Hierarchinė struktūra

 

Bet kurie

 

Efektyvus dideliems duomenų masyvams

 

 

 

          RLE algoritmas. RLE algoritmas remiasi pasikartojančių duomenų sekų suradimu ir jų pakeitimu paprasta struktūra, kurioje pateikiamas duomenų kodas ir pasikartojimo koeficientas. Pavyzdžiui duomenų sekai 0; 0; 0; 127; 127; 0; 255; 255; 255; 255 (iš viso 10 baitų) sudaromas toks vektorius:

Lentelė 2

Reikšmė

Pasikartojimo koeficientas

0

3

127

2

0

1

255

4

 

Tada suglaudinti duomenys bus tokie: 0; 3; 127; 2; 0; 1; 255; 4 (iš viso 8 baitai). Šiame pavyzdyje duomenų sutankinimo lygis bus 8/10% = 80%

          RLE algoritmu veikiančios programos pasižymi paprastumu, dideliu greičiu, bet vidutiniškai pasiekia neaukštą suspaudimo laipsnį. Geriausiai tinka grafiniams failams, kuriuose vienspalviai paveikslo plotai koduojami ilgomis vienodų baitų sekomis. Tekstiniams duomenims šis metodas neefektyvus.

          KWE algoritmas. KWE algoritmas remiasi pradinio dokumento tam tikrų leksinių vienetų (žodžių ar jų grupių) kodavimu. Kodavimo rezultatai suvedami į lentelę (žodyną), kuri pridedama prie suglaudinto kodo. Paprastai žodžiai ar frazės koduojami dvibaičiu kodu, todėl šio metodo programos gerai tinka nelabai dideliems angliško teksto, kurio žodžiai turi mažai skirtingų formų, failams suglaudinti. Kaip pavyzdį galima būtų pateikti garsų J.F. Kennedy sakinį:

"Ask not what your country can do for you - ask what you can do for your country."

Ši citata turi 17 žodžių, sudarytų iš 61 raidės, 16 tarpų, 1 brūkšnio ir 1 taško. Jei kiekvienas simbolis užimtų vieną atminties vienetą, tai failas užimtų 79 vienetus. Kad sumažinti failo dydį, reikia ieškoti pasikartojančios informacijos. Galima iš karto pastebėti šiuos pasikartojimus:

ask, what, your, country, can, do, for, you

pasikartoja po du kartus.

Jei nekreipsime dėmesio į didžiąsias ir mažąsias raides, tai iš 9 žodžių galima atkurti visą citatą.

Sunumeruotas žodžių, kurie pasikartoja sakinyje po du kartus, sąrašas:

1. ask 2. what 3. your  4. country 5. can 6. do 7. for 8. you

Tuomet mūsų sakinys atrodys taip:

"1 not 2 3 4 5 6 7 8 - 1 2 8 5 6 7 3 4"

 

          Žinodami šį rūšiavimo metodą, galime lengvai atkurti sakinį. Būtent tai ir daro suskleidimo – išskleidimo programos. Tad kiek šiuo atveju mes sutaupėme vietos? Visa frazė užima 79 atminties vienetus. Suspausta frazė su tarpais užima 37 vienetus. Žodžių sąrašas užima dar 37 vienetus. Sudėję šiuos skaičius gauname 74 vienetų dydžio failą. Jis sumažėjo penkiais vienetais arba 6,3 %. Bet tai tik vienas sakinys. Jei taip suspaustume visą knygą, skirtumas būtų akivaizdus. Taigi, suspaudimo kokybė priklauso nuo informacijos kiekio bei informacijos pobūdžio, t.y. kuo daugiau yra pasikartojančių simbolių, tuo efektyviau bus galima sumažinti informacijos apimtį.

 

          Chafmano algoritmas. Šiuo metodu koduojama ne baitais, o bitų grupėmis. Prieš kodavimo pradžią atliekama dokumento kodo dažnumų analizė ir nustatomas kiekvieno simbolio pasikartojimo laipsnis. Kuo dažniau kartojasi vienas ar kitas simbolis, tuo mažesniu bitų kiekiu jis koduojamas. Susidariusi, atlikus kodavimą, hierarchinė struktūra pridedama prie suspausto failo kaip atitikimų lentelė.

Pav. 1 Hierarchinė struktūra

 

          Sintetiniai algoritmai. Čia aptarti sutankinimo algoritmai tokiu “grynu” pavidalu praktikoje nenaudojami, nes kiekvieno iš jų efektyvumas labai priklauso nuo pradinių sąlygų, t.y. suspaudžiamo failo savybių. Todėl šiuolaikinės duomenų archyvavimo programos naudoja sudėtingesnius “sintetinius” algoritmus, sudarytus iš keleto teorinių algoritmų kombinacijos. Bendras tokių algoritmų darbo principas yra išankstinis failo peržiūrėjimas ir duomenų struktūros analizė individualiam algoritmo suderinimui šiems duomenims sutankinti.

 

          Duomenų suglaudinimo programos (archyvatoriai). Klasikiniai duomenų sutankinimo formatai, naudojami asmeniniuose kompiuteriuose, yra .ZIP ir .ARJ. Pastaruoju metu vietoj plačiai DOS terpėje naudoto .ARJ formato naudojamas .RAR formatas. OS UNIX aplinkoje dažniausiai naudojami .GZ ir .TAR formatai. Populiariausios šiais formatais duomenis sutankinančios programos yra:

ü             PowerArchiver (nemokama);

ü             WinZip;

ü             WinRAR;

ü             WinArj;

ü             ZipMagic.

         

Šie archyvatoriai integruojasi su Windows operacine sistema. Tada failo archyvavimą galima atlikti iš dešiniu pelės spragtelėjimu iškviečiant kontekstinį meniu programoje “Windovs Explorer” ar “My Computer”.

 

 

 

          Svarbiausios archyvatorių funkcijos.

ü             Sukurti archyvą;

ü             Įdėti failą (failus) į archyvą;

ü             Išimti failą (failus) iš archyvo;

ü             Suarchyvuoti (išarchyvuoti) katalogą;

ü             Sukurti archyvą nurodyto dydžio tomais (atskiruose failuose);

ü             Sukurti save išpakuojantį archyvą (su .exe plėtiniu);

ü             Apsaugoti duomenis archyve slaptažodžiu;

ü             Atlikti failų paiešką archyvo viduje;

ü             Iškviesti dokumentą ar paleisti programą, jos neišpakuojant iš archyvo.

 

          Atsarginės duomenų kopijos. Aptartomis archyvavimo programomis atsarginės duomenų kopijos daromos “rankomis”. Sukurtus archyvus reikia perkelti į kitus duomenų kaupiklius, nepamiršti juos reguliariai atnaujinti. Toks būdas labiau tinka asmeninių, palyginti nedidelių duomenų kiekių apsaugai. Automatizuotam tokių duomenų archyvavimui galima naudoti į Windows sudėtį įeinančią programą Backup, ar jai analogišką kitą pagalbinę programą (pvz. nemokamą Cobian Backup 5). Šios programos leidžia nurodyti į kokį įrenginį, kokių failų ar katalogų ir kokiu reguliarumu sukurti atsarginę kopiją. Duomenų bazių, informacinių sistemų, apskaitos bei kitų programų didelės apimties duomenims kopijuoti naudojama speciali programinė įranga ir tam skirti įtaisai – strimeriai, zip-įrenginiai ir kt. Be to nustatomos specialios duomenų apsaugos ir rezervinio kopijavimo tvarka taisyklės.

 

 

Kompiuteriniai virusai. Antivirusinės programos.

 

          Virusas yra genetinės medžiagos fragmentas, kuris savo gyvavimui ir dauginimuisi turi infekuoti (užkrėsti) kokį nors organizmą-nešėją. Kad virusas plistų tarp organizmų, jam paprastai būdingos savybės, priverčiančios nešėją atlikti tam tikrus patologinius (liguistus) veiksmus. Todėl įvairios kenkėjiškos kompiuterinės programos (t.y. tokios, kurios, įvestos į sistemą, sutrikdo jos veikimą) pavadintos bendru virusų vardu. Taigi, programuotojo požiūriu, virusas - tai kompiuterinis kodas, kuris savo plėtimuisi turi infekuoti kurią nors programą-nešėją. Paprastai kompiuterinis virusas infekuoja kitas programas įjungdamas į jas programos-viruso kodą. Pirmą kartą (1949m.) programos-viruso, t.y. kompiuterinės programos, galinčios daugintis, modelį pateikė Džonas fon Neimanas (John fon Neumann). Pirmas užregistruotas kompiuterinis virusas buvo žaidimas “Karas operatyvioje atmintyje” (“Core War”), kurį 6-ajame dešimtmetyje sukūrė kompanijos Bell Laboratories darbuotojas M.Duglas Makilroi. Žaidimo tikslas buvo parašyti programą, kuri ištrintų priešininko informaciją ir blokuotų jo įrašus atmintyje. EGABTR - pirmas IBM PC virusas, atsiradęs 1985 m. liepos mėnesį. Šiuo metu pateikti visą esamų virusų sąrašą praktiškai neįmanoma, nes nauji virusai sukuriami beveik kiekvieną dieną. Absoliuti dauguma virusų šiuo metu į kompiuterius „atkeliauja“ iš interneto: jie plinta per elektroninių laiškų priedus (87% ), FTP, per naujienų grupes, internetinius puslapius bei parsisiunčiant įvairius failus. Virusai taip pat dauginasi per diskelius, kompaktinius diskus bei vietinius kompiuterių tinklus.

          Virusų klasifikacija. Virusus galima klasifikuoti pagal įvairius požymius:

ü             Viruso algoritmo ypatybės ir veikimo būdas:

-       Tikrasis virusas;

-       Kirminas;

-       Loginė bomba;

-       Laiko bomba;

-       Trojos arklys;

-       Virusai palydovai;

-       Polimorfinis virusas;

-       Nematomi virusai.

ü            Viruso kenksmingumas:

-      Nepavojingi;

-      Pavojingi;

-      Labai pavojingi.

ü            Pagal užkrėtimo būdą:

-      Rezidentiniai;

-      Nerezidentiniai.

ü            Pagal “gyvenimo” aplinką:

-      Failų užkratai (file infectors);

-      Pakrovimo sektoriaus virusai (boot sector viruses);

-      Makrovirusai (macro viruses).

          Pagrindiniai failų, kurie dažniausiai infekuojami, tipai yra šie: .COM, .EXE, .SYS, .OVL, .LIB, .OBJ, .PRG, .DOC, .DOT.

 

          Virusų padaroma žala:

ü             Programų užkrėtimas – kai kurios užkrėstos programos nustoja veikti arba veikia blogai;

ü             Garso ir videoefektai - pvz., krintantys simboliai, įvairūs ekrano režimų trukdymai muzika ir kt., trukdantys kompiuterio darbą;

ü             Sistemos darbo lėtėjimas, pvz. įvedimo-išvedimo metu;

ü             Tam tikrų operacijų, pvz., programų vykdymo arba OS kelties trukdymas kompiuteryje;

ü             Nepastebimas duomenų failų modifikavimas, pvz., skaičių sukeitimas failuose;

ü             Informacijos diskuose sunaikinimas, pvz. formatuojant diską ar trinant tam tikras disko sritis;

ü             Failų sistemos sugadinimas - failų išdėstymo lentelės, katalogų, disko sistemos kelties ir kieto disko paskirstymo lentelės modifikavimas.

 

 

          Kaip apsisaugoti nuo virusų?

ü             Naudoti techninę ir programinę antivirusinę įrangą. Reguliariai atnaujinti antivirusines programas. Gauti nauji failai prieš atidarant turi būti patikrinti antivirusinėmis programomis.

ü             Turėti vertingų duomenų kopijas diskeliuose ar kompaktiniuose diskuose.

ü             Reguliariai tikrinti kietąjį diską antivirusinėmis programomis.

ü             Apsaugoti nuo įrašymo visą tik skaitymui naudojamą informaciją.

ü             Išjungiant ar atliekant kompiuterio pakartotinę keltį iš kieto disko, patikrinti, ar kaupiklyje neįdėtas diskelis.

ü             Atliekant kompiuterio keltį iš diskelio, reikia naudotis tik nuo įrašymo apsaugotu diskeliu.

ü             Pastebėjus užkrėtimo simptomus, reikia atjungti kompiuterio ryšį su internetu ir jį išjungti, kad virusas netęstų savo griaunamųjų veiksmų.

 

          Antivirusinė programinė įranga. Pagal atliekamas funkcijas į antivirusinės sistemos sudėtį įeinančios programos skirstomos taip:

ü             Programos - detektoriai ( scaners) aptinka virusą pagal tam tikrą jo naudojamą parašą, t.y. pagal jam būdingą baitų kombinaciją ( string).

ü             Programos - daktarai ne tik aptinka virusus, bet ir ištrina juos iš užkrėstų failų. Failai, kurių nepavyksta „išgydyti“ ištrinami arba karantinuojami.

ü             Programos - revizoriai atsimena duomenis apie programų ir diskų sisteminių sričių savybes ir turinį. Traktuojama, kad tuo metu jos neužkrėstos. Vėliau revizoriai lygina jų būklę su pradine. Norint patikrinti, ar nepasikeitė failas, skaičiuojamas jo ilgis arba kontrolinė suma.

ü            Programos - filtrai dar vadinamos rezidentinėmis antivirusinėmis programomis arba bendrojo monitoringo programomis. Jos talpinamos rezidentiškai kompiuterio operatyviojoje atmintyje ir perima tuos kreipinius į OS, kuriuos virusai naudoja dauginimuisi ir kenkimui, pvz., vykdomųjų failų keitimas, failo atributo „tik skaitymui“ ( read only) panaikinimas, disko formatavimas, programos padarymas rezidentine ir pan.

          Populiariausios antivirusinės programos

ü             McAffee VirusScan;

ü             Norton Antivirus;

ü             Panda Software Panda Antivirus;

ü             Kaspersky Antiviral Toolkit Pro;

ü             Computer Associates InoculateIT.

 

 

Informacijos apsauga nuo nesankcionuoto jos naudojimo

 

          Informacijos apsaugai nuo nesankcionuoto jos naudojimo geriausia naudoti operacines sistemas, kuriose dirbti su kompiuteriu galima tik registruotiems jose vartotojams. Šiuo atveju įėjimas į katalogus yra ribojamas, neleidžiant į juos patekti kitiems vartotojams. Tai Windows 2000 PE ir vėlesnės versijos, Linux ir Unix operacinės sistemos. Dirbant kitose OS (Windows 95, Windows 98) galima naudoti BIOS slaptažodį, reikalingą įvesti OS įkrovos metu. Jei kompiuteris dirba tinkle, būtina sekti dalijimosi ( sharing) failais ir katalogais būklę, kad nebūtų palikta leidžiamų prisijungti kitiems vartotojams ir slaptažodžiu neapsaugotų katalogų. Slaptažodžiuose reikia naudoti ne tik raides, bet ir skaitmenis ir specialius ženklus, nenaudoti su savimi susijusiu tikrinių daiktavardžių (savo, žmonos, vyro vardas, gimtas miestas ir pan.), nes jie gali būti lengvai atspėti.

 

Literatūra:

1)     J.Adomaitis ir kt. Informatika I dalis Vadovėlis, L-kla “Technologija”, Kaunas, 1999.

2)     Pagrindinės informacijos technologijos sąvokos. L-kla Žara, Vilnius, 2001.

 

Prieiga per internetą:

1)     http://distance.ktu.lt/kursai/informatika1/5/

2)     http://hoox.vr9.com/men/down/archyv.htm

3)     http://techno.su.lt/~dalia/kompiute.html

4)     http://base.lt/internetas/virusai.html

5)     http://www.hot.lt/articles/viruses.htm

6)     http://www.ekspertas.lt/library/antiv/m1_s1_2.html