Ar galima VU Žiniatinklio pašte filtruoti laiškus pagal kalbą (koduotę)?

Atnaujinta: 2016-02-19

Tiksliai nustatyti, kokia kalba parašytas laiškas galima ne visada. Daugeliu atvejų tą galima padaryti ieškant laiške dominančios kalbos simbolių arba pagal nurodytą laiško koduotę (jei ji nurodyta teisingai). Jei naudojama universali koduotė UTF-8, viename laiške galima naudoti daugelio kalbų rašmenis, pvz. rusiškus, angliškus, lietuviškus, kiniškus ir t.t., todėl tokiu atveju tinka tik būdingų kalbai simbolių paieška, tačiau toks laiškų filtravimo būdas yra gana nepatogus. Paprastesnis būdas VU žiniatinklio pašte (su sąlyga, kad nurodyta teisinga laiško koduotė) yra filtruoti laiškus pagal jų koduotę. Nors tai nėra idealus būdas, gera žinia ta, kad dauguma rusiškų el. pašto šiukšlių siuntėjų naudoja standartines rusiškas koduotes.

Pasitaiko atvejų, kai VU el. pašto naudotojai gauna nepageidaujamus rusiškus reklaminio pobūdžio laiškus. Taip atsitinka todėl, kad prenumeruojamos AntiSpam DB apie rusiško [Spam] laiškų siuntėjus ir laiškus turi mažiau duomenų. Tuo atveju, jei niekada nesusirašinėjate rusų kalba ir iš nieko paprastai negaunate rusiškų laiškų, šį metodą galima naudoti kaip supaprastintą AntiSpam sistemos nepastebėtų nepageidaujamų rusiškų laiškų filtrą.

 

Tarkime, jog norime susikurti filtrą, kuris perkels visus gaunamus vienos ar kelių rusiškų koduočių laiškus į specialų katalogą "rusiški laiškai". Pavyzdyje laikysime, jog katalogas jau sukurtas.

 

1. Sukurkite naują katalogą "rusiški laiškai" (kaip tai padaryti, plačiau galite sužinoti čia...) ir skiltyje "Filtrai"

pasirinkite sukurti naują filtravimo taisyklę.

ru-filtras-01

 

2. Nurodykite naujos filtravimo taisyklės parametrus:

A. Pavadinimą

B. Kiek sąlygų turi atitikti taisyklė, kad būtų pritaikyta

C. Pasirinkite "Pačio aprašyta antraštė", nurodykite laiško antraštės (angl. header) parametro pavadinimą "Content-Type" , kuris "Turi" reikšmę "koi8-r".

D. Jei pageidaujate, galite nurodyti daugiau rusiškų koduočių (žr. žemiau).

E. Nurodykite katalogą, į kurį bus perkeliami laiškai vėlesnei peržiūrai.

F. Išsaugokite pakeitimus.

ru-filtras-02

 

Visi gauti laiškai, kuriuose bus nurodyta koi8-r koduotė, bus perkeliami į katalogą "rusiški laiškai".

 

Pastabos

  • KOI8-R yra ko gero populiariausia rusiška koduotė, tačiau naudojamos ir windows-1251 bei ISO-8859-5.
  • Atminkite, jog viena koduotė gali būti skirta kelioms kalboms (šalims), todėl neapsižiūrėję galite sulaukti netikėtų rezultatų.
  • Daugiau apie koduotes ir jų naudojimą galite sužinoti čia...
  • Filtravimo taisyklėse nenaudokite universalių koduočių, tokių kaip UTF-8, nes ja koduoti laiškai gali būti parašyti bet kokia kalba (taip pat ir lietuvių). Toks filtras yra beprasmis.
  • Naudojant parodytą principą galima kurti ir sudėtingesnius kombinuotus filtrus (apjungiant kelių kalbų koduotes), tačiau reikėtų būti atsargiems ir filtro taisykles atitinkančių laiškų netrinti iškart, o perkelti į laikiną katalogą vėlesnei peržiūrai, kaip tai parodyta pavyzdyje.