Home » Articles » Հոդվածներ

Շեղումների բացահայտում կամ Anomaly detection

Շեղումների բացահայտումը (outlier detectionդա վերլուծական մեթոդ է, որի դեպքում բացահայտվում են այն երևույթները, օբյեկտները կամ այլ փոփոխականները, որոնք չեն համապատասխանում տվյալների բազայի  սպասված կաղապարներին:

Սովորաբար կտրուկ շեղումները վկայում են պրոբլեմների առկայության մասին՝ մասնավորապես բանկային տվյալների բազաներում կտրուկ շեղումները վկայում են խախտումների և խաբությունների մասին:  Այս մեթոդը իրականացվում է նաև բժշկական հետազոտություններում՝ բացահատելու համար առկա խնդիրները:  Մեթոդը լակնորեն օգտագործվում է նաև տեքստերի կոնտենտ վերլուծության մեջ՝ հնարավորություն տալով հասկանալու լատենտ երևույթները:   Սոցիոլոգիական և վերլուծական գրականության մեջ այս շեղումները անվանում են աղմուկ, բացառություն, խախտում և այլն: 

Պետք է նշել, որ շեղումները հաճախ ոչ թե բացառիկ երևույթներ են տվյալների բազայի մեջ, այլ կարող են լինել նոր պրոցեսների սկբի նախանշաններից:  Այս առումով կարևոր է բացահայտել դրանք դինամիկայի մեջ:   

Մյուս կողմից շեղումները կարող են արդյունք լինել տվյալների հավաքման մեթոդների թերությունների՝ մասնավորապես հետազոտության գործիքի սահմանափակությունը կարող է հանգեցնել, որ տվյալները որոշակի մասը դիտարկվի որպես "այլ տարբերակ":  Պետք է նշել, որ կլաստերային վերլուծությունը հաճախ բացահայտում է, որ նախկինում բացառություն կամ շեղում համարվող տարրերը իրականում միկրո կլաստերներ են: 

Որպես կանոն շեղումները բացահայտվում են երկու եղանակով՝ 
1. Տվյալների բազան դիտարկվում է որպես "նորմալ", իսկ նրա միջին ցուցանիշներից ցանկացած անընդունելի շեղում ընկալվում է որպես անոմալիա:  
2. Շեղման սահմանները դրվում են  նախորոք, և սահմանված չափանիշներից ցանկացած անհամապատասխանություն դիտարկվում է որպես անոմալիա:   

Շեղումների բացահայտման մեթոդը օգտագործվում է հնարավոր պատերազմների վտանգների բացահայտման դեպքում, խաբեությունների և բացթողումների ուսումասիրության, համակարգի առողջության գնահատման  ժամանակ, բնապահպանական խնդիրների ուսումասիրության դեպքում: Հաճախ այս մեթոդի միջոցով տվյալների բազայից դուր են բերում բազայի որակի վրա ազդող փոփոխականների միավորները:   

Շեղումների բացահայտման համար կարող են օգտագործվել համարյա բոլոր վիճակագրական համակարգչային ծրագրերը: 
Այուամենայիվ խորհուրդ է տրվում օգտագործել մասնագիտացված ծրագիր` 
ELKI: Environment for Developing KDD-Applications Supported by Index-Structures

Ավելի մասնրամասն տես հետևյալ կայքում՝

http://elki.dbs.ifi.lmu.de/

Category: Հոդվածներ | Added by: Vahik (2015-09-29)
Views: 360 | Rating: 0.0/0
Total comments: 0