A comparison of methodologies with minimal hyper-parameter tuning for anomaly detection on transactional data
Date
2023-03
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Stellenbosch : Stellenbosch University
Abstract
ENGLISH SUMMARY: In the information technology era where data has become as valuable as gold, being able to process and use it effectively is vital. Many large industries ranging from healthcare and insurance to banking utilise some form of transactional data in order to track and process many of the services and products which they offer to their clients. These processes are moving too fast for any human to keep up, due to the ever increasing rates of service and convenience which are core drivers in this technological era. Under these circumstances, anomaly detection is required. Fraud detection is the process whereby these transactions are identified and so are the items which could be related to any fraudulent, wasteful or abusive behaviour. A variety of anomaly detection methodologies are investigated to illustrate and compare their ability to quickly and accurately detect anomalous transactions without being given a set of rules. The methods used range from traditional statistical methods, through to machine learning and deep learning. Isolation forest performs best on the evaluation criteria used in this study.
AFRIKAANSE OPSOMMING: In die inligtingstegnologie-era waar data so waardevol soos goud geword het, is dit noodsaaklik om dit doeltreffend te verwerk en te gebruik. Baie groot nywerhede wat wissel van gesondheidsorg en versekering tot bankwese gebruik een of ander vorm van transaksiedata om baie van die dienste en produkte wat hulle aan hul kliente bied, op te spoor en te verwerk. Hierdie prosesse beweeg te vinnig vir enige mens om by te hou, as gevolg van die steeds toenemende tempo van diens en gerieflewering wat die kerndrywers in hierdie tegnologiese era is. Omstandighede vereis anomalie opsporing. Bedrogopsporing is die proses waardeur hierdie transaksies uitgelig word en so ook die items wat verband kan hou met enige bedrieglike, verkwistende of beledigende gedrag. ’n Verskeidenheid anomalie-opsporingsmetodologiee word ondersoek om hul vermoe om vinnig en akkuraat afwykende transaksies op te tel, te illustreer en te vergelyk. Die metodes wat gebruik word wissel van tradisionele statistiese metodes tot masjienleer en diep leer. Isolasie woude presteer die beste met die evalueringskriteria kriteria wat in hierdie studie gebruik word.
AFRIKAANSE OPSOMMING: In die inligtingstegnologie-era waar data so waardevol soos goud geword het, is dit noodsaaklik om dit doeltreffend te verwerk en te gebruik. Baie groot nywerhede wat wissel van gesondheidsorg en versekering tot bankwese gebruik een of ander vorm van transaksiedata om baie van die dienste en produkte wat hulle aan hul kliente bied, op te spoor en te verwerk. Hierdie prosesse beweeg te vinnig vir enige mens om by te hou, as gevolg van die steeds toenemende tempo van diens en gerieflewering wat die kerndrywers in hierdie tegnologiese era is. Omstandighede vereis anomalie opsporing. Bedrogopsporing is die proses waardeur hierdie transaksies uitgelig word en so ook die items wat verband kan hou met enige bedrieglike, verkwistende of beledigende gedrag. ’n Verskeidenheid anomalie-opsporingsmetodologiee word ondersoek om hul vermoe om vinnig en akkuraat afwykende transaksies op te tel, te illustreer en te vergelyk. Die metodes wat gebruik word wissel van tradisionele statistiese metodes tot masjienleer en diep leer. Isolasie woude presteer die beste met die evalueringskriteria kriteria wat in hierdie studie gebruik word.
Description
Thesis (MCom)--Stellenbosch University, 2023.