A decision support framework for machine learning applications

Date
2020-20
Journal Title
Journal ISSN
Volume Title
Publisher
Stellenbosch : Stellenbosch University
Abstract
ENGLISH ABSTRACT: Data is currently one of the most critical and influential emerging technolo-gies. Organisations and employers around the globe strive to investigateand exploit the exponential data growth to discover hidden insights in aneffort to create value. Value creation from data is made possible throughdata analytics (DA) and machine learning (ML). The true potential of datais yet to be exploited since, currently, about 1% of generated data is everactually analysed for value creation. There is a data gap. Data is availableand easy to capture; however, the information therein remains untappedyet ready for digital explorers to discover the hidden value in the data. Onemain factor contributing to this gap is the lack of expert knowledge in thefield of DA and ML.In a survey of 437 companies, 76% indicated an interest to invest in DA andML technologies over the years of 2015 to 2017. However, in a survey of 400companies, 4% indicated that they have the right strategic intent, skilledpeople, resources and data to gain meaningful insights from their data andto act on them. Small, medium and micro enterprises (SMMEs) lack theavailability of DA and ML skills in their existing workforce, have limitedinfrastructure to realise ML and have limited funding to employ ML toolsand expertise. They need proper guidance as to how to employ ML in alow-cost, feasible and sustainable way.This study focused on addressing this data gap by providing a decision sup-port framework for ML algorithms. The goal of this study was therefore todevelop and validate adecision support frameworkwhich considers both thedata characteristicsand theapplication typeto enable SMMEs to choosethe appropriate ML algorithm for their unique data and application pur-pose. This study aimed to develop the framework for a semi-skilled analyst,with mathematics, statistics and programming education, who is familiar with the process of programming, yet has not specialised in the variety ofML algorithms which are available.This research project followed the Soft Systems Methodology and utilisedJabareen’s framework development methodology. Various literature studieswere performed on data, DA, application purposes, ML and the processof applying ML. The CRoss-Industry Standard Process for Data Mining(CRISP-DM) was followed to design and implement the experiments. Theresults were evaluated and summarised to create the decision support frame-work. The framework was validated by consulting subject matter experts(SMEs) and possible end-users (PEUs).
AFRIKAANSE OPSOMMING: Data is tans een van die mees kritieke en invloedrykste ontluikende teg-nologie ̈e. In ’n poging om besigheidswaarde te skep, streef organisasiesen werkgewers regoor die wˆereld daarna om die eksponensi ̈ele groei vandata te ondersoek en te benut om verborge inligting en insigte te ontdek.Waardeskepping vanuit data word deur data-analise (DA) en masjienleer(ML) moontlik gemaak. Die werklike potensiaal van data moet nog ontginword, aangesien slegs ongeveer 1% van die gegenereerde data tans vir dieontginning van besigheidswaarde ontleed word. Daar is ’n datagaping. Datais geredelik beskikbaar en maklik om vas te vang, maar die inligting daarinbly onbenut, maar gereed vir digitale ontdekkingsreisigers om die verborgewaarde in die data te ontdek. ’n Groot faktor wat tot hierdie gaping bydra,is die gebrek aan kundige kennis op die gebied van DA en ML.In ’n opname onder 437 maatskappye het 76% ’n belangstelling in die be-legging in DA- en ML-tegnologie ̈e in die jare 2015 tot 2017 aangedui. In’n peiling onder 400 ondernemings het 4 % egter aangedui dat hulle dieregte strategiese ingesteldheid, arbeidsmag, hulpbronne en data het ombetekenisvolle insigte uit hul data te ontgin en daarop staat te maak virbesluitneming. Klein, medium en mikro-ondernemings (KMMOs) het nie die beskikbaarheid van DA- en ML-vaardighede in hul bestaande arbeids-mag nie, het beperkte infrastruktuur om ML te verwesenlik en het beperktefinansiering om ML-gereedskap en kundigheid aan te skaf. Hulle benodigbehoorlike leiding oor hoe om ML op ’n lae-koste, haalbare en volhoubaremanier aan te skaf.Hierdie studie het gefokus om hierdie datagaping aan te spreek deur ’nbesluitsteunraamwerk vir ML-algoritmes te skep. Die doel van hierdie studiewas om ’nbesluitsteunraamwerkte ontwikkel en te valideer, wat beide diedata eienskappeen dietoepassingsdoeloorweeg, om KMMOs in staat te stel om die mees toepaslike ML-algoritme vir hul unieke data en toepassingsdoelte kies. Hierdie studie het gemik om die raamwerk vir ’n semi-vaardigeontleder, met met wiskunde, statistiek en programmeringsopleiding, watvertroud is met die programmeringsproses, maar nog nie gespesialiseer hetin die verskeidenheid van ML-algoritmes wat beskikbaar is nie, te ontwikkel.Hierdie navorsingsprojek het die Sagtestelselmetodiek (SSM) gevolg en Jaba-reen se raamwerk-ontwikkelingsmetodologie gebruik. Verskeie literatuurstu-dies met betrekking tot data, DA, toepassingsdoeleindes, ML en die prosesom ML toe te pas, was uitgevoer. Die KRuisIndustrie-StandaardProses virData-Ontginning (KRISP-DO) was gevolg om die eksperimente te ontwerpen te implementeer. Die resultate was ge ̈evalueer en opgesom om die raam-werk vir besluitsteun te skep. Die raamwerk is bekragtig deur vakkundigesen moontlike eindgebruikers te raadpleeg.
Description
Thesis (MEng)--Stellenbosch University, 2020.
Keywords
Industrial engineering applications, UCTD, Machine learning, Decision support systems
Citation