Model-based decision support for subjective preference blending

Kellermann, Thomas Johannes (2019-04)

Thesis (PhD)--Stellenbosch University, 2019.

Thesis

ENGLISH SUMMARY: In a subjective preference blending problem (SPBP), the objective is to select a most pleasing alternative from a set of alternatives, based on the relative performances of the alternatives in respect of a number of (possibly conflicting) selection criteria. What distinguishes this problem from other types of selection problems is that there is no universally accepted objective function for scoring the alternatives according to the selection criteria. Instead, every decision maker has his or her own relative preferences of the alternatives with respect to the various selection criteria — hence the prefix subjective. Although various multi-criteria decision support frameworks or methodologies exist for estimating a particular decision maker’s value function in respect of combined selection criteria in an SPBP instance, these processes are only effective if the decision space of the problem instance is not too large. This is because value function estimation procedures typically involve pairwise comparisons of the criteria, which has quadratic-order time complexity. Large decision spaces, in fact, often induce the phenomenon of satisficing, where a decision maker settles for an acceptable alternative rather than attempting to discover the best alternative — either because of time constraints or because of a lack of a full characterisation of the decision space. The provision of automated decision support to a decision maker in respect of the exploitation and exploration of the decision space of an SPBP instance resides within the realm of interactive preference learning. The quest in preference learning is to predict the subjective preferences of a decision maker based on past observed preference information elicited from that decision maker or similarly minded decision makers. Preference learning becomes interactive if the decision maker is actively included in the (typically iterative) learning process, in which case such (subjective) learning is usually tailored to the specific decision maker involved. An interactive preference learning decision support system is proposed in this dissertation for facilitating solution of SPBP instances. The working of the system is based on an iterative involvement of the DM in the form of the elicitation of pairwise comparisons of alternatives strategically selected by the system so as to achieve a trade-off between efficiently exploring the entire decision space and exploiting well-performing areas of the decision space according to the current value function estimation of the decision maker. The design objectives of the system specifically include workload reduction of the decision maker and the accommodation of low to moderate levels of decision maker inconsistency during pairwise comparisons of alternatives. The effectiveness of the decision support system is assessed in view of its intrinsic ability to learn a decision maker’s value function by applying methods from inferential statistics to the output recommendations of the system. The system is finally also validated by applying it to two SPBP instances involving real human decision makers.

AFRIKAANSE OPSOMMING: In ’n subjektiewe voorkeur-vermengingsprobleem (SVVP) is die doel om ’n mees verkose alternatief uit ’n versameling alternatiewe te kies, gebaseer op die relatiewe prestasies van die alternatiewe ten opsigte van ’n aantal (moontlik teenstrydige) seleksiekriteria. Wat hierdie probleem van ander tipes seleksieprobleme onderskei, is dat daar geen universeel-aanvaarde doelfunksie bestaan waarvolgens die alternatiewe met betrekking tot die seleksiekriteria gekwantifiseer kan word nie. In plaas daarvan het elke besluitnemer sy of haar eie relatiewe voorkeure van die alternatiewe met betrekking tot die verskillende seleksiekriteria — daarom die voorvoegsel subjektiewe. Alhoewel daar verskeie multi-kriteria besluitsteunraamwerke of metodologieë vir die afskatting van ’n bepaalde besluitnemer se waardefunksie met betrekking tot gekombineerde seleksiekriteria in ’n SVVP-geval bestaan, is hierdie prosesse slegs doeltreffend as die beslissingsruimte van die probleemgeval nie te groot is nie. Die rede hiervoor is dat waardefunksie afskattingsprosedures tipies paarsgewyse vergelykings van die kriteria behels, wat kwadratiese-orde tydkompleksiteit het. Groot beslissingsruimtes veroorsaak trouens die verskynsel van bevrediging, waar ’n besluitnemer bloot ’n aanvaarbare alternatief selekteer eerder as om te poog om die beste alternatief te ontdek — óf as gevolg van tydsbeperkings óf weens die onbeskikbaarheid van ’n volle karakterisering van die beslissingsruimte. Die verskaffing van ge-outomatiseerde besluitsteun aan ’n besluitnemer ten opsigte van die uitbuiting en verkenning van die beslissingsruimte van ’n SVVP-geval val binne die studieveld van interaktiewe voorkeurleer. Die doel in voorkeurleer is om die subjektiewe voorkeure van ’n besluitnemer te voorspel, gebaseer op vorige waargenome voorkeure van die besluitnemer of soortgelyke besluitnemers. Voorkeurleer word interaktief as die besluitnemer aktief betrokke is by die (tipies iteratiewe) leerproses. In sulke gevalle vind (subjektiewe) leer plaas wat spesifiek op die betrokke besluitnemer van toepassing is. ’n Interaktiewe voorkeurleer-besluitsteunstelsel word in hierdie proefskrif daargestel om die oplossing van SVVP-gevalle te fasiliteer. Die werking van die stelsel is gebaseer op ’n iteratiewe betrokkenheid van die DM in die vorm van die spesifikasie van paarsgewyse vergelykings van alternatiewe wat strategies deur die stelsel gekies is, ten einde ’n afruiling te bewerkstellig tussen die doel-treffende verkenning van die hele beslissingsruimte en die ontginning van hoë-kwaliteit areas van die beslissingsruimte volgens die besluitnemer se huidige waardefunksie-afskatting. Die ontwerp-doelwitte van die stelsel sluit spesifiek werksladingvermindering van die besluitnemer en die akkommodasie van lae tot matige vlakke van besluitnemer-inkonsekwentheid tydens paarsgewyse vergelyking van alternatiewe in. Die doeltreffendheid van die besluitsteunstelsel ten opsigte van die intrinsieke vermoë daarvan om ’n besluitnemer se waardefunksie te leer, word beoordeel deur metodes uit inferensiële statistiek op die aanbevelingsafvoer van die stelsel toe te pas. Die stelsel word uiteindelik ook gevalideer deur dit op twee SVVP-gevalle toe te pas waarby menslike besluitnemers betrokke is.

Please refer to this item in SUNScholar by using the following persistent URL: http://hdl.handle.net/10019.1/105920
This item appears in the following collections: