Free Essay

Mulivariate Analysis

In:

Submitted By ykellens
Words 10514
Pages 43
| FACULTEIT B.E.W. Bedrijfseconomische toepassingen van multivariate database analyse (1951)GroepswerkCindy BuntinxJonathan FranssensYorick KellensBart Laermans Alexander Van de VeldeEerste masterjaar HIAcademiejaar 2013-2014 |
Inhoudstabel

Om te beginnen 3 Zijn de data geschikt om er een factoranalyse op uit te voeren? 6 Conceptuele ondersteuning en homogene steekproef 6 Metrische data 6 Steefproefgrootte 6 Analyse correlatiematrix 6 Visuele inspectie 6 Kaiser-Meyer-Olkin (KMO) 7 Bartlett’s test of sphericity 7 MSA per variable 8 Partiële correlaties 8 Conslusie 9 Hoeveel factoren zijn er volgens de analyse? 10 Latent root criterion 10 Scree test 10 Horn’s parallel test 11 Besluit 12 Interpretatie van deze factoren 13 3 factoren 13  Factor 1: Innoverend persoon die graag zijn kennis ter zake met anderen deelt 13  Factor 2: Gevestigde waarde die de voor- en nadelen van computerproducten kent 14  Factor 3: Marktvolgers 14 4 factoren 15  Factor 1: Trendsetter en informatiebron over nieuwe merken 15  Factor 2: Innovators en early adopters 16  Factor 3: Informatiebron over computer gerelateerde producten 16  Factor 4: Late majority en laggards 16 Conclusie 17 Zijn de factoren goede voorspellers? 18 Discriminant analyse 20 Normaliteitvereiste 20 Box’s M Test 21 Logistische regressie 21 Block 0: Beginning Block 23 Block 1: Method= Forward Stepwise (Wald) 24 Testen van de kwaliteit van de regressie 24 Interpretatie van de variabelen in de regressie 31 Het model in stap 2 33 Het model in stap 3 34 Is stap 2 beter dan stap 3? 35 Logistische regressie vraag b 36 Block 0: Beginning Block 36 Block 1: Method = Forward Stepwise (Wald) 38 Inleiding 42 Analyse 43 Bijlages 46

OPDRACHT 1: OM TE BEGINNEN
Een belangrijk onderdeel alvorens de echte analyses te beginnen bestaat uit het analyseren van de samenstelling van de steekproef en het bestuderen van zogenaamde beschrijvende statistieken. a) Beschrijf de steekproef aan de hand drie - volgens jou – relevante kenmerken b) Bereken twee – volgens jou - relevante beschrijvende statistieken voor elk van de variabelen Dell01-Dell13. Bepaal tevens of de gemiddelde klantperceptie voor elk van de variabelen significant afwijkt van het schaal middelpunt.
Om te beginnen

Alvorens analyses op de data uit te voeren, dient deze eerst te worden besproken.
Allereerst geven we aan per variabele welke meetschaal van toepassing is. De variabelen education, age, income, SAT, WOM, REP, LOY5, LOY10, Dell01-Dell13 en Pers01-Pers13 zijn allen ordinaal. (enkel mode, mediaan, percentage en range) Dit besluiten we omdat er duidelijk sprake is van rangorde bij deze variabelen, maar wel zonder een vast interval. Aangezien er bij Gender en WB01-WB07 geen rangorde is, zijn deze nominaal. (geen gemiddelden gebruiken bij nominaal) Choice heeft daarentegen wel een duidelijke rangorde en een vast interval, dus is deze variabele een schaal.
Dan zijn er nog de zogenaamde “missing values”. We kunnen opmerken dat bij sommige variabelen de optie mogelijk is om geen mening op desbetreffend onderwerp te geven. Als deze optie wordt aangeduid, wordt dit in de dataset aangegeven met een nulwaarde. Zo concluderen we dat er nooit echt sprake is van ontbrekende waarden in de dataset (cfr. INCOME heeft 38 “missing” values). De dataset is dus volledig.
We kunnen ook nog besluiten dat de dataset gelijk verdeeld is tussen mannen en vrouwen. De verdeling wat betreft opleidingsniveau, inkomen en leeftijd zijn voor beide geslachten gelijkend.
Het inkomen is normaal verdeeld, met uitschieters voor meer dan $100.000. Deze uitschieters kunnen we echter wijten aan het feit dat er geen bovengrens is voor het inkomen. Het is dus vrij waarschijnlijk dat indien er verdere opsplitsingen werden gemaakt in de categorie “$100,000 or over” het inkomen over de volledige lijn normaal verdeeld zou zijn.
Leeftijd is ook normaal verdeeld, met een kleine staart voor oudere leeftijden. We kunnen ook opmerken dat geen enkele respondent ouder is dan 80 jaar.
Voor de scholingsgraad kunnen we opmerken dat hoe hoger de scholingsgraad, hoe hoger het aantal respondenten.
De variabelen Dell01 tot en met Dell13 representeren de klantpercepties van bepaalde kenmerken van Dell computers. Als we de gemiddeldes, modi en standaardafwijkingen van deze kenmerken bekijken, zien we dat er over het algemeen de steekproef vrij tot zeer tevreden is over de bevraagde kenmerken. Ze hebben namelijk allen een gemiddelde waarde groter dan 6, bij de meesten zelfs nog groter dan 7. Daarbij zien we dat de modus, de meest frequent gekozen waarde, vaak 9 is. We zien echter wel dat sommige variabelen (Dell09, Dell10 en Dell11) een grotere standaardafwijking hebben. Dit betekent dat de antwoorden bij deze 3 variabelen meer verspreid liggen dan die bij de andere variabelen. Als we dan nog een T-test uitvoeren, merken we op dat de gemiddeldes van alle variabelen significant verschillen van het schaalmiddelpunt (zie tabel 1.2 in de bijlage).

Opdracht 2: Wie is de klant en hoe beïnvloedt dit zijn gedrag?
Voor veel producten geldt dat meer psychologische klantkenmerken zoals innovativiteit een belangrijke rol spelen in het uiteindelijke gedrag van de klant met betrekking tot het product. Typisch voor deze psychologische constructen is dat ze gemeten worden aan de hand van een groot aantal (op elkaar lijkende) vragen. Dat is noodzakelijk omdat deze abstracte psychologische kenmerken anders niet op een betrouwbare en valide manier kunnen worden gemeten. Echter, zo’n grote hoeveelheid variabelen is niet erg werkbaar bij het uitvoeren van analyses. Door middel van factor analyse is het mogelijk de informatie die aanwezig is in een grote set variabelen efficiënt samen te vatten in een relatief klein aantal factoren. Deze factoren kunnen vervolgens als surrogaat voor de oorspronkelijke uitgebreide set variabelen in analyses worden gebruikt. a) Het onderzoek bevat 13 items (Pers01-Pers13) die klantkenmerken meten waarvan het vermoeden bestaat dat ze een invloed hebben op de keuze voor Dell PC’s. Voer een exploratieve factor analyse (principal component extractie, varimax rotatie) om te onderzoeken of er sprake is van onderliggende factoren. Besteed expliciet aandacht aan het volgende: (i) zijn de data geschikt voor factor analyse? (ii) hoeveel factoren zijn er ? (iii) interpretatie van de factoren
Zodra je de definitieve factor analyse hebt uitgevoerd sla dan de factor scores op als variabelen in de data set. Je hebt deze nodig voor de volgende vraag. b) Zijn de factoren die resulteren uit de analyse uitgevoerd voor stap a) goed voorspellers van de waarschijnlijkheid of ze het aanschaffen van een Dell aanbevelen bij familie, vrienden, en kennissen (variabele WOM). Wat zijn de praktische implicaties die volgen uit deze analyse?

Zijn de data geschikt om er een factoranalyse op uit te voeren?
Conceptuele ondersteuning en homogene steekproef
Een eerste basisassumptie is dat er een onderliggende structuur aanwezig is in de set van geselecteerde variabelen. We gaan er van uit dat deze assumptie voldaan is aangezien we werken met een survey uitgevoerd door Dell zelf. De tweede basisassumptie stelt dat de steekproef homogeen moet zijn ten opzichte van de onderliggende factorstructuur. Wederom veronderstellen we dat deze voldaan.
Metrische data
De beschouwde variabelen zijn allen metrische variabelen, we mogen dus stellen dat het bepalen van correlaties geen probleem zal zijn.
Steefproefgrootte
Hair et al (2010) stelt voorop dat we minstens 50 observaties in de dataset moeten hebben eer een factoranalyse mag uitgevoerd worden. Alternatief kan er gekeken worden naar de ratio van obseraties per te analyseren variabele. Hierbij geldt er dan een minimum ratio van 5 observaties per te analyseren variabele, wenselijk is zelf om een verhouding 10:1 te hebben hiervoor. In ons geval voldoen we met 372 observaties ruimschoots aan beide eisen bij het analyseren van de dertien klantkenmerken (Pers01 tot en met Pers13) in een factoranalyse.
Analyse correlatiematrix
Vooraleer we overgaan tot de eigenlijke factoranalyse moeten we eerst nog de correlatiematrix analyseren om zeker te stellen dat de dataset voldoende correlaties bevat voor de verdere factoranalyse. Dit kan op drie manieren, met name een visuele inspectie, een control van Kaiser-Meyer-Olkin’s Measure of Sapmling Adequacy en het nagaan van Bartlett’s Test of Sphericity.
Visuele inspectie
Tabel 2.1 geeft de correlatiematrix weer. Bij een visuele inspectie gaan we na of de correlaties voldoende groot zijn en identificeren welke correlaties statistisch significant zijn. Zo zien we dat in 47 van de 78 gevallen de correlaties een waarde hoger dan 0,3 hebben. Verder geeft tabel 2.1 ook weer welke correlaties significant verschillen van nul, en dit op zowel het 1% significantieniveau, alsook op het 5%sn en op het 10%sn. Zo lijkt de data op het eerste zicht al vrij geschikt voor een factoranalyse.

Tabel 2.1 Correlation matrix with significance levels
Kaiser-Meyer-Olkin (KMO)
Tabel 2.2 geeft de KMO waarde weer. Kaiser-Meyer-Olkin’s Measure of Sampling Adequacy test wat de graad van intercorrelatie tussen de variabelen is. Een minmale waarde van 0,50 wordt als maatstaf vooropgesteld vooraleer een factoranalyse uitgevoerd mag worden. Met een KMO van 0,857 kunnen we stellen dat er een Meritorious degree of common variance is. Dankzij deze verdienstelijke graad van gemeenschappelijke variantie wordt bevestigd dat deze dataset zich goed schikt tot een factoranalyse.

Tabel 2.2 KMO & Bartlett’s test of sphericity
Bartlett’s test of sphericity
Tabel 2.2 geeft eveneens Bartlett’s Test of Sphericity weer. Deze test zal aantonen of in de correlatiematrix voldoende statistische significantie aanwezig is tussen ten minste enkele van de variabelen. De nulhypothese hierbij stelt dat de correlatiematrix gelijk is aan de eenheidsmatrix (H0:R=I). Om een factoranalyse te kunnen uitvoeren moet dit juist verschillen van elkaar (Ha:R≠I) en moeten we dus de nulhypothese kunnen verwerpen. In dit geval zien we dat de chi-kwadraat groot is en duidelijk significant is op het 1%significantieniveau met een p-waarde gelijk aan 0,000. Hierdoor mogen we de nulhypothese verwerpen en een factoranalyse uitvoeren.
Conclusie op basis van deze 3 analyses van de correlatiematrix is dat de data geschikt is om er zonder probleem een factoranalyse op te mogen uitvoeren.
MSA per variable
Tabel 2.3 geeft de anit-image correlatie matrix weer. Hiermee kunnen we de measurement of sampling adequacy (MSA) per variable nagaan. Hoe dichter tegen een waarde 1 aan, hoe meer correlatie tussen de variabelen. Verder moeten deze eveneens minstens groter zijn dan de kritieke waarde van 0,50 en zijn ze terug te vinden op de diagonaal van de anti-image correlation matrix. Hier zien we dat enkel de MSA van Pers07 de kritieke waarde niet haalt. Zo kan men overwegen op basis hiervan deze variablen uit de verdere analyse te laten, echter zou het foutief deze te schrappen enkel omwillen van een minder goede individuele MSA.

Tabel 2.3 Anti-image matrix
Partiële correlaties
Tot slot neme we nog de partiële correlaties onder de loep. Deze vinden we ook terug in tabel 2.3. Ze geven de correlaties weer tussen twee variabelen, terwijl er voor de andere variabelen gecontroleerd wordt. We stellen dat onze partiële correlaties niet groter mogen zijn dan 0,70. Dit om te zorgen dat er geen enkel variabele is die de andere voorspelt. We zien dat de kritieke waarde van 0,70 nooit wordt overschreden in de anti-image correlation matrix.

Conslusie
We kunnen concluderen dat onze dataset geschikt is voor factoranalyse en dus gaan we vervolgens de principal component methode toepassen.

Hoeveel factoren zijn er volgens de analyse?
Één van de belangerijkste onderdelen in de factoranalyse is het bepalen van het aantal af te leiden factoren. Hiervoor kunnen we gebruik maken van een reeks verschillende criteria. Wij gaan nu volgende drie criteria in rekening brengen: het latent root criterion, de scree test en Horn’s parallel test.
Latent root criterion
De eerste manier om het aantal factoren te bepalen is om naar de eigenwaarde van de verschillende variabelen te kijken. Wanneer deze groter is dan 1 kan de factor de variantie van minstens één variabele verklaren. Het is dan ook ons streefdoel enkel factoren te nemen die aan deze minimumvereiste voldoen. Hiervoor kunnen we kijken naar Tabel 2.4. Hier zien we dat er vier eigenwaardes groter dan 1 zijn en we dus op basis van het latent root criterium voor 4 factoren zouden kiezen. Deze vier verklaren samen 75,881% van de totale variantie.
Indien de vijfde eigenwaarde nog dicht tegen 1 aan zou zitten kunnen we eventueel een totaal van 5 factoren overwegen, doch met een vijfde eigenwaarde van 0,785 verwerpen we deze mogelijkheid, ook al zou de stijging in het verklarend vermogen 6,039% zijn.

Tabel 2.4 Total variance explained
Scree test
Een tweede manier om het aantal factoren te bepalen is door naar de scree plot te kijken. Deze vinden we terug op Figuur 2.1 en geeft aan de hand van een knikpunt visueel weer hoeveel factoren er kunnen zijn vooraleer de hoeveelheid unieke variantie de common variance structure begint te overheersen. Wanneer we de gemiddelde stijging in verklarend vermogen nagaan komen we uit op een gemiddelde stijging van 7.69%. Het opnemen van een vierde factor helpt 7,739% meer verklaren, terwijl een vijfde factor nog maar 6,039% meer verklaring zou toevoegen. Volgens Hair et al (2010) moeten we het knikpunt zelf nemen en vinden we dan wederom 4 factoren als oplossing terug.

Figuur 2.1 Scree plot
Horn’s parallel test
De derde manier om het aantal factoren te bepalen is door Horn’s parallel test uit te voeren. Deze is minder subjectief dan de voorgaande twee manieren. De test verondersteld dat een bijkomende factor wordt afgeleid indien de eigenwaarde van deze factor beter is dan de eigenwaarde gegenereerd op basis van random data. Op Figuur X zijn de resltaten hiervan zichtbaar. Hier zien we dat onze werkelijke eigenwaarden slechts tot 3 factoren groter is dan die van random gegenereerde data.

Figuur 2.2 Horn’s parallel test

Besluit
We besluiten om voor zowel 3 als voor 4 factoren onze verdere analyse na te gaan en op deze manier rekening te houden met alle 3 de testen.

Interpretatie van deze factoren
Zoals eerder gezegd gaan we hier kijken naar de optie van 3 factoren en de optie van 4 factoren.
3 factoren
Tabel 2.5 geeft ons de Rotated Component Matrix weer van 3 factoren die we volgens Horn’s parallel test zouden moeten overwegen. Hierop vinden we alle factorladingen, waarbij crossladingen vermeden worden. Deze factorladingen geven de correlaties tussen de variabele en de betreffende factor weer en helpen ons bij de benoeming van de factoren.

Tabel2.5 * Factor 1: Innoverend persoon die graag zijn kennis ter zake met anderen deelt
De eerste factor bevat volgende klantkenmerken: Pers01 | I like introducing new brands and products to my friends. | Pers02 | I like helping people by providing them with information about many kinds of products. | Pers03 | People ask me for information about products, places to shop, or sales. | Pers04 | My friends think of me as a good source of information when it comes to new products or sales. | Pers05 | I like to take a chance. | Pers08 | I like to try new and different things. | Pers09 | I often try new brands before my friends and neighbors do. | Pers10 | I like to experiment with new ways of doing things. |

De aanwezige variabelen hebben te maken met innovatief zijn en in zekere mate ook hoe uw kennis over de technologie ertoe leidt dat u een bron van informatie bent voor vrienden en familie. * Factor 2: Gevestigde waarde die de voor- en nadelen van computerproducten kent
De tweede factor bevat volgende klantkenmerken: Pers11 | When it comes to computer-related products, my friends are very likely to ask my opinion. | Pers12 | I am often used as a source of advice about computer-related products by friends and neighbors. | Pers13 | I often tell my friends what I think about computer-related products. |

De aanwezige variabelen hebben te maken met de kennis die u bezit en hoe u deze kennis gebruikt om vrienden en familie in te lichten over de voor- en nadelen van bepaalde producten. * Factor 3: Marktvolgers
De derde factor bevat volgende klantkenmerken: Pers06 | Buying a new product that has not yet been proven is usually a waste of time and money. | Pers07 | If people would quit wasting their time experimenting, we would get a lot more accomplished. |

De aanwezige variabelen hebben een te maken met het type klant dat liever afwacht tot een product of technologie al wat verder gevorderd is in zijn ontwikkeling eer zich er naar toe te begeven.
4 factoren
Tabel X geeft ons de Rotated Component Matrix weer van 4 factoren die we volgens het latent root criterion en de scree test zouden vormen.

Tabel 2.6 * Factor 1: Trendsetter en informatiebron over nieuwe merken
De eerste factor bevat volgende klantkenmerken: Pers01 | I like introducing new brands and products to my friends. | Pers02 | I like helping people by providing them with information about many kinds of products. | Pers03 | People ask me for information about products, places to shop, or sales. | Pers04 | My friends think of me as a good source of information when it comes to new products or sales. |

De aanwezige variabelen hebben te maken met hoe uw kennis over de technologie ertoe leidt dat u een bron van informatie bent voor vrienden en familie. * Factor 2: Innovators en early adopters
De tweede factor bevat volgende klantkenmerken: Pers05 | I like to take a chance. | Pers08 | I like to try new and different things. | Pers09 | I often try new brands before my friends and neighbors do. | Pers10 | I like to experiment with new ways of doing things. |

De aanwezige variabelen hebben te maken met innovatief zijn, of men graag nieuwe producten uitprobeert vooraleer de meerderheid van de mensen dit doet. Stemt heel sterk overeen met de innovators en early adopters van de productlevenscyclus. * Factor 3: Informatiebron over computer gerelateerde producten
De derde factor bevat volgende klantkenmerken: Pers11 | When it comes to computer-related products, my friends are very likely to ask my opinion. | Pers12 | I am often used as a source of advice about computer-related products by friends and neighbors. | Pers13 | I often tell my friends what I think about computer-related products. |

De aanwezige variabelen hebben te maken met de kennis die u bezit en hoe u deze kennis gebruikt om vrienden en familie in te lichten over de voor- en nadelen van bepaalde producten. * Factor 4: Late majority en laggards
De vierde factor bevat volgende klantkenmerken: Pers06 | Buying a new product that has not yet been proven is usually a waste of time and money. | Pers07 | If people would quit wasting their time experimenting, we would get a lot more accomplished. |

De aanwezige variabelen hebben te maken het type klant dat liever afwacht tot een product of technologie al wat verder gevorderd is in zijn ontwikkeling eer zich er naar toe te begeven. Stemt heel sterk overeen met de late majority en laggards uit de productlevenscyclus.

Conclusie
Factor 2 en 3 van de 3-factor analyse (A) stemmen overeen met factor 3 en 4 van de 4-factor analyse (B). Met andere woorden, factor 1 van analyse A is een samenvoeging van factor 1 en 2 van analyse B. Echter zien we dat de factorladingen door het samenvoegen er op achteruit gaan. Daarom kiezen we er voor om toch maar met de 4 factoroplossing verder te werken bij volgende vraag.

Zijn de factoren goede voorspellers van de waarschijnlijkheid of ze het aanschaffen van een Dell aanbevelen bij familie, vrienden en kennissen (WOM)? Wat zijn de praktische implicaties die volgen uit deze analyse?

Na gekozen te hebben voor 4 factoren voor de definitieve factoranalyse hebben we de resulterende factor scores opgeslagen als variabele in de dataset. Hiermee gaan we nu nog een laatste test uitvoeren.
We willen we nagaan of de uiteindelijke factoren goede voorspellers zijn voor de waarschijnlijkheid of men het aanschaffen van een Dell zou aanbevelen bij familie, vrienden en kennissen. Deze variabele is in de dataset gekend als WOM, word-of mouth.
Hiervoor gaan we een regressieanalyse uitvoeren met WOM als afhankelijke variabele en de 4 factoren als afhankelijke variabelen. De resultaten van deze regressie vinden we terug in tabel 2.7.

Tabel 2.7
Daaruit blijkt volgende regressiefunctie:
WOM=1,736-0,063*Factor1+0,017*Factor2+0,030*Factor3-0,067*Factor4
Echter zien we in tabel 2.7 ook dat de t-waardes te klein zijn en de coëfficiënten niet significant verschillen van nul. Daarom kunnen we stellen dat de factoren 1 tot en met 4 slechte voorspellers zijn voor de variabele WOM.
Wel zijn we benieuwd wat het zou geven indien we toch onze 3 factoroplossing opgeslagen zouden hebben en daar de regressie mee zouden uitvoeren. Het resultaat ervan staat in tabel 2.8

Tabel2.8
Deze regressiefunctie zou er dan als volgt uit zien:
WOM=1,736-0,021*Factor1+0,016*Factor2-0,094*Factor3
Hierbij zien we echter dat de t-waardes nog steeds laag zijn en enkel factor 3 significant is op het 5% significantieniveau met een p-waarde van 0,033. Maar over het algemeen zijn deze drie factoren dus nog steeds slechte voorspellers.

Opdracht 3: Keuzes, keuzes, keuzes
Veel relevante marketing maatstaven worden dichotoom gemeten (bijv. koop je een product of niet). Als je deze non-metrische maatstaven vervolgens wil relateren aan een set van voorspellende variabelen dien je gebruik te maken van analyse technieken als discriminant analyse of aanverwante methoden. Dell is geïnteresseerd in de vraag welke product- en dienstkenmerken de keuze om opnieuw een Dell aan te schaffen het meest beïnvloeden. Hiertoe is het volgende gemeten.
De variabele CHOICE meet de of de klant opnieuw voor een Dell zou kiezen
De variabelen Dell01-Dell13 meet de klantpercepties met betrekking verschillende product en dienstkenmerken van Dell a) Voer een discriminant analyse uit om de vraag die centraal staat in deze opdracht te beantwoorden. Wat zijn de voornaamste bevindingen en implicaties? b) Een bijkomende vraag is of de keuze om opnieuw een Dell aan te schaffen naast de hierboven geanalyseerde kenmerken ook beïnvloed wordt door het geslacht (GENDER) en de leeftijd (AGE) (jong versus oud) van de klant. Voer een nieuwe analyse om deze vraag te beantwoorden. Wat zijn de voornaamste bevindingen en implicaties?

Discriminant analyse
Voor we van start gaan met de analyse gaan we na of de dataset voldoet aan de basisassumpties van discriminant analyse.
Normaliteitvereiste
De eerste basisassumptie is de normaliteitsvereiste. Deze kunnen we echter achterwege laten aangezien de omvang van de steekproef 372 waarnemingen bedraagt. Dit overschrijdt het minimum van 200 waarnemingen om deze vereiste achterwege te kunnen laten. De steekproef is immers groot genoeg zodat een mogelijk vertekend effect van niet-normaal verdeelde data gereduceerd zou worden.
Box’s M Test
Bij de tweede basisassumptie gaan we na of de covariantiematrices van beide groepen significant verschillen van elkaar. Als ze niet significant verschillen van elkaar wordt er voldoen aan de basisassumptie. Bijgevolg zijn de nulhypothese en alternatieve hypothese de volgende:
H0: ∑yes = ∑no
Ha: ∑yes ≠ ∑no
Uit de resultaten de Box’s M test (tabel 3.1) blijkt dat de nulhypothese verworpen op het 1% significantieniveau. De p-waarde is 0,000 en dus significant. Er kan besloten worden dat er niet voldaan wordt aan de tweede basisassumptie. Om deze reden kiezen we om niet verder te gaan met discriminant analyse, maar over te schakelen naar een logistische regressie. We kiezen voor een logistische regressie omdat deze techniek minder strenge toepassingsvoorwaarden omvat.

Test results | | | Box’s M | | 63,474 | F | Approx. | 10,459 | | df 1 | 6 | | df 2 | 350607,315 | | Sig. | ,000 |
Tabel 3.1
Logistische regressie
Vooraleer we beginnen met de logistische regressie gaan we de individuele variabelen evalueren aan de hand van een ANOVA-test. Dit wil zeggen dat we voor elke variabele nagaan hoe goed ze verschillen van elkaar met betrekking tot de afhankelijke variabele CHOICE. In onderstaande tabel kunnen we zien dat de variabelen Dell07, 09, 10 en 11 niet significant zijn (Dell11 is wel nog significant op het 10% significantieniveau). Dit wil zeggen dat deze variabelen een weinig verklarende toegevoegde waarde zullen hebben. Aangezien logistische regressie geen basisassumpties heeft besluiten we om geen variabelen te verwijderen voordat we beginnen. We nemen de niet significante variabelen dus mee op in het model. We weten nu echter wel al dat de kans zeer klein is dat deze variabelen opgenomen zullen worden in de regressie. ANOVA | | Sum of Squares | df | Mean Square | F | Sig. | Dell01 | Between Groups | 59,086 | 1 | 59,086 | 29,066 | ,000 | Dell02 | Between Groups | 51,335 | 1 | 51,335 | 20,381 | ,000 | Dell03 | Between Groups | 128,270 | 1 | 128,270 | 40,778 | ,000 | Dell04 | Between Groups | 34,118 | 1 | 34,118 | 21,090 | ,000 | Dell05 | Between Groups | 27,926 | 1 | 27,926 | 8,008 | ,005 | Dell06 | Between Groups | 45,795 | 1 | 45,795 | 14,800 | ,000 | Dell07 | Between Groups | ,653 | 1 | ,653 | ,181 | ,671 | Dell08 | Between Groups | 47,613 | 1 | 47,613 | 18,376 | ,000 | Dell09 | Between Groups | 4,140 | 1 | 4,140 | ,407 | ,524 | Dell10 | Between Groups | 14,701 | 1 | 14,701 | 1,884 | ,171 | Dell11 | Between Groups | 22,968 | 1 | 22,968 | 3,754 | ,054 | Dell12 | Between Groups | 65,616 | 1 | 65,616 | 24,552 | ,000 | Dell13 | Between Groups | 29,660 | 1 | 29,660 | 18,181 | ,000 |
Tabel 3.2
De methode die we gebruiken bij de logistische regressie is de ‘forward stepwist (Wald) methode’. Bij deze stapsgewijze methode wordt aan de hand van de Wald coëfficiënt bepaald of een variabele wordt opgenomen in de regressie of niet. De afhankelijke variabele van deze logistische regressie is de variabele CHOICE. De variabele CHOICE is een binaire variabele die gaat over de keuze of de klant voor opnieuw voor een Dell Computer zou kiezen (zie tabel 3.4).

Case Processing Summary | Unweighted Casesa | N | Percent | Selected Cases | Included in Analysis | 329 | 88,4 | | Missing Cases | 43 | 11,6 | | Total | 372 | 100,0 | Unselected Cases | 0 | 0,0 | Total | 372 | 100,0 |
Tabel 3.3 Dependent Variable Encoding | Original Value | Internal Value | Definitely Choose | 0 | Less Likely to Choose | 1 |
Tabel 3.4
Block 0: Beginning Block
In Block 0 wordt het nulmodel bepaald van de logistische regressie. Dit wil zeggen dat er enkel een constante aanwezig is in het model. Dit brengt met zich mee dat het model alle observaties zal toedelen aan de grootste groep.
Uit de classificatietabel (tabel 3.4) kunnen we afleiden dat de grootste groep zou kiezen voor een Dell Computer. Maar liefst 215 van de 329 klanten kiezen opnieuw voor een Dell Computer, wat overeenkomt met 65,3%. Deze 65,3% is de Cmax die weergeeft hoe vaak we een observatie juist toewijzen als we alle observaties in de grootste groep plaatsen. Aan de hand van deze gegevens kunnen we de Odds ratio berekenen:
Odds ratio = PnoPyes = 0,3470,653 = 0,531
De waarde van deze Odds ratio valt ook af te lezen in tabel 3.5 bij Exp(B). Classification Table | Observed | Predicted | | Recoded Likelihood of Choosing | Percentage Correct | | Definitely Choose | Less Likely to Choose | | Step 0 | Recoded Likelihood of Choosing | Definitely Choose | 215 | 0 | 100,0 | | | Less Likely to Choose | 114 | 0 | 0,0 | | Overall Percentage | | | 65,3 |
Tabel 3.5 Variables in the Equation | | B | S.E. | Wald | df | Sig. | Exp(B) | Step 0 | Constant | -,634 | ,116 | 29,987 | 1 | ,000 | ,530 |
Tabel 3.6

In dit nulmodel zijn nog geen variabelen opgenomen in de regressie. Tabel 3.7 toont alle variabelen die zich niet in het model bevinden, en hun bijhorende score die gebaseerd is op de Wald coëfficiënt. De variabele met de hoogste score zal als eerste toegevoegd worden aan de regressie. Uit de tabel kunnen we afleiden dat de variabele Dell03 de hoogste score heeft en dus als eerste zal worden opgenomen in de logistische regressie. We zien dat de variabelen Dell07, 09, 10, 11 ,die niet significant waren bij de ANOVA-test, hier ook niet significant zijn en dus niet zullen worden opgenomen in de regressie. Variables not in the Equation | | Score | df | Sig. | Step 0 | Variables | Dell01 | 27,522 | 1 | ,000 | | | Dell02 | 17,330 | 1 | ,000 | | | Dell03 | 32,637 | 1 | ,000 | | | Dell04 | 19,551 | 1 | ,000 | | | Dell05 | 6,406 | 1 | ,011 | | | Dell06 | 12,782 | 1 | ,000 | | | Dell07 | 1,247 | 1 | ,264 | | | Dell08 | 19,184 | 1 | ,000 | | | Dell09 | ,000 | 1 | ,990 | | | Dell10 | 1,180 | 1 | ,277 | | | Dell11 | 3,331 | 1 | ,068 | | | Dell12 | 21,636 | 1 | ,000 | | | Dell13 | 16,792 | 1 | ,000 | | Overall Statistics | 53,936 | 13 | ,000 |
Tabel 3.7
Block 1: Method= Forward Stepwise (Wald)
Testen van de kwaliteit van de regressie
Voor we verder gaan met de interpretatie van de logistische regressie gaan we de kwaliteit van de regressie na aan de hand van enkele maatstaven.

Model Summary | Step | -2 Log likelihood | Cox & Snell R Square | Nagelkerke R Square | 1 | 392,038 | ,094 | ,130 | 2 | 381,542 | ,123 | ,169 | 3 | 376,919 | ,135 | ,186 |
Tabel 3.8
- 2 Log likelihood
De -2LL is een maatstaf die bepaalt hoe goed de ‘fit’ is van een model. Hoe dichter bij de nul de waarde van de -2LL is, hoe beter het model is. In tabel 3.8 ziet men dat deze maatstaf daalt bij elke stap, wat wijst op een verbetering van het model. De grote waarde van de -2LL, die nog steeds 376,919 bij stap drie bedraagt, toont aan dat het model echter wel van lage kwaliteit is.
Pseudo R²
Deze maatstaf beschrijft de hoeveelheid variantie die verklaard kan worden door het opgestelde model. De waarde van de maatstaf varieert tussen 0 en 1. Hoe hoger de waarde, hoe beter het model. Als we naar de waarden van de Cox & Snell R² en de Nagelkerke R² kijken in tabel 3.8 moeten we vaststellen dat de R² stijgt bij elke stap, maar zich dicht bij nul bevindt. Dit bevestigt ons bevindingen van de vorige maatstaf waardoor we opnieuw moeten vaststellen dat het model van lage kwaliteit is.
Chi-kwadraat
De Chi-kwadraat van het model geeft het verschil in de -2LL aan tussen het nulmodel (Block 0) en de volgende stappen. In tabel 3.9 ziet men dat van het nulmodel over te gaan naar stap 1 gepaard gaat met een daling in de -2LL met 32,541. Als we naar stap 2 overgaan, zien we een daling van 10,496 in de -2LL ten opzichte van stap 1, en een daling van 43,036 ten opzichte van het nulmodel. Op dezelfde manier zien we dat de overgang van stap 2 naar stap 3 een daling van 4,623 in de -2LL teweegbrengt. We merken hierbij op dat dit verschil enkel significant is op het 5%, maar niet op het 1% significantieniveau. Het verschil in de -2LL tussen stap en het beginmodel bedraagt 47,659.

Omnibus Tests of Model Coefficients | | Chi-square | df | Sig. | Step 1 | Step | 32,541 | 1 | ,000 | | Block | 32,541 | 1 | ,000 | | Model | 32,541 | 1 | ,000 | Step 2 | Step | 10,496 | 1 | ,001 | | Block | 43,036 | 2 | ,000 | | Model | 43,036 | 2 | ,000 | Step 3 | Step | 4,623 | 1 | ,032 | | Block | 47,659 | 3 | ,000 | | Model | 47,659 | 3 | ,000 |
Tabel 3.9
Een andere manier om het model te evalueren aan de hand van de Chi-kwadraat is de likelihood ratio test. Bij deze test wordt nagegaan of het model in zijn geheel significant is. Met andere woorden gaan we testen of de coëfficiënten van de variabelen in de regressie significant verschillen van nul:

H0: βDell03βDell13βDell08 = 0
Ha: Minstens één van de β’s is niet gelijk aan nul
Om na te gaan of we nulhypothese kunnen verwerpen kijken we naar de Chi-kwadraat waarde voor het model. We zien in tabel 3.9 dat voor alle drie de stappen de nulhypothese wordt verworpen op het 1% significantieniveau. We kunnen dus aan de hand van deze test besluiten dat de coëfficiënten van de opgenomen variabelen verschillen van nul. Aan de hand hiervan besluiten we dat het model in zijn geheel statistisch significant is.
Classificatie
Classification Table | Observed | Predicted | | Recoded Likelihood of Choosing | Percentage Correct | | Definitely Choose | Less Likely to Choose | | Step 1 | Recoded Likelihood of Choosing | Definitely Choose | 205 | 10 | 95,3 | | | Less Likely to Choose | 90 | 24 | 21,1 | | Overall Percentage | | | 69,6 | Step 2 | Recoded Likelihood of Choosing | Definitely Choose | 195 | 20 | 90,7 | | | Less Likely to Choose | 73 | 41 | 36,0 | | Overall Percentage | | | 71,7 | Step 3 | Recoded Likelihood of Choosing | Definitely Choose | 198 | 17 | 92,1 | | | Less Likely to Choose | 77 | 37 | 32,5 | | Overall Percentage | | | 71,4 |
Tabel 3.9
De classificatietabel bevat informatie over hoe goed het model de werkelijkheid voorspelt. Als we naar stap 1 kijken zien we dat 114 (= 90 + 24) deelnemers minder geneigd waren om een Dell Computer aan te kopen. We kunnen dus vaststellen dat stap 1 van het model hier slecht 21,1% (=24/114) correct voorspelt. Van de 215 (= 205 + 10) respondenten die wel een Dell Computer wouden kopen worden er 95,3% (=205/215) correct toegewezen. In het totaal zijn de voorspellingen van het model voor 69,6% [=(24 +205)/329)] van alle gevallen juist. Dezelfde interpretatie geldt voor stap 2 en stap 3. Als we deze laatste twee stappen bekijken zien we dat het percentage van het aantal correcte toewijzingen daalt van stap 2 naar stap 3. Dit valt waarschijnlijk te verklaren door de interactie tussen de variabelen.
De volgende stap bij de interpretatie van de classificatietabel is het nulmodel vergelijken met het model dat gegenereerd werd door de regressie. In het nulmodel bleek dat 65,3% van alle respondenten correct werd toegewezen (tabel 3.5). We vergelijken deze kans op een correcte toewijzing met de kans op een correcte toewijzing van elke stap uit het model. * Stap 1: We berekenen de R²Adjusted Count = [(205+24) – 215] / 329 = 0,0425. We kunnen hieruit besluiten dat het model in stap 1 de voorspellingsfout met 4,25% vermindert ten opzichte van het nulmodel. * Stap 2: We berekenen de R²Adjusted Count = [(195+41) – 215] / 329 = 0,0638. We kunnen hieruit besluiten dat het model in stap 2 de voorspellingsfout met 6,38% vermindert ten opzichte van het nulmodel. * Stap 3: We berekenen de R²Adjusted Count = [(198+37) – 215] / 329 = 0,0608. We kunnen hieruit besluiten dat het model in stap 2 de voorspellingsfout met 6,08% vermindert ten opzichte van het nulmodel.
Uit deze vergelijkingen met nulmodel kunnen we opnieuw besluiten dat het model in stap 2 een groter percentage correcte toewijzingen teweeg brengt dan het model in stap 3. Om deze reden gaan we de verdere interpretatie opdelen in twee delen. We gaan het model met twee stappen en het model met drie stappen evalueren.
Het model in stap 2
Om het classificatievermogen van het model te testen moeten we proportioneel kanscriterium berekenen. Dit proportioneel kanscriterium geeft het percentage weer van hoeveel toewijzingen correct gebeuren op basis van toeval.
Cprop= 195+73329* 195+20329+ 41+20329* 41+73329 = 0,532 + 0,064 = 59,6%
Aan de hand van de waarde van het proportioneel kanscriterium gaan we testen of het model in stap 2 beter is dan een toewijzing op basis van toeval. De hypotheses bij deze test zijn de volgende:
H0: q = 0,596
Ha: q > 0,596
Als de nulhypothese verworpen wordt kunnen we besluiten dat het model een betere voorspelling geeft dan het toeval. We berekenen de Z-waarde om te kijken of we de nulhypothese kunnen verwerpen of niet: Z-waarde = 0,717-0,5960,596*(1-0,596)329 = 4,47
De Z-waarde is groter dan 2,33 wat wel zeggen dat de nulhypothese verworpen wordt op het 1% significantieniveau. Hieruit besluiten we dus dat het model in stap 2 statistisch significant beter is dan een toewijzing die gebeurt aan de hand van het toeval.
Om zeker te zijn gaan we hetzelfde testen, maar deze keer aan de hand van het maximum kanscriterium. De Cmax in het nulmodel bedraagt 65,3% (tabel 3.4). Dit zorgt voor de volgende hypothesen:
H0: q = 0,653
Ha: q > 0,653 Z-waarde = 0,717-0,6530,653*(1-0,653)329 = 2,44
We kunnen vaststellen dat de nulhypothese ook verworpen wordt als we de test doen aan de hand van maximum kanscriterium. De Z-waarde van 2,44 is groter dan 2,33 wat wil zeggen dat de nulhypothese op het 1% significantieniveau wordt verworpen. We besluiten dat het model in stap 2 statistisch significant beter is dan de toewijzing die gebeurt aan de hand van alle observaties aan de grootste groep toe te wijzen.
Het model in stap 3
We gaan nu ook het classificatievermogen van het model in stap 3 na. We volgen dezelfde methodes die werden toegepast bij de evaluatie van het model in stap 2.
Cprop = 198+77329* 198+17329+ 37+17329* 37+77329 = 0,546 + 0,057 = 0,6029 = 60,29%
H0: q = 0,6029
Ha: q > 0,6029
Z-waarde = 0,714-0,60290,6029*(1-0,6029)329 = 4,11 ( >2,33)
We kunnen vaststellen dat op basis van het proportioneel kanscriterium de nulhypothese wordt verworpen op het 1% significantieniveau. Dit wil zeggen dat het model in stap 3 statistisch significant beter is dan een toewijzing die gebeurt aan de hand van het toeval. We testen vervolgens ook het classificatievermogen van het model in stap 3 aan de hand van maximum kanscriterium:

Cmax = 65,3%
H0: q= 0,653
Ha: q > 0,653
Z-waarde = 0,714-0,6530,653*(1-0,653)329 = 2,32
We kunnen besluiten dat we de nulhypothese niet kunnen verwerpen op het 1% significantieniveau aangezien de Z-waarde kleiner is dan de kritische waarde voor het 1% significantieniveau, die 2,33 bedraagt. De nulhypothese kan echter wel verworpen worden op het 5% significantieniveau aangezien de Z-waarde groter is dan 1,645. Het model in stap 3 is dus enkel statistisch significant beter op het 5% significantieniveau dan een toewijzing die gebeurt aan de hand van een observatie aan de grootste groep toe te wijzen.
Hosmer en Lemeshow Goodness-of-Fit Test
Om zeker te zijn testen we de voorspellingskwaliteit van het model ook aan de hand van een Hosmer en Lemeshow Goodness-of-Fit Test. Deze test deelt de steekproef op in tien gelijke groepen. Met behulp van de Chi-kwadraat test wordt er nagegaan of er een significant verschil bestaat tussen de waargenomen en de verwachte frequenties binnen de groepen. De nulhypothese van de test stelt dat er geen significante verschillen bestaan tussen de geobserveerde en voorspelde frequenties. Doordat deze test de steekproef opdeelt in groepen moeten we voldoende observaties hebben om deze test toe te passen. Het minimum van vijf waarden per groep wordt bij deze steekproef ruimschoots overschreden aangezien er 329 observaties zijn opgenomen in de regressie. In tabel 3.11 zien we dat stap 2 de hoogste Chi-kwadraat waarde heeft. Dit wijst erop dat stap 2 van het model de beste fit heeft. Dit staaft onze bevindingen uit de vorige testen van het classificatievermogen van het model. Hosmer and Lemeshow Test | Step | Chi-square | df | Sig. | 1 | 1,678 | 4 | ,795 | 2 | 9,047 | 7 | ,249 | 3 | 6,034 | 8 | ,643 |
Tabel 3.11 Contingency Table for Hosmer and Lemeshow Test | | Recoded Likelihood of Choosing = Definitely Choose | Recoded Likelihood of Choosing = Less Likely to Choose | Total | | Observed | Expected | Observed | Expected | | Step 1 | 1 | 62 | 62,287 | 15 | 14,713 | 77 | | 2 | 47 | 45,568 | 14 | 15,432 | 61 | | 3 | 54 | 55,872 | 29 | 27,128 | 83 | | 4 | 21 | 22,404 | 17 | 15,596 | 38 | | 5 | 21 | 18,018 | 15 | 17,982 | 36 | | 6 | 10 | 10,852 | 24 | 23,148 | 34 | Step 2 | 1 | 42 | 44,524 | 11 | 8,476 | 53 | | 2 | 38 | 38,683 | 11 | 10,317 | 49 | | 3 | 20 | 16,098 | 2 | 5,902 | 22 | | 4 | 32 | 30,546 | 10 | 11,454 | 42 | | 5 | 20 | 21,105 | 12 | 10,895 | 32 | | 6 | 18 | 19,846 | 13 | 11,154 | 31 | | 7 | 24 | 20,794 | 12 | 15,206 | 36 | | 8 | 11 | 15,083 | 22 | 17,917 | 33 | | 9 | 10 | 8,321 | 21 | 22,679 | 31 | Step 3 | 1 | 31 | 30,018 | 4 | 4,982 | 35 | | 2 | 23 | 23,874 | 6 | 5,126 | 29 | | 3 | 29 | 26,838 | 5 | 7,162 | 34 | | 4 | 24 | 26,262 | 11 | 8,738 | 35 | | 5 | 26 | 22,799 | 6 | 9,201 | 32 | | 6 | 22 | 24,878 | 15 | 12,122 | 37 | | 7 | 20 | 21,379 | 14 | 12,621 | 34 | | 8 | 20 | 18,261 | 13 | 14,739 | 33 | | 9 | 13 | 14,964 | 20 | 18,036 | 33 | | 10 | 7 | 5,727 | 20 | 21,273 | 27 |
Tabel 3.12

Interpretatie van de variabelen in de regressie

Variables not in the Equation | | Score | df | Sig. | Step 1 | Variables | Dell01 | 8,004 | 1 | ,005 | | | Dell02 | 2,079 | 1 | ,149 | | | Dell04 | 3,424 | 1 | ,064 | | | Dell05 | ,060 | 1 | ,806 | | | Dell06 | 3,389 | 1 | ,066 | | | Dell07 | ,129 | 1 | ,720 | | | Dell08 | 4,883 | 1 | ,027 | | | Dell09 | ,635 | 1 | ,426 | | | Dell10 | ,035 | 1 | ,851 | | | Dell11 | ,608 | 1 | ,436 | | | Dell12 | 4,890 | 1 | ,027 | | | Dell13 | 10,261 | 1 | ,001 | | Overall Statistics | 23,144 | 12 | ,027 | Step 2 | Variables | Dell01 | 3,872 | 1 | ,049 | | | Dell02 | ,617 | 1 | ,432 | | | Dell04 | ,941 | 1 | ,332 | | | Dell05 | ,028 | 1 | ,867 | | | Dell06 | 1,693 | 1 | ,193 | | | Dell07 | ,000 | 1 | ,996 | | | Dell08 | 4,700 | 1 | ,030 | | | Dell09 | 1,540 | 1 | ,215 | | | Dell10 | ,035 | 1 | ,852 | | | Dell11 | ,393 | 1 | ,530 | | | Dell12 | 3,062 | 1 | ,080 | | Overall Statistics | 13,907 | 11 | ,238 | Step 3 | Variables | Dell01 | 2,202 | 1 | ,138 | | | Dell02 | ,049 | 1 | ,825 | | | Dell04 | ,204 | 1 | ,652 | | | Dell05 | 1,253 | 1 | ,263 | | | Dell06 | ,284 | 1 | ,594 | | | Dell07 | ,320 | 1 | ,571 | | | Dell09 | 2,742 | 1 | ,098 | | | Dell10 | ,798 | 1 | ,372 | | | Dell11 | ,000 | 1 | ,999 | | | Dell12 | ,892 | 1 | ,345 | | Overall Statistics | 9,428 | 10 | ,492 |
Tabel 3.13
We beginnen de interpretatie van de variabelen met te kijken naar de variabelen die niet zijn opgenomen in de regressie. In stap 0 waren er acht variabelen die significant waren (tabel 3.7). In stap 1 kunnen we vaststellen dat er nog maar 4 variabelen significant zijn na het opnemen van Dell03 in de regressie. We kunnen dit verklaren aan de hand van multicollineariteit. Dit wil zeggen dat deze variabelen een hoge correlatie hebben met Dell03.
Verder zien we in stap 1 dat de variabele Dell13 de hoogste score, op basis van de Wald coëfficiënt, heeft en significant is, dus wordt deze variabele opgenomen in de regressie. In stap 2 zijn er nog maar twee variabelen significant. Aangezien de variabele Dell08 de hoogste Wald coëfficiënt heeft wordt deze opgenomen in het model. In stap 3 zien we dat geen enkele variabele nog significant is dus worden er geen variabelen meer opgenomen in de regressie.
Vervolgens kunnen we overgaan naar de interpretatie van de variabelen die zijn opgenomen in de regressie. We interpreteren deze variabelen aan de hand van de waarde van Exp(B) die we terugvinden in tabel 3.14. Tijdens het evalueren van het classificatievermogen zijn we tot de conclusie gekomen dat stap 2 van het model een betere voorspelling geeft dan het model in stap 3. Om deze reden splitsen we de interpretatie van de variabelen opnieuw op.

Variables in the Equation | | B | S.E. | Wald | df | Sig. | Exp(B) | Step 1 | Dell03 | -,360 | ,067 | 28,807 | 1 | ,000 | ,697 | | Constant | 1,799 | ,465 | 14,958 | 1 | ,000 | 6,046 | Step 2 | Dell03 | -,339 | ,069 | 24,268 | 1 | ,000 | ,713 | | Dell13 | -,324 | ,103 | 9,800 | 1 | ,002 | ,723 | | Constant | 4,307 | ,969 | 19,770 | 1 | ,000 | 74,192 | Step 3 | Dell03 | -,281 | ,075 | 14,207 | 1 | ,000 | ,755 | | Dell08 | -,176 | ,082 | 4,589 | 1 | ,032 | ,839 | | Dell13 | -,325 | ,105 | 9,615 | 1 | ,002 | ,723 | | Constant | 5,237 | 1,088 | 23,190 | 1 | ,000 | 188,162 |
Tabel 3.14
Het model in stap 2
Dell03
Indien de waarde van de variabele Dell03 stijgt met één eenheid zal de kans tot het opnieuw aankopen van een Dell computer veranderen met Pno/Pyes*0,713. Dit wil zeggen dat de kans tot niet opnieuw aankopen ten opzichte van een Dell computer opnieuw aankopen verkleind wordt met de 0,713. De variabele Dell03 is het antwoord op de vraag ‘Dell Computers delivers its products quickly?’. We kunnen dus vaststellen dat indien de variabele Dell03 met één eenheid stijgt, de kans op een aankoop ten opzichte van geen aankoop verhoogd met: PyesPno * 10,713= PyesPno *1,403.
We kunnen vaststellen dat de leveringssnelheid van Dell een positief effect heeft op de kans tot een aankoop van een Dell computer. Hoe sneller de consument van dat het product geleverd wordt, hoe hoger de kans tot opnieuw een aankoop wordt.
Dell13
De variabele Dell13 heeft in de tweede stap van de logistische regressie een Exp(B) van 0,723. Dit wil zeggen dat als de waarde van de variabele Dell13 stijgt met één eenheid de volgende kansverandering te weeg brengt: Pno/Pyes*0,723. De waarde van de variabele Dell13 hangt af van het feit of er gemakkelijk toegankelijke technische steun bestaat voor Dell computers. Indien de waarde van Dell13 stijgt met één eenheid zal de kans dat men kiest voor het opnieuw aankopen van een Dell Computer ten opzichte van dat men niet kiest voor een wederaankoop verhoogd worden met: PyesPno * 10,723= PyesPno * 1,383.
We kunnen dus besluiten dat hoe makkelijker de toegang is tot technische steun, hoe hoger de kans is dat de respondent opnieuw een Dell Computer zou aankopen.
Het model in stap 3
Dell03
De interpretatie van deze variabelen is hetzelfde als in het model in stap 2. De waarde van Exp(B) bedraagt in deze stap van het model 0,755. We kunnen dus vaststellen dat indien de variabele Dell03 met één eenheid stijgt, de kans op een wederaankoop ten opzichte van geen wederaankoop verhoogd met: PyesPno * 10,755= PyesPno *1,325.
Dit bevestigt het besluit dat de leveringssnelheid van Dell een positief effect heeft op de kans tot opnieuw een aankoop van een Dell computer.
Dell 08
De variabele Dell08 heeft in de derde stap van de logistische regressie een Exp(B) van 0,839. Dit wil zeggen dat als de waarde van de variabele Dell08 stijgt met één eenheid het volgende effect heeft: Pno/Pyes*0,839. De waarde van de variabele Dell08 wordt bepaald door de kwaliteit van de randapparatuur van Dell computers. Indien de waarde van Dell08 stijgt met één eenheid zal de kans dat men opnieuw kiest voor het aankopen van een Dell Computer ten opzichte van dat men niet kiest voor een wederaankoop verhoogd worden met: PyesPno * 10,839= PyesPno * 1,192.
Hieruit kunnen we besluiten dat de kwaliteit van de randapparatuur van Dell Computers de kans dat men opnieuw kiest voor de aankoop van een Dell Computer laat verhogen.
Dell13
De variabele Dell13 is reeds besproken bij het model in stap 2 en heeft in het model in stap 3 exact dezelfde waarde voor Exp(B). We kunnen dus besluiten dat het effect van de variabele Dell13 hetzelfde is voor het model in stap 2 en het model in stap 3.
Is stap 2 beter dan stap 3?
Uit de verschillende testen die we reeds hebben gedaan blijkt telkens dat het model in stap 2 beter is dan het model in stap 3. Om deze reden gaan we testen of het model in stap 2 werkelijk significant beter is dan het model in stap 3. In stap 3 worden 71,4% van alle gevallen juist toegewezen. In stap 2 worden 71,7% van alle gevallen juist toegewezen. Aan de hand van de waarde van het minder goede model stellen we de nulhypothese op:
H0: q = 0,714
Ha: q > 0,714
Indien de nulhypothese verworpen wordt kunnen we vaststellen dat het model in stap 2 significant beter is dan het model in stap 3. We berekenen de bijhorende Z-waarde om na te gaan of we deze nulhypothese kunnen verwerpen.
Z-waarde = 0,717-0,7140,714*(1-0,714)329 = 0,12
De zeer kleine Z-waarde leert ons dat we de nulhypothese niet kunnen verwerpen. We kunnen dus besluiten dat het model in stap 2 niet significant beter is dan het model in stap 3.

Logistische regressie vraag b

We gaan na of de variabele CHOICE wordt beïnvloed door het geslacht (variabele GENDER) en de leeftijd (AGE) van de klant. We doen dit door deze twee variabelen mee op te nemen in de logistische regressie. Voor we overgaan naar de werkelijke regressie kunnen we al vaststellen dat het opnemen van deze twee variabelen geen effect heeft gehad op het aantal opgenomen observaties in de regressie. We zien tabel 3.15 identiek is aan tabel 3.3 uit de vorige regressie. Case Processing Summary | Unweighted Casesa | N | Percent | Selected Cases | Included in Analysis | 329 | 88,4 | | Missing Cases | 43 | 11,6 | | Total | 372 | 100,0 | Unselected Cases | 0 | 0,0 | Total | 372 | 100,0 |
Tabel 3.15
Block 0: Beginning Block
De classificatietabel (tabel 3.16) en de tabel van de variabelen die zijn opgenomen in de regressie (tabel 3.17) zijn hetzelfde als bij de vorige regressie. Deze bevinding is logisch omdat we weten dat even veel cases zijn opgenomen in beide regressies en er nog geen variabele wordt toegevoegd aan de regressie. In tabel met de variabelen die niet zijn opgenomen in de regressie (tabel 3.18) zien we echter wel een verschil met de vorige regressie. We zien dat de nieuwe variabelen AGE en GENDER een zeer lage score hebben op basis van hun Wald coefficient en niet significant zijn. Dit wil zeggen dat deze twee variabelen geen of weinig invloed hebben op de afhankelijke variabele CHOICE. Aan de hand van deze waarden verwachten we dan ook dat deze variabelen niet zullen opgenomen worden in de regressie.

Classification Table | Observed | Predicted | | Recoded Likelihood of Choosing | Percentage Correct | | Definitely Choose | Less Likely to Choose | | Step 0 | Recoded Likelihood of Choosing | Definitely Choose | 215 | 0 | 100,0 | | | Less Likely to Choose | 114 | 0 | 0,0 | | Overall Percentage | | | 65,3 |
Tabel 3.16

Variables in the Equation | | B | S.E. | Wald | df | Sig. | Exp(B) | Step 0 | Constant | -,634 | ,116 | 29,987 | 1 | ,000 | ,530 |
Tabel 3.17

Variables not in the Equation | | Score | df | Sig. | Step 0 | Variables | Dell01 | 27,522 | 1 | ,000 | | | Dell02 | 17,330 | 1 | ,000 | | | Dell03 | 32,637 | 1 | ,000 | | | Dell04 | 19,551 | 1 | ,000 | | | Dell05 | 6,406 | 1 | ,011 | | | Dell06 | 12,782 | 1 | ,000 | | | Dell07 | 1,247 | 1 | ,264 | | | Dell08 | 19,184 | 1 | ,000 | | | Dell09 | ,000 | 1 | ,990 | | | Dell10 | 1,180 | 1 | ,277 | | | Dell11 | 3,331 | 1 | ,068 | | | Dell12 | 21,636 | 1 | ,000 | | | Dell13 | 16,792 | 1 | ,000 | | | AGE | ,182 | 1 | ,669 | | | GENDER | ,010 | 1 | ,919 | | Overall Statistics | 56,241 | 15 | ,000 |
Tabel 3.18
Block 1: Method = Forward Stepwise (Wald)
We bekijken de samenvatting van het model in tabel 3.19 en merken op dat deze waarden exact hetzelfde zijn als in de regressie zonder de variabelen AGE en GENDER. Ook de waarden voor de testen met de Chi-kwadraat waarden (tabel 3.19), voor de Hosmer and Lemeshow Test (tabel 3.20) en voor de classificatietabel exact hetzelfde zijn als in de regressie zonder de variabelen AGE en GENDER. Model Summary | Step | -2 Log likelihood | Cox & Snell R Square | Nagelkerke R Square | 1 | 392,038 | ,094 | ,130 | 2 | 381,542 | ,123 | ,169 | 3 | 376,919 | ,135 | ,186 |
Tabel 3.19 Omnibus Tests of Model Coefficients | | Chi-square | df | Sig. | Step 1 | Step | 32,541 | 1 | ,000 | | Block | 32,541 | 1 | ,000 | | Model | 32,541 | 1 | ,000 | Step 2 | Step | 10,496 | 1 | ,001 | | Block | 43,036 | 2 | ,000 | | Model | 43,036 | 2 | ,000 | Step 3 | Step | 4,623 | 1 | ,032 | | Block | 47,659 | 3 | ,000 | | Model | 47,659 | 3 | ,000 |
Tabel 3.20 Hosmer and Lemeshow Test | Step | Chi-square | df | Sig. | 1 | 1,678 | 4 | ,795 | 2 | 9,047 | 7 | ,249 | 3 | 6,034 | 8 | ,643 |
Tabel 3.21

Classification Table | Observed | Predicted | | Recoded Likelihood of Choosing | Percentage Correct | | Definitely Choose | Less Likely to Choose | | Step 1 | Recoded Likelihood of Choosing | Definitely Choose | 205 | 10 | 95,3 | | | Less Likely to Choose | 90 | 24 | 21,1 | | Overall Percentage | | | 69,6 | Step 2 | Recoded Likelihood of Choosing | Definitely Choose | 195 | 20 | 90,7 | | | Less Likely to Choose | 73 | 41 | 36,0 | | Overall Percentage | | | 71,7 | Step 3 | Recoded Likelihood of Choosing | Definitely Choose | 198 | 17 | 92,1 | | | Less Likely to Choose | 77 | 37 | 32,5 | | Overall Percentage | | | 71,4 |
Tabel 3.22
We kunnen aan de hand van tabel 3.23 besluiten dat de variabelen die opgenomen worden niet veranderen. Ook de waarde van Exp(B) van deze variabelen blijven hetzelfde in de verschillende stappen van het model. Variables in the Equation | | B | S.E. | Wald | df | Sig. | Exp(B) | Step 1 | Dell03 | -,360 | ,067 | 28,807 | 1 | ,000 | ,697 | | Constant | 1,799 | ,465 | 14,958 | 1 | ,000 | 6,046 | Step 2 | Dell03 | -,339 | ,069 | 24,268 | 1 | ,000 | ,713 | | Dell13 | -,324 | ,103 | 9,800 | 1 | ,002 | ,723 | | Constant | 4,307 | ,969 | 19,770 | 1 | ,000 | 74,192 | Step 3 | Dell03 | -,281 | ,075 | 14,207 | 1 | ,000 | ,755 | | Dell08 | -,176 | ,082 | 4,589 | 1 | ,032 | ,839 | | Dell13 | -,325 | ,105 | 9,615 | 1 | ,002 | ,723 | | Constant | 5,237 | 1,088 | 23,190 | 1 | ,000 | 188,162 |
Tabel 3.23
Indien we de tabel bekijken van de variabelen die niet zijn opgenomen in de regressie (tabel 3.24), kunnen we vaststellen dat de variabelen AGE en GENDER bij geen enkele stap in aanmerking zijn gekomen om opgenomen te worden in de regressie. We kunnen dit besluiten doordat deze variabelen in elke stap een kleine score hebben op basis van de Wald coëfficiënt en niet significant zijn. Dit bevestigt het vermoeden dat we reeds bij het nulmodel hadden. We kunnen dus besluiten dat de kans tot het opnieuw aankopen van een Dell Computer niet significant beïnvloed wordt door de leeftijd of het geslacht van de klant. Variables not in the Equation | | Score | df | Sig. | Step 1 | Variables | Dell01 | 8,004 | 1 | ,005 | | | Dell02 | 2,079 | 1 | ,149 | | | Dell04 | 3,424 | 1 | ,064 | | | Dell05 | ,060 | 1 | ,806 | | | Dell06 | 3,389 | 1 | ,066 | | | Dell07 | ,129 | 1 | ,720 | | | Dell08 | 4,883 | 1 | ,027 | | | Dell09 | ,635 | 1 | ,426 | | | Dell10 | ,035 | 1 | ,851 | | | Dell11 | ,608 | 1 | ,436 | | | Dell12 | 4,890 | 1 | ,027 | | | Dell13 | 10,261 | 1 | ,001 | | | AGE | 1,159 | 1 | ,282 | | | GENDER | ,002 | 1 | ,961 | | Overall Statistics | 25,662 | 14 | ,029 | Step 2 | Variables | Dell01 | 3,872 | 1 | ,049 | | | Dell02 | ,617 | 1 | ,432 | | | Dell04 | ,941 | 1 | ,332 | | | Dell05 | ,028 | 1 | ,867 | | | Dell06 | 1,693 | 1 | ,193 | | | Dell07 | ,000 | 1 | ,996 | | | Dell08 | 4,700 | 1 | ,030 | | | Dell09 | 1,540 | 1 | ,215 | | | Dell10 | ,035 | 1 | ,852 | | | Dell11 | ,393 | 1 | ,530 | | | Dell12 | 3,062 | 1 | ,080 | | | AGE | 1,380 | 1 | ,240 | | | GENDER | ,081 | 1 | ,776 | | Overall Statistics | 16,715 | 13 | ,213 | Step 3 | Variables | Dell01 | 2,202 | 1 | ,138 | | | Dell02 | ,049 | 1 | ,825 | | | Dell04 | ,204 | 1 | ,652 | | | Dell05 | 1,253 | 1 | ,263 | | | Dell06 | ,284 | 1 | ,594 | | | Dell07 | ,320 | 1 | ,571 | | | Dell09 | 2,742 | 1 | ,098 | | | Dell10 | ,798 | 1 | ,372 | | | Dell11 | ,000 | 1 | ,999 | | | Dell12 | ,892 | 1 | ,345 | | | AGE | 1,522 | 1 | ,217 | | | GENDER | ,014 | 1 | ,905 | | Overall Statistics | 12,287 | 12 | ,423 |
Tabel 3.24

OPDRACHT 4: GROEPSVORMING
Tussen klanten bestaan zowel verschillen als overeenkomsten. De kern van segmentatie is het ontdekken van overeenkomsten tussen klanten die gerelateerd zijn aan hun uiteindelijke gedrag. Idealiter resulteert een effectieve segmentatie analyse tot intra-segment homogeniteit en inter-segment heterogeniteit. Cluster analyse is gebaseerd op het zelfde principe en is derhalve een techniek die kan worden ingezet om te onderzoeken of er verschillende segmenten bestaan.
Dell zou graag willen weten of er verschillende segmenten bestaan die verschillen in hun percepties ten aanzien van Dell product- en dienstkenmerken (Variabelen Dell01-Dell13). a) Voer een two-stage cluster analyse uit (cf. Punj and Stewart 1984) om deze vraag te beantwoorden. Dat wil zeggen eerst een hiërarchische cluster analyses en vervolgens een non-hiërarchische cluster analyse. Zie voor verder details de slides. b) Beschrijf de segmenten. c) Is de hierboven gevraagde cluster analyse een effectieve manier om de keuze voor opnieuw een Dell te kopen te begrijpen? Waarom wel/niet? Toon dit zo mogelijk analytisch aan.

Inleiding
Alvorens te beginnen met de clusteranalyse, moeten er eerst enkele punten worden nagegaan, aangezien deze de uitkomst van de clusteranalyse ernstig kunnen beïnvloeden (Hair et al., 2010, p. 518 en p.526).
De steekproef moet van voldoende grootte zijn, dit om ook kleine groepen in de populatie te vertegenwoordigen en de onderliggende structuur te representeren. Aangezien het hier gaat om een steekproef met 372 observaties kunnen we stellen dat dit een goede representatie zal zijn van de realiteit.
Vervolgens gaan we op zoek naar outliers. Een outlier, of uitschieter, is een observatie die sterk verschilt van de rest van de steekproef. Hiervoor kijken we naar de dissimilarity waardes van de observaties:

Observation | Dissimilarity | 277 | 18,4489503 | 315 | 18,16283488 | 301 | 16,79709795 | 15 | 16,44079706 | 145 | 15,29587433 | 163 | 14,96557394 | 201 | 14,91504717 | 118 | 14,38588788 | 135 | 14,22586737 | 46 | 13,96138102 | 371 | 13,74274956 | 154 | 13,67838918 | 10 | 13,67679034 | 109 | 13,66776709 |
Tabel 4.1 Dissimilarity tabel
We zien dat de grootste dissimilarities bij observatie 277 en 315 liggen. Deze waardes liggen vrij dicht bij elkaar. We zien ook dat het verschil tussen de dissimilarity van observatie 315 en 301 groter is dan het verschil tussen eender welke opeenvolgende observaties. Op het eerste zicht blijken waarneming 277 en 355 dus uitschieters te zijn. Om deze nu al te verwijderen uit de dataset zou echter al voorbarig zijn. De dissimilarity analyse is immers niet voldoende bewijs om deze als outliers te bestempelen. Het kan bijvoorbeeld zijn dat deze 2 waarnemingen een groep representeert die onvoldoende gesampled is.
Vervolgens bekijken we de multicollineariteit. In onze data hebben we hier echter niet mee te maken. Dit kan men zien door naar de correlatiematrix te kijken (tabel 4.2 in de bijlage). Hier merken we op dat er geen correlaties zijn groter dan 0,70 (Hair et al., 2010, p. 204). De grootste correlatie is immers 0,560.

Analyse
Om te ontdekken of er verschillende segmenten bestaan die verschillen in hun percepties ten aanzien van Dell product- en dienstkenmerken, voeren we een two stage cluster analyse uit. Dit omvat dat we eerst een hiërarchische analyse uitvoeren en nadien een K-means cluster analyse. Uit de hiërarchische analyse bekomen we de volgende agglomeratietabel. Aantal clusters | Coefficients | Proportionele toename | 8 | 8507,824 | 0,04063 | 7 | 8853,499 | 0,061844 | 6 | 9401,031 | 0,068236 | 5 | 10042,522 | 0,066596 | 4 | 10711,317 | 0,09222 | 3 | 11699,110 | 0,101704 | 2 | 12888,958 | 0,318374 | 1 | 16992,462 | |
Tabel 0.3 - Agglomeratie tabel
De coefficients zijn de variaties binnen de groepen, die we met ward’s methode minimaliseren. De gemiddelde proportionele toename is 0,107086247. Om het aantal clusters vast te stellen kijken we naar de proportionele toename in heterogeniteit. Zolang deze groter is als het gemiddelde kunnen we meer de cases opdelen in meer clusters. Bij 3 clusters is deze proportionele toename al kleiner dan het gemiddelde, dus houden we het op een 2-cluster oplossing.
Vervolgens voeren we een K-means cluster analyse uit, waarbij we op voorhand vaststellen dat er 2 clusters zijn. Hieruit bekomen we dan de definitieve clustercenters die we kunnen gebruiken om onze clusters beter te interpreteren.

Figuur 4.1 - Cluster Centers
We zien dat de clusters vrij gelijkend zijn, in het algemeen scoort cluster 1 overal iets lager dan cluster 2. Het is enkel bij de variabelen Dell09, Dell 10 en Dell11 dat er een groter verschil is tussen de clusters. In de ANOVA-tabel (tabel 4.4 in de bijlage) kan men zien dat alle variabelen significant zijn en we ze dus mogen gebruiken om de clusters te vergelijken. We zien ook dat de F-waardes van de variabelen Dell09, Dell10 en Dell11 het grootste zijn, waaruit we kunnen besluiten dat deze variabelen het belangrijkst zijn om de verschillen tussen de clusters te beschrijven.
Aangezien het bij de variabelen Dell09, Dell10 en Dell11 vooral om het technologische aspect gaat, zouden we kunnen stellen dat de respondenten in cluster 1 technologisch kritischer zijn dan de respondenten in cluster 2. Ze hebben hogere eisen qua software, internetverbinding, …. Daarom zouden we cluster 1 als het ware de techies kunnen noemen. Cluster 2 zijn dan weer de mensen die wat minder technologisch aangelegd zijn en sneller tevreden zijn. Deze cluster zullen we vanaf nu de nitwits noemen.

Nu zitten we nog met de vraag of er een duidelijk verschil is tussen de segmenten wat betreft de waarschijnlijkheid dat ze in de toekomst opnieuw een Dell zouden kopen. Indien we een kruistabel maken waarin we de cluster membership tegen de recoded likelihood of choosing zetten, zien we dat er 68,3% van de techies opnieuw zou kiezen voor een Dell. Terwijl bij de nitwits, het percentage dat opnieuw zou kiezen voor een Dell niet veel verschilt met het percentage dat voor een ander merk zou kiezen (56,7% t.o.v. 43,3%). De volledige kruistabel vindt u terug in de bijlage (tabel 4.5)

Bijlages

| Mean | Mode | Std. Dev. | Dell01 | 7,74 | 9 | 1,479 | Dell02 | 7,58 | 9 | 1,628 | Dell03 | 6,9 | 7 | 1,866 | Dell04 | 8,2 | 9 | 1,306 | Dell05 | 6,45 | 7 | 1,886 | Dell06 | 7,5 | 9 | 1,792 | Dell07 | 7,64 | 9 | 1,899 | Dell08 | 7,54 | 9 | 1,647 | Dell09 | 6,07 | 9 | 3,188 | Dell10 | 6,55 | 9 | 2,796 | Dell11 | 7,38 | 9 | 2,483 | Dell12 | 7,73 | 9 | 1,686 | Dell13 | 8,2 | 9 | 1,307 |
Tabel 1.1 – Beschrijvende statistieken van Dell01- Dell13 | t | Sig. (2-tailed) | Dell01 | 35,764 | ,000 | Dell02 | 30,468 | ,000 | Dell03 | 19,614 | ,000 | Dell04 | 47,207 | ,000 | Dell05 | 14,555 | ,000 | Dell06 | 26,869 | ,000 | Dell07 | 26,671 | ,000 | Dell08 | 29,781 | ,000 | Dell09 | 6,429 | ,000 | Dell10 | 10,636 | ,000 | Dell11 | 17,859 | ,000 | Dell12 | 31,118 | ,000 | Dell13 | 47,224 | ,000 |
Tabel 1.2 – T-test Dell01-Dell13 (H0: µ = 5)

| Dell01 | Dell02 | Dell03 | Dell04 | Dell05 | Dell06 | Dell07 | Dell08 | Dell09 | Dell10 | Dell11 | Dell12 | Dell13 | Dell01 | | | | | | | | | | | | | | Dell02 | ,451** | | | | | | | | | | | | | Dell03 | ,492** | ,511** | | | | | | | | | | | | Dell04 | ,417** | ,473** | ,493** | | | | | | | | | | | Dell05 | ,296** | ,386** | ,399** | ,332** | | | | | | | | | | Dell06 | ,297** | ,466** | ,322** | ,425** | ,410** | | | | | | | | | Dell07 | ,192** | ,167** | ,098 | ,189** | ,216** | ,248** | | | | | | | | Dell08 | ,445** | ,558** | ,423** | ,389** | ,485** | ,449** | ,300** | | | | | | | Dell09 | ,217** | ,204** | ,132* | ,226** | ,203** | ,275** | ,212** | ,223** | | | | | | Dell10 | ,225** | ,317** | ,159** | ,266** | ,379** | ,417** | ,343** | ,344** | ,499** | | | | | Dell11 | ,237** | ,251** | ,193** | ,221** | ,333** | ,270** | ,259** | ,322** | ,309** | ,360** | | | | Dell12 | ,377** | ,560** | ,463** | ,481** | ,402** | ,508** | ,243** | ,528** | ,244** | ,300** | ,366** | | | Dell13 | ,314** | ,262** | ,182** | ,329** | ,150** | ,252** | ,144** | ,131* | ,189** | ,171** | ,073 | ,225** | | **. Correlation is significant at the 0.01 level (2-tailed). | *. Correlation is significant at the 0.05 level (2-tailed). |
Tabel 4.2 Correlatiematrix

| F | Sig. | Dell01 | 51,048 | ,000 | Dell02 | 92,671 | ,000 | Dell03 | 57,406 | ,000 | Dell04 | 76,546 | ,000 | Dell05 | 89,827 | ,000 | Dell06 | 100,485 | ,000 | Dell07 | 35,686 | ,000 | Dell08 | 101,959 | ,000 | Dell09 | 177,040 | ,000 | Dell10 | 238,258 | ,000 | Dell11 | 141,444 | ,000 | Dell12 | 108,366 | ,000 | Dell13 | 36,512 | ,000 |
Tabel 4.4 - ANOVA table

| | Cluster 1 | Cluster 2 | Total | Definitely Choose | Count | 172 | 68 | 240 | | % within Cluster Number of Case | 68,3% | 56,7% | 64,5% | Less Likely to Choose | Count | 80 | 52 | 132 | | % within Cluster Number of Case | 31,7% | 43,3% | 35,5% | Total | Count | 252 | 120 | 372 | | % within Cluster Number of Case | 100,0% | 100,0% | 100,0% |
Tabel 4.5 - Kruistabel Cluster membership vs.

Similar Documents

Premium Essay

Marketing

...QA Concept Introducing LoadRunner  • Why should you automate performance testing?  • What are the LoadRunner components?  • Understanding LoadRunner Terminology  • What is the load testing process?  • Getting Familiar with HP Web Tours  • Application Requirements  The Power of LoadRunner  • Creating the Load Test  • Running the Load Test  • Monitoring the Load Test  • Analyzing Results  Building Scripts  • Introducing the Virtual User Generator (VuGen)  • How do I start recording user activities?  • Using VuGen’s Wizard mode  • How do I record a business process to create a script?  • How do I view the script?  Playing Back Your Script  • How do I set the run-time behavior?  • How do I watch my script running in real time?  • Where can I view information about the replay?  • How do I know if my test passed?  • How do I search or filter the results?  Solving Common Playback Problems  • Preparing HP Web tours for playback errors  • How do I work with unique server values?  Preparing a Script for Load Testing  • How do I measure business processes?  • How do I emulate multiple users?  • How do I verify Web page content?  • How can I produce debugging information?  • Did my test succeed?  Creating a Load Testing Scenario  • Introducing the LoadRunner Controller  • How do I start the Controller?  • The Controller window at a glance  • How do I modify the script details?  • How do I generate a heavy load?  • How do I emulate real load...

Words: 468 - Pages: 2

Free Essay

Preparing Business Scenario Analyses

...Preparing Business Scenario Analyses The following general guidelines may be used in preparing for an oral or written business scenario analysis and presentation. There may be several feasible courses of action regarding the solution to any case. It is more important to concern yourself with the process of problem definition and isolation, analysis, and evaluation of alternatives, and the choice of one or more recommendations, rather than trying to find a single answer. Very often, the right answer is the one that you can propose, explain, defend, and make work. • The Process of Analyzing a Case 1. Read and study the scenario thoroughly and efficiently. Read the scenario once for familiarity, noting issues that come to the forefront. Read the scenario again. Determine all the facts, making notes about symptoms of problems, root problems, unresolved issues, and roles of key players. Watch for issues beneath the surface. 2. Isolate the problem(s). Get a feel for the overall environment by putting yourself in the position of one of the key players. Seek out the pertinent issues and problems. 3. Analyze and evaluate alternatives. a. Once the problems and issues are isolated, work at gaining a better understanding of causes. In what area of the unit do the problems exist? Why? What caused them? Examine and evaluate the strengths and weaknesses of the unit’s processes (e.g., planning, communication), human behaviors, and/or exhibits (e.g., financial statements,...

Words: 505 - Pages: 3

Free Essay

Pest Analysis

...PEST Analysis One way of planning your business is to undertake a PEST analysis.1 PEST analysis involves looking at the Political, Economic, Socio-cultural and Technological factors that could affect your business. Every business needs to consider a range of external forces in order to take decisions. For many people imagination is very limited and is coloured solely by their own experience and personal beliefs. This can lead to wish fulfilment or a refusal to see reality or recognise the critical changes that are happening in the world around them. It can also lead to grabbing short-term solutions that, if they do not exacerbate problems, certainly ignore the longer term. In the business world pressure is often applied to take decisions quickly, acting on judgement and instinct rather than careful analysis. There are many driving forces in the external environment that might impact on your business. These can be categorised as: • Social; • Technological; • Economic; • Environmental; and • Political. Social forces Social forces include, for example, changing demography and education, etc. The population in Western Europe is relatively static, but the age bands are changing. The number of older people, for example, is growing rapidly. Technological forces Technological forces are changing dramatically quickly. What effects will this have on your production, marketing and distribution plans? Depending on your market, technology might either raise or lower entry barriers...

Words: 371 - Pages: 2

Free Essay

Anaylsis for Emc

...Fall 2015: Industry Analysis in Emerging Markets Your role in this analysis is to work with your team and to look at emerging technologies. From autonomous drones to emergent AI to 3D printers, you are going to research and get a better understanding of our fast-approaching technological future. Scientific American compiled the Top 10 List of Emerging Technologies for 2015. You can start here, but you are not limited to these technologies. You must choose an emerging industry, and will analyze the history of this technology and its industry, the trajectories of the technology, the key competitors, and the trends in the market. The end goal is to develop a comprehensive understanding of the industry, the competitive landscape, emerging trends to watch in the future, and an overall assessment as to the attractiveness of this industry. Your final deliverable for this project will be an in-class presentation, due April 26th. 1) What SIC/NAICS code does your industry fall under? 2) Describe your industry- a. Provide a brief history of your industry. (You may use a timeline in a separate appendix) b.  List and describe the characteristics of the products your industry offers in the marketplace. c. Who are the key competitors in the industry? d. What are the main differences between the products offered by key competitors? e. What strengths & weaknesses (capabilities, complementary resources, related intellectual property, etc.)...

Words: 430 - Pages: 2

Premium Essay

Service Marketing

...http://www.mysensex.comPESTLE « Pestle Summary: India | Main | Pestle summary: USA » 03/28/2009 Pestle Summary China Well, I guess this is where I get controversial, at least a bit. There are others who have predicted that China was in for a tough ride over the past few years, but they mostly got ignored, or were proven wrong by events. And, to a certain extent, if you cry doom long enough you'll always get proved right, given the laws of entropy. So this is a bit 'faux' controversy... This is the introductory note taking exercise for a Pestle analysis of China, drawn on conventional internet sources such as Wikipedia, the CIA World Factbook and Nationmaster. China is the most populous country in the world, with 1.34 billion people. It has the third largest GDP, with $4.84 trillion, behind Japan and the U.S. Like India, the currency and conditions make it useful to look at some statistics using Purchasing Power Parity, which bumps up China's GDP to $7.8 trillion, which would move it ahead of Japan. It also is the second in the world in annual military spending, although that needs a bit of context, as the world's number two spends about 15% of what the world number one (USA) spends. But with PPP, that looks like more money, and insofar as it is used to pay salaries, rather than buy Israeli rocket parts, PPP is valid in this context too. China is badly governed by the Communist Party, and in my five-year Pestle forecast I will be making the case that misgovernance will...

Words: 1059 - Pages: 5

Free Essay

Bsa/375

...McCauley, COO * Hugh McCauley, COO of Riordan has sent a service request to us. The service request SR-rm-022 stats that Riordan wants to make improvement on their current HR tools. They are currently using a variety of HR tools and would want’s us create one integrated application. To do this we will have to do a system analysis of their current system. An analysis will be made with recommendations to upgrade and consolidate their system. * The service request is basically a project statement. This is a document from the customer who clearly states what the project should deliver and outline the high-level work required for completing this project * (SR-rm-022). Riordan Manufacturing has 550 employees worldwide and has projected earnings of $46 million. It is a fortune 1000 enterprise with $1 billion in excess revenues. It is wholly owned by Riordon Industries and based in San Jose , California. * . We will use the joint application design (JAD) for our system analysis, this should help keep the analysis efforts to a minimum. Fact finding is at the core of system analysis. Interviewing of individuals who understand the current system and any known issues, including future activities needed. To do this observation of how data is handled and how this is used for their jobs. Through study of the documents, policies, and procedures in reference to the system. * Interviewing and gathering...

Words: 397 - Pages: 2

Free Essay

Hr Stratgey

...29th, 2013 Angela Lucente Planning For People Job analysis is an important process, any organization used to use it in order to collect information and data about required skills, level of education, work environment, responsibilities, and the duties to create a job description, recruiting plans, and performance development planning (Susan M. Heatfield, 2013). Once job analyses are updated as described, a summary of the results is normally prepared in writing in the form of a job description (Wayne F. Cascio, 2010). According to my reading chapter five about job analysis process. There are some topics I felt comfortable with, such as alternative perspectives on jobs. This topic add to my knowledge many information and explained how jobs are important to organizations, what is the highly unusual jobs that some organizations required it, and distinguish job analysis form job design (Wayne F. Cascio, 2010). On the other hand, I struggled with topic job requirements because there are many methods created in order to study job requirements and none of them alone is sufficient. Thus, it is essential to integrate this methods to obtain the results of the tasks and duties of a job (Wayne F. Cascio, 2010). It is not that easy to implement the methods of job analysis, such as job performance, observation, interview, critical incidents, and structured questionnaire, those are the most five common methods of job analysis and each one of those takes time and effort to achieve desirable...

Words: 321 - Pages: 2

Premium Essay

Job Analysis Examination

...------------------------------------------------- Running header: Job Analysis Methods ------------------------------------------------- Abstract Examination of different methods utilized to create a comprehensive job analysis, including advantages and disadvantages of all approaches. There are several methods that can be utilized to create a comprehensive job analysis. A job analysis provides a better understanding of the positions within an organization, which will allow the recruitment process to be more focused, consistent and thorough. The first method that can be employed to create an effective job analysis is the Critical Incidents Technique. This technique identifies circumstances that arise in a current position, what action was taken, and the consequences of the action, to identify the effective and ineffective behaviors in job performance. These critical situations are documented by interviewing former jobholders, supervisors, or by reviewing documents and logs from the job. Job duties are examined, and then critical incidents are identified to determine poor or good performance issues related to a specific job requirement. This technique is useful for covering job events that may not be covered in a general job description. Identifying atypical circumstances that may arise in a position can aid in finding a candidate that would be an ideal fit. Reviewing these critical incidents also enable the recruitment process to be shaped to include more pointed questions...

Words: 916 - Pages: 4

Premium Essay

Google Car

...to accomplish that soon, also technology is to expensive. Other companies building autonomous cars said that they are working on vehicles that will be able to safely make that switch. Volvo says that it expects to have its cars tested on city streets by 2020. The Google management team faced several questions. Should Google continue to invest in the technology behind self-driving cars? How could Google's core software-based and search business benefit from self-driving car technology? As large auto manufacturers began to invest in automotive technology themselves, could Google compete? Was this investment of time and resources worth it for Google? Environmental Scanning (external and internal analysis): PEST Analysis After reading the case study Google car I have used the PEST analysis model in which the following was concluded: 1. Political Factors: Government’s regulations on automobile transportation are one of the major aspects in Google's car that have legal barriers. Due to that most of the governments do not have specific laws for self-driving vehicle and there are no federal standards for autonomous cars special permission in all US states adjusted for road test. Laws need to be adapted to accidents liability for insurance purposes. 2. Economic Factors: Cost is a concern, due to the investment in technology required to be adapted to cars an estimated of $150,000 in equipment. The consumers are not willing to spend more than $3,000 for autonomous driving applications...

Words: 479 - Pages: 2

Free Essay

Vaan Lan

...implementation actions you recommend should be explicit and thoroughly explained. Occasionally, careful evaluation of implementation actions may show the strategy to be less favorable than you thought originally. A strategy is only as good as the firm's ability to implement it effectively. Therefore, effort to determine effective implementation is important. Process Issues You should ensure that your presentation (either oral or written) has logical consistency throughout. For example, if your presentation identifies one purpose, but your analysis focuses on issues that differ from the stated purpose, the logical inconsistency will be apparent. Likewise, your alternatives should flow from the configuration of strengths, weaknesses, opportunities, and threats you identified by the internal and external analyses. Thoroughness and clarity also are critical to an effective presentation. Thoroughness is represented by the comprehensiveness of the analysis and alternative generation. Furthermore, clarity in the results of the analyses, selection of the best alternative strategy, and design of implementation actions are important. For example, your statement of the strengths and weaknesses should flow clearly and logically from the internal analyses presented. Presentations (oral or...

Words: 305 - Pages: 2

Premium Essay

Pest Analysis Italy

...BLEND TWO COUNTRY ANALYSIS ITALY Task: You will carry out an analysis of Italy today in order to have a general idea of its current state of affairs. To do this you will visit several sites to gather the necessary information. This information should then be transferred in note-form onto the table below. You will then use these notes to give a short, informal presentation during the following class session. Procedure: You will use a well-known analytical tool: THE PEST ANALYSIS. Although this tool was originally created for the business environment, it is now used in many sectors to analyse organisations, projects and systems. STEP ONE: WHAT IS A PEST ANALYSIS 1. First you need to find out what a PEST analysis is: Go to http://www.rapidbi.com/created/the-PESTLE-analysis-tool.html#political Read quickly through the information and write short answers to the following questions: What sort of picture does a Pest analysis offer? Why is it important to take these factors into account? What are some common uses of the Pest? In what situation might you use a Pest in your own professional context? The Table below gives some of the indicators which may be relevant for each category. Can you think of any other factors to consider? Add them to the corresponding column. PEST ANALYSIS TEMPLATE Political / Legal Economic Social Technological - Government organisation / attitude - Economic growth (overall; by industry sector) - Income...

Words: 615 - Pages: 3

Premium Essay

Philosophy

...participated voluntarily in the study? * Was institutional review board approval obtained from the agency in which the study was conducted? Data Collection * Are the major variables (independent and dependent variables) identified and defined? What were these variables? * How were data collected in this study? * What rationale did the author provide for using this data collection method? * Identify the time period for data collection of the study. * Describe the sequence of data collection events for a participant. Data Management and Analysis * Describe the data management and analysis methods used in the study. * Did the author discuss how the rigor of the process was assured? For example, does the author describe maintaining a paper trail of critical decisions that were made during the analysis of the data? Was statistical software used to ensure accuracy of the analysis? * What measures were used to minimize the effects of researcher bias (their experiences and perspectives)? For example, did two researchers independently analyze the data and compare their analyses? Findings / Interpretation of Findings * What is the researcher’s interpretation of...

Words: 363 - Pages: 2

Free Essay

Ecn 400 Week 6 Macroeconomic Indices

...com/product/ecn-400-week-6-macroeconomic-indices/ Contact us at: SUPPORT@ACTIVITYMODE.COM ECN 400 WEEK 6 MACROECONOMIC INDICES ECN 400 Week 6 Critical Thinking: Macroeconomic Indices Critical Thinking: Macroeconomic Indices (70) Begin working on your Portfolio Project by researching and selecting an article for your analysis. Appropriate articles are those that: • Are no older than six months old • Contain at least three general economic principles • Contain at least three to five macroeconomic indices. • Submit an outline that provides information on your article and the three general economic principles and the three to five macroeconomic indices you will be discussing in your Project. ECN 400 WEEK 6 MACROECONOMIC INDICES To purchase this visit following link: http://www.activitymode.com/product/ecn-400-week-6-macroeconomic-indices/ Contact us at: SUPPORT@ACTIVITYMODE.COM ECN 400 WEEK 6 MACROECONOMIC INDICES ECN 400 Week 6 Critical Thinking: Macroeconomic Indices Critical Thinking: Macroeconomic Indices (70) Begin working on your Portfolio Project by researching and selecting an article for your analysis. Appropriate articles are those that: • Are no older than six months old • Contain at least three general economic principles • Contain at least three to five macroeconomic indices. • Submit an outline that provides information on your article and the three general economic principles and the three to five macroeconomic...

Words: 834 - Pages: 4

Premium Essay

Kenyan Problem

...[u06a1] Unit 6 Assignment 1 Systems Theory and Conflict Resolution Resources * Systems Theory and Conflict Resolution Scoring Guide. * APA (6th edition) Style and Formatting. * Webuwrite Academy Simulation. By successfully completing this assignment, you will demonstrate your proficiency in the following course competencies and assignment criteria: * Competency 5: Implement a strategy for reducing conflict. * Propose strategies for reducing conflict based on a systems analysis. * Competency 7: Communicate effectively in a variety of formats. * Communicate in a manner that respects the dignity, cultural and ethnic backgrounds, and individual uniqueness of others. For this assignment, you will analyze the conflicts at Webuwrite Academy using systems theory, as described by Wilmot and Hocker in Chapter 7. When people think of conflict, they often tend to think only about the actual conflict itself. They often fail tocontextualize that conflict within the norms and background of a larger organization or group. This type of contextualization is an important part of understanding a conflict more fully, and of better understanding how to resolve the conflict. Systems theory is a method of analyzing conflict that goes beyond looking at individual behavior and goals, and instead focuses on the patterns of interactions between individuals as a part of a whole organization. Systems theory also focuses on the roles that individuals play within organizations. For...

Words: 433 - Pages: 2

Premium Essay

P-Political Factors Affecting The Healthcare Environment

...PEST Analysis P- Political Factors affecting the healthcare environment Insurance mandates, such as the individual mandate, are an element in the political sphere that could have an impact on healthcare. The individual mandate requires that individuals or families have health insurance or pay a penalty. Although it has recently been repealed, it continues to affect the healthcare environment, as many will continue to be uninsured. E- Economic Factors affecting the healthcare environment Unemployment is an example of how economic factors affect the healthcare environment. If people are losing their jobs this means there will be a greater loss of health insurance coverage, which will affect the type of health services people receive. S- Sociocultural Factors Demographics, values, and beliefs of various consumer groups should be identified in a PEST analysis. Organizations should be knowledgeable about the community it serves to avoid violating community values. For example, the Hispanic population is a growing population and as of 2017, the percentage of Hispanics in the United States is 17.8 (census.gov). T- Technological Factors...

Words: 460 - Pages: 2