Waarschijnlijkheidsvragen om uw gegevensvaardigheden te testen

Zoals je solliciteert datawetenschap banenwordt u waarschijnlijk gevraagd om verschillende waarschijnlijkheid vragen tijdens het technische gedeelte van de interview. Binnen dit bericht wil ik vijf verschillende waarschijnlijkheidsvragen behandelen (oplopend in moeilijkheidsgraad) die volgens mij dienen als een goede weergave van de verschillende soorten vragen die je zou verwachten in het interviewproces.

5 veelvoorkomende waarschijnlijkheidsvragen

  1. Er worden twee eerlijke dobbelstenen gegooid. Wat is de kans dat hun som groter is dan vier?
  2. Een pot bevat 12 knikkers: vier rode, vijf blauwe en drie oranje. Als je drie knikkers trekt zonder ze terug te plaatsen, wat is dan de kans om alle drie de kleuren in de volgorde blauw, oranje en rood te krijgen? Wat is de kans dat je helemaal oranje krijgt?
  3. Samsung produceert 40 procent van de markt voor singleboardcomputers, Panasonic produceert 25 procent en LG 35 procent. Eén procent van alle SBC’s van Samsung en Panasonic is defect, terwijl 2 procent van alle SBC’s van LG defect is. Als de SBC die u hebt gekocht defect was, wat is dan de kans dat het een Panasonic SBC is?
  4. Hoe groot is de kans dat er in een zaal met 50 mensen minstens twee mensen op dezelfde dag jarig zijn?
  5. Je speelt een spelletje poker en je haalt een three of a kind. Wat is de kans dat deze hand voorkomt?

Dit artikel is niet bedoeld om alles te oefenen, maar is eerder bedoeld om uw bekendheid met enkele van de meest voorkomende waarschijnlijkheidsvragen te verbeteren.

Dat gezegd hebbende, laten we beginnen.

Hoe 5 veelvoorkomende waarschijnlijkheidsvragen op te lossen?

Vraag 1: De dobbelsteenworp

Er worden twee eerlijke dobbelstenen gegooid. Wat is de kans dat hun som groter is dan vier?

Antwoorden

Eerst moeten we de voorbeeldruimte vinden. Als we één dobbelsteen gooien, heeft elke uitkomst (nummers één tot en met zes) allemaal een gelijke kans van 1/6. Omdat we echter met twee dobbelstenen gooien, is elke uitkomst 1/36. Dit betekent dat onze steekproefruimte 36 is.

Vanaf hier zijn er twee manieren om het probleem op te lossen. We kunnen eerst het aantal van alle sommen vinden die groter zijn dan vier en delen door 36, of we kunnen de sommen vinden die kleiner zijn dan of gelijk zijn aan vier en het complement ervan vinden. We zullen het laatste doen, omdat het minder tijd kost om het op te lossen.

Ten eerste vinden we het aantal manieren waarop de uitkomst van onze dobbelsteen een som van vier of minder heeft. Dit zou opleveren in:

kans op dobbelstenen
Uitkomsten voor dobbelstenen rollen minder dan vier. | Afbeelding: Adam Sabra

Merk ook op dat, aangezien de worp van elke dobbelsteen onafhankelijk is, de volgorde van de uitkomsten van belang is, dwz (1,2) is een ander resultaat dan (2,1), enzovoort.

Zoals we hierboven kunnen zien, hebben we zes mogelijke uitkomsten waarbij de som vier of minder is. Dit levert een kans op van 6/36 of 1/6. Omdat de vraag om sommen vraagt ​​die groter zijn dan vier, moeten we nu het complement vinden van de kans die we hierboven hebben gevonden. Daarom is de kans om met twee dobbelstenen te gooien waarvan de som groter is dan vier gelijk aan: 5/6.

Interviewvoorbereiding: Hoe u uw eerste baan in de gegevenswetenschap kunt binnenhalen

Vraag 2: Marmerkleuren

Een pot bevat 12 knikkers: vier rode, vijf blauwe en drie oranje. Als je drie knikkers trekt zonder ze terug te plaatsen, wat is dan de kans om alle drie de kleuren in de volgorde blauw, oranje en rood te krijgen? Wat is de kans dat je helemaal oranje krijgt?

Antwoorden

We moeten eerst noteren „zonder vervanging“ dit betekent dat wanneer we de knikker trekken, we hem niet terug in de pot stoppen. Dit betekent dat de monsterruimte bij elke trek met één afneemt, beginnend bij 12.

Voor de eerste vraag willen we de kans vinden dat knikkers worden getrokken in de volgorde blauw, oranje en rood. We moeten eerst de kans vinden om blauw te trekken, wat 5/12 is.

Nu we de knikker niet terug in de pot doen, hebben we nog 11 knikkers over. De kans om een ​​oranje knikker te trekken is nu 3/11, in plaats van 3/12.

In deze pull hebben we nog 10 knikkers over. Dit betekent dat de kans om een ​​rode knikker te trekken 4/10 is. Om de kans te vinden, vermenigvuldigen we nu de drie gebeurtenissen.

Vergelijking voor kansen om specifieke gekleurde knikkers te trekken
Vergelijking om de kans te vinden om een ​​blauwe, oranje en rode knikker in de juiste volgorde te trekken. | Afbeelding: Adam Sabra

Voor de tweede vraag willen we de kans vinden om alle oranje knikkers te trekken, ook zonder vervanging. We zullen dezelfde procedure volgen als hierboven, behalve dat deze keer zowel de monsterruimte als het aantal oranje knikkers zullen afnemen.

Voor de eerste trek is de kans om de eerste oranje knikker te trekken 3/12. Voor de tweede trek is de kans om de tweede oranje knikker te trekken 2/11. Voor de laatste keer trekken is de kans om de derde oranje knikker te trekken 1/10. We vermenigvuldigen deze uitkomsten en krijgen het antwoord.

Vergelijking om de kans te vinden om drie oranje knikkers te trekken
Waarschijnlijkheid van het trekken van drie oranje knikkers. | Afbeelding: Adam Sabra

Vraag 3: Defecte computers met één bord

Samsung, Panasonic en LG produceren single board computers (SBC’s) voor hobbyisten. Samsung’s SBC’s nemen 40 procent van de markt in beslag, Panasonic’s SBC’s nemen 25 procent van de markt in beslag en LG’s SBC’s nemen de rest in beslag. Eén procent van alle SBC’s van Samsung en Panasonic is defect, terwijl 2 procent van alle SBC’s van LG defect is. Als de SBC die u hebt gekocht defect was, wat is dan de kans dat het een Panasonic SBC is?

Antwoorden

Voordat we kunnen beginnen met het oplossen van dit probleem, laten we opschrijven wat we weten. We gebruiken S voor Samsung, P voor Panasonic, L voor LG en D voor de defecte computer.

Panasonic, Samsung en LG SBC computerproductie
Panasonic, Samsung en LG zijn uitgesplitst op basis van het aantal geproduceerde computers en defecte computers. | Afbeelding: Adam Sabra

Om de waarschijnlijkheid van een Panasonic SBC te vinden, gegeven dat het bord defect is, moeten we gebruiken Stelling van Bayes. In de context van het probleem betekent dit dat:

Vergelijking om de kans op een defecte Panasonic SBC te vinden
Stellingvergelijking van Bayes om de kans te vinden dat een Panasonic SBC defect is.

Vraag 4: Het verjaardagsprobleem

Deze vraag wordt ook wel het ‚verjaardagsprobleem‘ genoemd.

Hoe groot is de kans dat er in een zaal met 50 mensen minstens twee mensen op dezelfde dag jarig zijn? Neem aan dat alle verjaardagen even waarschijnlijk zijn – uniforme verdeling – en er zijn 365 dagen in het jaar.

Antwoorden

Net als bij de eerste vraag zijn er twee manieren om dit probleem op te lossen, waarbij de ene methode sneller is dan de andere.

Voor de meest efficiënte manier om deze vraag op te lossen, zullen we eerst de waarschijnlijkheid vinden dat geen twee mensen dezelfde verjaardag delen en de complementaire ervan vinden. Aangezien de vraag is of ten minste twee mensen dezelfde verjaardag hebben, houdt het complement in dat geen twee mensen dezelfde verjaardag hebben, wat gemakkelijker te vinden is.

Het vinden van de kans dat alle 50 mensen alle verschillende verjaardagen hebben, is als volgt:

verschillende verjaardagen kansvergelijking
Verschillende verjaardagen kansvergelijking. | Afbeelding: Adam Sabra

Daarom is de kans dat ten minste twee mensen dezelfde verjaardag hebben het complement van hierboven, wat ongeveer 97 procent is.

Een overzicht van veelvoorkomende waarschijnlijkheidsvragen die kandidaten voor datawetenschap in perspectief moeten kennen. | Video: Eenvoudig leren

Interviewvoorbereiding: 26 Tips voor sollicitatiegesprekken om een ​​blijvende indruk te maken

Vraag 5: De pokerhand

Je speelt een spelletje poker en je haalt een three of a kind. Dit betekent dat van de vijf kaarten in je hand, er drie van hetzelfde type zijn (Koningin, Aas, 10, enz.) van verschillende kleuren, en de andere twee willekeurige kaarten uit het kaartspel zijn. Wat is de kans dat deze hand voorkomt?

Antwoorden

Voordat we iets doen, moeten we de vergelijking van de binomiale coëfficiënten oproepen, ook bekend als nCr. De vergelijking is als volgt:

binomiale coëfficiënten vergelijking
Binominale coëfficiënten vergelijking. | Afbeelding: Adam Sabra

Deze vergelijking is belangrijk, omdat het ons in staat stelt om de combinaties met betrekking tot onze pokerhand heel gemakkelijk te vinden. We zullen duidelijke voorbeelden gebruiken omdat de kans niet van hand tot hand zal variëren, een three of a kind resulteert altijd in dezelfde kans.

Laten we aannemen dat we drie vrouwen, harten twee en schoppen vijf hebben. Er zijn 13 soorten kaarten – Aas, 2, 3, … , King – elk met vier kleuren.

Als we in onze hand drie koninginnen hebben, dan zijn dat drie van de vier kleuren van 1 van de 13 soorten. Onze andere twee kaarten komen van de andere 12 soorten, omdat we ervoor moeten zorgen dat we niet de vierde koningin trekken en de twee soorten moeten verschillend zijn. Dit betekent dat we twee soorten moeten kiezen uit de resterende 12. Aangezien de reeks tussen de twee andere kaarten onafhankelijk is, zullen we de kans vinden om één reeks uit de vier te trekken en deze te kwadrateren.

Het antwoord is als volgt:

kans op het trekken van een three-of-a-kind
Vergelijking voor de kans op het trekken van een three of a kind. | Afbeelding: Adam Sabra

Ik hoop dat deze vragen dienden als een redelijke test van uw waarschijnlijkheidsvaardigheden. Deze vragen waren enkele van mijn favoriete vragen toen ik begon met het leren van de basisprincipes van waarschijnlijkheid, en ze zijn nog steeds leuk voor mij om op te lossen wanneer ik vrije tijd heb. Veel succes met het sollicitatieproces en blijf uitblinken.

.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert