Simpsoni Paradoks

Sisukord:

Simpsoni Paradoks
Simpsoni Paradoks

Video: Simpsoni Paradoks

Video: Simpsoni Paradoks
Video: Simpson's Paradox 2023, Märts
Anonim

Sisenemise navigeerimine

  • Sissesõidu sisu
  • Bibliograafia
  • Akadeemilised tööriistad
  • Sõprade PDF-i eelvaade
  • Teave autori ja tsitaadi kohta
  • Tagasi üles

Simpsoni paradoks

Esmakordselt avaldatud 2. veebruaril 2004; sisuline redaktsioon reedel 1. aprillil 2016

Vaatleme järgmist lugu:

(Kujutatava) ettevõtte Globalfixit Pharmacuticals Ltd. FIXIT-Y-kapslite iga pakendi etiketil on järgmine soovitatav kasutamine:

Soovitatav meestele ja naistele, kellel on haigus Y, kuid ei ole soovitatav inimestele, kellel on haigus Y.

Kuna etiketil peene trükiga selgitatakse:

Kliinilised uuringud, kus kasutati FIXIT-Y, näitasid Y-st taastumise protsentuaalselt suuremat protsenti, kui mehed seda võtsid, võrreldes platseebot võtnud meestega, ja samamoodi ka naiste puhul. Kuid rühmas, mis võttis platseebot, oli kogu taastumise määr kõrgem. Tõenditel põhineva farmakoloogia edastamiseks võite usaldada FIXITi.

Ettevõte turustab ka FIXIT-Z-kapsleid. Neil sildil on kirjas, et Z-kapsleid soovitatakse inimestele, kes põevad Z-d, kuid mitte meestele ja mitte naistele. Kuna etiketil peene trükiga selgitatakse:

Kliinilised uuringud, kus kasutati FIXIT-Z, näitasid, et seda kasutanud inimestel oli kõrgem taastumismäär võrreldes platseebot võtnud inimestega. Kuid nii meestel kui naistel, kes võtsid platseebot, oli taastumise määr kõrgem kui meestel ja naistel, kes võtsid FIXIT-Z. Tõenditel põhineva farmakoloogia edastamiseks võite usaldada FIXITi.

Ehkki ükski kapsel ei pruugi olla hea meestele ja naistele, samas halb inimestele või hea inimestele, samal ajal kui see on halb meestele ja naistele, näitavad ettekujutatud andmed (vt allpool), millel FIXIT oma soovituste aluseks on, nii aritmeetiliselt võimalikke kui ka pöördeid üles tegelikes andmekogumites. Ehkki selliste andmete olemasolul pole aritmeetika seisukohast midagi paradoksaalset, tekitavad need praktiliste otsuste tegemisel probleeme (nt kas soovite, et teid ravitataks Fixiti kapslitega, pidades silmas kliinilisi uuringuid?), Kasutatava heuristika osas intuitiivsetes mõttekäikudes tõenäosuste kohta, järelduste tegemiseks andmetest põhjuslike suheteni ja üldisemalt filosoofiliste programmide jaoks, mille eesmärk on kõrvaldada või vähendada põhjuslikkuse seoseid seaduspärasuste ja tõenäosuste vaheliste suhetega.

Aritmeetika, millel põhinevad sellised näited nagu FIXITi läbimõtlemata soovitused, ei ole probleemne. Kokkuvõtlikult põhineb see asjaolul, et

Seoseid muutujate paari vahel saab populatsiooni jagunemise korral igas elanikkonna alampopulatsioonis järjekindlalt ümber pöörata ja vastupidiselt saab andmete liitmisel iga alampopulatsiooni assotsiatsioonid ümber pöörata.

Nimetage seda põhimõtet Simpsoni ebavõrdsuse ümberpööramiseks. Selliste ümberpööramiste mittetunnustamine võib viia ülalnimetatud lõhedeni, mida teha, mida uskuda, mida järeldada ja mis põhjustab. Isegi tegeliku ja võimaliku tagasipööramise tuvastamisel jäävad lõksud alles. Positiivne on see, et kui Simpsoni pöördumiste võimalused on teadvustatud, pakuvad need rikkalikku ressurssi põhjuslike mudelite konstrueerimiseks, mis aitavad selgitada paljusid fakte, mis alguses tunduvad anomaalsed. Lisaks on olemas test nn tagaukskriteeriumiks (Pearl 1993), mida saab kasutada selleks, et aidata lahendada küsimus, kas otsuse tegemisel tuleks tugineda kogupopulatsioonile või jaotatud alampopulatsioonidele.

1. jaos on esitatud lühike Simpsoni paradoksi ajalugu, selle aluseks olevad aritmeetilised struktuurid ja diagnoos ning selle esinemise piirtingimused. 2. jaos uuritakse kehtetuid mõttekäike, mille lähtekohaks on Simpsoni paradoks, ja selle mõju vastu võitlemise võimalikke viise. Eriti olulist juhtumit, kus Simpsoni paradoks on valesti rakendatud, käsitletakse 3. jaotises. Arvatakse, et paradoksaalsed andmed pakuvad ratsionaalse valiku teooriates Sure Thingi põhimõttele vastupidiseid näiteid. Selgitatakse, miks sellised andmed pakuvad kindla näite põhimõtet vastuoluliste näidetena, ja see, kuidas nad seda teevad, hajutatakse.4. jaos käsitletakse paradoksaalsete andmete rolle ja tagajärgi põhjusliku järeldamise teooriatele ja põhjuslike seoste analüüsile tõenäosuste osas. Kuigi selle jaotise järeldused on suures osas negatiivsed, illustreerib 5. jagu, kuidas ilmselt paradoksaalsed andmed toetavad tunnuste kujunemise põhjuslikke mudeleid, mis algul näivad olevat kokkusobimatud olukorraga, kus looduslik valik seab ebasoodsamasse seisundisse indiviidid.

  • 1. Simpsoni paradoks: selle ajalugu, diagnoos ja piiritingimused

    • 1.1 Ajalugu
    • 1.2 Mis on Simpsoni paradoks: diagnoos
    • 1.3 Simpsoni pöörduste piirtingimused
  • 2. Simpsoni ebavõrdsuse pöördumised kui kehtetute mõttekäikude allikad
  • 3. Kas paradoksaalsed andmed pakuvad kindla näite põhimõttele vastupidiseid näiteid?
  • 4. Simpsoni ebavõrdsuse, korrelatsiooni ja põhjuslikkuse pöördumised
  • 5. Simpsoni ebavõrdsuse ümberpööramine evolutsioonilistes seadetes
  • Bibliograafia
  • Akadeemilised tööriistad
  • Muud Interneti-ressursid
  • Seotud kirjed

1. Simpsoni paradoks: selle ajalugu, diagnoos ja piiritingimused

1.1 Ajalugu

1951. aastal ilmunud trükises juhtis EH Simpson tähelepanu lihtsale asjaolule fraktsioonide kohta, millel on lai valik üllatavaid rakendusi (Simpson 1951). Rakendused tulenevad proportsioonide, protsendimäärade, tõenäosuste ja nende murdarvudes esindatuse tihedast seosest. Kui 20. sajandi alguse statistikud olid teadnud statistikaprobleemidest, millele Simpson tähelepanu juhtis, pälvisid tema vaimukad ja üllatavad illustratsioonid neile paradoksaalsuse tiitli (vrd Yule 1903). 1934. aastal tutvustasid Morris Cohen ja Ernst Nagel filosoofidele paradoksaalsete andmete põhjustatud probleemide ühte aspekti. Nad tsiteerisid tegelikku surmajuhtumit 1910. aastal tuberkuloosi tõttu Richmondis (Virginia) ja New Yorgis New Yorgis, mis kinnitas järgmisi väiteid (Cohen & Nagel 1934): [1]

Aafrika ameeriklaste suremus oli Richmondis madalam kui New Yorgis.

Kaukaaslaste suremus oli Richmondis madalam kui New Yorgis.

Aafrika ameeriklaste ja kaukaaslaste kogurahvastiku suremus oli Richmondis kõrgem kui New Yorgis.

Järgmisena esitasid nad kaks küsimust suremuse kohta käivate andmete kohta: “Kas sellest järeldub, et tuberkuloos põhjustas [kursiivis lisatud] Richmondis suuremat suremust kui New Yorgis …” ja “… kas need kaks populatsiooni on võrreldavad, st homogeenne?” (Cohen & Nagel 1934). Pärast küsimuste esitamist jätsid nad lugejale ülesandeks neile vastata. Pärast Simpsoni paberi avaldamist algatasid statistikud elava arutelu selliste faktide olulisuse üle nagu need, mida kinnitavad viidatud tabelid Cohen ja Nagel. Arutelus otsiti statistikapraktika piiranguid, mis väldiksid tegelikest ja võimalikest paradoksaalsetest andmetest tulenevaid segadusi. Selles arutelus ei käsitletud aga Coheni ja Nageli esimest küsimust põhjusliku järelduse kohta. Nagu Judea Pearl märgib oma Simpsoni paradoksi käsitleva statistikaalase kirjanduse ülevaates, oli statistikutel vastumeelsus rääkida põhjuslikest seostest ja põhjuslikest järeldustest, mis põhines veendumusel, et põhjusliku seose kontseptsioon ei olnud teaduslike uurimismeetodite ja teooria jaoks sobiv ja ebavajalik ehitus (Pearl 2000, 173–181).

Filosoofilise huvi Simpsoni paradoksi vastu tabas Nancy Cartwright seda oma väidete toetuseks, väites, et põhjuslikele seadustele ja põhjuslikele võimetele tuleb tugineda teadusliku uurimise ja ratsionaalse valiku teooriate abil (Cartwright 1979). Ta püüdis näidata, et tuginemine reeglipärasustele ja sagedustele, millel tõenäosusotsused põhinevad, ei ole põhjuslike seoste esindamiseks piisavad. Eelkõige peavad teaduslike teooriate testid ja põhjusliku seose filosoofilised analüüsid andma vastused küsimustele, mille on esitanud Cohen ja Nagel: nt kas on võimalik, et tuberkuloos põhjustas Richmondis suuremat suremust kui New Yorgis, isegi kui suremuse määr näib, et iga rassi järgi klassifitseeritud alampopulatsioon soovitab teisiti? Kui põhjuslikud seosed jälgivad seaduspärasusi,Milline põhjuslike suhete süsteem võib selliseid tagajärgi saavutada? Kui Coheni ja Nageli esitatud küsimustele sarnased vastused pakkuvad põhjuslike seoste esindajad on juba käes, osutuvad representatsioonid tõlgendusteks, mis pakuvad põhjuslike mudeleid paljudele huvitavatele ja mõistatuslikele nähtustele. Need hõlmavad altruismi kui stabiilse tunnusjoone kujunemise põhjuslikke mudeleid populatsioonis, isegi kui altruistlikud teod seavad ebasoodsamasse olukorda need, kes neid teostavad, ja eelistavad konkurente. (Vt Sober 1993 ja Sober & Wilson 1998, kus arendatakse neid teemasid üksikasjalikult välja elanikkonna bioloogia ja sotsiobioloogia valdkonnas.) Selliste mudelite näited on sõnastatud ja neid käsitletakse 5. jaotises.esindused osutuvad tõlgendustega, mis pakuvad põhjuslike mudeleid paljudele huvitavatele ja mõistatuslikele nähtustele. Need hõlmavad altruismi kui stabiilse tunnusjoone kujunemise põhjuslikke mudeleid populatsioonis, isegi kui altruistlikud teod seavad ebasoodsamasse olukorda need, kes neid teostavad, ja eelistavad konkurente. (Vt Sober 1993 ja Sober & Wilson 1998, kus arendatakse neid teemasid üksikasjalikult välja elanikkonna bioloogia ja sotsiobioloogia valdkonnas.) Selliste mudelite näited on sõnastatud ja neid käsitletakse 5. jaotises.esindused osutuvad tõlgendustega, mis pakuvad põhjuslike mudeleid paljudele huvitavatele ja mõistatuslikele nähtustele. Need hõlmavad altruismi kui stabiilse tunnusjoone kujunemise põhjuslikke mudeleid populatsioonis, isegi kui altruistlikud teod seavad ebasoodsamasse olukorda need, kes neid teostavad, ja eelistavad konkurente. (Vt Sober 1993 ja Sober & Wilson 1998, kus arendatakse neid teemasid üksikasjalikult välja elanikkonna bioloogia ja sotsiobioloogia valdkonnas.) Selliste mudelite näited on sõnastatud ja neid käsitletakse 5. jaotises.ja Sober & Wilson 1998, mis arendavad neid teemasid üksikasjalikult elanikkonna bioloogia ja sotsiobioloogia valdkonnas.) Selliste mudelite näited on sõnastatud ja neid käsitletakse 5. jaotises.ja Sober & Wilson 1998, mis arendavad neid teemasid üksikasjalikult elanikkonna bioloogia ja sotsiobioloogia valdkonnas.) Selliste mudelite näited on sõnastatud ja neid käsitletakse 5. jaotises.

1.2 Mis on Simpsoni paradoks: diagnoos

Mõnede täisarvude korral võib meil olla:

) alusta {joonda} a / b & \ lt A / B, \\ c / d & \ lt C / D, \ tekst {ja} (a + c) / (b + d) & \ gt (A + C) / (B + D). \ lõpeta {joondus})

Nimetage seda Simpsoni ebavõrdsuse ümberpööramiseks. Allpool on toodud õpetlik illustratsioon. Selle aluseks olevad aritmeetilised ebavõrdsused on:

) alustage {joondama} 1/5 & \ lt 2/8 \\ 6/8 & \ lt 4/5 \\ 7/13 & \ gt 6/13. \ lõpeta {joondus})

Järgnev konstruktsiooni tõlgendus illustreerib, miks see võib tekitada hämmingut. See näide põhineb lahtiselt diskrimineerimisülesandel, mis esitati California ülikooli Berkeley vastu (vt Bickle jt, 1975).

Oletame, et ülikool üritab töötajate palkamisel diskrimineerida naisi. See reklaamib seisukohti ajaloo osakonnas ja geograafia osakonnas ning ainult nendes osakondades. Ajaloo ametikohtadele kandideerib viis meest ja üks palgatakse, kaheksa naist kandideerib ja kaks palgatakse. Meeste edukuse määr on kakskümmend protsenti ja naiste edukuse määr on kakskümmend viis protsenti. Ajalooosakond on soosinud naisi meeste ees. Geograafiaosakonnas kandideerib kaheksa meest ja kuus palgatakse ning viis naist kandideerib ja neli palgatakse. Meeste edukuse määr on seitsekümmend viis protsenti ja naiste puhul kaheksakümmend protsenti. Geograafiaosakond on soosinud naisi meeste ees. Sellegipoolest kandideeris ülikoolis tervikuna tööle 13 meest ja 13 naist ning palgati 7 meest ja 6 naist. Meestaotlejate edukuse määr on suurem kui naissoost taotlejate edukuse määr.

Mehed Naised
Ajalugu 1/5 (lt) 2/8
Geograafia 6/8 (lt) 4/5
Ülikool 7/13 (gt) 6/13

Kuidas saab olla nii, et iga osakond soosib naissoost kandideerijaid ja üldiselt on mehed siiski paremad kui naised? Valimis on küll eelarvamusi, kuid pole lihtne aru saada, kus see kallutatus ilmneb. Taotlejaid oli 13 mees- ja 13 naissoost: mõlemas rühmas võrdsed valimi suurused. Geograafias ja ajaloos oli mõlemal 13 taotlejat: jällegi võrdsed valimid. Samuti ei seisne häda selles, et proovid on väikesed: korrutage kõik numbrid 1000-ga ja puzzle jääb alles. Siis muutub ebavõrdsuse ümberpööramine üsna jõuliseks: saate neist tuhandetest lisada või lahutada üsna palju, häirimata Simpsoni pöördumist.

Selle mõistatusliku näite võti peitub selles, et rohkem naisi kandideerib raskematele töökohtadele. Ajaloos on raskem oma teed saada kui geograafias. (Geograafiasse sisenemiseks peate lihtsalt sündima; ajalukku sisenemiseks peate tegema midagi meeldejäävat.) Tööle kandideerivatest naistest kandideerib rohkem ajalugu kui geograafias ning vastupidine kehtib meestele. Ajalugu palkas 13-st taotlejast vaid 3, geograafia aga 13-st taotlejast 10. Seetõttu oli edukuse määr geograafias palju kõrgem, kus meessoost kandidaate oli rohkem.

1.3 Simpsoni pöörduste piirtingimused

Simpsoni ebavõrdsuste ümberpööramine toimub paljude väärtuste korral, mida saab asendada sõnadega (a), (b), (c), (d), (A), (B), (C), (D) ülaltoodud skeemil. Väärtused jäävad laia äärmusse, mis jääb kahe äärmuse vahele:

Ühest küljest taotleb veidi rohkem naisi palju raskemaid töökohti.

Mehed Naised
Ajalugu 1/45 (lt) 5/55
Geograafia 50/55 (lt) 45/45
Ülikool 51/100 (gt) 50/100

Teisest küljest taotleb veel palju naisi tööd, mida on pisut raskem saada.

Mehed Naised
Ajalugu 4/5 (lt) 90/95
Geograafia 94/95 (lt) 5/5
Ülikool 98/100 (gt) 95/100

Lisaks saab skemaatilist mustrit kiirendava murdarvu lugejaid ja nimetajaid ühtlaselt korrutada mis tahes positiivse arvuga, häirimata seejuures murdude vahelisi suhteid. Fraktsioonid, mis neid mustreid näitavad, vastavad protsentidele ja tõenäosustele. Nende tõenäosusvormis pakub Colin Blyth Simpsoni pöördumistele (Blyth 1972) järgmised piirtingimused. Olgu '(P)' tõenäosusfunktsioon ja võtke tingimuslikud tõenäosused tingimusteta tõenäosuste suhtena vastavalt nende ortodokssele määratlusele; st lugedes kontekstis '/' (P (- \ keskel \ ldots)) kui "antud tingimusel",

[P (A \ keskel B) = P (A \ amp B) / P (B), \ tekst {eeldusel, et} P (B) tekst {on positiivne.})

Blyth märgib, et matemaatilisest aspektist, tingimustel

) alusta {joonda} P (A \ keskel B \ amp C) & \ ge \ delta \ cdot P (A \ keskel { sim} B \ amp C) \ P (A \ keskel B \ amp { sim} C) & \ ge \ delta \ cdot P (A \ keskel { sim} B \ amp { sim} C) end {joondada})

(delta \ ge 1) abil on võimalik

[P (A \ keskel B) umbes 0 \ tekst {ja} P (A \ keskel { sim} B) u 1 / \ delta.)

Eeldusel, et aritmeetika eeldused on vajalikud, võrdsustatakse need võimalused aritmeetika olemasolu tingimustega. Skeem:

[Kui on võimalik, et (A) on vajalik, siis (A)]

kehtib suures modaaloogika perekonnas. Simpsoni pöörduste piirtingimused võimaldavad (A) ja (B) vahelise tõenäosusliku seose ümber pöörata mõnes järgmises jaotises (B). Aritmeetika seisukohast on olemas partitsioon ({) C, ({ sim}) C (}), milles ühendused (A) ja (B) vahel on ümber pööratud. Oluline sellega seotud tagajärg on see, et alati on matemaatiliselt võimalik esitada mõni tingimus või tegur (C), mis muudab (A) tõenäosuslikult sõltumatuks (B), kui (C) on ühendatud (B) tingimusena (A) ja tingimusena ({ sim} B) tingimusena (A). Need aritmeetika faktid iseenesest ei oma empiirilist tähendust. Kuid,neil on metodoloogiline tähtsus niivõrd, kuivõrd statistiliste ja tõenäosussuhete põhjal järelduste tegemiseks on vaja olulisi empiirilisi eeldusi.

Vajadus sisuliste empiiriliste eelduste järele tekib seadetes, kus leidub aritmeetilisi võimalusi, mida tähistavad Simpsoni pöördumised urnimudelites ning võimalikes ja tegelikes empiirilistes seadetes. Näiteks kaaluge meie töökoha taotlejate edukuse määra urni mudelit. Mudel koosneb kahekümne kuuest kuulist. Iga pall on märgistatud ühega komplektidest ({M, { sim} M }, {H, { sim} H }) ja ({S, { sim } S }), näiteks võib antud kuul olla märgistatud ([{ sim} M, H, { sim} S]) Oletame, et sildid on jaotatud vastavalt tööotsijate jaotusele. Pallidest urnist väljatõmbamise katsetes koos asendamisega seostatakse alampopulatsioonides (M), (H) ja (S) vahelisi seoseid ja vastupidist seost (M) ja (S) kogu rahvastikus,on vastupidavad. Vastupidavad seosed on tingitud ainult mudeli ülesehitusest ja neil puudub põhjuslik tähtsus. Vastupidi, muudel juhtudel on järelduste tegemiseks vaja sisulisi eeldusi.

Andmete mustrid, mis jäävad Simpsoni ebavõrdsuse pöördumiste piirtingimustesse, võivad tekitada probleeme empiiriliste hüpoteeside testimisel ja hindamisel, nt meditsiiniliste protseduuride tõhususe ja ohutuse testimisel. Ajaloo ja geograafia personali mõjutava haigusseisundi ravikuuri saab seostada madalama ravitud surmajuhtumitega võrreldes ajaloos ravimata patsientidega ja madalama ravitud surmajuhtumitega võrreldes ravimata patsientidega geograafias; siiski võib ravikuur korreleeruda kõrgema suremusmääraga, kui ravitud patsiente võrreldakse üldiselt ravimata patsientidega. Vastupidiselt saab ravi seostada kõrgema suremuse määraga igas alarühmas, samal ajal kui see on korrelatsioonis kogu elanikkonna madalama suremusega. Sellistel juhtudel pole kaugeltki selge, mida,kui midagi, siis järeldada korrelatsioonide põhjal ravi efektiivsuse ja ohutuse kohta.[2]Lisaks võivad selle näite puhul oletatavate mustritega samade andmete erinevad osadeks jaotamise viisid anda erinevaid korrelatsioone, mis näivad olevat kokkusobimatud andmete jagamise algsel viisil esitatud korrelatsioonidega. Näiteks näib, et akadeemiliste distsipliinide kaupa jaotatud patsiendid lähevad ravimisel halvemaks, ehkki kogu populatsioonis võib ravi ja paranemise vahel olla positiivne korrelatsioon. See on kooskõlas positiivse korrelatsiooniga ravi ja taastumise vahel, kui elanikkond jaotatakse soo järgi. Ehkki ajaloolased ja geograafid on raviga võrreldes halvemad, saavad kahe osakonna mehed ja naised mõlemad ravi korral paremini hakkama ning need andmed on kooskõlas nii elanikkonna koondnurgaga kui ka halvema elanikkonnaga.[3]

Eelnimetatud võimalused tulenevad asjaolust, et järgmised valemid on kollektiivselt järjekindlad. Võtke tõenäosusfunktsiooniks '(P)'. Võimalik on pakkuda tõenäosusmudeleid, mis kontrollivad järgmistest valemitest koosneva komplekti järjepidevust:

) alusta {joonda} P (A \ keskel B) & P (A \ keskel { sim} B) \ P (A \ keskel B \ amp C) & \ lt P (A keskpaigas { sim} B \ amp C) \ P (A \ keskel B \ amp { sim} C) & \ lt P (A \ keskel { sim} B \ amp { sim} C) \ P (A \ keskel B \ amp D) & P (A \ keskel { sim} B \ amp D) \ P (A \ keskel B \ amp { sim} D) & \ gt P (A \ keskel { sim } B \ amp { sim} D) \ \ end {joondada})

Sarnane ebavõrdsus on võimalik ka vastupidiste märkidega ning tõenäosuslikku sõltumatust esindavad võrdsused vastavad positiivsetele ja / või negatiivsetele seostele populatsioonide vaheseintes. Need faktid ei ole aritmeetika seisukohast paradoksaalsed. Nendele esindatavatele seaduspärasustele ei saa siiski anda kausaalset olulisust ja tõenäosusliku sõltumatuse jaoks piisavatest tõenäosuslikest võrdsustest ei saa kõiki pidada põhjuslikuks sõltumatuseks.

Tähtsuse testimise standardsed statistilised meetodid ei kindlusta vastuoluliste tulemuste vastu, kui andmeid jaotatakse või konsolideeritakse. Seadmes, kus uue meditsiinilise ravi tõhusust testitakse, toetavad järgmised andmed nullhüpoteesi tagasilükkamist.05 tasemel, et ravi (T) ei muuda taastumist (R), kus alternatiiv nullhüpoteesile on see, et ravi on taastumiseks soodne. [4]

(R) ({ sim} R)
(T) 369 340
({ sim} T) 152 176

Kuid selles mudelis, kui elanikkond jaotatakse soo järgi veelgi, toetatakse meestele ja naistele vastupidist soovitust 0,05 olulisuse tasemel.

(RM) ({ sim} RM) (R { sim} M) ({ sim} R { sim} M)
(T) 48 152 321 188
({ sim} T) 73 145 79 31

Tehke nullhüpoteesiks see, et ravi ja taastumise vahel pole seost, ja nullhüpoteesi alternatiiv, et ravi on taastumiseks vähem soodne kui ravi puudumine. Nullhüpoteesi tagasilükkamine jääb nii (M) - kui ka (({ sim} M) - tabelite jaoks olulisuse0,0 piiresse. Nii et konsolideeritud andmete arvessevõtmisel eelistatakse ravi, kuid kui elanikkond jaotatakse soo järgi, ei eelistata ravi nii meeste kui ka naiste puhul. Täiendav jaotus, nt jaotamine vanuserühmade kaupa, võib vaheseinte vahelised seosed soo järgi ümber pöörata. Nii et ravi saab positiivselt korreleerida kogu elanikkonna taastumistega, negatiivselt korreleeruda taastumistega, kui elanikkond jaotatakse soo järgi,ja on positiivses korrelatsioonis taastumisega, kui elanikkond jaotatakse vanuse järgi. Simpsoni ebavõrdsuse ümberpööramise piirtingimuste üldisus tagab, et aritmeetikas on alati olemas mudeleid, mis sisaldavad andmeid ja toetavad vastuolulisi soovitusi. Aritmeetika ei vaiki selleni, milliseid partitsioone tuleb aluseks võtta, et hinnata vastuolusid antud andmete hüpoteeside ja andmete jaotamise viiside vahel.

2. Simpsoni ebavõrdsuse pöördumised kui kehtetute mõttekäikude allikad

Intuitiivne arutlus protsentide ja tõenäosussuhete üle on kurikuulsalt õnnetuste oht. Näide, mis põhines Berkeley vastu esitatud kohtuasjal, illustreeris, kuidas andmete koondamisel võib ümber kalduda eelarvamus ülikooli iga osakonna töölevõtmise tavades. Kuid paljud inimesed pidasid vähemalt esialgu võimatuks seda, et suurem protsent mehi oleks edukas keskkonnas, kus naistel oli kõrgem edukuse määr igas osakonnas, kus kohtumisi tehti. Üks viis Simpsoni pöördumistest tuleneva intuitiivse mõttekäigu puuduse nägemiseks on märkida, et elanikkonna partitsioonide andmete osade esitamine murdarvudena ja murdosade kasutamisel andmete koondamisel andmete kogumiseks kogu populatsiooni kohta ei ole tagatud vaheseinte fraktsioonide vaheliste suhete säilitamine. Õigetel murdudel on lõpmata palju samaväärseid esitusi. Näiteks 1 / (2 = 2/4 = 4/8 = \ ldots). Nüüd tuletage meelde fraktsioonide vaheliste suhete vormi, mille abil illustreeriti Simpsoni pöördumist, st

) alusta {joonda} a / b & \ lt A / B, \\ c / d & \ lt C / D, \ tekst {ja} (a + c) / (b + d) & \ gt (A + C) / (B + D). \ lõpeta {joondus})

Käsitledes termineid õige murdarvana, võib meil olla (a / b = 2a / 2b) ja (A / B = 5A / 5B); (c / d = 3c / 3d) ja (C / D = 4C / 4D). Kui need samaväärsed esindused ühendatakse, erinevad fraktsioonidevahelised suhted sageli algsest suhtest. Nt, ((2a + 3c) / (2b + 3d)) võib olla enam või vähem kui ((a + c) / (b + d)). Seetõttu pole õige järeldada, et protsendimäärade või suhtarvude vahelised suhted andmete liitmisel vastavad reeglipärasustele, mida näitavad andmete partitsioone sisaldavad komplektid. Suhete ekvivalentsed esindused annavad andmete liitmisel erineva panuse.

Üks viis selle raskuse aritmeetiliseks lahendamiseks on alarühmade andmete esinduste "normaliseerimine" ja andmete normaliseeritud esinduste koondamine. Andmete normaliseerimine arvestab viltude mõjuga, pakkudes püsivaid nimetajaid fraktsioonidele, mis andmeid esindavad, ja esindades võrreldavaid alampopulatsioone, nagu oleksid nad võrdsetes mõõtmetes võrdse suurusega. Simpsoni tagasipöördumised näitavad aga, et elanikkonna jaotamiseks on arvukalt viise, mis on kooskõlas kogu elanikkonna assotsiatsioonidega. Sooline jaotus võib näidata, et nii meestel kui naistel oli uue ravi korral halvem olukord, samas kui sama populatsiooni jagunemine vanuse järgi näitas, et alla viiekümne patsiendi,ning viiekümne ja vanema patsiendi seisund oli uue ravi korral parem. Sama populatsiooni erineva jaotamise viiside andmete normaliseerimine annab ühitamatuid järeldusi assotsiatsioonide kohta, mis kehtivad kogu populatsioonis.

Seotud punkt tuleb veelgi ilmekamalt välja siis, kui murdu tõlgendatakse tõenäosusena. Eespool märgiti, et Simpsoni ümberpööramisel võib olla järgmine tõenäoline kuju: See on võimalik

) alusta {joonda} P (A \ keskel B) & P (A \ keskel { sim} B), \ tekst {kus} (A \ keskel B \ amp C) & \ lt P (A \ keskel { sim} B \ amp C) tekst {ja} \ P (A \ keskel B \ amp { sim} C) & \ lt P ({ sim} B \ amp { sim} C). \ lõpeta {joondus})

Üks võimalus intuitiivsetele mõttekäikudele sellest võimalusest mööda vaadata on nn täieliku tõenäosuse seaduse tähelepanuta jätmine ja selle olulisus selle seade suhtes. Tõenäosusarvutusest on meil järgmised ekvivalendid, mis tähistavad tõenäosusi kaalutud keskmistena.

) alusta {joonda} P (A \ keskel B) & = P (A \ keskel B \ amp C) P (B \ keskel C) + P (A \ keskel B \ amp { sim} C) P (B \ keskel { sim} C) \ P (A \ keskel { sim} B) & = P (A \ keskel { sim} B \ amp C) P ({ sim} B \ keskel C) + P (A \ keskel { sim} B \ amp { sim} C) P ({ sim} B \ keskel { sim} C) lõpp {joondus})

Kaldkaalud: (P (B \ keskel C)), (P (B \ keskel { sim} C)), (P ({ sim} B \ keskel C)) ja (P ({ sim} B \ keskel { sim} C)) loovad hulga võimalusi, mida tähistavad Simpsoni pöördumiste piirtingimused. Nt las

) alusta {joonda} P (A \ keskel B) & =.54 \ tekst {ja} \ P (A \ keskel { sim} B) & =.44 \ lõpeta {joonda})

Seega on (B) positiivselt asjakohane (A) suhtes. Olgu kaalud, mis iseloomustavad nende tõenäosuste esitamist koefitsiendina (C):

) alusta {joonda} P (B \ keskel C) & =.28, \\ P ({ sim} B \ keskel C) = =.72, \\ P (B \ keskel { sim} C) & =.66, \ tekst {ja} \ P ({ sim} B \ keskel { sim} C) & =.34 \ lõpp {joonda})

Neid kaalumisi arvestades on (B) positiivselt asjakohane (A), kuid see on negatiivselt asjakohane (A) suhtes kõigis lahtrites, mida partitsioon pakub ({C, { sim } C }). St [5]

) alusta {joonda} P (A \ keskel B \ amp C) & =.27, \\ P (A \ keskel B \ amp { sim} C) & =.33, \\ P (A \ keskel { sim} B \ amp C) & =.64, \ tekst {ja} \ P (A \ keskel { sim} B \ amp { sim} C) & =.66 \ lõpp {joondada})

Kui intuitiivsed vastumeelsed ignoreerivad kaalude mängitavaid rolle või ei suuda neid tõenäosuse põhjendamisel kaaluda, on nad hämmastavad, kui Simpsoni pöördumised ilmnevad tegelikes või võimalikes andmetes. Inimitiivsetes mõttekäikudes kaalumiste tähelepanuta jätmine võib tuleneda teadmatusest, harjumusest või ebaõnnestunud heuristilisusest tõenäosussuhete põhjendamisel. Muidugi on see empiiriline küsimus, kas selline järelevalve on kehtetute põhjenduste allikas või selgitab mõni muu hüpotees paremini, miks peavad paljud inimesed Simpsoni pöördumisi alguses võimatuks ja miks on pöördumised jätkuvalt üllatavad ka pärast nende allika selgitamist neile.

3. Kas paradoksaalsed andmed pakuvad kindla näite põhimõttele vastupidiseid näiteid?

Nn kindla asja põhimõte (edaspidi STP) on ratsionaalse otsuse teooriate jaoks põhiline. LJ Savage esitab selle järgmise sõnastuse:

Kui eelistaksite kindlasti (g) kui (f), kas siis, kui teate, et sündmus (C) saadi, või kui teadsite, et sündmus (C) ei toimunud, siis eelistate kindlasti (g)) kuni (f) (Savage 1954, 21–2).

Ratsionaalse valiku teooriates, milles eelistused tellitakse eeldatava kasulikkuse maksimeerimise reegli järgi, on STP tagajärg asjaolule, et optsiooni eeldatavat kasulikkust saab esitada üksteist välistavate ja kollektiivselt ammendavate eeldatavate kommunaalteenuste tõenäosuslikult kaalutud keskmisena kuidas saaks maailm olla eeldusel, et valik on valitud. Näiteks kui „EU” tähistab funktsiooni, mis määrab eeldatavad kommunaalkulud ja „P” tõenäosusfunktsiooni, [EU (A) = EL (A \ amp B) P (B) + EL (A \ amp { sim} B) P ({ sim} B).)

Kui teate, et (B) kehtib, muutub see parameetriks eeldatava kasulikkuse (A) jaoks ja samamoodi siis, kui teate, et (B) kehtib. Nii et kui eeldatav väärtus, mis omistatakse (C), on väiksem kui (A) eeldusel, et teate, et (B) saavutatakse, ja sarnaselt eeldusega, et (B) ei saa, siis on (C) eeldatav väärtus tingimusteta väiksem kui (A) oodatav väärtus.

Oletame nüüd, et kahe osakonna näites pakutakse teile ennustusi taotlejatele, kes saavad tööd. Teie võimalused on kihla vedada, et juhuslikult valitud edukas taotleja on mees, või panustada juhuslikult valitud edukale taotlejale, kes on naine. Olgu (C) ajaloos töökoha taotlemise sündmus ja ({ sim} C) geograafias töökoha taotlemise sündmus. (Iga vastava valdkonna inimene kandideerib täpselt ühele ametikohale.) Arvestades, et naissoost edukuse määr oli suurem kui mõlemas osakonnas meestel, soovitab STP, et pakkujate valimisel peaksite naisi toetama? Selle põhjuseks võib olla (valesti) järgmine: arvestades, et naistel on suurem võimalus õnnestuda nende taotluste puhul, mis on antud (C) ja antud ((sim} C),STP soovitab eelistada loteriil, kus panustatakse edukate taotlejate soo alusel, panuseid naistele. Muidugi oleks see eeskuju seadmisel halb nõuanne, kuna meeste edukuse määr oli üldiselt suurem. Arvestades piisavalt suurt panuste arvu, võiks nutikale bukmeistrile olla kindel kindel kasum, kui panustajad toetaksid naisi võistlustel. Nende edukuse määr oli madalam kui meeskonkurentide edukuse määr üldiselt, vaatamata sellele, et see oli igas osakonnas kõrgem. Nende edukuse määr oli madalam kui meeskonkurentide edukuse määr üldiselt, vaatamata sellele, et see oli igas osakonnas kõrgem. Nende edukuse määr oli madalam kui meeskonkurentide edukuse määr üldiselt, vaatamata sellele, et see oli igas osakonnas kõrgem.

Et näha, mis on STP rakendamisel selles seaduses valesti läinud, piisab, kui märkida, et edukate taotlejate juhuslik loosimine tehakse segust, mis sisaldab mehi ja naisi, ja segus on rohkem isaseid. (Pidage meeles, et naisi kandideeris suurem arv neid töökohti, mida oli raskem saada.) Põhimõtte rakendamiseks ei piisa sellest, kui tõenäosused vastavad naistele, kellel on igas osakonnas suurem õnnestumisvõimalus. Põhimõtet kohaldatakse eelistuste suhtes, võttes arvesse kommunaalteenuste kaalutud keskmisi koos tõenäosusega, et kaalu antakse. Esitatud võimalused on järgmised

  • (1) Juhuslikult valitud edukas taotleja on naine.
  • (2) Juhuslikult valitud edukas taotleja on mees.

Kui öelda, et valitud kandidaat kandideeris ajaloos (C) või geograafias (({ sim}) C), siis see ei mõjuta segu õnnestumise tõenäosust. See on ilmne, kui optsioonide eeldatavad kasulikkused on selgesõnaliselt esitatud kaalutud keskmistena. Kasutades 'M' meeste puhul, '({ sim}) M' naiste puhul, 'S' edukate jaoks ja 'C' ja '({ sim}) C' nagu ülalpool, oodatakse valikud on järgmised.

) alustage {joondage *} silt {1} EL ({ sim} M \ amp S) & = EL ({ sim} M \ amp S \ amp C) P (C \ mid S \ amp { sim} M) & \ quad + EU ({ sim} M \ amp S \ amp { sim} C) P ({ sim} C \ keskel S \ amp { sim} M) \ \ silt {2} EL (M \ amp S) & = EU (M \ amp S \ amp C) P (C \ mid S \ amp M) & \ quad + EU (M \ amp S \ amp { sim} C) P ({ sim} C \ keskel S \ amp M) lõpp {joonduma *})

Arvestades näites kasutatud arvnäitajaid, on paranduskoefitsientide tõenäosussuhted järgmised:

) alusta {joonda} P (C \ mid S \ amp { sim} M) & \ gt P (C \ mid S \ amp M) tekst {ja} \ P ({ sim} C \ mid S \ amp { sim} M) & \ gt P ({ sim} C \ keskel S \ amp M). \ lõpeta {joondus})

Just need suhted on illusiooni allikaks, et STP valib variandi 1. Tõenäosus, et edukas naissoost kandidaat kandideerib ajaloole, on suurem kui tema meessoost konkurendil ajaloo kandidaatide seas ja samamoodi naistel naistel Geograafia. Kui kandidaadid olid sorteeritud nende avalduste järgi vastavatesse osakondadesse, kus naistel oli suurem edukuseaste, ja joonistamine tehti juhuslikult valitud osakonnast (korduvate loosimiste ja asendamisega kuni eduka kandidaadi loosimiseni), mitte aga Kui olete edukad taotlejad, oleks parim valik soost, kelle edukuse määr on kõrgem vastavates osakondades, st naised. Sellist korraldust ei mõjuta asjaolu, et rohkem naisi kandideeris raskematele töökohtadele. Kuid selline kihlvedude korraldamine, kus valitakse välja valitud edukate taotlejate hulgast, pole ette nähtud. Võimalus valida sellest segust mees (või naine) on sõltumatu osakonnast, kuhu edukad taotlejad olid pöördunud. Seetõttu leiavad ratsionaalsed panustajad, et STP pole seaduses kohaldatav, kuna neil ei ole eelistusi, mida selle rakendamine eeldab, st eelistusi naistele, kuna nad kandideerisid tööle ajaloos (C) ja eelistavad naised, arvestades, et nad taotlesid tööd geograafias (({ sim} C)). Mõistlike panustajate jaoksVõimalus valida sellest segust mees (või naine) on sõltumatu osakonnast, kuhu edukad taotlejad olid pöördunud. Seetõttu leiavad ratsionaalsed panustajad, et STP pole seaduses kohaldatav, kuna neil pole eelistusi, mida selle rakendamine eeldab, st eelistusi naistele, arvestades, et nad kandideerisid tööle ajaloos (C), ja naised, arvestades, et nad taotlesid tööd geograafias (({ sim} C)). Mõistlike panustajate jaoksVõimalus valida sellest segust mees (või naine) on sõltumatu osakonnast, kuhu edukad taotlejad olid pöördunud. Seetõttu leiavad ratsionaalsed panustajad, et STP pole seaduses kohaldatav, kuna neil ei ole eelistusi, mida selle rakendamine eeldab, st eelistusi naistele, kuna nad kandideerisid tööle ajaloos (C) ja eelistavad naised, arvestades, et nad taotlesid tööd geograafias (({ sim} C)). Mõistlike panustajate jaoksMõistlike panustajate jaoksMõistlike panustajate jaoks

) alustage {joondama} EL ({ sim} M \ amp S) & = EL ({ sim} M \ amp S \ amp C) & = EU ({ sim} M \ amp S \ amp { sim} C), \ lõpeta {joondus})

ja samamoodi (M) puhul, samas kui näites toodud arvudel

[EL ({ sim} M \ amp S) lt EU (M \ amp S).)

Ehkki Simpsoni tagasipöördumised ei toeta otsuseid, mis on vastuolus kindla põhimõttega, tekitavad need siiski praktilise tähtsusega probleeme, kui tuleb vastu võtta otsused, mida teha. Kas inimeste koguarvust koosnevad ühendused peaksid suunama otsuste langetamist Fixiti korraldatud kohtuprotsessis? Või peaksid meeste ja naiste alampopulatsioonide ühendused suunama otsuseid, kas võtta ravimeid? Pidage meeles, et kogu rahvastiku erinev jaotus, näiteks vanuse järgi, võib esile kutsuda selliseid assotsiatsioone nagu kogu elanikkonnast, ja vastupidine soole tuginevale jaotusele. Puuduvad a priori meetodid, mis vastaksid küsimustele, kas assotsiatsioonid koondandmetes või assotsiatsioonid koondatud andmete partitsioonides,on head alused järelduste tegemiseks põhjustest tagajärgedeni või otsuste tegemiseks, mida teha. Võimalikud juhised on konkreetsete praktiliste probleemide loogilise ja põhjusliku struktuuri kohta käivad tingimuslikud hüpoteesid. Kui on olemas asjakohane taustteave, võivad raviotsuste tegemisel olla aluseks suhted, nt ravi ja taastumise vahel kogu elanikkonnas. Arvestades erinevat taustteavet, võivad ravi ja taastumise suhted elanikkonna silmatorkavas osas olla õigustatud, vastupidiselt assotsiatsioonidele kogu elanikkonnas. Kuna konkreetsetel juhtudel puuduvad loogiliste ja põhjuslike struktuuride osas mingid tingimuslikud eeldused, pole abinõud otsustamiseks, mida teha. Ehkki Simpsoni pöördumised pole loogilisest aspektist paradoksaalsed,nad osutavad vastuolulistele ühendustele, mis muutuvad tõeliselt paradoksaalseks, kui neile kõigile antakse põhjuslik tähtsus.

4. Simpsoni ebavõrdsuse, korrelatsiooni ja põhjuslikkuse pöördumised

On tavaline, et muutujate vahelised korrelatsioonid ei tähenda, et need seisaksid põhjuslikes suhetes. Kuigi mõned korrelatsioonid on täiesti juhuslikud, võivad teised olla seaduslikud ka siis, kui korrelatiivsete muutujate vahel põhjuslikku seost ei teki - nt korrelatsioon langevate baromeetrite ja vihma vahel on seaduslik, kuna need on ühise põhjuse, st langeva õhurõhu ühised tagajärjed. Kontrollitud eksperimentide eesmärk on paljastada korrelatsioonid, mis on lihtsalt juhuslikud. Mis saab siis tugevatest korrelatsioonidest muutujate vahel, mis ei ole omavahel seotud? Hans Reichenbach tegi ettepaneku, et muutujate tugev korrelatsioon on petlik [juhuslik], kui on tegur, mis korrelatsiooni välja lülitab ja on seotud muutujate tavaliseks põhjuseks (Reichenbach 1971, ptk 4). Ütle, et (A) on B-ga seotud siis ja ainult siis, kui nad pole tõenäosuslikult sõltumatud, st (P (A \ keskel B) ne P (A)). Reichenbach leidis, et selline seotus on võlts, eeldusel et on olemas tegur (C), et (P (A \ keskel B \ amp C) = P (A \ keskel C)).

Simpsoni ebavõrdsuste ümberpööramine illustreerib, et aritmeetilisest vaatepunktist on alati olemas tegur või pakkumine (C), mis "välistab" korrelatsiooni. Sellise teguri olemasolu ei saa olla korrelatsiooni võltsimiseks piisav. Oletagem näiteks, et (A) antud (B) tõenäosus on suurem kui ilma (B). Järgmine diagramm illustreerib seda võimalust tõenäosustega, mis vastavad suletud ruumide proportsionaalsetele suurustele, kusjuures kõiki (A) tähistab suletud ristkülik, mida lõikab sirge, mis jagab (B) joont ({ sim} B).

puudu tekst, palun teavitage
puudu tekst, palun teavitage

Joonis 1. (P (A \ keskel B) gt P (A \ keskel { sim} B))

Simpsoni pöörduste piirtingimused tagavad, et leidub (C), mis ristub (A \ amp B) ja (A \ amp { sim} B) võrdsete osadega. 1. jaos märgiti, et aritmeetilised võimalused võrdsustatakse aritmeetiliste faktide olemasolu tingimustega. Tingimusel, et prooviruumi saab piisavalt peeneks jagada, saab tõenäosusliku olulisuse (A) ja (B) vahel „välja pesta” mõne suvalise teguriga (C), mille piires on tõenäosus, et (A \ ampull B) ja (A \ amp { sim} B) on võrdsed. Järgmine diagramm illustreerib seda aritmeetilist võimalust:

puudu tekst, palun teavitage
puudu tekst, palun teavitage

Joonis 2. (P (A \ keskel B \ amp C) = P (A \ keskel { sim} B \ amp C))

kus (C) tähistab rööpkülik, mis on poolitatud piirist (B) ja ({ sim} B) ning koosneb võrdsetest osadest (A \ amp B) ja (A \ amp { sim} B). (C) on suvaline väide või tegur. Kuna suletud ruumid vastavad tõenäosustele, (P (A \ keskel B \ amp C) = P (A \ keskel { sim} B \ amp C)). Niisiis, (C) 'kuvatakse ekraanilt välja (A) (B); selle olemasolu on aga selgelt ebapiisav, et näidata, et korrelatsioon (A) ja (B) vahel on petlik. Ehkki „sõelumine” võib osutuda vajalikuks tingimuseks, mis näitab, et muutujate vaheline korrelatsioon on tingitud tavalisest põhjusest, on tõenäoline kalkulatsiooni aluseks olev aritmeetika selle tingimata täidetud. Lisaks (A), (B) vahelistele tõenäosussuhetele tuleb pakkuda täiendavaid sisulisi tingimusi.ja (C), et tuvastada (C) kui (A) ja (B) levinud põhjus.

Järeldus, et seaduslikult korreleeruvad muutujad on põhjuslikult üksteisest sõltumatud, kui korrelatsioon tuleneb üldisest põhjusest, on üldisema ülevaate erijuhtum, mis põhjustab nende mõju tõenäosuse suurenemist. [6] Kui muutujate (B) ja (A) vahel on korrelatsioonil tavaline põhjus (C), ei põhjusta (B) (A); (A) võimaluste suurendamine on tingitud (C) ja kuigi (B) võib olla (A) sümptom, on see tingitud sellest, et see on (C), mis eelneb (A). Järgmine diagramm illustreerib neid suhteid. (Nooled tähistavad põhjuslike seoste suunda.)

puudu tekst, palun teavitage
puudu tekst, palun teavitage

Joonis 3. (B) eelneb (A) ja (C) on (B) ja (A) levinud põhjus

Arvestades (C), (B) ei suurenda (A) võimalusi. Juhuslikkuse suurendamise põhjusliku seose analüüsi aluseks on see, et põhjused soodustavad nende mõju. Deterministlikes tingimustes võtavad võimalused ainult äärmuslikke väärtusi ja põhjused ei suurenda efektide tekkevõimalusi, välja arvatud degenereerunud mõttes, kus nad suurendavad nende mõju tõenäosust nullist ilma nendeta ühele nendele (välja arvatud deterministliku ülemäärase määramise juhtumid)). Küsimus on siiski selles, kas maailm, milles me elame, on deterministlik või indeterministlik ning põhjuslikkuse kontseptsioonid peavad arvestama nii viimase kui ka esimese võimalusega. Seejärel võib deterministliku põhjusliku seose esitusi vaadelda kui tõenäolise põhjusliku seose erijuhtu, kus põhjused on nende tagajärgede jaoks piisavad ja vajalikud.

Arvestades Simpsoni ebavõrdsuste pöördumisi, varieeruvad tõenäosussuhted muutujate vahel populatsioonide erinevates osades või olekuruumides väga erinevalt. See fakt tõenäosussuhete kohta on hindamatu ressurss keerukate suhete, mis toimivad põhjuste võrkude ja nende tagajärgede vahel, tõenäosuslikus väljenduses. Põhjused mitte ainult ei saa soodustada mõju, vaid võivad soodustada ka nende puudumisel ilmneda võivat mõju pärssida. Näiteks pärsib või vähendab regulaarne treenimine kardiovaskulaarsete häirete tõenäosust. Seega soodustab regulaarse treenimise edendamine südame-veresoonkonna tervist, isegi kui see soodustab ka südame-veresoonkonna haigusi. Cartwright toob järgmise näite. Suitsetamine põhjustab südamehaigusi,kuid see võib põhjustada ka seda, et suitsetajad hakkavad rohkem liikuma kui mittesuitsetajad. Sel juhul võib suitsetamine põhjustada kaudselt südame-veresoonkonna tervist, põhjustades samal ajal otsest haigust. Kui pluss- ja miinusmärgid näitavad, kas põhjus soodustab või pärsib mõju, näitab järgmine diagramm põhjuslikku ülesehitust, milles suitsetamine võib edendada südame-veresoonkonna tervist, edendades samal ajal haigust.

puudu tekst, palun teavitage
puudu tekst, palun teavitage

Joonis 4.

Näiteks kui suitsetamine suurendab südamehaiguste tõenäosust 25%, kuid suurendab ka regulaarse treenimise võimalusi 40%, samal ajal kui treenimine vähendab haiguse tõenäosust 70%, on suitsetajatel üldiselt kasu harjumusest südame-veresoonkonna tervise osas. Selles koosseisus võiks toimuda Simpsoni pöördumine, kus suitsetajad, kes treenivad, on halvemad kui mittesuitsetajad, kes treenivad, ja sarnaselt suitsetajatele, kes ei tee trenni võrreldes mittesuitsetajatega, samal ajal kui suitsetajate haigus on üldiselt madalam. Suitsetamise neto-põhjuslik mõju tervisele on näites positiivne, kuna tegemist on kolmanda muutuja, trenniga, st suitsetamise mõjuga. Muude põhjuslike seoste korral on Simpsoni pöördumiste allikaks muude muutujate põhjuslikud panused, kus täiendavate muutujate panused muudavad otsese põhjusliku seose mõju. Nende hulka kuuluvad juhtumid, kus otseseid mõjusid kahandavad kaasneva teguri pärssivad mõjud, nt ained, mis on eraldi mürgised, happelised ja leeliselised, ja need võivad koosmõjul olla kahjulikud. Mõlemad toimivad üksteise vastumürgina.[7] Täiendavate takerdumiste hulka kuuluvad juhtumid, kus efekti soodustava põhjusega kaasneb mõju pärssiv põhjus ja mõlemad on ühise põhjuse tagajärjed. Nt

puudu tekst, palun teavitage
puudu tekst, palun teavitage

Joonis 5. (E) võimalust ei sega (CC), see on tavaline põhjus.

Selle diagrammi tõlgendus: tromboos võib olla raseduse tagajärg ja see võib olla ka rasestumisvastaste tablettide mõne koostisosa mõju. Nii rasedus kui ka pillid suurendavad tromboosi tõenäosust. Pillid vähendavad aga rasestumisvõimalusi ning neto mõju naistele, kes neid tarvitavad, ei näita tromboosi sageduse muutumist. Näited, näiteks sellised, mis on lõiganud, näitavad, et kahe muutuja vahelise põhjusliku seose jaoks pole vajalik ega piisav, et üks suurendaks teise tõenäosust. Cartwright (2001, 271) sedastab küsimuse järgmiselt: 'Põhjused võivad suurendada nende mõju tõenäosust; kuid nad ei pea. Ja vastupidi: tõenäosuse suurenemine võib olla tingitud põhjuslikust seosest; kuid ka paljud muud asjad võivad olla vastutustundlikud.”

Kas Cartwrighti vaatlus põhjustab põhjuslikkuse ja põhjusliku seose tõenäosuslikkuse analüüsimise programmi pessimismi? Mitte tingimata. See seab probleemiks põhjuslikud takerdumised, mida tõenäosussuhted ei jälgi, ja tõenäosuslikud takerdumised, mis pole tingitud põhjuslikest seostest. Põhjuslike seoste tõenäosuslike esituste pakkumise programm peab tagama tingimused, mis eraldaksid põhjuslikud võrgud. Vajalik on viis populatsioonide õigete vaheseinte leidmiseks, kus õiged on need, mille tõenäosussuhted jälgivad põhjuslikke seoseid, hoides samal ajal fikseeritud olulised taustategurid. Kirjanduses on tõenäosusliku põhjusliku seose kohta esitatud mitmeid erinevaid ettepanekuid, mille eesmärk on pakkuda kriteeriume andmete õigete partitsioonide leidmiseks põhjuslike seoste tuvastamiseks.

Ettepanekud jagunevad kahte laiasse kategooriasse: (1) redutseerivad ettepanekud: need ei meeldi põhjuslikele mõistetele ja nende eesmärk on pakkuda korrelatsioonide filtrit, mis tuvastaks, millised seosed on väärad. Korrelatsioonid, mis ei ole võlts, on ette nähtud põhjuslike seoste intuitsiooniga vastavusse viimiseks ja põhjuslike suhete jaoks intuitiivselt määratud rollide rakendamiseks. [8](2) Mittereduktiivsed ettepanekud: nende puhul on mõistlik kasutada põhjuslikke mõisteid väära ja põhjusliku seose eristamiseks. Selle teise rühma ettepanekud on üldiselt skeptilised Humeani programmi suhtes, mis motiveerib redutseerivaid ettepanekuid. Simpsoni pöördumiste näideteks olevad seadistused on nende üks peamisi kriitilisi skalpelli (Cartwright 1979 ja eriti Dupre & Cartwright 1988). Sellegipoolest seisavad nad silmitsi probleemiga pakkuda korrelatsioonide filtrit, mis näitab välja, millised neist on võltsitud, kuid nad ei tunne end tingimata põhjuslikele seostele viitamise vältimisel pakkudes kriteeriume partitsioonide valimiseks, mis pakuvad usaldusväärseid andmeid põhjuslike järelduste kohta. Kokkuvõttes pakuvad nii reduktsionistid kui ka antireduktsionistid, kes toetavad põhjuslike suhete esinemise programmi tõenäosussuhete osas, (C) põhjustab (E) ainult siis, kui (E) tõenäosus on suurem antud (C), kui antud mitte (C), eeldusel, et (ldots X \ ldots).

Erand on vajalik selliste juhtumite filtreerimiseks, kus tõenäosussuhted (C) tüüpi sündmuste ja (E) tüüpi sündmuste vahel ei jälgi põhjuslikke seoseid. Nende arvamused lahustuvad sellest, kas põhjuslikke mõisteid on vaja või kas neid saab ilma kurja ringluseta kasutada tingimuse sisu täpsustamisel. (Täpikesed X \ ppud). Redutseerijad otsivad viisi, kuidas täpsustada tingimust homogeensete võrdlusklasside osas, kus homogeensus on määratletud kindla korrelatsiooni teel tingimusel, et tegu on rea teguritega, mida hoitakse fikseerituna. Redutseerimise vastu võitlejad küsivad kiiresti: millised tegurid? Kõigi võimalike tegurite oluliseks tunnistamine pole mitte ainult epistemoloogiliselt keeruline, vaid võib viia rumalate järeldusteni, kuivõrd kõigi, kuid absoluutselt põhiliste põhjuslike protsessidega saab manipuleerida, kehtestades mõned sekkuvad tegurid. Ntsurma tõenäosus südameataki korral on suurem kui ilma infarktita, kuid südameinfarkti panus kontrollitakse välja juhtudel, kui südameatakk langeb kokku veoautoga alla sõitmisega. Selles näites on surmavõimalused ülemäära määratletud. Põhjusliku ülemäärase määramise juhtumid on äärmuslikud näited põhjuslikest võrkudest, kus tõenäosuse olulisus kaob või muutub eksogeense muutuja põhjusliku panuse abil ümber. Eksperimentaalteadustes on standardne protseduur tegurite eraldamise vastasmõju segavate muutujate vahel. See, mis on saavutatav isegi parimates laboritingimustes, ei vasta ideaalile näidata, et puuduvad sekkuvad tegurid, millest korrelatsioon sõltub. Viimase näitamiseks oleks vaja näidata, et negatiivne eksistentsiaalne väide on tõene.

Reduktsioonivastastel on valmis vastus küsimusele, millised tegurid peavad tõenäoliste sõltuvuste ja tõenäosusliku sõltumatuse hindamisel fikseeruma. Nad soovivad, et kõik potentsiaalselt põhjuslikult olulised tegurid, mis võivad huvi pakkuda, oleksid fikseeritud, et tuvastada tõenäosussuhted C ja E vahel, mis on tingitud ja sobivad põhjuslike seoste esitamiseks. Selle lähenemisviisi kohaselt pakuvad põhjuslikult homogeensed võrdlusklassid sobivat alust tõenäosussuhete hindamiseks. Seejärel uuritakse taustteaduslikke teooriaid ja muid teadmisi põhjuslike seoste kohta, et teha kindlaks, kas võrdlusklassid on põhjuslikult homogeensed. [9]Paljudel juhtudel ületab meie uudishimu põhjuslike seoste üle meie praegused teadmised põhjuslikult olulistest muutujatest, mida tuleb fikseerida. Siis võivad statistilistest andmetest tuletatud põhjuslike seoste järeldused, mida saab andmete erinevates osades alati vastupidiste seaduspärasustega vastandada, põhjustada põhjuslikke seoseid puudutavaid väiteid.

Arvestades andmete ümberpööramist, seisavad teadlased silmitsi küsimusega, kas agregeeritud andmetes olevad seosed on väärad või kas jagatud andmete seosed on väärad. Erinevad põhjuslikud mudelid (mida tähistavad erinevad suunatud atsüklilised graafikud) on sobivad esindama erinevatel juhtudel erinevaid vastuseid (vt tõenäolist põhjuslikku seost käsitlevat kirjet). Neid mudeleid saab testida interventsioonide abil, mis isoleerivad ja kontrollivad muutujate võetud väärtusi, mis on uurijale huvi pakkuvate mõjude nähtavad põhjused. Nõuetekohaselt läbi viidud katsed eraldavad manipuleeritavad muutujad ja loevad seejärel läbi manipulatsioonide mõju (vt põhjuslikku seost ja manipuleeritavust käsitlevat kirjet). Nn tagauksekriteerium (Pearl 1993) täpsustab täpselt, mida on vaja mõne muutuja manipuleerimiseks sobivalt isoleerimiseks. Niisiis saab Simpsoni ümberpöördumistega seotud probleeme lahendada katsetades erinevaid vaatlusandmetele vastavaid põhjuslikke hüpoteese, kus sekkumistega tehtavad testid pakuvad lisaks pelgatele vaatlustele aluse mõnede põhjuslike mudelite aktsepteerimiseks põhjuslike seoste ja nende tagasilükkamise eest, millel on lihtsalt petlikud seosed. Simpsoni “paradoks” on seega lahendatud selles mõttes, et on võimalik testida erinevaid põhjuslikke hüpoteese, mis näitavad, millised seosed on petlikud. (Selle meetodi kohta leiate lisateavet pärlist 2014.)Simpsoni ümberpöördumiste põhjustatud probleeme saab lahendada katsetades erinevaid vaatlusandmetele vastavaid põhjuslikke hüpoteese, kui sekkumistega tehtavad testid pakuvad lisaks pelgatele vaatlustele aluse mõne põhjusliku mudeli aktsepteerimiseks põhjusliku seose korrektseks esitamiseks ja tagasilükkamiseks. teised, millel on lihtsalt petlikud seosed. Simpsoni “paradoks” on seega lahendatud selles mõttes, et on võimalik testida erinevaid põhjuslikke hüpoteese, mis näitavad, millised seosed on petlikud. (Selle meetodi kohta leiate lisateavet pärlist 2014.)Simpsoni ümberpöördumiste põhjustatud probleeme saab lahendada katsetades erinevaid vaatlusandmetele vastavaid põhjuslikke hüpoteese, kui sekkumistega tehtavad testid pakuvad lisaks pelgatele vaatlustele aluse mõne põhjusliku mudeli aktsepteerimiseks põhjusliku seose korrektseks esitamiseks ja tagasilükkamiseks. teised, millel on lihtsalt petlikud seosed. Simpsoni “paradoks” on seega lahendatud selles mõttes, et on võimalik testida erinevaid põhjuslikke hüpoteese, mis näitavad, millised seosed on petlikud. (Selle meetodi kohta leiate lisateavet pärlist 2014.)Simpsoni “paradoks” on seega lahendatud selles mõttes, et on võimalik testida erinevaid põhjuslikke hüpoteese, mis näitavad, millised seosed on petlikud. (Selle meetodi kohta leiate lisateavet pärlist 2014.)Simpsoni “paradoks” on seega lahendatud selles mõttes, et on võimalik testida erinevaid põhjuslikke hüpoteese, mis näitavad, millised seosed on petlikud. (Selle meetodi kohta leiate lisateavet pärlist 2014.)

5. Simpsoni ebavõrdsuse ümberpööramine evolutsioonilistes seadetes

Simpsoni ebavõrdsuse ümberpööramistel on rakendusi majandusteoorias ja elanikkonna geneetikas, eriti juhtudel, mis hõlmavad ettevõtete või organismide vahelist konkurentsi. Ülaltoodud meeste ja naiste erineva palkamise näite korral kujutage ette, et me kaardistaksime naised näiteks lemmikutele ja mehed näiteks rottidele. Kujutlege, et lemmikud oleksid altruistlikud ja ohverdavad, või kujutage neid alternatiivina ette irratsionaalseteks, ebaefektiivseteks või laiskadeks - mõlemal juhul mõelge ühel või teisel viisil, kujutage ette, et nad käituvad viisil, mis toob naabritele kasu oma kulul. Kujutage ette, et rotid on isekad, ratsionaalsed ja tõhusad ning saavad regulaarselt kasu naabrite arvelt.

Järgmisena kaardistage ajaloo osakond Norrale väga karmi talve ajal ja oletagem, et Norras on rohkem rotte kui lemmikuid. Siis on elu Norras kõigile karm ja lemmikute jaoks on see veelgi karmim kui rottide jaoks. Kaardistage geograafiaosakond Rootsile, kus on keset väga kerget talve, ja oletagem, et Rootsis on rohkem lemmikuid kui rotte. Siis on Rootsis kõigi elu lihtsam, ehkki vabalt ratsutavate ja oportunistlike rottide jaoks on see isegi lihtsam kui lemmikute puhul. Lõpuks kaaluge rottide ja lemmikute paljunemisvõimet kahe riigi kogu maismaas. (Või kui need "rotid" ja "lemmings" olid ettevõtted, siis arvestage nende suhtelise pankrotimääraga.) Seejärel võivad numbrid kuvada sama mustrit, mida kirjeldasime meeste ja naiste rendi määradele California ülikoolis:

Lemmings Rotid
Norra ((1 \ korda 10 ^ 9) / (5 \ korda 10 ^ 9)) (lt) ((2 \ korda 10 ^ 9) / (8 \ korda 10 ^ 9))
Rootsi ((6 \ korda 10 ^ 9) / (8 \ korda 10 ^ 9)) (lt) ((4 \ korda 10 ^ 9) / (5 \ korda 10 ^ 9))
Skandinaavia ((7 \ korda 10 ^ 9) / (13 \ korda 10 ^ 9)) (gt) ((6 \ korda 10 ^ 9) / (13 \ korda 10 ^ 9))

Lemmings kaotab norra Norras ja Rootsis; ometi on nad saavutanud võimu kombineeritud aladel, mis moodustavad kaks riiki.

Lemmikute populaarsuse tõus kahe riigi ühises piirkonnas on see, et rohkem lemmikuid elab seal, kus ellujäämismäär on kõrgem. Pange tähele, et ellujäämismäär on seal kõrgem just seetõttu, et just seal elab rohkem lemmikuid. Seega, kui rotid kogunevad kokku, on iga roti isekas efektiivsus halb mitte ainult naabruses asuvate vaeste lemmikute jaoks, vaid ka teiste rottide jaoks. Isegi kui ainult pisut rohkem rotte elab ühes piirkonnas kui teises, kui nende naabrite kulul saadav kasu muutub liiga ekstreemseks, vähendab see kõigi naabruses elavate inimeste, sealhulgas rottide ellujäämise määra; see sadestab Simpsoni pöördumise ja rottide arv hakkab lemmikutega võrreldes globaalselt vähenema.

Nii Darwini evolutsiooniteoorias kui ka suures osas majandusteoorias on raske mõista, kuidas „altruism” (või selles osas süsteemne ebatõhusus) areneda või pikaajaliselt püsima jääda. See tähendab, et on raske mõista, kuidas elanikkond suudaks säilitada päritavaid käitumisharjumusi, millest on kasu üksikute ettevõtete või organismide konkurentidele, pikaajaliste ellujäämisvõimaluste või reproduktiivse edukuse arvelt nendele isikutele ja teistele, kellel on samasugune hoiak.. Sel põhjusel on Simpsoni paradoksi rakenduste uurimine märkimisväärse teoreetilise tähtsusega, et teada saada, kas see võib aidata selgitada mitte ainult altruismi, vaid ka irratsionaalsust, ebaefektiivsust, laiskust ja muid rahva seas valitsevaid vimma,ja see võib põhjustada elanikkonna majandusliku ratsionalisti või darwiniini ideaali, mis seisneb halastamatult tõhusal viisil iga inimese enda kasumi teenimisel või pikaajalise reproduktiivse edu saavutamisel. Kokkuvõttes on see ilmselt rõõmsameelne uudis.

Bibliograafia

  • Axelrod, R., 1984, The Evolution of Cooperation, New York: Põhiraamatud.
  • Bickel, PJ, Hjammel, EA ja O'Connell, JW, 1975, “Seksuaalne eelarvamus üliõpilaste vastuvõtul: andmed Berkeleylt”, Science, 187: 398–404.
  • Blyth, CR, 1972, “Simpsoni paradoksi ja kindla asja põhimõtte kohta”, Ameerika statistikaühenduse ajakiri, 67: 364–366.
  • Cartwright, N., 1979, “Põhjuslikud seadused ja tõhusad strateegiad”, Noûs, 13 (4): 419–437.
  • –––, 2001, “Mis Bayes Netsil viga on?”, The Monist, 84 (2): 242–265. Tõenäosuses kordustrükk on Life Guide, HE Kyburg, Jr ja M. Thalos (toim), Chicago ja La Salle, IL: Open Court, 2003, 253–275.
  • Cohen, MR ja Nagel, E., 1934, Sissejuhatus loogikasse ja teaduslikku meetodisse, New York: Harcourt, Brace and Co.
  • Dawid, AP, 1979, “Tingimuslik sõltumatus statistilises teoorias”, Kuningliku statistikaühingu ajakiri (seeria B), 41: 1–15.
  • Dupre, J. ja Cartwright, N., 1988, “Tõenäosus ja põhjuslikkus: miks Hume ja indeterminism ei segune”, Noûs, 22: 521–536.
  • Eells, E., 1987, “Cartwright ja Otte Simpsoni paradoksil”, Philosophy of Science, 54: 233–243.
  • Glymour, C. ja Meek, C., 1994, “Konditsioneerimine ja sekkumine”, Briti ajakiri teaduse filosoofiale, 45: 1001–1021.
  • Hardcastle, VG, 1991, “Partitsioonid, tõenäosuslikud põhjuslikud seadused ja Simpsoni paradoks”, Synthese, 86: 209–228.
  • Hesslow, G., 1976, “Arutelu: kaks märkust põhjuslikkuse tõenäosusliku lähenemise kohta”, Philosophy of Science, 43: 290–292.
  • Lindly, DV ja Novick, MR, 1981, “Vahetatavuse roll järelduste tegemisel”, Ameerika statistikaühenduse ajakiri, 9: 45–58.
  • Malinas, G., 1997, “Simpsoni paradoks ja viisakas uurija”, Australasian Journal of Philosophy, 75: 343–359.
  • –––, 2001, “Simpsoni paradoks: loogiliselt healoomuline, empiiriliselt reeturlik hüdra”, The Monist, 84 (2): 265–284. Kordustrükk „Tõenäosus on elu väga juhend”, Henry E. Kyburg, Jr ja Mariam Thalos (toim), Chicago ja La Salle, IL: Open Court, 2003, 165–182.
  • Mittal, Y., 1991, “Alampopulatsioonide homogeensus ja Simpsoni paradoks”, Ameerika statistikaühenduse ajakiri, 86: 167–172.
  • Otte, R., 1985, “Tõenäoline põhjuslikkus ja Simpsoni paradoks”, Philosophy of Science, 52: 110–125.
  • Pearl, J., 1988, Probabilistic Reasoning in Intelligent Systems, San Mateo, CA: Morgan Kaufman.
  • –––, 1993, “Kommentaar: graafilised mudelid, põhjuslikkus ja sekkumine”, Statistiline teadus, 8: 266–269.
  • –––, 2000, põhjuslikkus: mudelid, arutluskäik ja järeldused, New York, Cambridge: Cambridge University Press. [Teine väljaanne, 2009.]
  • –––, 2014, “Kommentaar: mõistmine Simpsoni paradoksist”, Ameerika statistik, 68: 8–13.
  • Reichenbach, H., 1971, Aja suund, Berkeley: University of California Press.
  • Savage, LJ, 1954, statistika alused, New York: John Wiley ja pojad.
  • Simpson, EH, 1951, “Interaktsiooni tõlgendamine situatsioonitabelites”, Kuningliku statistikaühingu ajakiri (seeria B), 13: 238–241.
  • Skyrms, B., 1980, põhjuslik vajalikkus, New Haven; Yale University Press.
  • Sober, E., 1993, The Nature of Selection, Chicago: University of Chicago Press.
  • –––, 1993, bioloogiafilosoofia, Oxford: Oxford University Press.
  • Sober, E. ja DS Wilson, 1998, Unto Others: Omakasupüüdmatu käitumise evolutsioon ja psühholoogia, Cambridge, MA: Harvard University Press.
  • Spohn, W., 2001, “Bayesi võrgud on kõik põhjuslikus seostes”, stohhastilises sõltuvuses ja põhjuslikkuses, D. Constantini, MC Galavotti ja P. Suppes (toim), Stanford: CSLI Publications.
  • Sunder, S., 1983, “Simpsoni pöördumise paradoks ja kulude jaotamine”, Journal of Accounting Research, 21: 222–233.
  • Suppes, P., 1970, põhjuslikkuse tõenäosusteooria, Amsterdam; Põhja-Hollandi kirjastus..
  • Thalos, M., 2003, “põhjusliku seose vähendamine”, H. Kyburgi ja M. Thalos (toim), Tõenäosus on elu väga teejuht: Juhu filosoofiline kasutamine, Chicago: Avatud kohus.
  • Thornton, RJ ja Innes, JT, 1985, “Simpsoni paradoksist majandusstatistikas”, Oxford Bulletin of Economics and Statistics, 47: 387–394.
  • Van Frassen, BC, 1989, Seadused ja sümmeetria, Oxford: Clarendon.
  • Yule, GH, 1903, “Märkused atribuutide seostamise teooria kohta statistikas”, Biometrika, 2: 121–134.

Akadeemilised tööriistad

sep mehe ikoon
sep mehe ikoon
Kuidas seda sissekannet tsiteerida.
sep mehe ikoon
sep mehe ikoon
Vaadake selle sissekande PDF-versiooni SEP-i sõprade veebisaidil.
info ikoon
info ikoon
Otsige seda sisenemisteema Interneti-filosoofia ontoloogiaprojektilt (InPhO).
phil paberite ikoon
phil paberite ikoon
Selle kande täiustatud bibliograafia PhilPapersis koos linkidega selle andmebaasi.

Muud Interneti-ressursid

  • Simpsoni paradoks, Queenslandi hariduse (Austraalia) veebisaidilt Exploring Data (arhiveeritud Interneti-arhiivis)
  • Simpsoni paradoks, autor Alan Crowe (arhiivitud Interneti-arhiivis)
  • Simpsoni paradoks - kui suurandmed muutuvad halvaks, siis tõenäosuse ja statistika hämmastavates rakendustes saidil www.intuitor.com.
  • Nick Chateri, Ivo Vlaevi ja Maurice Grinbergi veebiväljaanne „Simpsoni paradoksi uus tagajärg: Stabiilne koostöö individualiseeritud õppeagentide populatsioonist pärit ühekordse vangide dilemma korral”, Londoni ülikooli kolledž / Uus Bulgaaria ülikool.

Populaarne teemade kaupa