Paradoxul lui Newcomb — de la global la local

Paradoxul lui Newcomb¹ este unul dintre cele mai discutate experimente de gândire din teoria deciziei, punând în tensiune două principii aparent incompatibile: maximizarea utilității așteptate și principiul dominanței.

Paradoxul lui Newcomb

Pentru o prezentare accesibilă, vezi:

Discuțiile standard formulează de obicei problema în termeni de:

Evidential Decision Theory (EDT) (teoria deciziei bazată pe evidență)
Causal Decision Theory (CDT) (teoria deciziei cauzale)

În această postare propunem o formulare alternativă din punct de vedere structural, bazată pe:

$$ \begin{gathered} \textit{distincția dintre raționamentul global și raționamentul local.} \end{gathered}\tag{G→L} $$

Paradoxul lui Newcomb poate fi înțeles mai clar dacă separăm două moduri de a modela decizia:

local: decizia este evaluată punctual, condiționat exclusiv de starea actuală a lumii.
global: decizia este evaluată ca parte a unei reguli de comportament, anticipată de mecanismul jocului într-un mod consistent.

Premisa Link spre

Presupunem existența unui predictor aproape perfect:

$$ P(\text{clasificare corectă} \mid \tau) \approx 1 $$

unde $ \tau$ reprezintă tipul agentului — adică o regulă stabilă de comportament.

În acest model, predictorul nu observă doar o acțiune punctuală, ci identifică structura comportamentală a agentului:

dacă ești agent local, vei fi identificat ca atare
dacă ești agent global, vei fi identificat ca atare

Cu alte cuvinte, predictorul operează pe nivelul regulii de decizie (global), nu doar pe nivelul rezultatului individual (local).

Mecanismul jocului Link spre

În cadrul modelului nostru, interpretăm că predictorul nu răspunde la alegerea ta punctuală, ci reacționează la tipul tău de agent:

agent local → cutia mare este lăsată goală;
agent global → cutia mare va conține \$1,000,000.

Punct fix: capcana locală Link spre

Raționamentul local poate fi privit ca o simplificare deliberată: decizia este evaluată punctual, fără un mecanism explicit de agregare la nivelul regulii generale de comportament.

Cu alte cuvinte, modelul agentului este modular, dar nu este închis: el nu specifică modul în care aceste decizii izolate sunt integrate în structura globală a jocului. În această simplificare, se ignoră dependența dintre tipul agentului și configurația problemei:

Cutia mare este tratată ca fiind fixată și independentă de tipul agentului; în acest context, criteriul de dominanță implică faptul că două cutii sunt preferabile unei singure cutii.

Criteriul dominanței este aplicat în mod local, însă această aplicare presupune implicit că starea problemei este independentă de tipul agentului — o ipoteză care nu mai este validă în acest cadru.

Însă structura efectivă a jocului duce la următorul scenariu:

Ești identificat de predictor ca agent local (care optimizează punctual).
Configurația jocului reflectă această clasificare, iar cutia mare este goală.
În momentul alegerii, ignorând această dependență, alegi ambele cutii.
Obții doar \$1,000 (din cutia mică).

Rezultă un punct fix: agentul local este întotdeauna recunoscut ca fiind local și ajunge sistematic în lumea în care cutia mare este deja goală.

Este o buclă care se auto-confirmă: faptul de a gândi ca un agent local te ancorează definitiv în realitatea (și rezultatele) agentului local.

Observație: despre simplificare și consistență Link spre

Această abordare nu este eronată din punct de vedere matematic, ci incompletă:

tratează corect decizia condiționată de o stare deja fixată;
dar nu modelează mecanismul prin care această stare a fost generată inițial;
tratează starea cutiei ca fiind exogenă, deși, în realitate, ea este endogenă tipului de agent.

Prin urmare, apare o tensiune de consistență: regula locală este aplicată într-un cadru general care, de fapt, depinde structural de tipul regulii însăși. Aceasta este exact limita unui model modular care nu dispune de o regulă de agregare la nivel global.

Global vs Local Link spre

Pe scurt, distincția poate fi formulată astfel:

global = alegi o regulă de comportament ținând cont de faptul că arhitectura jocului este construită condiționat de această regulă.
local = ignori această dependență de fond și optimizezi exclusiv decizia punctuală.

Legătura cu EDT și CDT Link spre

Această separare oferă o perspectivă utilă asupra distincției clasice din teoria deciziei:

EDT (Evidential Decision Theory) nu trebuie înțeleasă aici ca fiind strict echivalentă cu un raționament global și nici nu constituie premisa exclusivă a acestei analize.
CDT (Causal Decision Theory) poate fi asociată, în multe privințe, cu perspectiva raționamentului local.

În paradigma propusă aici, problema nu este strict una de cauzalitate, ci de nivel de modelare:

dacă tratezi decizia ca pe un eveniment izolat, pierzi informația crucială despre modul în care ești clasificat.

Dacă iei în serios faptul că configurația jocului depinde de tipul tău de decident, atunci un agent care vizează consistența de ansamblu va alege regula globală. Un agent global va accepta, în mod conștient, să sacrifice dominanța locală.

Aceasta nu este o anomalie, ci reflectă o limită generală a optimizării punctuale: proprietățile locale nu se agregă întotdeauna în mod coerent la nivel global.

Doi vectori pot avea fiecare componente mai mici decât ale altor vectori corespunzători (pe fiecare direcție în parte), dar rezultanta lor poate avea o direcție sau o magnitudine care nu respectă această comparație componentă cu componentă.²

Cu alte cuvinte: chiar dacă fiecare viteză locală este inferioară pe fiecare axă, suma vectorială totală nu este determinată de aceste comparații locale. Compararea componentă-cu-componentă nu se transferă în mod direct la nivelul rezultantei.

În mod similar, dominanța locală nu garantează optimalitatea globală într-un joc în care starea însăși depinde de tipul agentului.

El va accepta această limitare, într-o manieră analogă (dar nu identică) cu situațiile în care cooperarea poate fi susținută în Dilema Prizonierului (vezi explicația video).

Alegerea de a lua ambele cutii (de a acționa ca defector) devine justificabilă în special atunci când modelarea este strict locală. Mecanismul jocului reacționează exact la această limitare. Tocmai de aceea, pentru un agent care urmărește consistența globală, adoptarea unei strategii globale (one-boxer) devine o opțiune robustă.

Structura informațională și meta-alegerea Link spre

Participarea la acest joc introduce o structură informațională specifică:

predicția reflectă o reducere aproape completă a incertitudinii asupra alegerii agentului;
alegerea agentului este, la rândul ei, un semnal clar despre tipul său.

Astfel, se naște o corelație puternică între tipul agentului și rezultatul jocului. Adoptarea tipului de raționament (local sau global) reprezintă, în fond, meta-alegerea reală din spatele acestui paradox.

Condiționat de această decizie de nivel înalt, agentul adoptă o regulă de comportament care este consistentă cu structura jocului. Prin urmare:

libertatea de alegere nu este negată; agentul decide să participe la joc și, condiționat de această alegere, adoptă o regulă de comportament pe care o respectă ulterior;
această alegere mută decizia de la nivelul acțiunii punctuale la nivelul alegerii regulii;
întrebarea fundamentală nu mai este ce fac acum?, ci ce tip de agent aleg să fiu într-un joc conceput să răspundă la acest tip?.

Odată fixată această regulă, deviația locală nu mai reprezintă neapărat o manifestare superioară a libertății de decizie, ci poate fi privită ca o formă de inconsistență strategică. Schimbarea deciziei punctuale ar contrazice exact alegerea inițială de a participa în mod coerent la joc.

Pentru agentul global, eventuala pierdere asociată alegerii unei singure cutii nu este tratată ca un risc ce trebuie acoperit ulterior în mod ad-hoc, ci ca o consecință deja integrată în regula de comportament adoptată. Ajustările ulterioare rămân posibile, dar nu reprezintă un plan de rezervă, ci fac parte din structura anticipată a deciziei.

Concluzie Link spre

Dacă acceptăm premisa predictorului aproape perfect, putem trage următoarele concluzii:

strategia locală este o modelare simplificată, care tratează ignoranța drept independență și poate fi anticipată;
strategia globală se dovedește a fi o abordare consistentă la nivelul întregului sistem.

Paradoxul nu este în mod fundamental despre alegerea între o cutie și două, ci despre alegerea între două moduri de a modela decizia: global vs local.

Paradoxul lui Newcomb descrie o situație în care un predictor (aproape) perfect anticipează alegerea agentului și plasează sume de bani în două cutii în funcție de această predicție. Ulterior, agentul poate alege fie o singură cutie (care conține o sumă mare dacă a fost corect prezis), fie ambele cutii (obținând suma sigură din cutia transparentă plus eventual suma din cutia mare — misterioasă). Tensiunea apare între raționamentul local (criteriul de dominanță — două cutii sunt preferabile indiferent de conținut) și dependența globală (corelația cu predicția). ↩︎
Paradoxul lui Simpson. ↩︎