Toeria
O dilema do prisioneiro é um problema da teoria dos jogos e um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em outros muitos, supõe-se que cada jogador, de modo independente, quer aumentar ao máximo a sua própria vantagem sem lhe importar o resultado do outro jogador.
As técnicas de análise da teoria de jogos padrão - por exemplo determinar o equilíbrio de Nash - podem levar cada jogador a escolher trair o outro, mas curiosamente ambos os jogadores obteriam um resultado melhor se colaborassem. Infelizmente (para os prisioneiros), cada jogador é incentivado individualmente para defraudar o outro, mesmo após lhe ter prometido colaborar. Este é o ponto-chave do dilema.
No dilema do prisioneiro iterado, a cooperação pode obter-se como um resultado de equilíbrio. Aqui se joga repetidamente, pelo que, quando se repete o jogo, oferece-se a cada jogador a oportunidade de castigar o outro jogador pela não cooperação em jogos anteriores. Assim, o incentivo para defraudar pode ser superado pela ameaça do castigo, o que conduz a um resultado melhor, cooperativo.
O dilema do prisioneiro foi originalmente formulado por Merrill Flood e Melvin Dresher enquanto trabalhavam na RAND em 1950. Mais tarde, Albert W. Tucker fez a sua formalização com o tema da pena de prisão e deu ao problema geral esse nome específico. O dilema do prisioneiro (DP) dito clássico funciona da seguinte forma:
Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes para condená-los, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros, confessando, testemunhar contra o outro e esse outro permanecer em silêncio, o que confessou sai livre enquanto o cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a seis meses de cadeia cada um. Se ambos traírem o comparsa, cada um leva cinco anos de cadeia. Cada prisioneiro faz a sua decisão