nbsp

Um papo sobre probabilidade subjetiva

“a probabilidade é o conceito mais importante da ciência moderna, especialmente porque ninguém tem a menor ideia do que ela significa”

O curioso da probabilidade é que a ideia que se tem dela pode ser, ao mesmo tempo, familiar e misteriosa. Familiar, porque a usamos “a torto e a direito”, seja como sinônimo de possibilidade ou chance de algo acontecer (e.g., qual a probabilidade de chover amanhã?), seja como ferramenta aplicada (e.g., o cálculo da probabilidade do time P ou F de ganhar o campeonato B). Misteriosa, porque quando se pede para defini-la, normalmente se tem certa dificuldade. Há uma frase atribuída a Bertrand Russell que explicita essa dualidade. É mais ou menos assim: “a probabilidade é o conceito mais importante da ciência moderna, especialmente porque ninguém tem a menor ideia do que ela significa”

A questão do mistério que a envolve, na minha opinião, está muito ligada ao modo como o conceito é introduzido: usa-se um dispositivo aleatório de maneira ilustrativa (na maioria das vezes, um dado). Normalmente é dito que a probabilidade de um evento (e.g., jogar um dado e sair o número 6) é a frequência média em que esse evento será observado se usarmos esse dispositivo repetidamente. De forma que, a probabilidade de se obter um 6 em um dado não-viciado (o termo é importante para garantir que o resultado depende do acaso) é 1/6, porque se você jogar um dado muitas vezes, em média, observará o número “6” uma vez em seis. É a chamada definição frequentista.

Como essa probabilidade é determinada pelas propriedades geométricas do dado, ou seja, as suas simetrias, pode parecer que essa probabilidade é, objetivamente, uma propriedade do dado. Assim, as probabilidades têm sido vistas como propriedades objetivas dos eventos considerados, como por exemplo, nas definições dadas por Charles Sanders Pierce [1, p.321], quando ele diz que atribuir ao dado “um certo potencial”, é dizer que ele “tem uma propriedade”

Acontece que essa visão torna difícil falar da probabilidade de um único evento que dificilmente será repetido, como por exemplo, qual é a probabilidade de se ganhar na Mega-Sena duas vezes seguidas? Também torna difícil falar de eventos que já foram determinados, mas não são conhecidos, como acontece se você jogar uma moeda para o ar, pegá-la e colocá-la sobre uma mesa, com a face para cima e escondida sob sua mão. Qual é a probabilidade de ter saído cara ou coroa? Metade para cada uma ou com certeza cara (ou coroa)? 

Ainda, e se o mundo for determinista? Se todos os eventos são causais, ou seja, determinados por causas anteriores, não há motivo para se falar em probabilidade.

Uma solução para esse imbróglio, é pensar na probabilidade como algo subjetivo (e não objetivo). Ela é uma “medida” da nossa incerteza. Eu lanço uma moeda e vi que deu cara. Sei que a probabilidade de ter dado cara é de 100%. Você não viu, pode achar que é de 50%. Mesmo evento e probabilidades diferentes, porque temos informações diferentes.

Desta forma, não é muito diferente das outras medidas que temos, como comprimento (medida da distância); área (medida do tamanho da superfície); volume (medida do tamanho do espaço); peso (medida da massa). Probabilidade (medida da incerteza).

Mas, em que sentido é realmente uma medida como as outras? As medidas podem ser definidas por um conjunto de propriedades matemáticas. Por exemplo, a medida do comprimento da soma de dois segmentos separados é a soma de seus comprimentos (e.g., AB + BC = AC).

Kolmogorov definiu alguns princípios para que a probabilidade pudesse ser vista como uma medida. Na teoria de Kolmogorov, probabilidades são valores numéricos atribuídos a “eventos” [2]. Os números não são negativos, possuem um valor máximo de 1 (que significa 100%) e a probabilidade de que um de dois eventos mutuamente exclusivos ocorra é a soma de suas probabilidades individuais (Fig. 1 – à esquerda).

nbsp
Fig. 1: À esquerda, eventos mutuamente exclusivos. À direita, eventos não-mutuamente exclusivos.

Assim, a probabilidade da união de dois eventos exclusivos é a soma das probabilidades dos eventos. Dessa forma, a probabilidade de obter 5 ou 6 em um dado é 1/6 + 1/6 = 2/6 (ou 33,33%) e a probabilidade do time P ou time F ganhar o campeonato B é de 88% (67% e 21% respectivamente) (Fig.2).

nbsp
Fig. 2: Probabilidades de ganhar o campeonato B em 22 de agosto de 2022. Fonte: FiveThirtyEight.

Admito que comprimento, área, volume e peso são coisas que podem ser medidas objetivamente, usando uma régua, uma balança, etc. Como podemos “medir” a incerteza?

Savage [3] mostrou que se seguirmos alguns princípios de racionalidade (chamados de axiomas de Savage), podemos usar nossas crenças como uma medida de probabilidade. Para Savage, os resultados possíveis de um evento não têm a ver com as propriedades do evento em si, mas dependem se um estado particular do mundo é real. Na teoria de Savage, existem dois primitivos: resultados e estados do mundo. Os primeiros representam as coisas boas ou ruins que, em última análise, afetam uma pessoa (e por isso são importantes para ela). Os segundos são as características do mundo sobre as quais a pessoa não tem controle e, por não ter controle, são as causas da sua incerteza sobre o mundo. Eventos, representam os conjuntos de estados. Essa distinção entre resultados e estados serve para separar desejo de crença. Os resultados são, de acordo com a teoria de Savage, o alvo do desejo, enquanto os estados do mundo são o alvo da crença. Assim, poderíamos “medir” a nossa probabilidade percebida observando nossas escolhas. É o que ele chamou à época de probabilidade pessoal [3, p.27].

Em 1972, o ano da publicação da segunda edição do seu livro referência, The Foundations of Statistics, cujo exemplar tenho, Savage introduz o conceito dizendo que pessoalmente considerava “ser mais provável” que fosse eleito um presidente do partido republicano em 1996, do que nevar em Chicago em “algum momento do mês de maio de 1994”. Tendo a história (em 1996 foi eleito Bill Clinton, do partido democrata) e os dados ao nosso lado – apesar de ter sido uma primavera gelada, não nevou em Chicago em maio de 1994 (Figs. 3, 4 e 5) – se podemos dizer que Savage estava redondamente enganado na sua declaração, não podemos afirmar o mesmo a respeito do raciocínio que embasou a sua decisão: os republicanos ganharam as eleições de 1952, 1956 e 1968 e perderam a de 1960 e 1964 (voltariam a ganhar a de 1972, mas Savage já havia falecido) e até então havia nevado em maio na cidade de Chicago apenas em 1966 [4].   

nbsp
Fig.3: A faixa diária de temperaturas relatadas (barras cinzas) e máximas de 24 horas (tons vermelhos) e mínimas (tons azuis), colocadas sobre a temperatura média diária alta (linha vermelha fraca) e baixa (linha azul fraca), com 25ºF a 75ºF e bandas do percentil 10 a 90. Fonte: https://weatherspark.com/
nbsp
Fig. 4: A temperatura informada por hora, codificada por cores em faixas. As sobreposições sombreadas indicam o crepúsculo noturno e matutino. Fonte: https://weatherspark.com/
nbsp
Fig. 5: A profundidade da neve medida diariamente em maio de 1994 em Chicago. Fonte: https://weatherspark.com/

Hoje, o conceito de Savage é conhecido como probabilidade subjetiva e embasa a tomada de decisão de pessoas tão distintas quanto as que trabalham no mercado financeiro ou os frequentadores de casas de apostas (sem contar presidentes de Bancos Centrais, alta diretoria de conglomerados corporativos, etc.). Conceitualmente, é um tipo de probabilidade derivada do julgamento pessoal de um indivíduo ou da própria experiência dele sobre a probabilidade de um resultado específico ocorrer. Funciona da seguinte maneira, considere a aposta: você ganha R$100 se “a seleção brasileira vencer a copa do mundo do Qatar” e R$0 caso contrário. Se você estiver disposto a pagar R$20 para fazer essa aposta (e não mais), a sua probabilidade subjetiva de vitória da seleção brasileira é de 20%. Perceba que não contém cálculos formais e reflete apenas as opiniões e experiências passadas do sujeito. 

Incrivelmente, se nossas probabilidades subjetivas respeitarem os princípios de Kolmogorov, elas também respeitariam o Teorema de Bayes, das probabilidades condicionais, que descreve a probabilidade de um evento baseado em um conhecimento a priori. Atualmente há na ciência uma certa visão “bayesiana” da probabilidade, o que a faz (a probabilidade) ser vista como subjetiva e refletindo o peso das evidências.

Embora se costume falar de probabilidades como se fossem propriedade de eventos externos, elas são mais um reflexo do que está dentro da nossa cabeça e do que escolhemos usar como evidência. E aí, como está o seu senso de probabilidade subjetiva?

Referências

[1] Saito, Fumikazu & Bacha, Maria. (2018). As duas teorias da probabilidade na obra de Charles Sanders Peirce e a Estatística norte-americana no final do século XIX. In book: Actas/Anais do 7.º Encontro Luso-Brasileiro de História da Matemática. [António Costa Canas, João Caramalho Domingues & Luis Saraiva (Eds.)]. Sociedade Portuguesa de Matemática.
[2] Probability – The Formal Theory Of Probability. https://science.jrank.org/pages/10861/Probability-Formal-Theory-Probability. Acessado em 20 de agosto de 2022.
[3] Savage, Leonard J. (1972). The Foundations of Statistics. Dover Publications.    
[4] Weather History: When Does Chicago Typically See Its Final Snow of the Season? NBC Chicago, https://www.nbcchicago.com/weather/weather-history-when-does-chicago-typically-see-its-final-snow-of-the-season/2804459/. Acessado em 24 de agosto de 2022.

Marcelo Tibau

Um cara com algumas ideias na cabeça e muita vontade em compartilhar.

post anterior
nbsp

O ótimo humor true crime de Only Murders in the Building

próximo post
nbsp

Doritos divulga novo sabor pizza para o Rock in Rio!

relacionados