Intervalo de Confiança Bayesiano
Uma das novidades do Weibull++ 7 é o método para estimar os intervalos
de confiança baseando no teorema de Bayes. Este tipo de intervalo de
confiança conta com uma escola de pensamento de análise estatística
diferente, onde a informação prévia é combinada com os dados da amostra
a fim inferir sobre os parâmetros do modelo e as suas funções. Uma
introdução aos métodos bayesianos é mostrada neste artigo.
Introdução
Os intervalos de
confiança bayesiano são derivados do critério de Bayes, dado por:
 |
(1) |
onde:
- f(θ|Data) é a pdf a posteriori de θ.
- θ é o vetor de parâmetros da
distribuição escolhida (isto é, Weibull, lognormal, etc.)
- L(.) é a função de verossimilhança.
- φ(θ)
é a
pdf a priori do vetor de parâmetros.
- ς é o tamanho de θ.
Em outras palavras, a priori é o conhecimento prévio fornecido
pela forma da pdf a priori dos parâmetros, que é combinado por sua vez com
os dados da amostra a fim obter a pdf a posteriori. Existem diferentes
formas de informação existentes da priori, como dados passados, a
opinião de um perito ou priori não-informativa. Pode-se ver na Eq (1) que
agora nós estamos tratando das melhores
distribuições dos parâmetros ao invés dos únicos valores dos parâmetros.
Por exemplo, considere uma distribuição de um parâmetro com um
valor positivo θ1. Dado um conjunto de dados da amostra e uma
distribuição a priori para θ1, a Eq (1), φ(θ1) pode ser escrita como:
 |
(2) |
Ou seja, agora nós temos a distribuição de θ1 e podemos fazer inferências estatísticas
deste parâmetro, tal como calcular probabilidades. Especificamente, a probabilidade
de θ1 ser menos ou
igual a um valor x,
P( θ1 ≤ x ) pode ser obtida integrando a Eq (2), ou
seja:
 |
(3) |
A Eq (3) calcula essencialmente um limite de confiança
para o parâmetro,
onde P( θ1 ≤ x ) é o nível de confiança e
x é o limite de confiança. (Obs.:
Em inferência bayesiana, a expressão intervalo de confiança não é
correta. Intervalo de credibilidade é a expressão correta. Entretanto,
já que a perspectiva da aplicação dá a mesma interpretação do resultado,
nós usaremos a expressão intervalo de confiança para evitar a confusão).
Substituindo a Eq (2) na Eq (3) resulta:
 |
(4) |
A única questão nesse momento é qual distribuição a
priori para θ1 devemos utilizar. Para o cálculo
do intervalo de confiança, uma distribuição a priori não-informativa é
utilizada.
A distribuição a priori não-informativa
não têm nenhuma informação da população e faz um papel de mínimo na
distribuição posteriori. A idéia de fazer uso de uma distribuição a
priori não-informativa é fazer com que a inferência não seja afetada por
informação externa, ou quando uma informação externa não está disponível.
No caso geral dos cálculos dos intervalos de confiançaa confiança usando métodos bayesianos, o método deve ser independente da informação externa e deve
confiar somente nos dados atuais. Conseqüentemente, as priori
não-informativas são utilizadas. Especificamente, a distribuição uniforme
é usada como uma distribuição priori para diferentes parâmetros da
distribuição selecionada para ser selecionada. Por exemplo, se a
distribuição
Weibull é ajustada aos dados, é assumido a distribuição uniforme
como distribuições prioris para beta e eta.
A Eq (4) pode ser generalizada para toda distribuição que tem um
vetor de parâmetros θ, que rende a equação geral para o cálculo
do intervalo de confiança Bayesiano:
 |
(5) |
onde:
- CL é nível de confiança;
- θ é o vetor
de parâmetros;
- L(.) é a função de verossimilhança;
- φ(θ) é a pdf a priori do
vetor de parâmetros;
- ς é o comprimento de θ.
- ξ é o comprimento de cada θ variando Ψ(T,R) do
valor máximo de θ
até mínimo de θ
para Ψ(T,R).
Ψ(T,R) é a função
tal que se T é dado então o intervalos de confiança é calculado
para R e se R é dado, então é calculado o intervalo para T.
Se T é dado, então a Eq (5) e Ψ
e para um dado CL, o intervalo para R pode
ser calculado. Para mais detalhes, clique
aqui.
Se R é dado, então a Eq (5) e Ψ
e para um dado CL, o intervalo para T pode
ser calculado. Para mais detalhes, clique
aqui.
Quando o
conjunto de dados que está sendo analisado é pequeno, o método Bayesiano
para o cálculo dos intervalos de confiança é geralmente preferido ao
invés de
Matriz de Fisher,
Razão de Verossimilhança e o método Beta
Binomial. A vantagem do método Bayesiano para os intervalos está no
fato de fazer poucas suposições sobre a
distribuição dos parâmetros. O método de Matriz de Fisher assume uma
suposição de normalidade. O método de Razão de Verossimilhança supõe que

tem uma distribuição
Qui-Quadrado. O método Beta Binomial é um método não-paramétrico, que
impede de fazer predições fora da
escala dos dados. (Note também que no Weibull++ 7 o método Beta Binomial
está disponível somente para distribuição Weibull Mista.) O
método de Bayesiano para o Intervalo de Confiança disponível para todas suposições desde
que a distribuição posterior é calculada diretamente.