See a worldwide directory.

 

ReliaSoft > Reliability Hotwire >  Edição 26 > Conceitos Básicos de Confiabilidade
Reliability HotWire: eMagazine for the Reliability Professional
Reliability HotWire

Edição 26, Abril 2007

Conceitos de Confiabilidade

Estimador de Máxima Verossimilhança (MLE)

Neste artigo nós abordaremos o método de estimação de Máxima Verossimilhança. Esta técnica é considerada a técnica mais robusta de estimação de parâmetros.

Função de Verossimilhança
O método de máxima verossimilhança estima os valores dos parâmetros da distribuição que maximiza a função de verossimilhança. Em outras palavras, se os dados tem uma distribuição Weibull, para cada combinação diferente de beta e eta, tem-se diferentes distribuições de Weibull e o estimador de máxima verossimilhança selecionará o par de beta e eta que melhor explique a amostra observada. A função de verossimilhança é baseada na função densidade de probabilidade (f.d.p.) para uma dada distribuição. Como exemplo, consideremos uma f.d.p. genérica:

onde x representa os dados (tempo até a falha), e  q1, q2,..., qk são os parâmetros a serem estimados. Para a distribuição Weibull 2-parâmetros, por exemplo, temos que encontrar beta (b) e eta (h). Para conjuntos de dados não censurados, a função de verossimilhança é o produto das funções pdf de cada observação do conjunto de dados:

onde R é o número de falhas do conjunto de dados, e xi é o i-ésimo tempo de falha. Matematicamente é mais conveniente trabalhar com o logaritmo da função de verossimilhança. A função log-verossimilhança é dada por:

Agora é só encontrar os valores dos parâmetros que maximizam a função. Isto é feito calculando as derivadas parciais da equação log-linear para cada parâmetro e resolver o sistema igualando á zero:

Isto pode ser matéria relativamente simples se houver somente um parâmetro à ser estimado. Mas em muitas situações onde este não é o caso, as técnicas numéricas necessitam ser empregadas para resolver o sistema de equações.

Exemplo com a distribuição Exponencial
Este processo é facilmente ilustrado com a distribuição Exponencial de um parâmetro. Desde que há somente um parâmetro, há somente uma equação para ser resolvida. Além disso, a distribuição de verossimilhança da distribuição exponencial é derivável em todos os pontos, devido a natureza da f.d.p. da exponencial. A função de verossimilhança da distribuição exponencial é dada por:

onde lambda (l) é o parâmetro que queremos estimar. Desde que a função Log-verossimilhança é matematicamente mais fácil de manipular, nós calculamos o logaritmo natural da função de verossimilhança e a derivamos. Para distribuição Exponencial, a função Log-verossmilhança é da seguinte forma:

Tomando a derivada da equação em relação a l e igualando o resultado a zero:

Agora é só rearranjar, que se tem a expressão do estimador de máxima verossimilhança para l:

Isto dá uma solução de forma fechada do estimador de MLE da distribuição Exponencial de um parâmetro. Obviamente, este é o exemplo mais simples disponível, mas ilustra muito bem o processo. A metodologia é mais complexa para distribuições com mais de um parâmetro, ou seja, elas não tem uma solução de forma fechada. 

Trabalhando com Suspensões
A seção anterior foi para ilustrar a metodologia MLE para dados completos, ou seja, onde não houve censuras. Entretanto, freqüentemente encontramos conjunto de dados com suspensões. Isto tornará o processo mais difícil. Essencialmente, tratar de dados suspensos ou dados com censura a direita, envolve incluir um outro termo na função de verossimilhança. Como dito antes, o termo para dados completos usa a função de distribuição da probabilidade (f.d.p.). O segundo termo para incluir as suspensões incorpora a função cumulativa de densidade (f.c.d.). Esta função de verossimilhança estendida tem a seguinte forma:

onde m é o número de dados suspensos, yj é a j-ésima suspensão, e F(yj;q1, q2,..., qk) é a f.c.d.. Com esta função, o processo da análise prossegue como descrito anteriormente: toma-se o logaritmo natural da função de verossimilhança, acha-se as derivadas parciais em relação aos parâmetros, e resolve o sistema de equações simultaneamente, igualando a zero.

A função de verossimilhança para dados com suspensões ilustra algumas das vantagens que a análise MLE tem sobre outras técnicas de estimação de parâmetros. Primeiramente antes de tudo, a metodologia MLE adiciona na função de verossimilhança os valores dos tempos das suspensões, como foi visto na equação acima. Um outro método, Plotando Probabilidades (Probability Plotting) toma somente a posição relativa das suspensões, e não avalia o tempo-até-a-suspensão real. Isto torna a técnica MLE uma ferramenta muito mais poderosa do que as outras ao trabalhar com um conjunto de dados que apresenta uma quantidade relativamente grande de suspensões. Uma segunda vantagem do método MLE é que com ele teoricamente é possível encontrar estimativas para os parâmetros onde o conjunto de dados é formado apenas suspensões. (Note, entretanto, que é matematicamente impossível resolver as derivadas parciais para mais de um parâmetro para conjunto de dados que consiste apenas de suspensões. Ou uma distribuição de um parâmetro deve ser usada, ou os valores para os outros parâmetros da distribuição devem ser supostos. Geralmente não se recomenda tirar conclusões importantes de análises onde os dados são representados apenas por suspensões.)

Note que esta análise usa somente dados de tempo de falha ou suspensão para análise; em nenhum ponto os valores ou as estimativas de confiabilidade/desconfiabilidade são incorporados. Isto resulta às vezes em modelos que não seguem os pontos traçados no método de plotar as probabilidades, onde os pontos são traçados no gráfico com o eixo x representando o tempo de falha e o eixo y uma estimativa da desconfiabilidade. O estimador de máxima verossimilhança não usa essa estimativa da desconfiabilidade. Consequentemente, a linha plotada baseada no parâmetro estimado pelo método MLE não segue sempre os pontos traçados pelo outro método. Isto não significa que esse ou o outro método são "errados", eles apenas utilizam-se de técnicas diferentes.

Superfície da Função de Verossimilhança
O software Weibull++ da ReliaSoft contém uma característica que permite a geração de uma representação gráfica tridimensional da função Log-verossimilhança. Ela é melhor representada para distribuições com dois parâmetros, quando os valores dos parâmetros são representados pelos eixos x e y, e os valores log-verossimilhança pelo eixo z. (No Weibull++, o valor da log-verossimilhança é normalizado para o valor de 100%). O gráfico mostrado como exemplo representa a superfície da função de verossimilhança plotada para uma distribuição Weibull dois parâmetros.

Likelihood Function Surface plot for a 2-parameter Weibull distribution, created in Weibull++.

O "pico" da superfície da função de verossimilhança corresponde os valores dos parâmetros que maximizam a função de verossimilhança, isto é, os os parâmetros da distribuição estimados pelo método MLE.

Comentários da Estimação por Máxima Verossimilhança
O estimador de máxima verossimilhança têm muitas propriedades da teoria das grande amostras que torna o seu resultado mais atrativo. O estimador é assintoticamente consistente, significa que quanto maior o tamanho da amostra, mais próximos os valores das estimativas estarão dos verdadeiros valores. Ele é não-viesado, isto é, sua a esperança é igual ao valor estimado. Ele também é assintoticamente eficiente, quanto maior a amostra, maior precisão das estimativas. Os parâmetros estimados são normalmente distribuídos. Estas são excelentes propriedades da teoria das grandes amostras.

Infelizmente, é necessário um tamanho grande de amostra para satisfazer essas propriedades: 30 a 50 ou mais dados de falhas dependendo da aplicação. Com poucos dados, o método pode ser viesado. Sabe-se, por exemplo, que as estimativas de MLE para o parâmetro de forma (beta) da distribuição Weibull são viesadas para tamanho de amostra pequena, e o efeito pode ser aumentado dependendo da quantidade de censura. Esta tendência pode causar discrepância na análise.

Há também situações mórbidas quando as situações assintóticas do MLE não se aplicam. Um destas é a estimação do parâmetro de escala (eta) da distribuição Weibull três parâmetros quando o parâmetro de forma (beta) tem um valor perto de 1. Esses problemas, podem causar maiores discrepâncias.

Em geral, é recomendado usar a técnica Regressão em X, quando se tem uma amostra pequena e sem censuras. Quando se tem presente, censuras  em grande quantidade ou de forma desigual as falhas, quando uma proporção grande de dados está presente ou o tamanho da amostra é suficiente, é o estimador de máxima verossimilhança deve ser escolhido.
 

Copyright © 2005 ReliaSoft Brasil, TODOS DIREITOS RESERVADOS

 

[Home]   [Softwares]   [Treinamentos]   [Consultorias]   [Painel de Confiabilidade]   [A Empresa]   [Clientes]   [weibull.com]

Copyright ©1998-2006 ReliaSoft Brasil, Todos os Direitos Reservados
Última Alteração: 17-10-06
 

LEGAL [Termos de Uso] [Links]
[Privacidade das Informações]

Contate Webmaster
Tel:
+55 11 2177-5456