Reliability HotWire

Edição 41, Agosto 2008

Conceitos de Confiabilidade

Discussão sobre a soma dos quadrados dos resíduos em DOE

Na natureza ocorrem variações, seja a força elástica de um determinado tipo de aço, a cafeína contida na sua bebida energética ou na distância percorrida pelo seu veículo em um dia. Variações também são vistas durante várias execuções de um processo, mesmo quando as condições são mantidas tão homogeneamente quanto possível. As variações naturais que ocorrem num processo, mesmo quando todos os fatores são mantidos no mesmo nível, são frequentemente denominadas como ruído. Nas Análises de Delineamento de Experimentos, o objetivo chave é estudar os efeitos de um ou mais fatores sobre as medida de interesse (ou respostas) para um produto ou processo. Assim, torna-se extremamente importante distinguir as mudanças nas respostas causadas por um fator daquelas causadas por ruído. Uma série de métodos estatísticos, geralmente direcionados aos testes hipotéticos, está disponível para fazer esta distinção. Estes métodos normalmente envolvem a quantificação da variabilidade devido ao ruído ou erro em conjunto com a variabilidade devido aos diferentes fatores e suas interações. Portanto, é possível determinar se as mudanças observadas nas respostas devido a mudanças nos fatores são significativas.
 
Neste artigo, nós discutiremos diferentes componentes de erro e daremos um exemplo de como o erro e cada um dos seus componentes são definidos e usados num contexto de teste hipotético.

Introdução
Numa análise DOE, o erro é quantificado em termos da soma dos quadrados dos resíduos. Para ilustrar isto, consideramos o modelo de regressão padrão:

(1)

onde a e b são coeficientes e εi é o termo referente ao erro.

Dado este modelo, o valor ajustado de
yi é:

(2)

Onde  e são coeficientes estimados.

A discrepância entre o valor observado e o valor ajustado é chamado de resíduo. Observe que enquanto o resíduo e o termo de erro são frequentemente utilizados indiferentemente, o resíduo é a estimativa do termo de erro εi.

A soma dos quadrados dos resíduos (SSE) é a dimensão completa da discrepância entre o dado e o modelo estimado. Quanto menor a discrepância, melhor será a estimativa do modelo. A discrepância é quantificada em termos da soma dos quadrados dos resíduos.
 

(3)


A soma dos quadrados dos resíduos normalmente pode ser dividida em duas partes: erro puro e falta de ajuste. Elas serão discutidas na seção subseqüente.                  

Como mencionado, é de grande importância poder identificar quais termos são significativos. (A palavra termo refere-se a um efeito no modelo – por exemplo, o efeito do fator A, o efeito do fator B ou o efeito de suas interação, AB.) Para realizar isto, a media quadrática do termo de interesse é testada frente a média quadrática do erro.  A média quadrática do erro é definida como a soma dos quadrados dos erros dividida pelo grau de liberdade atribuído ao erro.

(4)


O Grau de liberdade do erro é o número de observações desconhecidas que sobram. Por exemplo, se há 3 observações desconhecidas e 7 independentes, então o valor do grau de liberdade é 4 (7 − 3 = 4).

A média quadrática de um termo é definida como a soma dos quadrados dos termos divididos pelo grau de liberdade atribuído aquele termo.
 

(5)


O grau de liberdade de um termo é o número de efeitos independentes daquele termo. Por exemplo, para um fator com 4 níveis (4 diferentes valores do fator ou ajuste), somente três são independentes. O valor do grau de liberdade associado com aquele termo é 3. Para mais informações, veja [
1].

Para o teste Hipotético H0: o termo testado não é significativo, um teste estatístico é necessário. A relação entre a média quadrática do termo e a médio quadrática do erro é chamada de relação F.

(6)

Pode-se mostrar que se um termo não é significativo, esta relação segue a distribuição F. H0 é rejeitada (o termo é considerado significativo) se:
 

Onde    é o percentual da distribuição F correspondente a probabilidade acumulada de (1- a) e a é o nível de significância.


Exemplo

O seguinte exemplo exibe as definições e aplicações da soma dos quadrados do resíduo, do erro puro e da falta de ajuste.

Considere o seguinte projeto de dois níveis, onde os níveis são codificados como -1 e 1. Y é a medida de interesse ou a resposta. A medida obtida está exibida a seguir.
 

A

B

Y

-1

-1

12

1

-1

1

-1

1

32

1

1

9

-1

-1

23

1

-1

3

-1

1

10

1

1

8


Cada execução deste experimento envolve uma combinação dos níveis dos fatores investigados, A e B. Cada uma destas combinações é referida a um tratamento. Desde que haja dois fatores com dois níveis cada, temos 4 (22 = 4 ) combinações possíveis  para o conjunto de fatores. Desde que todas as combinações possíveis estejam presentes, este delineamento será denominado como um delineamento de fatorial completo.

Múltiplas execuções para um dado tratamento são chamadas de repetições. Neste exemplo em particular temos 2 repetições para cada tratamento (existem 2 repetições do tratamento com A= -1 e B= -1, 2 repetições do tratamento com  A= 1 e B= -1, e etc.)

Análise dos Resultados
Assumindo que a interação dos termos não é de interesse, os seguintes resultados são obtidos pelo software DOE++ da Reliasoft.
 

Figura 1: Resultado da Análise no DOE++
[
Clique para aumentar]


A seguinte discussão irá focalizar na seção marcada acima em vermelho.

Erro Residual
O modelo de regressão nesta análise, não considerando a interação entre os termos AB, é:
 

(7)


Com
a0 = 12.25, a1 = -7 e a2 = 2.5 (obtidos pela Tabela de Informações de Regressão acima sob a coluna de coeficiente). A soma dos quadrados dos residuos podem ser então obtidas usando a equação (1).


Dado 3 incógnitas no modelo,
a0, a1 and a2, e 8 observações, o grau de liberdade de um erro pode ser encontrado.

Erro Puro
O Erro Puro reflete a variabilidade das observações dentro de cada tratamento. A soma dos quadrados para o erro puro é a soma dos quadrados dos desvios das respostas pela resposta média em cada série de repetições.

Neste exemplo, existem quatro tratamentos. Os valores médios para os tratamentos são exibidos a seguir.
 

A

B

Y mean

-1

-1

17.5

1

-1

2

-1

1

21

1

1

8.5


O erro puro pode ser calculado como segue.

  • O erro puro do tratamento com A=-1 e B = -1 é:

  • erro puro do tratamento com A=1 e B = -1 é:

  • erro puro do tratamento com A=-1 e B = 1 é:

  • erro puro do tratamento com A= 1 e B = 1 é:

  • A soma dos quadrados dos erros puros é então:


O Grau de liberdade correspondente à soma dos quadrados dos erros puros é:



Onde
n é o número de tratamentos e m é o número de repetições.

Para o exemplo acima:


A média quadrática de um erro puro pode ser obtida como segue:


A média quadrática de um erro puro pode ser utilizada para testar a adequação do modelo como mostrado na próxima seção.

Erro por falta de ajuste
A medida do erro por falta de ajuste devido à deficiência no modelo. Neste exemplo em particular, a deficiência é explicada pela falta do termo AB no modelo.

Se um modelo de regressão ajusta bem os dados, a média quadrática de erro por falta de ajuste deve ser próxima à média quadrática por erro puro. Então, o erro por falta de ajuste pode ser usado para testar se o modelo pode se ajustar bem ao dado. Se a falta de ajuste do termo é significativa, nós rejeitaríamos as hipóteses nulas e concluiríamos que o modelo não é adequado.

A soma dos quadrados por falta de ajuste é calculada como segue:


O grau de liberdade é calculado como segue:
 


A média quadrática da falta de ajuste pode ser obtida por:
 


A estatística para testar a importância da falta de ajuste pode ser calculada como se segue:
 


Note que quando nós testamos à importância da falta de ajuste, o denominador é a média quadrática de um erro puro
, enquanto que quando testamos a importância de um termo no modelo, o denominador é a média quadrática do resíduo como exibido na equação (3).

O valor critico para este teste no nível de importância é de  0.05:
 

Desde que (0.59 < 7.709), a um nível de importância de 0,05, nós não rejeitamos a hipótese de que o modelo se adequa aos dados. Em outras palavras, neste nível de importância, é aceitável usar o modelo reduzido que não inclui o termo de interação.

Alternativamente, nós podemos também encontrar o menor nível de importância, a, que conduziria à rejeição das hipóteses nulas de um dado valor de um teste estatístico e para concluir que o modelo estatístico não é aceitável. Isto também é chamado de valor p e é definido como:
 


Para este exemplo, podemos calcular o seguinte:
 


Conclusão
Este exemplo apresentou uma introdução sobre os cálculos de erros em diferentes componentes. Particularmente foi utilizada a média quadrática do erro puro e o teste da falta de ajuste para validar um modelo escolhido. Embora não ilustrado aqui, uma vez obtido o erro residual, ele poderá ser utilizado para testar a importância de qualquer termo no modelo.
 

Referencias
[1] ReliaSoft Corporation, Experiment Design and Analysis Reference, ReliaSoft Publishing, Tucson, AZ, 2008.

Copyright © 2008 ReliaSoft Brasil, TODOS DIREITOS RESERVADOS

 
[../../../../ReliaSoft Internet/Arquivos FrontPage/ReliaSoft Brasil/ReliaSoft.com/_private/footer.htm]