If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Desvio-padrão dos resíduos ou raiz do quadrado médio do desvio (RQMD)

O desvio-padrão dos resíduos é uma medida do ajustamento de uma reta de regressão aos dados. Ele também é conhecido como raiz do quadrado médio do desvio ou raiz do quadrado médio do erro.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA10C E aí, pessoal? Tudo bem? Digamos que queremos saber a relação entre as horas de estudo de uma pessoa e a sua pontuação em um teste. E essa pontuação vai de zero até 6. O que vamos fazer é uma observação das pessoas que estudaram, ou seja, vamos observar a quantidade de horas que elas estudaram e sua pontuação. Por exemplo, uma pessoa que estudou uma hora teve uma pontuação de 1 no teste. E o que vamos fazer com isso é ajeitar esta linha de regressão. Ou seja, esta é a linha de regressão real para estes quatro pontos. Aqui está a equação dela, e existem algumas coisas que você precisa ter em mente quando faz este tipo de análise. Você geralmente faz isso com muito mais do que esses quatro pontos, mas a razão pela qual eu os mantive é porque quero calcular quão boa está a linha de regressão quando fazemos à mão. E isso porque geralmente você não traça isso na mão, pois há computadores que podem fazer isso. A maneira que vamos medir quão bom é o ajuste desta reta de regressão aos dados tem vários nomes. Um nome é o desvio-padrão de resíduos, e um outro nome é raiz do quadrado médio do erro, ou RQME, às vezes também chamado de erro quadrático médio. Então, o que vamos fazer é calcular o resíduo para cada um desses pontos, e vamos pegar a soma de cada um desses resíduos, ou seja, o somatório dos resíduos, elevar ao quadrado, e dividir isso por n - 2. Em estatística mais avançada, você consegue ver porque dividimos por n - 2. Mas basicamente o que estamos tentando fazer é estimar um parâmetro verdadeiro, o melhor possível, em n - 2. E para calcular a raiz do quadrado médio do erro devemos tirar a raiz quadrada disso. Claro, você pode até ver uma semelhança entre isso e como calculamos a amostra de desvio-padrão no início das nossas aulas de estatística. Eu sugiro que você pense um pouco a respeito disso. Vamos ver de fato o que acontece. Para isso, vou colocar uma tabela aqui com o valor de “x”, o valor de “y”, o valor na nossa função, e também o residual ao quadrado, ou seja, o nosso “y” real menos o nosso “y” estimado para o valor de x². Então, isso ao quadrado. Depois, vamos somar todos esses valores, dividir por n - 2 e tirar a raiz quadrada. Vamos começar por este ponto, que é o ponto 1,1, e vamos substituir na nossa função: 2,5 vezes 1 menos 2, que é igual a 2,5 menos 2, que é igual a 0,5. E o nosso residual vai ser igual a “y”, que é 1 menos (0,5)², que vai ser igual a 1 menos 0,5, elevando ao quadrado, vai ser igual a 0,25. Agora, fazendo para este ponto, que é o ponto 2,2 vamos ficar com 2,5 vezes 2 menos 2, que vai ser igual a 3. E vamos ficar com 2 menos 3², que vai ser igual a 1. Agora, para este ponto, que é o ponto 2,3, vamos ficar com 2,5 vezes 2 menos 2, que também é igual a 3. Aqui, vamos ficar com 3 menos 3², que é igual a zero. Por fim, no 3,6, vamos ficar com 2,5 vezes 3 menos 2... 2,5 vezes 3 é igual a 7,5, menos 2, é igual a 5,5. Aqui, vamos ficar com 6 menos (5,5)², que é igual a 0,25. O próximo passo é fazer o somatório desses valores. Se somarmos tudo isso, vai ser igual a 1,5. Observe que não precisamos elevar ao quadrado de novo porque já fizemos isso aqui. E ainda temos que dividir tudo isso por n - 2. Ou seja, temos: um, dois, três... quatro dados. Se subtrairmos 2, vamos ficar com 2. Então, dividimos este 1,5 por 2. Mas, claro, ainda temos que tirar a raiz quadrada disso tudo, que é a mesma coisa que tirar a raiz quadrada deste valor. Se você utilizar uma calculadora, vai ver que isso é aproximadamente 0,87. Ou seja, este é um bom ajuste para esta reta de regressão. Quanto mais longe for do zero, pior vai ser o seu ajuste. E quais seriam as unidades para a raiz do desvio quadrático médio? Seriam em termos de quaisquer que sejam as suas unidades para o eixo “y”. Neste caso, seria a pontuação do teste. Espero que esta aula tenha te ajudado. Até a próxima, pessoal!