If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Demonstração (parte 3) minimização do erro quadrado da regressão linear

Demonstração (parte 3) Minimização de erro quadrado para linha de regressão. Versão original criada por Sal Khan.

Quer participar da conversa?

  • Avatar aqualine ultimate style do usuário tanisio carlos
    se usasse derivada parcial com regra da cadeia antes de expandir o quadrado, muito cálculo teria sido evitado, o q diminuiria a probabilidade de erro do aluno, expandir é bom pela didática, mas pra quem conhece o cálculo, seria bem mais divertido.
    (3 votos)
    Avatar Default Khan Academy avatar do usuário
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA2JV - E aí, pessoal! No último vídeo, nós estávamos completando nossa saga ao longo de todas estas equações aqui, de todas estas transformações para tentar achar esta linha aqui, que é a linha que minimiza o erro quadrado, ou seja, o mínimo quadrado entre os pontos que eu tiver em um determinado gráfico, que eu estiver observando. Então, a gente fez todos estes cálculos, toda esta parte algébrica, e eu falo de uma maneira feliz para vocês que nós finalmente chegamos na última parte desses cálculos algébricos, nessa parte de simplificação e que envolve matemática um pouco mais complicada. E essa parte é a parte da derivada parcial. Se vocês ainda não aprenderam derivada parcial, não se preocupem, porque não é difícil, mas talvez seja um pouco complicado só de ver ela sendo feita nesta equação aqui. Mas eu vou fazer, então, se vocês precisarem pausar o vídeo em algum momento, sintam-se à vontade para pausar. E, só avisando de novo, não é muito complicado, então, não se preocupe quanto a isso. Então, eu vou apagar isto aqui para ter um pouco mais de espaço, apagar estes hieróglifos que ficaram aqui no meio do vídeo. Então, quando a gente tirar uma derivada, por que a gente quer tirar a derivada, a derivada em relação a "m" e em relação a "b" nesta equação aqui? Quando a gente tira uma derivada, a gente acha uma equação que descreve a inclinação de uma determinada reta que passa por uma função em um determinado ponto. Então, se a gente tivesse a derivada desta equação aqui em relação a "m", nós teríamos esta reta, que inclusive já está desenhada aqui. Nós teríamos esta reta com inclinação zero aqui neste ponto máximo do nosso gráfico. E, se a gente tirasse a derivada em relação a "b", nós teríamos, também, a reta de inclinação zero que passa, no caso, a gente teria que tirar a derivada igual a zero. Desculpa, eu quase me confundi aqui. Então, a gente teria esta linha que passa pelo ponto mínimo aqui, cuja inclinação é zero. Então, agora, vamos parar de falar e vamos fazer. Então, vamos começar tirando a derivada desta equação aqui em relação a "m". Em relação a "m", vou marcar neste lado aqui. "n" média de y². A derivada disto aqui em relação a "m" é zero, porque tudo o que está aqui, embora tenha um monte de letras e até uma variável y², isto aqui, quando a gente derivar em relação a "m", vai se comportar como uma constante. Então, em relação a "m", isto aqui é zero. Não aparece na nossa derivada. Agora a gente tem: menos 2mn, média de xₙ yₙ Eu vou só escrever este xₙyₙ como xy, para ficar um pouco menos complicado depois, de ver. Então deixe-me reescrever isto como xy. Desta maneira aqui. E a derivada disto aqui em relação a "m" vai ser: 2, -2, na verdade. -2 vezes "n" média de xy. Vocês conseguiram ver o que aconteceu aqui? A derivada, de certa forma, só os coeficientes que multiplicam este "m" que estava aqui, para quem ainda não sabe fazer derivada. Então, é como se o grau aqui deste "m" fosse 1, e eu passasse este grau 1 para baixo aqui, para esta equação, multiplicando aqui na frente deste -2, e multiplicasse só os outros coeficientes que estão ali. Então, continuando nossa derivada. Nesta parte aqui da equação, a gente também não tem "m". Então, isto aqui vai se comportar como uma constante, vai ser zero, não aparece na nossa derivada. E aqui, m²n média de x². Este m², a derivada é 2m. Então, mais 2m. Multiplicando pelo resto, por este coeficiente: vezes "n" média de x². E agora, a derivada de 2mbn média de "x" vai ser 2bn média de "x". Mais 2bn média de "x". E este nb aqui, que no caso não tem "m", vai ser uma constante. E vai ser, então, zero a nossa derivada. Lembrando que a gente achou a derivada em relação a "m", a derivada parcial desta nossa equação em relação a "m", mas nós ainda precisamos igualá-la a zero. Então, já vou fazer isso aqui. Igualei a zero. E agora, a gente vai calcular a derivada em relação a "b". É o mesmo esquema de calcular a derivada em relação a "m", só que agora a gente está calculando em relação a "b". Então: ny² vai ser zero, que é uma constante em relação a "b". 2mn média de xy vai ser também zero, porque é uma constante em relação a "b". Agora, menos 2bn média de "y" não vai ser constante. Então, este "b" desaparece e fica só: menos 2n média de "y". Aqui não temos "b", então, vai ser constante. Aqui nós temos "b". Então, vai ser, este "b" desaparece, porque é grau 1. Então, fica: 2mn média de "x". Mais 2mn média de "x". E este nb², este grau passa aqui para baixo, e no caso fica: 2nb, e este "b" que ficou aqui no final a gente diminui 1 grau no expoente. Então, fica: mais 2nb. E isto aqui também tem que ser igual a zero. Então, a gente acabou de achar duas equações. No caso, duas equações derivadas, em relação a "m" e em relação a "b". E agora, o que a gente pode fazer com elas seria, simplesmente, resolver, se a gente tivesse os pontos. Porque pode parecer que isto aqui é complicado e tem um monte de números aqui, mas lembrem-se que a gente só representou algumas coisas como letras aqui, que provavelmente vocês já teriam, no caso de fazer um exercício com isso. Aqui a gente tem duas equações com duas variáveis. As variáveis aqui são só: "m", são só "m" e "b". Não existe outra variável além de "m" e "b". Então, todos estes pontos e todos estes outros valores, vocês provavelmente teriam, então, não tem nenhuma preocupação aqui. E agora, vocês já podem também pensar que a gente pode simplificar um pouco mais isto aqui. E é verdade, a gente pode simplificar um pouco mais isto, dividindo todos os termos por 2n. Todos eles são divisíveis por 2n. 2n, aqui também tem 2n, e aqui também tem 2n. Então, eu vou fazer isso. Eu vou apagar isto aqui, porque está ocupando um pouco de espaço. Nem sei o que estava escrito aqui. Na verdade, não é mais importante, porque a gente acabou de reescrever o que estava aqui, aqui. Então, tanto faz. Então, dividindo todos os termos por 2n, nós vamos ficar com: menos média de xy, mais "m" média de x², mais "b" média de "x", isto vai ter que ser igual a zero. E também: menos média de "y", mais "m" média de "x", mais "b", tem que ser igual a zero. E a gente finalmente conseguiu, cada vez mais, chegar perto da nossa equação de retas. Tem uma última coisa que eu quero fazer, que é neste lado, adicionar, aqui nesta equação de cima, eu quero adicionar a média de xy nos dois lados. Então, vou botar aqui: mais média de xy, e aqui ficaria mais a média de xy. E, neste lado, adicionar a média de "y", o valor médio de "y". Então, neste lado, também adicionaria o valor médio de "y". E estas duas equações, então, agora, realmente é o nosso último passo agora, ficariam como? Aqui cancelaria, estes dois se cancelariam. Então, ficaria: "m" média de x², mais "b" média de "x", igual a, só este termo aqui: média de xy. Da mesma maneira, estes dois cancelariam, e ficaria: "m" valor médio de "x", mais "b", tem que ser igual ao valor médio de "y". E vocês também podem lembrar que a gente tinha, lá em cima, uma equação "mx + b", que era a nossa equação da reta. Este "y = mx + b" vai nos dar esta reta aqui. y = mx + b. E a gente acabou de achar dois pontos, ou melhor, dois conjuntos de dois pontos que satisfazem esta reta aqui. As nossas duas incógnitas aqui, no caso, seriam o "y" e o "x", que a gente acabou de tirar desta equação aqui, e a gente poderia simplesmente descobrir o "m" e o "b". Se a gente trocasse este "x" e este "y" aqui nesta equação, a gente veria que eles satisfazem esta equação da reta. Então, esta reta inclui os pontos: (valor médio de "x", valor médio de "y"), e da mesma forma, trocando pela média de x² e, na verdade, aqui, nesta equação, eu esqueci de fazer primeiro, a gente pode, ainda, dividir. Ela é divisível por valor médio de "x". Então, esta equação ficaria: "m", média de x² sobre média de "x", mais "b', igual à média de xy sobre "x". E estas duas equações aqui são as mesmas equações, só que uma é dividida por média de "x" e a outra, não. Então, este ponto estaria nesta reta, e estes dois pontos, no caso, também satisfariam essa reta. Então, eu também tenho o ponto (média de x² sobre média de "x", média de xy sobre média de "x"). Então, estes dois pontos estão contidos na nossa reta, ou na nossa linha, acho que fica melhor. Na nossa linha "ótima". Lembrando que ela é uma linha ótima em relação ao método que a gente está utilizando, que é o método do mínimo ao quadrado. Então, obrigado e até o próximo vídeo.