Conteúdo principal
Curso: Estatística e probabilidade > Unidade 5
Lição 6: Mais sobre regressão- Erro ao quadrado da regressão linear
- Demonstração (parte 1) minimização de erro quadrado para regressão linear
- Demonstração (parte 2) minimização do erro quadrado da regressão linear
- Demonstração (parte 3) minimização do erro quadrado da regressão linear
- Demonstração (parte 4) minimização do erro quadrado da regressão linear
- Exemplo de regressão linear
- Segundo exemplo de regressão
- Calculando R²
- Covariância e a regressão linear
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Demonstração (parte 3) minimização do erro quadrado da regressão linear
Demonstração (parte 3) Minimização de erro quadrado para linha de regressão. Versão original criada por Sal Khan.
Quer participar da conversa?
- se usasse derivada parcial com regra da cadeia antes de expandir o quadrado, muito cálculo teria sido evitado, o q diminuiria a probabilidade de erro do aluno, expandir é bom pela didática, mas pra quem conhece o cálculo, seria bem mais divertido.(3 votos)
Transcrição de vídeo
RKA2JV - E aí, pessoal! No último vídeo, nós estávamos
completando nossa saga ao longo de todas estas equações aqui,
de todas estas transformações para tentar achar
esta linha aqui, que é a linha que minimiza
o erro quadrado, ou seja, o mínimo quadrado entre os pontos que eu tiver
em um determinado gráfico, que eu estiver
observando. Então, a gente fez todos estes
cálculos, toda esta parte algébrica, e eu falo de uma
maneira feliz para vocês que nós finalmente chegamos na
última parte desses cálculos algébricos, nessa parte de
simplificação e que envolve matemática um pouco
mais complicada. E essa parte é a parte
da derivada parcial. Se vocês ainda não
aprenderam derivada parcial, não se preocupem,
porque não é difícil, mas talvez seja um
pouco complicado só de ver ela sendo feita
nesta equação aqui. Mas eu vou
fazer, então, se vocês precisarem pausar
o vídeo em algum momento, sintam-se à vontade
para pausar. E, só avisando de novo,
não é muito complicado, então, não se preocupe
quanto a isso. Então, eu vou
apagar isto aqui para ter um pouco
mais de espaço, apagar estes hieróglifos que
ficaram aqui no meio do vídeo. Então, quando a gente
tirar uma derivada, por que a gente quer
tirar a derivada, a derivada em relação a "m"
e em relação a "b" nesta equação aqui? Quando a gente tira uma derivada,
a gente acha uma equação que descreve a inclinação
de uma determinada reta que passa por uma função
em um determinado ponto. Então, se a gente tivesse a derivada
desta equação aqui em relação a "m", nós teríamos esta reta,
que inclusive já está desenhada aqui. Nós teríamos esta reta
com inclinação zero aqui neste ponto máximo
do nosso gráfico. E, se a gente tirasse
a derivada em relação a "b", nós teríamos, também,
a reta de inclinação zero que passa, no caso, a gente teria que
tirar a derivada igual a zero. Desculpa, eu quase
me confundi aqui. Então, a gente teria esta linha
que passa pelo ponto mínimo aqui, cuja inclinação
é zero. Então, agora, vamos parar
de falar e vamos fazer. Então, vamos começar tirando a derivada
desta equação aqui em relação a "m". Em relação a "m",
vou marcar neste lado aqui. "n" média de y². A derivada disto aqui
em relação a "m" é zero, porque tudo o que está aqui, embora tenha
um monte de letras e até uma variável y², isto aqui, quando a gente
derivar em relação a "m", vai se comportar
como uma constante. Então, em relação a "m",
isto aqui é zero. Não aparece na nossa derivada. Agora a gente tem:
menos 2mn, média de xₙ yₙ Eu vou só escrever
este xₙyₙ como xy, para ficar um pouco menos
complicado depois, de ver. Então deixe-me reescrever
isto como xy. Desta maneira aqui. E a derivada disto aqui
em relação a "m" vai ser: 2, -2, na verdade.
-2 vezes "n" média de xy. Vocês conseguiram
ver o que aconteceu aqui? A derivada, de certa forma, só os coeficientes que multiplicam
este "m" que estava aqui, para quem ainda não
sabe fazer derivada. Então, é como se o grau
aqui deste "m" fosse 1, e eu passasse este grau 1 para
baixo aqui, para esta equação, multiplicando aqui
na frente deste -2, e multiplicasse só os outros
coeficientes que estão ali. Então, continuando
nossa derivada. Nesta parte aqui da equação,
a gente também não tem "m". Então, isto aqui vai se comportar
como uma constante, vai ser zero, não aparece
na nossa derivada. E aqui, m²n
média de x². Este m², a derivada é 2m.
Então, mais 2m. Multiplicando pelo resto,
por este coeficiente: vezes "n"
média de x². E agora, a derivada de 2mbn
média de "x" vai ser 2bn média de "x". Mais 2bn média de "x". E este nb aqui, que no caso não
tem "m", vai ser uma constante. E vai ser, então, zero
a nossa derivada. Lembrando que a gente achou
a derivada em relação a "m", a derivada parcial desta nossa
equação em relação a "m", mas nós ainda precisamos
igualá-la a zero. Então, já vou fazer isso aqui.
Igualei a zero. E agora, a gente vai calcular
a derivada em relação a "b". É o mesmo esquema de calcular
a derivada em relação a "m", só que agora a gente está
calculando em relação a "b". Então: ny² vai ser zero, que é
uma constante em relação a "b". 2mn média de xy
vai ser também zero, porque é uma constante
em relação a "b". Agora, menos 2bn média de "y"
não vai ser constante. Então, este "b" desaparece e fica só:
menos 2n média de "y". Aqui não temos "b",
então, vai ser constante. Aqui nós
temos "b". Então, vai ser, este "b" desaparece,
porque é grau 1. Então, fica: 2mn
média de "x". Mais 2mn média de "x". E este nb², este grau passa aqui
para baixo, e no caso fica: 2nb, e este "b" que ficou aqui no final
a gente diminui 1 grau no expoente. Então, fica:
mais 2nb. E isto aqui também tem
que ser igual a zero. Então, a gente acabou
de achar duas equações. No caso, duas equações derivadas,
em relação a "m" e em relação a "b". E agora, o que a gente
pode fazer com elas seria, simplesmente, resolver,
se a gente tivesse os pontos. Porque pode parecer que
isto aqui é complicado e tem um monte
de números aqui, mas lembrem-se que a gente só representou
algumas coisas como letras aqui, que provavelmente vocês já teriam,
no caso de fazer um exercício com isso. Aqui a gente tem duas equações
com duas variáveis. As variáveis aqui
são só: "m", são só
"m" e "b". Não existe outra variável
além de "m" e "b". Então, todos estes pontos
e todos estes outros valores, vocês provavelmente teriam, então,
não tem nenhuma preocupação aqui. E agora, vocês já
podem também pensar que a gente pode simplificar
um pouco mais isto aqui. E é verdade, a gente pode
simplificar um pouco mais isto, dividindo todos
os termos por 2n. Todos eles são divisíveis por 2n. 2n, aqui também tem 2n,
e aqui também tem 2n. Então, eu vou fazer isso.
Eu vou apagar isto aqui, porque está ocupando
um pouco de espaço. Nem sei o que
estava escrito aqui. Na verdade, não é
mais importante, porque a gente acabou de
reescrever o que estava aqui, aqui. Então, tanto faz. Então, dividindo todos
os termos por 2n, nós vamos ficar com:
menos média de xy, mais "m"
média de x², mais "b"
média de "x", isto vai ter que
ser igual a zero. E também:
menos média de "y", mais "m"
média de "x", mais "b", tem que
ser igual a zero. E a gente finalmente
conseguiu, cada vez mais, chegar perto da nossa
equação de retas. Tem uma última coisa que
eu quero fazer, que é neste lado, adicionar, aqui nesta
equação de cima, eu quero adicionar
a média de xy nos dois lados. Então, vou botar aqui:
mais média de xy, e aqui ficaria mais
a média de xy. E, neste lado, adicionar a média de "y",
o valor médio de "y". Então, neste lado, também
adicionaria o valor médio de "y". E estas duas equações,
então, agora, realmente é o nosso último
passo agora, ficariam como? Aqui cancelaria,
estes dois se cancelariam. Então, ficaria:
"m" média de x², mais "b" média
de "x", igual a, só este termo aqui:
média de xy. Da mesma maneira, estes dois cancelariam,
e ficaria: "m" valor médio de "x", mais "b", tem que ser igual
ao valor médio de "y". E vocês também podem lembrar
que a gente tinha, lá em cima, uma equação "mx + b",
que era a nossa equação da reta. Este "y = mx + b"
vai nos dar esta reta aqui. y = mx + b. E a gente acabou de achar
dois pontos, ou melhor, dois conjuntos de dois pontos
que satisfazem esta reta aqui. As nossas duas incógnitas aqui,
no caso, seriam o "y" e o "x", que a gente acabou de tirar
desta equação aqui, e a gente poderia simplesmente
descobrir o "m" e o "b". Se a gente trocasse este "x" e este "y"
aqui nesta equação, a gente veria que eles satisfazem
esta equação da reta. Então, esta reta
inclui os pontos: (valor médio de "x",
valor médio de "y"), e da mesma forma,
trocando pela média de x² e, na verdade, aqui, nesta equação,
eu esqueci de fazer primeiro, a gente pode,
ainda, dividir. Ela é divisível por
valor médio de "x". Então, esta equação ficaria: "m",
média de x² sobre média de "x", mais "b', igual à média
de xy sobre "x". E estas duas equações aqui
são as mesmas equações, só que uma é dividida por
média de "x" e a outra, não. Então, este ponto
estaria nesta reta, e estes dois pontos, no caso,
também satisfariam essa reta. Então, eu também tenho o ponto
(média de x² sobre média de "x", média de xy sobre
média de "x"). Então, estes dois pontos
estão contidos na nossa reta, ou na nossa linha,
acho que fica melhor. Na nossa
linha "ótima". Lembrando que ela é uma
linha ótima em relação ao método que
a gente está utilizando, que é o método
do mínimo ao quadrado. Então, obrigado
e até o próximo vídeo.