If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Para entrar como usuário e utilizar todos os recursos da Khan Academy, habilite o JavaScript em seu navegador.

Conteúdo principal

Curso: Estatística Avançada > Unidade 10

Lição 9: Como testar a diferença de duas proporções da população

© 2024 Khan AcademyTermos de uso Política de privacidade Aviso de cookies

Exemplo de teste de hipóteses para diferença em proporções

Google Sala de Aula

Exemplo de teste de hipóteses para diferença em proporções.

Quer participar da conversa?

Classificar por:

Nenhuma postagem por enquanto.

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA10C Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos resolver um exemplo sobre teste de hipóteses para diferenças de proporções. Esse exemplo diz o seguinte: pesquisadores suspeitam que a miopia, ou hipometropia, está se tornando mais comum com o tempo. Um estudo do ano de 2000 mostrou 132 casos de miopia em 400 pessoas selecionadas aleatoriamente. Já um estudo separado, de 2015, mostrou 228 casos em 600 pessoas selecionadas aleatoriamente. Então, o que vamos fazer neste vídeo é realizar um teste de hipótese para ver se temos evidências para sugerir o que os pesquisadores falaram. Ou seja, que a miopia está se tornando mais comum com o tempo. Se estiver inspirado, te encorajo a pausar o vídeo e tentar trabalhar neste exemplo sozinho ou sozinha. Vamos fazer juntos agora? Então, vamos começar definindo nossa hipótese nula e nossa hipótese alternativa. Nossa hipótese nula é o quê? É algo contrário às suspeitas, ou seja, que a miopia não está se tornando mais comum. A melhor forma de realizar o teste de hipóteses é olhar para as medidas das proporções de pessoas que possuem miopia e como isso mudou ao longo do tempo, ou seja, vamos olhar para a proporção de pessoas com miopia em 2015 e comparar com a proporção em 2000. Portanto, nossa hipótese nula é que não vai haver diferença. Assumindo essa hipótese, teremos que a proporção real de pessoas que têm miopia em 2015 é igual à proporção real de pessoas que tiveram miopia em 2000. Aí, a nossa hipótese alternativa é o quê? Se suspeitam que está se tornando mais comum com o tempo, isto aqui seria uma situação em que nossa proporção real em 2015 vai ser maior que a proporção real em 2000. Neste cenário, a miopia estaria se tornando mais comum com o tempo, porque 2015 é depois de 2000. Antes de começar a testar nossa hipótese nula para ver se podemos rejeitar ou não, o que sugeriria a nossa alternativa, é preciso conferir se as condições para a inferência estão sendo atendidas, e já fizemos isso muitas vezes antes. Inicialmente, temos a nossa condição "aleatória". Pelo que vemos aqui, essa condição é atendida para ambas as amostras. Temos 400 pessoas selecionadas aleatoriamente, e aqui 600 pessoas selecionadas aleatoriamente, então, essa condição foi atendida. Também temos a condição "normal". Para atender a condição "normal", o número de sucessos e falhas em cada uma das amostras deve ser pelo menos 10. E vemos que esse é o caso, temos 132 sucessos, ou seja, 132 pessoas que têm miopia. Fazendo a diferença entre 400 e 132, temos o número de falhas. Nem preciso fazer o cálculo porque, em qualquer um desses números, teremos algo maior que 10. É a mesma coisa para a amostra de 2015, então, também atendemos essa condição. A última condição sobre a qual sempre falamos é a condição de independência. Existem duas maneiras de atender essa condição: ou você está realizando testes com substituição ou o tamanho de sua amostra não é maior que 10% da população. Acho que é seguro dizer que mesmo esta amostra maior de 600 pessoas atende a condição, porque com certeza existem mais de 6.000 pessoas no mundo. Então, acho que é razoável dizer que estamos atendendo essa condição de independência também, mesmo que isso não tenha sido deixado explícito aqui, mas é bom sempre pensar nisso. Agora, a próxima coisa a fazer em um teste de hipótese é definir o nível de significância, ou seja, α. Vou definir meu nível de significância como 0,05. Ou seja, 5%. Agora, o que vamos fazer é encontrar a probabilidade de obter uma diferença entre 2015 e 2000 que seja pelo menos tão grande quanto a que temos. E, se essa probabilidade for menor do que nosso nível de significância, então, rejeitaremos a nossa hipótese nula e vamos sugerir a alternativa. Mas, se essa probabilidade for maior do que o nosso nível de significância, então, falhamos em rejeitar a hipótese nula e não teremos evidências para a suspeita dos pesquisadores. Vamos prosseguir com isso. O que vamos fazer aqui é calcular “Z”. O nosso “Z” vai ser igual à proporção da amostra em 2015 menos a proporção da amostra em 2000, tudo isso dividido pelo desvio-padrão da distribuição de amostragem da diferença entre as proporções da amostra em 2015 e 2000. Agora, isso vai ser aproximadamente igual... Aproximadamente porque não podemos calcular esse numerador exatamente, mas conseguimos estimar o que está no denominador. Sendo assim, temos aqui o numerador. Vamos ver a proporção em 2015. Em 2015, temos 228 casos de 600. Portanto, temos 228 de 600. Agora, em 2000, temos 132 casos de 400. Sendo assim, colocamos menos 132 sobre 400. Aí, tudo isso sobre a raiz quadrada. Raiz quadrada de quê? Aqui vamos usar a proporção combinada. Poderíamos escrever isso como Pc com "chapéu". E o motivo de usar a proporção combinada, da qual inclusive já falamos em vídeos anteriores, é que, ao fazermos um teste de hipótese, assumimos que nossa hipótese nula é verdadeira. E se nossa hipótese nula for verdadeira, não haverá diferença entre nossas proporções em 2015 e 2000. Para obter uma estimativa melhor da verdadeira proporção, devemos somar nossas amostras. Portanto, nosso tamanho da amostra vai ser 600 mais 400, e o número de casos de miopia vai ser 228 mais 132. O que leva a gente a ter 360 sobre 1.000, que é igual a 0,36. Podemos usar isso dentro da expressão quando tentarmos estimar o nosso desvio-padrão dessa distribuição amostral. Então, isto aqui vai ser 0,36 vezes 1 menos 0,36, que é 0,64, sobre o tamanho da amostra em 2015, que é 600, mais 0,36 vezes 0,64 sobre o tamanho da amostra em 2000, que é 400. Antes de pegar minha calculadora, acho que dá para simplificar isso um pouco. 228 sobre 600... 228 dividido por 6 é igual a 38. Então, isto aqui é 0,38. Agora, 132 dividido por 4 é 33, então, isto aqui é 0,33. Assim, todo o nosso numerador vai ser apenas 0,05. Agora, posso colocar isso na calculadora. Vou ter então 0,05 dividido pela raiz quadrada de… Vamos ver. Vou ter 0,36 vezes 0,64 dividido por 600, mais 0,36 vezes 0,64 dividido por 400. Isso vai ser aproximadamente 1,61. Então, isto é aproximadamente igual a 1,61. E uma forma de pensar sobre isso é que a diferença que temos entre nossas proporções de amostra entre 2015 e 2000 é 0,05. Mas temos 1,61 de desvio-padrão acima de nossa média de distribuição de amostragem. Isso se assumirmos que a proporção nula é verdadeira. Agora, a partir disso, podemos calcular o nosso valor “P”. Lembre-se, o nosso valor “P” é igual à probabilidade de que nosso “Z” seja pelo menos tão grande assim, ou seja, que seja maior ou igual a 1,61. E uma forma de pensar sobre isso é que, se olharmos para a distribuição da amostra, realmente poderíamos apenas olhar para qualquer distribuição normal agora, já que normalizamos para “Z”. Então, estamos olhando para o padrão 1,61 desvios acima da média, afinal, “Z” é igual a 1,61. Sendo assim, estamos pensando sobre esta área, bem aqui. Este seria o nosso valor “P”. Para nos ajudar com isso, podemos consultar uma tabela “Z”. Esta tabela “Z” nos fornece a área cumulativa até algum valor “Z”. Assim, precisamos apenas calcular a diferença entre 1 e esse valor, seja o que for que isso nos dê. Indo aqui para 1,61, encontramos 0,9463. Então, isto é igual a 1 menos 0,9463, que é igual a 0,0537. Observe que este valor “P” é um pouco maior do que o nosso nível de significância. É por isso que precisamos definir o nosso nível de significância inicialmente. Não queremos ser tentados a dizer: "Estou tão perto, deixe-me apenas aumentar a minha significância e nivelar um pouco mais para que eu possa rejeitar minha hipótese nula e ter algo para contar aos meus amigos". Não, isso não seria uma boa ciência, definitivamente não seria uma boa estatística. Precisamos ser disciplinados! Então, pelo fato do nosso valor “P” ser maior que o nosso nível de significância, mesmo que seja por muito pouco, falhamos em rejeitar a nossa hipótese nula. Outra maneira de pensar sobre isso, em termos do contexto da questão, é que podemos dizer que não há evidências suficientes para sugerir que a miopia está se tornando mais comum com o tempo. E pronto, terminamos! Espero que você tenha compreendido tudo direitinho deste exemplo. Mais uma vez, quero deixar para você um grande abraço. E até a próxima!