Conteúdo principal
Curso: Estatística Avançada > Unidade 10
Lição 9: Como testar a diferença de duas proporções da população- Teste de hipóteses para diferença em proporções
- Como construir hipóteses para duas proporções
- Como escrever hipóteses para testar a diferença de proporções
- Exemplo de teste de hipóteses para diferença em proporções
- Estatística de teste em um teste z de duas amostras para a diferença de proporções
- Valor-p em um teste z de duas amostras para a diferença de proporções
- Como comparar o valor-p ao nível de significância para um teste que envolve diferença de proporções
- Intervalo de confiança de teste de hipóteses para diferença em proporções
- Como tirar conclusões sobre a diferença de proporções
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Exemplo de teste de hipóteses para diferença em proporções
Exemplo de teste de hipóteses para diferença em proporções.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA10C Olá, meu amigo ou minha amiga!
Tudo bem com você? Seja muito bem-vindo ou bem-vinda
a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos resolver
um exemplo sobre teste de hipóteses para
diferenças de proporções. Esse exemplo diz o seguinte:
pesquisadores suspeitam que a miopia, ou hipometropia, está se tornando mais
comum com o tempo. Um estudo do ano de 2000
mostrou 132 casos de miopia em 400 pessoas
selecionadas aleatoriamente. Já um estudo separado,
de 2015, mostrou 228 casos em 600 pessoas
selecionadas aleatoriamente. Então, o que vamos fazer neste vídeo
é realizar um teste de hipótese para ver se temos evidências para sugerir
o que os pesquisadores falaram. Ou seja, que a miopia está se tornando
mais comum com o tempo. Se estiver inspirado,
te encorajo a pausar o vídeo e tentar trabalhar neste exemplo
sozinho ou sozinha. Vamos fazer juntos agora?
Então, vamos começar definindo nossa hipótese nula
e nossa hipótese alternativa. Nossa hipótese nula é o quê?
É algo contrário às suspeitas, ou seja, que a miopia não está
se tornando mais comum. A melhor forma de realizar
o teste de hipóteses é olhar para as medidas das proporções
de pessoas que possuem miopia e como isso mudou ao longo do tempo, ou seja, vamos olhar para a proporção
de pessoas com miopia em 2015 e comparar com a proporção em 2000. Portanto, nossa hipótese nula
é que não vai haver diferença. Assumindo essa hipótese, teremos
que a proporção real de pessoas que têm miopia em 2015 é igual à proporção real de pessoas
que tiveram miopia em 2000. Aí, a nossa hipótese alternativa é o quê? Se suspeitam que está se tornando
mais comum com o tempo, isto aqui seria uma situação
em que nossa proporção real em 2015 vai ser maior que a proporção
real em 2000. Neste cenário, a miopia estaria
se tornando mais comum com o tempo, porque 2015 é depois de 2000. Antes de começar a testar
nossa hipótese nula para ver se podemos rejeitar ou não, o que sugeriria a nossa alternativa, é preciso conferir se as condições
para a inferência estão sendo atendidas, e já fizemos isso muitas vezes antes. Inicialmente, temos a nossa
condição "aleatória". Pelo que vemos aqui, essa condição
é atendida para ambas as amostras. Temos 400 pessoas
selecionadas aleatoriamente, e aqui 600 pessoas
selecionadas aleatoriamente, então, essa condição foi atendida. Também temos a condição "normal". Para atender a condição "normal",
o número de sucessos e falhas em cada uma das amostras
deve ser pelo menos 10. E vemos que esse é o caso,
temos 132 sucessos, ou seja, 132 pessoas
que têm miopia. Fazendo a diferença entre 400 e 132,
temos o número de falhas. Nem preciso fazer o cálculo porque,
em qualquer um desses números, teremos algo maior que 10. É a mesma coisa para a amostra de 2015, então, também atendemos essa condição. A última condição sobre a qual sempre
falamos é a condição de independência. Existem duas maneiras
de atender essa condição: ou você está realizando testes
com substituição ou o tamanho de sua amostra
não é maior que 10% da população. Acho que é seguro dizer que mesmo
esta amostra maior de 600 pessoas atende a condição, porque com certeza
existem mais de 6.000 pessoas no mundo. Então, acho que é razoável dizer que estamos atendendo essa condição
de independência também, mesmo que isso não tenha sido
deixado explícito aqui, mas é bom sempre pensar nisso. Agora, a próxima coisa a fazer
em um teste de hipótese é definir o nível de significância,
ou seja, α. Vou definir meu nível de significância
como 0,05. Ou seja, 5%. Agora, o que vamos fazer é encontrar a probabilidade de obter
uma diferença entre 2015 e 2000 que seja pelo menos tão grande
quanto a que temos. E, se essa probabilidade for menor
do que nosso nível de significância, então, rejeitaremos a nossa hipótese nula
e vamos sugerir a alternativa. Mas, se essa probabilidade for maior
do que o nosso nível de significância, então, falhamos em rejeitar
a hipótese nula e não teremos evidências para
a suspeita dos pesquisadores. Vamos prosseguir com isso. O que vamos fazer aqui é calcular “Z”. O nosso “Z” vai ser igual
à proporção da amostra em 2015 menos a proporção
da amostra em 2000, tudo isso dividido pelo desvio-padrão
da distribuição de amostragem da diferença entre as proporções
da amostra em 2015 e 2000. Agora, isso vai ser
aproximadamente igual... Aproximadamente porque não podemos
calcular esse numerador exatamente, mas conseguimos estimar
o que está no denominador. Sendo assim, temos aqui o numerador.
Vamos ver a proporção em 2015. Em 2015, temos 228 casos de 600. Portanto, temos 228 de 600. Agora, em 2000,
temos 132 casos de 400. Sendo assim, colocamos
menos 132 sobre 400. Aí, tudo isso sobre a raiz quadrada.
Raiz quadrada de quê? Aqui vamos usar a proporção combinada. Poderíamos escrever isso
como Pc com "chapéu". E o motivo de usar a proporção combinada, da qual inclusive já falamos
em vídeos anteriores, é que, ao fazermos
um teste de hipótese, assumimos que nossa hipótese nula
é verdadeira. E se nossa hipótese nula
for verdadeira, não haverá diferença entre nossas
proporções em 2015 e 2000. Para obter uma estimativa melhor
da verdadeira proporção, devemos somar nossas amostras. Portanto, nosso tamanho
da amostra vai ser 600 mais 400, e o número de casos de miopia
vai ser 228 mais 132. O que leva a gente a ter 360
sobre 1.000, que é igual a 0,36. Podemos usar isso dentro da expressão
quando tentarmos estimar o nosso desvio-padrão
dessa distribuição amostral. Então, isto aqui vai ser 0,36 vezes 1 menos 0,36,
que é 0,64, sobre o tamanho da amostra
em 2015, que é 600, mais 0,36 vezes 0,64 sobre o tamanho da amostra
em 2000, que é 400. Antes de pegar minha calculadora, acho que dá para simplificar
isso um pouco. 228 sobre 600... 228 dividido por 6
é igual a 38. Então, isto aqui é 0,38. Agora, 132 dividido por 4
é 33, então, isto aqui é 0,33. Assim, todo o nosso numerador
vai ser apenas 0,05. Agora, posso colocar isso
na calculadora. Vou ter então 0,05 dividido
pela raiz quadrada de… Vamos ver. Vou ter 0,36 vezes 0,64
dividido por 600, mais 0,36 vezes 0,64
dividido por 400. Isso vai ser aproximadamente 1,61. Então, isto é aproximadamente
igual a 1,61. E uma forma de pensar sobre isso
é que a diferença que temos entre nossas proporções de amostra
entre 2015 e 2000 é 0,05. Mas temos 1,61 de desvio-padrão acima de nossa média de
distribuição de amostragem. Isso se assumirmos que a proporção
nula é verdadeira. Agora, a partir disso,
podemos calcular o nosso valor “P”. Lembre-se, o nosso valor “P”
é igual à probabilidade de que nosso “Z” seja
pelo menos tão grande assim, ou seja, que seja maior
ou igual a 1,61. E uma forma de pensar sobre isso é que, se olharmos para
a distribuição da amostra, realmente poderíamos apenas olhar
para qualquer distribuição normal agora, já que normalizamos para “Z”. Então, estamos olhando para o padrão 1,61 desvios
acima da média, afinal, “Z” é igual a 1,61. Sendo assim, estamos pensando
sobre esta área, bem aqui. Este seria o nosso valor “P”. Para nos ajudar com isso,
podemos consultar uma tabela “Z”. Esta tabela “Z” nos fornece a área
cumulativa até algum valor “Z”. Assim, precisamos apenas calcular
a diferença entre 1 e esse valor, seja o que for que isso nos dê. Indo aqui para 1,61,
encontramos 0,9463. Então, isto é igual
a 1 menos 0,9463, que é igual a 0,0537. Observe que este valor “P”
é um pouco maior do que o nosso nível de significância. É por isso que precisamos definir o nosso
nível de significância inicialmente. Não queremos ser tentados
a dizer: "Estou tão perto, deixe-me apenas aumentar a minha
significância e nivelar um pouco mais para que eu possa rejeitar
minha hipótese nula e ter algo para contar aos meus amigos". Não, isso não seria uma boa ciência, definitivamente não seria
uma boa estatística. Precisamos ser disciplinados! Então, pelo fato do nosso valor “P” ser
maior que o nosso nível de significância, mesmo que seja por muito pouco, falhamos em rejeitar
a nossa hipótese nula. Outra maneira de pensar sobre isso,
em termos do contexto da questão, é que podemos dizer que
não há evidências suficientes para sugerir que a miopia está
se tornando mais comum com o tempo. E pronto, terminamos! Espero que você tenha compreendido
tudo direitinho deste exemplo. Mais uma vez, quero deixar para você
um grande abraço. E até a próxima!