Mostrando postagens com marcador quartil. Mostrar todas as postagens
Mostrando postagens com marcador quartil. Mostrar todas as postagens

O esquema de cinco números (Tukey, 1977) e seu desenho esquemático.

Este é um modelo de representação de um conjunto de dados. Então, foram selecionados a quantidade $n$ de dados, o valor central, ou seja, a mediana $Md$, as juntas (ou quartis), no caso $J_1$ e $J_3$, além dos valores extremos mínimo e máximo. Estes números são organizados conforme a seguinte figura.




Temos, ainda, uma outra representação chamada de desenho esquemático (Morettin). Neste caso, A figura é a seguinte:





Nesta figura, podemos identificar os quartis ou juntas, sendo que $J_2 = Md$. A figura, portanto, destacará o intervalo interquartil, de $J_1$ a $J_3$, portanto, a região em que estão concentrados a metade dos dados. O intervalo interquartil é calculado como $dj = J_3 - J_1$. Os eventuais valores $x$ da figura (podem ser vários), são considerados valores discrepantes ou outliers. Na figura, são valores inferiores a $J_1 - \dfrac{3}{2}dj$ e $J_3+\dfrac{3}{2}dj$. Este parâmetro, $\dfrac{3}{2}dj$ é oriundo de uma distribuição normal e serve para estabelecer um critério para discrepância. A linha que sai dos dois lados do retângulo serve para descrever os limites de dados não discrepantes. Assim, temos uma desenho representativo de um conjunto de dados.

mediana, decil e intervalo interquartil.

Considere a seguinte tabela de dados.


a) mediana            b) 1º decil             c) intervalo interquartil


a) A mediana é o valor central dos dados. Entretanto, quando estes dados estão organizados em classes, temos de fazer uma proporção na classe onde a mediana se encontra, para determiná-la, digamos, com precisão.
Então, como a mediana encontra-se na classe de 50 até antes de 55 Salários Mínimos (SM), temos que $55 - 50$ correspondem a 35% dos dados. Entretanto, nós necessitamos encontrar o valor que corresponde a 10%. 
Teremos então uma regrinha de três:
$$55 - 50 \rightarrow 35\%$$
$$x \rightarrow 10\% $$

Logo, teremos $x = \dfrac{10 \cdot 5}{35} = \dfrac{50}{35} = 1,43$

Portanto, nossa mediana será $Md = 50 + 1,43 = 51,43$

b) Vamos agora determinar o 1º decil. Vamos aproveitar para realizar uma abordagem apenas um pouco diferente. Vamos lá! A classe que contém o decil é a 3ª (40 a 45), cuja participação nos dados é de 15%. A porcentagem que falta é 4%, já que a frequência até a 2ª classe é 6%. Então, podemos encontrar, inicialmente a razão $\dfrac{4}{15}$ que mede a participação de 4% em 15%. A partir daí, fazemos $x = 5 \cdot \dfrac{4}{15}$ e encontramos $x = 1,33$. Portanto, o nosso 1º decil será $40 + 1,33 = 41,33$

c) Vamos agora encontrar o intervalo interquartil. Este intervalo é definido como a diferença entre o 3ª quartil e o 1º quartil ($J3 - J1$). 

Comecemos $J1$, que é o 1ª quartil (25%). A classe é a de 45 a 50 e precisamos obter, nesta classe, a que 10% corresponde na sequência de dados. Façamos por regra de três, então:

$$ 50 - 45 \rightarrow 40\%$$
$$x \rightarrow 10\%$$

Teremos então que $x = \dfrac{10 \cdot 5}{40} = 1,25$. Assim, $J1 = 45 + 1,25 = 46,25$

Vamos ao 3º quartil ($J3$). Apesar de estar claro na tabela, vamos fazer ingenuamente, e por razão. Temos que o 3º quartil está na classe que vai de 50 a 55. Nela temos 35%. E necessitamos andar exatamente 35% a partir dos 40%, logo fazemos $x = \dfrac{35}{35} \cdot 5 = 5$. Assim $J3 = 50 + 5 = 55$.

O intervalo interquartil será, então, $ 55 - 46,25 = 8,75$

O esquema de cinco números (Tukey, 1977) e seu desenho esquemático.

Este é um modelo de representação de um conjunto de dados. Então, foram selecionados a quantidade $n$ de dados, o valor central, ou seja, a ...