Na sequência de
dois artigos anteriores relacionados com a utilização da média e da mediana na
análise estatística, este artigo tem como objetivo responder à pergunta
enunciada no título. A análise e
interpretação de dados deve ser feita utilizando variados instrumentos e
medidas.
A média é uma
das medidas mais utilizadas, mas, como vimos anteriormente, devemos ter algum
cuidado na sua utilização. Os valores muito grandes e muitos pequenos distorcem
a média e é por isso que ela deve ser usada com muito cuidado. Além disso, duas
médias semelhantes podem ter naturezas completamente diferentes. Imagine-se que
um aluno obteve 10 a matemática e 12 a português, sendo que a média das duas
disciplinas é 11. Outro aluno obteve 6 matemática e 16 a português; a média
também é 11. Como podemos verificar, os
dois alunos têm média de 11, mas as respetivas notas são completamente
diferentes.
Muitas vezes
lemos notícias nos jornais em que determinado valor real atual é comparado com
a média de um período anterior. Mais uma vez, a conclusão a que chagamos pode
não ser a mais correta. A média é calculada pela soma de vários valores,
dividindo-se o seu resultado pelo número de elementos; no entanto, como vimos,
há valores que estão acima da média e outros que estão abaixo da média, pelo
que a existência de um valor superior à média não é necessariamente alto (da
mesma forma que um valor inferior à média não é necessariamente baixo). Se
calcularmos a média de um conjunto de 10 dados em que nove são muito próximos
uns dos outros e o décimo elemento é bastante superior aos restantes, por
ventura a média será superior aos 9 dados e apenas será menor que o décimo
elemento. Neste sentido, a existência de um elemento inferior à média não
implica que estejamos na presença de um valor baixo (no exemplo acima referido,
até podemos estar na presença de um elemento que é superior a nove elementos e
apenas inferior ao décimo elemento).
Para calcular a
mediana necessitamos de ordenar (do valor mais baixo para o mais elevado ou
vice-versa) os dados e escolher o elemento que divide o conjunto de elementos a
meio. Se o número de elementos for ímpar, haverá um único elemento que divide a
meio o conjunto de dados; se o número de elementos for par, calcular-se-á a
média dos dois elementos centrais. Em comparação com a média, a mediana é mais
resistente, pelo que não é influenciada por valores muito altos ou muito
baixos.
Como dissemos
atrás, a média é afetada por valores muito altos e muito baixos, pelo que,
nestes casos, deve ser usada com parcimónia; a média será tanto mais afetada
por aqueles valores quanto menor for o número de elementos.
Imagine-se uma
empresa que emprega 20 pessoas, entre as quais 4 auferem salários 5 ou 6 vezes
superiores aos restantes trabalhadores. O valor da média será bastante superior
ao salário da maioria dos trabalhadores da empresa, não representando desta
forma a população em estudo. Neste caso, seria preferível utilizar a mediana em
vez da média.