quinta-feira, 17 de setembro de 2020

Média ou mediana?

Na sequência de dois artigos anteriores relacionados com a utilização da média e da mediana na análise estatística, este artigo tem como objetivo responder à pergunta enunciada no título.  A análise e interpretação de dados deve ser feita utilizando variados instrumentos e medidas. 

A média é uma das medidas mais utilizadas, mas, como vimos anteriormente, devemos ter algum cuidado na sua utilização. Os valores muito grandes e muitos pequenos distorcem a média e é por isso que ela deve ser usada com muito cuidado. Além disso, duas médias semelhantes podem ter naturezas completamente diferentes. Imagine-se que um aluno obteve 10 a matemática e 12 a português, sendo que a média das duas disciplinas é 11. Outro aluno obteve 6 matemática e 16 a português; a média também é 11.  Como podemos verificar, os dois alunos têm média de 11, mas as respetivas notas são completamente diferentes.

Muitas vezes lemos notícias nos jornais em que determinado valor real atual é comparado com a média de um período anterior. Mais uma vez, a conclusão a que chagamos pode não ser a mais correta. A média é calculada pela soma de vários valores, dividindo-se o seu resultado pelo número de elementos; no entanto, como vimos, há valores que estão acima da média e outros que estão abaixo da média, pelo que a existência de um valor superior à média não é necessariamente alto (da mesma forma que um valor inferior à média não é necessariamente baixo). Se calcularmos a média de um conjunto de 10 dados em que nove são muito próximos uns dos outros e o décimo elemento é bastante superior aos restantes, por ventura a média será superior aos 9 dados e apenas será menor que o décimo elemento. Neste sentido, a existência de um elemento inferior à média não implica que estejamos na presença de um valor baixo (no exemplo acima referido, até podemos estar na presença de um elemento que é superior a nove elementos e apenas inferior ao décimo elemento).

Para calcular a mediana necessitamos de ordenar (do valor mais baixo para o mais elevado ou vice-versa) os dados e escolher o elemento que divide o conjunto de elementos a meio. Se o número de elementos for ímpar, haverá um único elemento que divide a meio o conjunto de dados; se o número de elementos for par, calcular-se-á a média dos dois elementos centrais. Em comparação com a média, a mediana é mais resistente, pelo que não é influenciada por valores muito altos ou muito baixos.

Como dissemos atrás, a média é afetada por valores muito altos e muito baixos, pelo que, nestes casos, deve ser usada com parcimónia; a média será tanto mais afetada por aqueles valores quanto menor for o número de elementos.

Imagine-se uma empresa que emprega 20 pessoas, entre as quais 4 auferem salários 5 ou 6 vezes superiores aos restantes trabalhadores. O valor da média será bastante superior ao salário da maioria dos trabalhadores da empresa, não representando desta forma a população em estudo. Neste caso, seria preferível utilizar a mediana em vez da média.