quinta-feira, 17 de setembro de 2020

Média ou mediana?

Na sequência de dois artigos anteriores relacionados com a utilização da média e da mediana na análise estatística, este artigo tem como objetivo responder à pergunta enunciada no título.  A análise e interpretação de dados deve ser feita utilizando variados instrumentos e medidas. 

A média é uma das medidas mais utilizadas, mas, como vimos anteriormente, devemos ter algum cuidado na sua utilização. Os valores muito grandes e muitos pequenos distorcem a média e é por isso que ela deve ser usada com muito cuidado. Além disso, duas médias semelhantes podem ter naturezas completamente diferentes. Imagine-se que um aluno obteve 10 a matemática e 12 a português, sendo que a média das duas disciplinas é 11. Outro aluno obteve 6 matemática e 16 a português; a média também é 11.  Como podemos verificar, os dois alunos têm média de 11, mas as respetivas notas são completamente diferentes.

Muitas vezes lemos notícias nos jornais em que determinado valor real atual é comparado com a média de um período anterior. Mais uma vez, a conclusão a que chagamos pode não ser a mais correta. A média é calculada pela soma de vários valores, dividindo-se o seu resultado pelo número de elementos; no entanto, como vimos, há valores que estão acima da média e outros que estão abaixo da média, pelo que a existência de um valor superior à média não é necessariamente alto (da mesma forma que um valor inferior à média não é necessariamente baixo). Se calcularmos a média de um conjunto de 10 dados em que nove são muito próximos uns dos outros e o décimo elemento é bastante superior aos restantes, por ventura a média será superior aos 9 dados e apenas será menor que o décimo elemento. Neste sentido, a existência de um elemento inferior à média não implica que estejamos na presença de um valor baixo (no exemplo acima referido, até podemos estar na presença de um elemento que é superior a nove elementos e apenas inferior ao décimo elemento).

Para calcular a mediana necessitamos de ordenar (do valor mais baixo para o mais elevado ou vice-versa) os dados e escolher o elemento que divide o conjunto de elementos a meio. Se o número de elementos for ímpar, haverá um único elemento que divide a meio o conjunto de dados; se o número de elementos for par, calcular-se-á a média dos dois elementos centrais. Em comparação com a média, a mediana é mais resistente, pelo que não é influenciada por valores muito altos ou muito baixos.

Como dissemos atrás, a média é afetada por valores muito altos e muito baixos, pelo que, nestes casos, deve ser usada com parcimónia; a média será tanto mais afetada por aqueles valores quanto menor for o número de elementos.

Imagine-se uma empresa que emprega 20 pessoas, entre as quais 4 auferem salários 5 ou 6 vezes superiores aos restantes trabalhadores. O valor da média será bastante superior ao salário da maioria dos trabalhadores da empresa, não representando desta forma a população em estudo. Neste caso, seria preferível utilizar a mediana em vez da média. 


segunda-feira, 31 de agosto de 2020

Novas tecnologias

Em 1914, na zona de Lamego, José Agostinho de Oliveira perguntou a um mendigo a razão de não trabalhar, visto que, aparentemente, o homem tinha boa saúde: 

"Como quere o senhor que eu trabalhe, se não tenho em quê? Antes de vir o maldito comboio, ganhava eu muito bem a minha vida, era barqueiro. A diligência não causava grande mal aos barcos da carreira que faziam viagens até ao Pôrto, e, se muitos passageiros tinham mêdo de passar os pontos  oh! O do Cadão [sic] era terrivel!  as cargas das mercadorias davam e sobejavam para muitos braços terem que fazer. Veio o caminho de ferro, e os nossos fretes foram deminuindo. Foram deminuindo barcos e barqueiros. E nós, que não sabemos fazer mais nada, temos de pedir esmola"

Já naquela altura houve quem perdeu o seu emprego por causa das novas tecnologias. 

sexta-feira, 21 de agosto de 2020

A mediana

 

Continuando com raciocínio do último artigo, em que chamei a atenção para o uso da média na análise e interpretação de dados estatísticos, a mediana também é uma medida de localização muito utilizada e colmata algumas lacunas evidenciadas pela média. Note-se que qualquer uma das medidas de tendência central tem vantagens e desvantagens; aliás, a análise e interpretação de dados deve ser realizada utilizando várias medidas (e instrumentos)  há situações em que faz mais sentido utilizar a média e outras em que a utilização da mediana é preferível à média.

Trata-se de uma medida de localização mais resistente (menos sensível) do que a média, uma vez que não é influenciada por valores muito altos ou muito baixos. Se tiver um conjunto de dados e substituir o valor mais elevado por outro ainda maior, a mediana continuará igual, mas a média será mais alta do que era anteriormente.

Depois de os dados estarem organizados por ordem crescente (ou decrescente), a mediana é o valor que divide a amostra em dois subconjuntos com o mesmo número de elementos. Significa isto que 50% dos elementos são menores ou iguais à mediana e os restantes 50% são maiores ou iguais à mediana.

Imagine-se uma empresa que emprega 5 funcionários, cujas remunerações são as seguintes: 1000€, 1400€, 700€, 800€, 750€. Depois de ordenadas as remunerações, o valor que divide a meio a amostra é o 800€ (ordenação crescente: 700€ <750€ <800€ <1000€ <1400€), logo é este o valor da mediana.

quarta-feira, 19 de agosto de 2020

Cuidado com a média

 

A média é das medidas de localização mais utilizadas na estatística. Raro é o dia em que não há, pelo menos, uma notícia que nos indica a média de determinado conjunto de dados. O cálculo da média é bastante simples: consiste em somar todos os dados e dividir o resultado pelo número de elementos.

Se, num conjunto de famílias, uma família consumir 10 euros por mês em água, a segunda suportar 30 euros relativos ao consumo de água e a última 80 euros, a média do valor gasto por mês em água é 40€ ((10 + 30 + 80)/3). Como podemos verificar, neste caso, a média não é representativa do valor gasto pelo conjunto das famílias analisadas, uma vez que existe uma diferença muito significativa entre a média e as despesas reais suportadas pelas famílias.

Ademais, duas médias com o mesmo valor podem ter origem em dados completamente diferentes. Em vez dos dados acima referidos, imaginem três famílias com os seguintes gastos mensais suportados no consumo de água: 30 euros, 40 euros e 50 euros. Neste conjunto de dados, a média seria de 40 euros (igual ao exemplo acima exposto), mas os dados que deram origem à média são completamente diferentes  neste caso, a média seria mais consentânea com os dados apresentados do que no exemplo acima referido.

A média é uma medida muito sensível a valores muito elevados e muito baixos, pelo que estes dados influenciam significativamente o valor da média. Quer isto dizer que um valor muito elevado, em comparação com os restantes, pode influenciar expressivamente o valor da média, sendo que a interferência será tanto maior quanto menos elementos tiver o estudo.

sábado, 15 de agosto de 2020

Cessação da atividade

 

A cessação da atividade pode ser efetuada no Portal das Finanças (por via eletrónica), sem a necessidade de se deslocarem, presencialmente, a uma repartição de finanças.

Trata-se de um processo bastante simples, pelo que, depois de entrar na declaração de cessação (Serviços>Cessação de atividade>Entregar Declaração – no caso de se tratar de uma entidade com contabilidade organizada, a entrega da declaração de cessação de atividade deverá ser realizada pelo Contabilista Certificado), apenas será necessário confirmar os dados que já estão preenchidos automaticamente e completar a declaração com a data da cessação da atividade e os motivos da mesma (em termos de IVA, IRS/IRC).

No caso de não conseguir encontrar a declaração de cessação de atividade no Portal das Finanças, pode escrever “cessação de atividade” no campo de procura, que será reencaminhado para a página apropriada.

No caso de se tratar de cessação em IRC, o representante legal da empresa também terá de preencher o campo 07 com os seus dados. Nos casos de fusão ou cisão, também será necessário preencher o quadro 08.

Finalmente, basta validar e submeter declaração.

sexta-feira, 7 de agosto de 2020

Os números também enganam...

 

Nas últimas semanas tivemos a oportunidade de conhecer os números do Produto Interno Bruto (PIB) de vários países. Ao olhar para os números divulgados na televisão, chamou-me atenção a diminuição do PIB americano: 32,9%. A maior parte dos órgãos de comunicação portugueses limitou-se a lançar os números sem os explicar.

Em Portugal, no segundo trimestre, a economia recuou 16,5% em comparação com o mesmo período do ano anterior; 14,1% se compararmos com os 3 primeiros meses de 2020.  

No entanto, os EUA não utilizam a mesma metodologia que é utilizada no nosso continente, razão pela qual os 32,9% não devem comparados com os dados de Portugal e/ou dos restantes países da União Europeia. Aquele valor refere-se à evolução da economia no segundo trimestre numa base anualizada (ou seja, os 32,9% correspondem à diminuição do PIB anual no pressuposto de que nos restantes trimestres a economia tenha a mesma evolução, o que é pouco provável). Nos países na União Europeia, os dados indicam a variação efetiva do PIB em comparação com o mesmo período do ano anterior (variação homóloga) ou com os 3 meses anteriores (variação em cadeia).

Muito pior do que transmitir os números sem explicar o respetivo enquadramento (o que fez a maioria dos canais de televisões portugueses) é tentar comparar os dados portugueses (seja os valores homólogos ou em cadeia) com os 32,9% dos EUA. Quem quiser comparar os dados de qualquer país da União Europeia com os EUA pode fazê-lo utilizando os 9,5% relativos à diminuição do PIB norte-americano em relação ao trimestre anterior (em cadeia).

sábado, 1 de agosto de 2020

Escalas de gráficos


A televisão púbica espanhola (RTVE) apresentou um conjunto de gráficos para mostrar a evolução negativa do PIB de 4 países europeus: Espanha, França, Alemanha e Itália. Como podemos observar no gráfico apresentado a seguir, a RTVE utilizou escalas diferentes para cada país, dando a sensação de que a queda do PIB espanhol é semelhante à queda verificada na Alemanha.

Infelizmente, não se trata de um caso isolado (tenho verificado este tipo de situações em vários meios de comunicação social)  não sei se é apenas ignorância ou se o objetivo é o de transmitir uma ideia diferente da real. De qualquer das formas, a situação é tão grave que um mero erro é inadmissível num meio de comunicação social que pretenda ser transparente.

Depois de muitas críticas, a RTVE corrigiu o erro.   Se compararmos os dois gráficos (o de cima e o que apresento a seguir), facilmente concluímos que as diferenças são abissais: no primeiro, a queda do PIB espanhol é semelhante à queda do PIB alemão e mais baixa que a queda do PIB francês e italiano; no gráfico de baixo, a Espanha é claramente o país mais penalizado.