terça-feira, 7 de janeiro de 2020

Notícias Acadêmicas #2 - Multivariância de(por) Distância

Liga a luz e esquenta a sopa! Chegou a hora deeeeeeeeeeeeeeeeeeeeeee Notícias Acadêmicas! Hoje eu vou falar sobre um artigo interessante sobre probabilidade e estatistica.


Claro que eu já falei sobre esses assuntos por aqui pelo blog, mas isso aqui é coisa matemática nova, quente em terceira mão! Uma vez que eu consumo do Science Daily

Existe uma coisa que é muito difícil na ciência que é analisar a depenência de fatores. Quando você está fazendo uma experiência, e se ela especificamente usa a matemática para descrever o que se analisa, você provavelmente vai tentar mexer uma variável por vez. O problema é que pode ser que elas não estejam relacionadas, por mais que pareçam estar. E como proceder?

Bom, existe uma medida estatística chamada Covariância, e a propriedade básica dela é que variáveis aleatórias independentes tem Covariância 0. Se o valor da covariância é diferente de 0 existe uma relação direta ou indireta de acordo com o sinal. A covariância é uma função de duas variáveis, então se você quiser observar a dependência de diversas variáveis aleatórias entre si, você precisa calcular todas as covarâncias duas a duas. Agora imagina no mundo real, que tem variável aleatória a dar com o pau!?

O problema é que mesmo assim esse método não é exatamente efetivo conforme a quantidade de variáveis se estende. Você pode ter dependências ocultas, ou encadeadas que vão ficando cada vez mais difíceis de rastrear. Então os caras vieram com uma idéia de verificar as relação entre as variáves em níveis mais profundos e daí surgiu a Multivariância de Distância!

Essencialmente o que se faz é computar uma matriz, o problema é se você tem uma matriz e a covariância é uma função simétrica ( cov(A, B) = cov(B, A) ), então o que você obtem é essencialmente uma matriz espelhada com uma diagonal que é a variância de fato. Se isso é um problema é uma boa pergunta, porque os caras optaram por não usar uma matriz desse tipo. Eles usam uma função muito doida com uns exponencial. Eu não saberia justificar porque diabos isso mas foi assim que eles fizeram.

Mas mano, imagina você juntar um monte de ingredientes e ter uma noção de como a combinação daqueles ingredientes afetam os sabores da comida. Isso é algo que é um bocado difícil porque geralmente a matemática é muito binária fazendo análises quase sempre dois a dois, ou pelo menos a matemática mais elementar é dessa forma. Veja você que por mais que ele esteja fazendo uma operação com muitas variáveis, ele faz é uma porção de operações binárias com elas, mas ainda assim você analisa o resultado como um todo.

É bastante provável que alguns estatísticos passem a usar essa função de verificação de dependência nos próximos estudos. Vamos aguardar e esperar que esse tipo de coisa se popularize.


Imagens:

Nenhum comentário:

Postar um comentário