Estatisticas

Conteúdo

Estatisticas#

Introdução#

Os dados quantitativos são frequentemente resumidos e analisados com métodos estatísticos e visualizados com plotagens/gráficos/diagramas. Os métodos estatísticos revelam tendências quantitativas, padrões e discrepâncias nos dados, enquanto gráficos ajudam a transmiti-los ao público. Realizar uma análise estatística adequada e escolher um tipo de gráfico adequado para seus dados, identificar suas possíveis armadilhas e realizar fielmente a análise ou gerar o gráfico com software adequado são essenciais para respaldar conclusões experimentais com dados e atingir metas de comunicação.

Redução de dimensionalidade#

O que é?#

A redução de dimensionalidade (também chamada de redução de dimensão) visa mapear dados de alta dimensão em um espaço de dimensão inferior para revelar melhor tendências e padrões. Os algoritmos que executam essa tarefa tentam reter o máximo de informações possível ao reduzir a dimensionalidade dos dados: isso é obtido atribuindo pontuações de importância a recursos individuais, removendo redundâncias e identificando recursos não informativos (por exemplo, constantes). A redução da dimensionalidade é uma etapa importante na análise quantitativa, pois torna os dados mais gerenciáveis e fáceis de visualizar. Também é uma importante etapa de pré-processamento em muitos algoritmos de análise downstream, como classificadores de aprendizado de máquina.

Correção em lote#

O que é?#

Efeitos de lote são variações sistemáticas entre amostras correlacionadas com condições experimentais (como diferentes horários do dia, diferentes dias da semana ou diferentes ferramentas experimentais) que não estão relacionadas ao processo biológico de interesse. Os efeitos de lote devem ser mitigados antes de fazer comparações entre vários conjuntos de dados, pois afetam a reprodutibilidade e a confiabilidade da análise computacional e podem influenciar drasticamente as conclusões. Algoritmos para correção de efeito em lote abordam isso identificando e quantificando fontes de variação técnicas e ajustando os dados para que sejam minimizados enquanto o sinal biológico é preservado. A maioria dos métodos de correção destes efeitos foi originalmente desenvolvido para dados de microarranjo e dados de sequenciamento, mas pode ser adaptada para vetores de recursos extraídos de imagens.

Teste de normalidade#

O que é?#

O teste de normalidade trata de avaliar se os dados seguem uma distribuição gaussiana (ou normal). Como a distribuição gaussiana é freqüentemente encontrada na natureza e tem propriedades matemáticas importantes, a normalidade é uma suposição central em muitos testes estatísticos amplamente utilizados. Quando essa suposição é violada, suas conclusões podem não se sustentar ou ser falhas. O teste de normalidade é, portanto, uma etapa importante do pipeline de análise de dados antes de qualquer tipo de teste estatístico.