material-de-estudos

Introdução - O Que é Mineração de Dados

Introdução - O Que é Mineração de Dados

É uma técnica auxiliada por um computador usada em análises para processar e interpretar grandes datasets

A mineração de dados extrai um significado ou conhecimento valioso dos datasets.

Através desses processos:

A Mineração de dados é um ramo da análise de dados ou uma Estratégia de análise usada para encontrar padrões ocultos ou desconhecidos.

O que é

Imagem

Metodologia

KKD

  1. Seleção
  2. Preparação
  3. Transformação

Crisp-DM

Na prática

Usa-se ambos conforme a necessidade

Qualidade dos Dados

Problemas Comuns:

Impactos:

Garbage in, garbage out - dados ruins geram modelos ruins.

Análise Descritiva

Medidas de tendência Central

Medidas de dispersão

Medidas de forma

TODO: validar isso aqui

Correlação e Covariância

Amostragem

Técnicas para trabalhar com subconjuntos representativos

Probabilísticas

Não-Probabilísticas

Classes Desbalanceadas

Imbalance Class

PCA: Redução de Dimensionalidade

Interpretação de Componentes Principais - PCA Componentes