material-de-estudos

Classificação

Classificação

Algoritmos para predizer categorias

Problema do Desbalanceamento

Cuidado: Alta acurácia nem sempre significa bom modelo!

Algoritmos de Classificação

Métricas de Avaliação

Definições

Precisão

Exemplo - Sistema de detecção de spam

O modelo classificou 100 e-mails como spam.

Desses, 90 eram realmente spam (TP) e 10 eram e-mails normais incorretamente classificados (FP).

Precisão = 90 / (90 + 10) = 0,9 (90%). ➝ Isso significa que quando o modelo fala que é spam, há 90% de chance de estar certo.

Recall

Exemplo - Ainda no cenário de detecção de spam

Temos 120 e-mails que realmente eram spam (TP + FN).

O modelo detectou corretamente 90 deles (TP) e deixou escapar 30 (FN).

Recall = 90 / (90 + 30) = 0,75 (75%). ➝ Isso significa que o modelo conseguiu identificar 75% de todos os spams existentes.

F1-Score

Exemplo:

F1 = 2 × (0,9 × 0,75) / (0,9 + 0,75) ≈ 0,82 (82%) ➝ Isso mostra que o modelo tem um equilíbrio razoável: consegue identificar bem os spams sem errar tanto nos falsos positivos.

📊 Quando usar cada métrica?

Exemplo de imagem