ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… машинного обучСния

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π’ Π·Π°Π΄Π°Ρ‡Π°Ρ… машинного обучСния для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ сравнСния Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, Π° ΠΈΡ… Π²Ρ‹Π±ΠΎΡ€ ΠΈ Π°Π½Π°Π»ΠΈΠ· β€” нСпрСмСнная Ρ‡Π°ΡΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρ‹ датасатаниста.

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ рассмотрим Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΈ качСства Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации, обсудим, Ρ‡Ρ‚ΠΎ являСтся Π²Π°ΠΆΠ½Ρ‹ΠΌ ΠΏΡ€ΠΈ Π²Ρ‹Π±ΠΎΡ€Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΈ Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΠΉΡ‚ΠΈ Π½Π΅ Ρ‚Π°ΠΊ.

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации

Для дСмонстрации ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ sklearn ΠΈ наглядного прСдставлСния ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ датасСт ΠΏΠΎ ΠΎΡ‚Ρ‚ΠΎΠΊΡƒ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² Ρ‚Π΅Π»Π΅ΠΊΠΎΠΌ-ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€Π°.

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Accuracy, precision ΠΈ recall

ΠŸΠ΅Ρ€Π΅Π΄ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΎΠΌ ΠΊ самим ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ввСсти Π²Π°ΠΆΠ½ΡƒΡŽ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΡŽ для описания этих ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… ошибок классификации β€” confusion matrix (ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок).
Допустим, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ Π΄Π²Π° класса ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· классов, Ρ‚ΠΎΠ³Π΄Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок классификации Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹Π³Π»ΡΠ΄Π΅Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ этомСтрика Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это
ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ этоTrue Positive (TP)False Positive (FP)
ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ этоFalse Negative (FN)True Negative (TN)

Π—Π΄Π΅ΡΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это— это ΠΎΡ‚Π²Π΅Ρ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это— истинная ΠΌΠ΅Ρ‚ΠΊΠ° класса Π½Π° этом ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅.
Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ошибки классификации Π±Ρ‹Π²Π°ΡŽΡ‚ Π΄Π²ΡƒΡ… Π²ΠΈΠ΄ΠΎΠ²: False Negative (FN) ΠΈ False Positive (FP).

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Accuracy

Π˜Π½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ понятной, ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎΠΉ ΠΈ ΠΏΠΎΡ‡Ρ‚ΠΈ Π½Π΅ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ являСтся accuracy β€” доля ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π­Ρ‚Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° бСсполСзна Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… с Π½Π΅Ρ€Π°Π²Π½Ρ‹ΠΌΠΈ классами, ΠΈ это Π»Π΅Π³ΠΊΠΎ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅.

Допустим, ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρƒ спам-Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π° ΠΏΠΎΡ‡Ρ‚Ρ‹. Π£ нас Π΅ΡΡ‚ΡŒ 100 Π½Π΅-спам писСм, 90 ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… наш классификатор ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ» Π²Π΅Ρ€Π½ΠΎ (True Negative = 90, False Positive = 10), ΠΈ 10 спам-писСм, 5 ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… классификатор Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ» Π²Π΅Ρ€Π½ΠΎ (True Positive = 5, False Negative = 5).
Π’ΠΎΠ³Π΄Π° accuracy:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Однако Ссли ΠΌΡ‹ просто Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ всС письма ΠΊΠ°ΠΊ Π½Π΅-спам, Ρ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ accuracy:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠŸΡ€ΠΈ этом, наша модСль ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½Π΅ ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ Π½ΠΈΠΊΠ°ΠΊΠΎΠΉ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ силой, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ ΠΌΡ‹ Ρ…ΠΎΡ‚Π΅Π»ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ письма со спамом. ΠŸΡ€Π΅ΠΎΠ΄ΠΎΠ»Π΅Ρ‚ΡŒ это Π½Π°ΠΌ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ с ΠΎΠ±Ρ‰Π΅ΠΉ для всСх классов ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΊ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ показатСлям качСства классов.

Precision, recall ΠΈ F-ΠΌΠ΅Ρ€Π°

Для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΠΈΠ· классов ΠΏΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π²Π²Π΅Π΄Π΅ΠΌ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ precision (Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ) ΠΈ recall (ΠΏΠΎΠ»Π½ΠΎΡ‚Π°).

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Precision ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ долю ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π½Π°Π·Π²Π°Π½Π½Ρ‹Ρ… классификатором ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΈ ΠΏΡ€ΠΈ этом Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡΠ²Π»ΡΡŽΡ‰ΠΈΠΌΠΈΡΡ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Π° recall ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, ΠΊΠ°ΠΊΡƒΡŽ долю ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса ΠΈΠ· всСх ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса нашСл Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ.

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ИмСнно Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ precision Π½Π΅ позволяСт Π½Π°ΠΌ Π·Π°ΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π² ΠΎΠ΄ΠΈΠ½ класс, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π² этом случаС ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ рост уровня False Positive. Recall дСмонстрируСт ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹ΠΉ класс Π²ΠΎΠΎΠ±Ρ‰Π΅, Π° precision β€” ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒ этот класс ΠΎΡ‚ Π΄Ρ€ΡƒΠ³ΠΈΡ… классов.

Как ΠΌΡ‹ ΠΎΡ‚ΠΌΠ΅Ρ‡Π°Π»ΠΈ Ρ€Π°Π½Π΅Π΅, ошибки классификации Π±Ρ‹Π²Π°ΡŽΡ‚ Π΄Π²ΡƒΡ… Π²ΠΈΠ΄ΠΎΠ²: False Positive ΠΈ False Negative. Π’ статистикС ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ Π²ΠΈΠ΄ ошибок Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ошибкой I-Π³ΠΎ Ρ€ΠΎΠ΄Π°, Π° Π²Ρ‚ΠΎΡ€ΠΎΠΉ β€” ошибкой II-Π³ΠΎ Ρ€ΠΎΠ΄Π°. Π’ нашСй Π·Π°Π΄Π°Ρ‡Π΅ ΠΏΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ ΠΎΡ‚Ρ‚ΠΎΠΊΠ° Π°Π±ΠΎΠ½Π΅Π½Ρ‚ΠΎΠ², ошибкой ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ Ρ€ΠΎΠ΄Π° Π±ΡƒΠ΄Π΅Ρ‚ принятиС лояльного Π°Π±ΠΎΠ½Π΅Π½Ρ‚Π° Π·Π° уходящСго, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ наша нулСвая Π³ΠΈΠΏΠΎΡ‚Π΅Π·Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π½ΠΈΠΊΡ‚ΠΎ ΠΈΠ· Π°Π±ΠΎΠ½Π΅Π½Ρ‚ΠΎΠ² Π½Π΅ ΡƒΡ…ΠΎΠ΄ΠΈΡ‚, Π° ΠΌΡ‹ эту Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρƒ ΠΎΡ‚Π²Π΅Ρ€Π³Π°Π΅ΠΌ. БоотвСтствСнно, ошибкой Π²Ρ‚ΠΎΡ€ΠΎΠ³ΠΎ Ρ€ΠΎΠ΄Π° Π±ΡƒΠ΄Π΅Ρ‚ ΡΠ²Π»ΡΡ‚ΡŒΡΡ «ΠΏΡ€ΠΎΠΏΡƒΡΠΊ» уходящСго Π°Π±ΠΎΠ½Π΅Π½Ρ‚Π° ΠΈ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎΠ΅ принятиС Π½ΡƒΠ»Π΅Π²ΠΎΠΉ Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρ‹.

Precision ΠΈ recall Π½Π΅ зависят, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ accuracy, ΠΎΡ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ классов ΠΈ ΠΏΠΎΡ‚ΠΎΠΌΡƒ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹ Π² условиях нСсбалансированных Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ.
Часто Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ стоит Π·Π°Π΄Π°Ρ‡Π° Π½Π°ΠΉΡ‚ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ (для Π·Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊΠ°) баланс ΠΌΠ΅ΠΆΠ΄Ρƒ этими двумя ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌΠΈ. ΠšΠ»Π°ΡΡΠΈΡ‡Π΅ΡΠΊΠΈΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ являСтся Π·Π°Π΄Π°Ρ‡Π° опрСдСлСния ΠΎΡ‚Ρ‚ΠΎΠΊΠ° ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ².
ΠžΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅ΠΌ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ всСх уходящих Π² ΠΎΡ‚Ρ‚ΠΎΠΊ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΡ…. Но, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ² ΡΡ‚Ρ€Π°Ρ‚Π΅Π³ΠΈΡŽ ΠΈ рСсурс для удСрТания ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ Π½ΡƒΠΆΠ½Ρ‹Π΅ ΠΏΠΎΡ€ΠΎΠ³ΠΈ ΠΏΠΎ precision ΠΈ recall. НапримСр, ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΡΡ€Π΅Π΄ΠΎΡ‚ΠΎΡ‡ΠΈΡ‚ΡŒΡΡ Π½Π° ΡƒΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ высокодоходных ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈΠ»ΠΈ Ρ‚Π΅Ρ…, ΠΊΡ‚ΠΎ ΡƒΠΉΠ΄Π΅Ρ‚ с большСй Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Ρ‹ Π² рСсурсах ΠΊΠΎΠ»Π»-Ρ†Π΅Π½Ρ‚Ρ€Π°.

ΠžΠ±Ρ‹Ρ‡Π½ΠΎ ΠΏΡ€ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π² случаС ΠΏΠ΅Ρ€Π΅Π±ΠΎΡ€Π° ΠΏΠΎ сСткС GridSearchCV ) ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΎΠ΄Π½Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°, ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΡ‹ ΠΈ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ Π½Π° тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅.
БущСствуСт нСсколько Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… способов ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ precision ΠΈ recall Π² Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ качСства. F-ΠΌΠ΅Ρ€Π° (Π² ΠΎΠ±Ρ‰Π΅ΠΌ случаС ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это) β€” срСднСС гармоничСскоС precision ΠΈ recall :

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ этов Π΄Π°Π½Π½ΠΎΠΌ случаС опрСдСляСт вСс точности Π² ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ΅, ΠΈ ΠΏΡ€ΠΈ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ этоэто срСднСС гармоничСскоС (с ΠΌΠ½ΠΎΠΆΠΈΡ‚Π΅Π»Π΅ΠΌ 2, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π² случаС precision = 1 ΠΈ recall = 1 ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это)
F-ΠΌΠ΅Ρ€Π° достигаСт максимума ΠΏΡ€ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅ ΠΈ точности, Ρ€Π°Π²Π½Ρ‹ΠΌΠΈ Π΅Π΄ΠΈΠ½ΠΈΡ†Π΅, ΠΈ Π±Π»ΠΈΠ·ΠΊΠ° ΠΊ Π½ΡƒΠ»ΡŽ, Ссли ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π±Π»ΠΈΠ·ΠΎΠΊ ΠΊ Π½ΡƒΠ»ΡŽ.
Π’ sklearn Π΅ΡΡ‚ΡŒ удобная функция _metrics.classificationreport, Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°ΡŽΡ‰Π°Ρ recall, precision ΠΈ F-ΠΌΠ΅Ρ€Ρƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ· классов, Π° Ρ‚Π°ΠΊΠΆΠ΅ количСство экзСмпляров ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса.

classprecisionrecallf1-scoresupport
Non-churned0.880.970.93941
Churned0.600.250.35159
avg / total0.840.870.841100

Π—Π΄Π΅ΡΡŒ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π² случаС Π·Π°Π΄Π°Ρ‡ с нСсбалансированными классами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€Π΅Π²Π°Π»ΠΈΡ€ΡƒΡŽΡ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅, часто приходится ΠΏΡ€ΠΈΠ±Π΅Π³Π°Ρ‚ΡŒ ΠΊ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ°ΠΌ искусствСнной ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ датасСта для выравнивания ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ классов. Π˜Ρ… сущСствуСт ΠΌΠ½ΠΎΠ³ΠΎ, ΠΈ ΠΌΡ‹ Π½Π΅ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡ… ΠΊΠ°ΡΠ°Ρ‚ΡŒΡΡ, здСсь ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ подходящий для вашСй Π·Π°Π΄Π°Ρ‡ΠΈ.

AUC-ROC ΠΈ AUC-PR

ΠŸΡ€ΠΈ ΠΊΠΎΠ½Π²Π΅Ρ€Ρ‚Π°Ρ†ΠΈΠΈ вСщСствСнного ΠΎΡ‚Π²Π΅Ρ‚Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, вСроятности принадлСТности ΠΊ классу, ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎ см. SVM) Π² Π±ΠΈΠ½Π°Ρ€Π½ΡƒΡŽ ΠΌΠ΅Ρ‚ΠΊΡƒ, ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΊΠ°ΠΊΠΎΠΉ-Π»ΠΈΠ±ΠΎ ΠΏΠΎΡ€ΠΎΠ³, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ 0 становится 1. ЕстСствСнным ΠΈ Π±Π»ΠΈΠ·ΠΊΠΈΠΌ каТСтся ΠΏΠΎΡ€ΠΎΠ³, Ρ€Π°Π²Π½Ρ‹ΠΉ 0.5, Π½ΠΎ ΠΎΠ½ Π½Π΅ всСгда оказываСтся ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΡ€ΠΈ Π²Ρ‹ΡˆΠ΅ΡƒΠΏΠΎΠΌΡΠ½ΡƒΡ‚ΠΎΠΌ отсутствии баланса классов.

Одним ΠΈΠ· способов ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ модСль Π² Ρ†Π΅Π»ΠΎΠΌ, Π½Π΅ ΠΏΡ€ΠΈΠ²ΡΠ·Ρ‹Π²Π°ΡΡΡŒ ΠΊ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΌΡƒ ΠΏΠΎΡ€ΠΎΠ³Ρƒ, являСтся AUC-ROC (ΠΈΠ»ΠΈ ROC AUC) β€” ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ (Area Under Curve) ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ошибок (Receiver Operating Characteristic curve ). Данная кривая прСдставляСт ΠΈΠ· сСбя линию ΠΎΡ‚ (0,0) Π΄ΠΎ (1,1) Π² ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π°Ρ… True Positive Rate (TPR) ΠΈ False Positive Rate (FPR):

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

TPR Π½Π°ΠΌ ΡƒΠΆΠ΅ извСстна, это ΠΏΠΎΠ»Π½ΠΎΡ‚Π°, Π° FPR ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, ΠΊΠ°ΠΊΡƒΡŽ долю ΠΈΠ· ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² negative класса Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ прСдсказал Π½Π΅Π²Π΅Ρ€Π½ΠΎ. Π’ идСальном случаС, ΠΊΠΎΠ³Π΄Π° классификатор Π½Π΅ Π΄Π΅Π»Π°Π΅Ρ‚ ошибок (FPR = 0, TPR = 1) ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ, Ρ€Π°Π²Π½ΡƒΡŽ Π΅Π΄ΠΈΠ½ΠΈΡ†Π΅; Π² ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΎΠΌ случаС, ΠΊΠΎΠ³Π΄Π° классификатор случайно Π²Ρ‹Π΄Π°Π΅Ρ‚ вСроятности классов, AUC-ROC Π±ΡƒΠ΄Π΅Ρ‚ ΡΡ‚Ρ€Π΅ΠΌΠΈΡ‚ΡŒΡΡ ΠΊ 0.5, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ классификатор Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹Π΄Π°Π²Π°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠ΅ количСство TP ΠΈ FP.
КаТдая Ρ‚ΠΎΡ‡ΠΊΠ° Π½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ соотвСтствуСт Π²Ρ‹Π±ΠΎΡ€Ρƒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΏΠΎΡ€ΠΎΠ³Π°. ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ Π² Π΄Π°Π½Π½ΠΎΠΌ случаС ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ качСство Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (большС β€” Π»ΡƒΡ‡ΡˆΠ΅), ΠΊΡ€ΠΎΠΌΠ΅ этого, Π²Π°ΠΆΠ½ΠΎΠΉ являСтся ΠΊΡ€ΡƒΡ‚ΠΈΠ·Π½Π° самой ΠΊΡ€ΠΈΠ²ΠΎΠΉ β€” ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ TPR, минимизируя FPR, Π° Π·Π½Π°Ρ‡ΠΈΡ‚, наша кривая Π² ΠΈΠ΄Π΅Π°Π»Π΅ Π΄ΠΎΠ»ΠΆΠ½Π° ΡΡ‚Ρ€Π΅ΠΌΠΈΡ‚ΡŒΡΡ ΠΊ Ρ‚ΠΎΡ‡ΠΊΠ΅ (0,1).

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠšΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ AUC-ROC устойчив ΠΊ нСсбалансированным классам (спойлСр: ΡƒΠ²Ρ‹, Π½Π΅ всё Ρ‚Π°ΠΊ ΠΎΠ΄Π½ΠΎΠ·Π½Π°Ρ‡Π½ΠΎ) ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ ΠΊΠ°ΠΊ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ случайно Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΉ positive ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΡ€Π°Π½ΠΆΠΈΡ€ΠΎΠ²Π°Π½ классификатором Π²Ρ‹ΡˆΠ΅ (Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π±Ρ‹Ρ‚ΡŒ positive), Ρ‡Π΅ΠΌ случайно Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΉ negative ΠΎΠ±ΡŠΠ΅ΠΊΡ‚.

Рассмотрим ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ: Π½Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ 100 Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΈΠ· 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ². ΠœΡ‹ Π½Π°ΠΌΠ°ΡˆΠΈΠ½Π»Π΅Ρ€Π½ΠΈΠ»ΠΈ Π΄Π²Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π‘ΠΊΠΎΡ€Π΅Π΅ всСго, ΠΌΡ‹ Π±Ρ‹ Π²Ρ‹Π±Ρ€Π°Π»ΠΈ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π²Ρ‹Π΄Π°Π΅Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠ°Π»ΠΎ False Positive Π½Π° Ρ„ΠΎΠ½Π΅ своСго ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚Π°. Но Ρ€Π°Π·Π½ΠΈΡ†Π° Π² False Positive Rate ΠΌΠ΅ΠΆΠ΄Ρƒ этими двумя Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ ΠΊΡ€Π°ΠΉΠ½Π΅ ΠΌΠ°Π»Π° β€” всСго 0.0019. Π­Ρ‚ΠΎ являСтся слСдствиСм Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ AUC-ROC измСряСт долю False Positive ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ True Negative ΠΈ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ…, Π³Π΄Π΅ Π½Π°ΠΌ Π½Π΅ Ρ‚Π°ΠΊ Π²Π°ΠΆΠ΅Π½ Π²Ρ‚ΠΎΡ€ΠΎΠΉ (больший) класс, ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Π²Π°Ρ‚ΡŒ Π½Π΅ совсСм Π°Π΄Π΅ΠΊΠ²Π°Ρ‚Π½ΡƒΡŽ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρƒ ΠΏΡ€ΠΈ сравнСнии Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ².

Для Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, вСрнСмся ΠΊ ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅ ΠΈ точности :

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π—Π΄Π΅ΡΡŒ ΡƒΠΆΠ΅ Π·Π°ΠΌΠ΅Ρ‚Π½Π° сущСствСнная Ρ€Π°Π·Π½ΠΈΡ†Π° ΠΌΠ΅ΠΆΠ΄Ρƒ двумя Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ β€” 0.855 Π² точности!

Precision ΠΈ recall Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ для построСния ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΈ, Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎ AUC-ROC, находят ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ Π½Π΅ΠΉ.

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π—Π΄Π΅ΡΡŒ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π½Π° ΠΌΠ°Π»Π΅Π½ΡŒΠΊΠΈΡ… датасСтах ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ PR-ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ чСрСсчур оптимистична, ΠΏΠΎΡ‚ΠΎΠΌΡƒ ΠΊΠ°ΠΊ вычисляСтся ΠΏΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρƒ Ρ‚Ρ€Π°ΠΏΠ΅Ρ†ΠΈΠΉ, Π½ΠΎ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π² Ρ‚Π°ΠΊΠΈΡ… Π·Π°Π΄Π°Ρ‡Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… достаточно. Π—Π° подробностями ΠΎ Π²Π·Π°ΠΈΠΌΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡΡ… AUC-ROC ΠΈ AUC-PR ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒΡΡ сюда.

Logistic Loss

Особняком стоит логистичСская функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, опрСдСляСмая ΠΊΠ°ΠΊ:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

здСсь ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это— это ΠΎΡ‚Π²Π΅Ρ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это-ΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это— истинная ΠΌΠ΅Ρ‚ΠΊΠ° класса Π½Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это-ΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ эторазмСр Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

ΠŸΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ ΠΏΡ€ΠΎ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΡŽ логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΡƒΠΆΠ΅ написано Π² Ρ€Π°ΠΌΠΊΠ°Ρ… поста ΠΏΡ€ΠΎ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
Данная ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° нСчасто выступаСт Π² бизнСс-трСбованиях, Π½ΠΎ часто β€” Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π½Π° kaggle.
Π˜Π½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ logloss ΠΊΠ°ΠΊ Π·Π°Π΄Π°Ρ‡Ρƒ максимизации accuracy ΠΏΡƒΡ‚Π΅ΠΌ ΡˆΡ‚Ρ€Π°Ρ„Π° Π·Π° Π½Π΅Π²Π΅Ρ€Π½Ρ‹Π΅ прСдсказания. Однако Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ logloss ΠΊΡ€Π°ΠΉΠ½Π΅ сильно ΡˆΡ‚Ρ€Π°Ρ„ΡƒΠ΅Ρ‚ Π·Π° ΡƒΠ²Π΅Ρ€Π΅Π½Π½ΠΎΡΡ‚ΡŒ классификатора Π² Π½Π΅Π²Π΅Ρ€Π½ΠΎΠΌ ΠΎΡ‚Π²Π΅Ρ‚Π΅.

ΠžΡ‚ΠΌΠ΅Ρ‚ΠΈΠΌ, ΠΊΠ°ΠΊ драматичСски выросла logloss ΠΏΡ€ΠΈ Π½Π΅Π²Π΅Ρ€Π½ΠΎΠΌ ΠΎΡ‚Π²Π΅Ρ‚Π΅ ΠΈ ΡƒΠ²Π΅Ρ€Π΅Π½Π½ΠΎΠΉ классификации!
Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ошибка Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Ρ‚ΡŒ сущСствСнноС ΡƒΡ…ΡƒΠ΄ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΠ±Ρ‰Π΅ΠΉ ошибки Π½Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. Π’Π°ΠΊΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ часто Π±Ρ‹Π²Π°ΡŽΡ‚ выбросами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½ΡƒΠΆΠ½ΠΎ Π½Π΅ Π·Π°Π±Ρ‹Π²Π°Ρ‚ΡŒ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ»ΠΈ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎ.
Всё становится Π½Π° свои мСста, Ссли Π½Π°Ρ€ΠΈΡΠΎΠ²Π°Ρ‚ΡŒ Π³Ρ€Π°Ρ„ΠΈΠΊ logloss:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π’ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ Ρ‡Π΅ΠΌ Π±Π»ΠΈΠΆΠ΅ ΠΊ Π½ΡƒΠ»ΡŽ ΠΎΡ‚Π²Π΅Ρ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΏΡ€ΠΈ ground truth = 1, Ρ‚Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ошибки ΠΈ ΠΊΡ€ΡƒΡ‡Π΅ растёт кривая.

ΠŸΠΎΠ΄Ρ‹Ρ‚ΠΎΠΆΠΈΠΌ:

ΠŸΠΎΠ»Π΅Π·Π½Ρ‹Π΅ ссылки

Благодарности

Бпасибо mephistopheies ΠΈ madrugado Π·Π° ΠΏΠΎΠΌΠΎΡ‰ΡŒ Π² ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ΅ ΡΡ‚Π°Ρ‚ΡŒΠΈ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠžΡ†Π΅Π½ΠΊΠ° качСства Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации ΠΈ рСгрСссии

Π’ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ ΠΎΡ†Π΅Π½ΠΊΠΈ качСства для Π·Π°Π΄Π°Ρ‡ΠΈ классификации ΠΈ рСгрСссии. ΠŸΡ€ΠΈΡ‡Π΅ΠΌ ΠΎΡ†Π΅Π½ΠΊΠ° Π·Π°Π΄Π°Ρ‡ΠΈ классификации часто Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ слоТнСС, Ρ‡Π΅ΠΌ ΠΎΡ†Π΅Π½ΠΊΠ° рСгрСссии.

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅

ΠžΡ†Π΅Π½ΠΊΠΈ качСства классификации [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠœΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок (Π°Π½Π³Π». Π‘onfusion matrix) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠŸΠ΅Ρ€Π΅Π΄ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΎΠΌ ΠΊ самим ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ввСсти Π²Π°ΠΆΠ½ΡƒΡŽ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΡŽ для описания этих ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… ошибок классификации β€” confusion matrix (ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок). Допустим, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ Π΄Π²Π° класса [math]y = \< 0, 1 \>[/math] ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· классов. Рассмотрим ΠΏΡ€ΠΈΠΌΠ΅Ρ€. ΠŸΡƒΡΡ‚ΡŒ Π±Π°Π½ΠΊ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ систСму классификации Π·Π°Ρ‘ΠΌΡ‰ΠΈΠΊΠΎΠ² Π½Π° крСдитоспособных ΠΈ нСкрСдитоспособных. ΠŸΡ€ΠΈ этом ΠΏΠ΅Ρ€Π²Ρ‹ΠΌ ΠΊΡ€Π΅Π΄ΠΈΡ‚ выдаётся, Π° Π²Ρ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ ΠΎΡ‚ΠΊΠ°Π·. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ нСкрСдитоспособного Π·Π°Ρ‘ΠΌΡ‰ΠΈΠΊΠ° ( [math]y = 1 [/math] ) ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ «ΡΠΈΠ³Π½Π°Π» Ρ‚Ρ€Π΅Π²ΠΎΠ³ΠΈ», ΡΠΎΠΎΠ±Ρ‰Π°ΡŽΡ‰ΠΈΠΉ ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… рисках.

Π›ΡŽΠ±ΠΎΠΉ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΉ классификатор ΡΠΎΠ²Π΅Ρ€ΡˆΠ°Π΅Ρ‚ ошибки. Π’ нашСм случаС Ρ‚Π°ΠΊΠΈΡ… ошибок ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π΄Π²Π΅:

НСслоТно ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ эти ошибки Π½Π΅Ρ€Π°Π²Π½ΠΎΡ†Π΅Π½Π½Ρ‹ ΠΏΠΎ связанным с Π½ΠΈΠΌΠΈ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°ΠΌ. Π’ случаС «Π»ΠΎΠΆΠ½ΠΎΠΉ Ρ‚Ρ€Π΅Π²ΠΎΠ³ΠΈ» ΠΏΠΎΡ‚Π΅Ρ€ΠΈ Π±Π°Π½ΠΊΠ° составят Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚Ρ‹ ΠΏΠΎ Π½Π΅Π²Ρ‹Π΄Π°Π½Π½ΠΎΠΌΡƒ ΠΊΡ€Π΅Π΄ΠΈΡ‚Ρƒ (Ρ‚ΠΎΠ»ΡŒΠΊΠΎ упущСнная Π²Ρ‹Π³ΠΎΠ΄Π°). Π’ случаС «ΠΏΡ€ΠΎΠΏΡƒΡΠΊΠ° Ρ†Π΅Π»ΠΈ» ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡ‚Π΅Ρ€ΡΡ‚ΡŒ всю сумму Π²Ρ‹Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π°. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ систСмС Π²Π°ΠΆΠ½Π΅Π΅ Π½Π΅ Π΄ΠΎΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ «ΠΏΡ€ΠΎΠΏΡƒΡΠΊ Ρ†Π΅Π»ΠΈ», Ρ‡Π΅ΠΌ «Π»ΠΎΠΆΠ½ΡƒΡŽ Ρ‚Ρ€Π΅Π²ΠΎΠ³Ρƒ».

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ошибка I Ρ€ΠΎΠ΄Π°, ΠΈΠ»ΠΈ Π»ΠΎΠΆΠ½ΠΎ-ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ исход классификации, ΠΈΠΌΠ΅Π΅Ρ‚ мСсто, ΠΊΠΎΠ³Π΄Π° ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ наблюдСниС распознано модСлью ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅. Ошибкой II Ρ€ΠΎΠ΄Π°, ΠΈΠ»ΠΈ Π»ΠΎΠΆΠ½ΠΎ-ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ исходом классификации, Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ случай, ΠΊΠΎΠ³Π΄Π° ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ наблюдСниС распознано ΠΊΠ°ΠΊ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ΅. Поясним это с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ошибок классификации:

[math]y = 1[/math][math]y = 0[/math]
[math]a ( x ) = 1[/math]Π˜ΡΡ‚ΠΈΠ½Π½ΠΎ-ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ (True Positive β€” TP)Π›ΠΎΠΆΠ½ΠΎ-ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ (False Positive β€” FP)
[math]a ( x ) = 0[/math]Π›ΠΎΠΆΠ½ΠΎ-ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ (False Negative β€” FN)Π˜ΡΡ‚ΠΈΠ½Π½ΠΎ-ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ (True Negative β€” TN)

Π—Π΄Π΅ΡΡŒ [math]a ( x )[/math] β€” это ΠΎΡ‚Π²Π΅Ρ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, Π° [math]y [/math] β€” истинная ΠΌΠ΅Ρ‚ΠΊΠ° класса Π½Π° этом ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ошибки классификации Π±Ρ‹Π²Π°ΡŽΡ‚ Π΄Π²ΡƒΡ… Π²ΠΈΠ΄ΠΎΠ²: False Negative (FN) ΠΈ False Positive (FP). P ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ Ρ‡Ρ‚ΠΎ классификатор опрСдСляСт класс ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ (N β€” ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ). T Π·Π½Π°Ρ‡ΠΈΡ‚ Ρ‡Ρ‚ΠΎ класс прСдсказан ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ (соотвСтствСнно F β€” Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ). КаТдая строка Π² ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ ошибок прСдставляСт спрогнозированный класс, Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ столбСц β€” фактичСский класс.

Π‘Π΅Π·ΡƒΠΏΡ€Π΅Ρ‡Π½Ρ‹ΠΉ классификатор ΠΈΠΌΠ΅Π» Π±Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ истинно-ΠΏΠΎΠ»ΠΎΒ­ΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΈ истинно ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ классификации, Ρ‚Π°ΠΊ Ρ‡Ρ‚ΠΎ Π΅Π³ΠΎ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок содСрТала Π±Ρ‹ Π½Π΅Π½ΡƒΠ»Π΅Π²Ρ‹Π΅ значСния Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π° своСй Π³Π»Π°Π²Π½ΠΎΠΉ Π΄ΠΈΠ°Β­Π³ΠΎΠ½Π°Π»ΠΈ (ΠΎΡ‚ Π»Π΅Π²ΠΎΠ³ΠΎ Π²Π΅Ρ€Ρ…Π½Π΅Π³ΠΎ Π΄ΠΎ ΠΏΡ€Π°Π²ΠΎΠ³ΠΎ Π½ΠΈΠΆΠ½Π΅Π³ΠΎ ΡƒΠ³Π»Π°):

ΠΠΊΠΊΡƒΡ€Π°Ρ‚Π½ΠΎΡΡ‚ΡŒ (Π°Π½Π³Π». Accuracy) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Π˜Π½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ понятной, ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎΠΉ ΠΈ ΠΏΠΎΡ‡Ρ‚ΠΈ Π½Π΅ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ являСтся accuracy β€” доля ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

Π­Ρ‚Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° бСсполСзна Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… с Π½Π΅Ρ€Π°Π²Π½Ρ‹ΠΌΠΈ классами, Ρ‡Ρ‚ΠΎ ΠΊΠ°ΠΊ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² сэмплирования ΠΈ это Π»Π΅Π³ΠΊΠΎ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅.

Допустим, ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρƒ спам-Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π° ΠΏΠΎΡ‡Ρ‚Ρ‹. Π£ нас Π΅ΡΡ‚ΡŒ 100 Π½Π΅-спам писСм, 90 ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… наш классификатор ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ» Π²Π΅Ρ€Π½ΠΎ (True Negative = 90, False Positive = 10), ΠΈ 10 спам-писСм, 5 ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… классификатор Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ» Π²Π΅Ρ€Π½ΠΎ (True Positive = 5, False Negative = 5). Π’ΠΎΠ³Π΄Π° accuracy:

[math] accuracy = \dfrac<5+90> <5+90+10+5>= 86,4 [/math]

Однако Ссли ΠΌΡ‹ просто Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ всС письма ΠΊΠ°ΠΊ Π½Π΅-спам, Ρ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Π°ΠΊΠΊΡƒΡ€Π°Ρ‚Π½ΠΎΡΡ‚ΡŒ:

[math] accuracy = \dfrac<0+100> <0+100+0+10>= 90,9 [/math]

ΠŸΡ€ΠΈ этом, наша модСль ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½Π΅ ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ Π½ΠΈΠΊΠ°ΠΊΠΎΠΉ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ силой, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ ΠΌΡ‹ Ρ…ΠΎΡ‚Π΅Π»ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ письма со спамом. ΠŸΡ€Π΅ΠΎΠ΄ΠΎΠ»Π΅Ρ‚ΡŒ это Π½Π°ΠΌ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ с ΠΎΠ±Ρ‰Π΅ΠΉ для всСх классов ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΊ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ показатСлям качСства классов.

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ (Π°Π½Π³Π». Precision) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ (precision) называСтся доля ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² ΠΏΡ€Π΅Π΄Π΅Π»Π°Ρ… класса β€” это доля ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‰ΠΈΡ… Π΄Π°Π½Π½ΠΎΠΌΡƒ классу ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ всСх ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ систСма отнСсла ΠΊ этому классу.

[math] Precision = \dfrac [/math]

ИмСнно Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ precision Π½Π΅ позволяСт Π½Π°ΠΌ Π·Π°ΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π² ΠΎΠ΄ΠΈΠ½ класс, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π² этом случаС ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ рост уровня False Positive.

ΠŸΠΎΠ»Π½ΠΎΡ‚Π° (Π°Π½Π³Π». Recall) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠŸΠΎΠ»Π½ΠΎΡ‚Π° β€” это доля истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… классификаций. ΠŸΠΎΠ»Π½ΠΎΡ‚Π° ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, ΠΊΠ°ΠΊΡƒΡŽ долю ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Ρ€Π΅Π°Π»ΡŒΠ½ΠΎ относящихся ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌΡƒ классу, ΠΌΡ‹ прСдсказали Π²Π΅Ρ€Π½ΠΎ.

[math] Recall = \dfrac [/math]

ΠŸΠΎΠ»Π½ΠΎΡ‚Π° (recall) дСмонстрируСт ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹ΠΉ класс Π²ΠΎΠΎΠ±Ρ‰Π΅.

ИмСя ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ ошибок, ΠΎΡ‡Π΅Π½ΡŒ просто ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Ρƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса. Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ (precision) равняСтся ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡŽ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π³ΠΎ диагонального элСмСнта ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΈ суммы всСй строки класса. ΠŸΠΎΠ»Π½ΠΎΡ‚Π° (recall) β€” ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡŽ диагонального элСмСнта ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΈ суммы всСго столбца класса. Π€ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ:

Π Π΅Π·ΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ классификатора рассчитываСтся ΠΊΠ°ΠΊ арифмСтичСскоС срСднСС Π΅Π³ΠΎ точности ΠΏΠΎ всСм классам. Π’ΠΎ ΠΆΠ΅ самоС с ΠΏΠΎΠ»Π½ΠΎΡ‚ΠΎΠΉ. ВСхничСски этот ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ называСтся macro-averaging.

F-ΠΌΠ΅Ρ€Π° (Π°Π½Π³Π». F-score) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Precision ΠΈ recall Π½Π΅ зависят, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ accuracy, ΠΎΡ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ классов ΠΈ ΠΏΠΎΡ‚ΠΎΠΌΡƒ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹ Π² условиях нСсбалансированных Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ. Часто Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ стоит Π·Π°Π΄Π°Ρ‡Π° Π½Π°ΠΉΡ‚ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ (для Π·Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊΠ°) баланс ΠΌΠ΅ΠΆΠ΄Ρƒ этими двумя ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌΠΈ. ΠŸΠΎΠ½ΡΡ‚Π½ΠΎ Ρ‡Ρ‚ΠΎ Ρ‡Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π°, Ρ‚Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅. Но Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ максимальная Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π° Π½Π΅ достиТимы ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ ΠΈ приходится ΠΈΡΠΊΠ°Ρ‚ΡŒ Π½Π΅ΠΊΠΈΠΉ баланс. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ, Ρ…ΠΎΡ‚Π΅Π»ΠΎΡΡŒ Π±Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ Π½Π΅ΠΊΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ которая объСдиняла Π±Ρ‹ Π² сСбС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ точности ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅ нашСго Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°. Π’ этом случаС Π½Π°ΠΌ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΡ‰Π΅ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΎ Ρ‚ΠΎΠΌ ΠΊΠ°ΠΊΡƒΡŽ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒ Π² производство (Ρƒ ΠΊΠΎΠ³ΠΎ большС Ρ‚ΠΎΡ‚ ΠΈ ΠΊΡ€ΡƒΡ‡Π΅). ИмСнно Ρ‚Π°ΠΊΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ являСтся F-ΠΌΠ΅Ρ€Π°.

F-ΠΌΠ΅Ρ€Π° прСдставляСт собой гармоничСскоС срСднСС ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚ΠΎΠΉ. Она стрСмится ΠΊ Π½ΡƒΠ»ΡŽ, Ссли Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΈΠ»ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π° стрСмится ΠΊ Π½ΡƒΠ»ΡŽ.

Данная Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° ΠΏΡ€ΠΈΠ΄Π°Π΅Ρ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΉ вСс точности ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅, поэтому F-ΠΌΠ΅Ρ€Π° Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠ°Π΄Π°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ ΠΏΡ€ΠΈ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠΈ ΠΈ точности ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Ρ‹. Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ F-ΠΌΠ΅Ρ€Ρƒ ΠΏΡ€ΠΈΠ΄Π°Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΉ вСс точности ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅, Ссли Π²Ρ‹ осознанно ΠΎΡ‚Π΄Π°Π΅Ρ‚Π΅ ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· этих ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΏΡ€ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

Π³Π΄Π΅ [math]Ξ²[/math] ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ значСния Π² Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π΅ [math]0\lt Ξ²\lt 1[/math] Ссли Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΎΡ‚Π΄Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚ точности, Π° ΠΏΡ€ΠΈ [math]Ξ²\gt 1[/math] ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚ отдаСтся ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅. ΠŸΡ€ΠΈ [math]Ξ²=1[/math] Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° сводится ΠΊ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ ΠΈ Π²Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚Π΅ ΡΠ±Π°Π»Π°Π½ΡΠΈΡ€ΠΎΠ²Π°Π½Π½ΡƒΡŽ F-ΠΌΠ΅Ρ€Ρƒ (Ρ‚Π°ΠΊΠΆΠ΅ Π΅Π΅ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ [math]F_1[/math] ).

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

20 популярных ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ машинного обучСния. Π§Π°ΡΡ‚ΡŒ 1. ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ классификации ΠΈ рСгрСссионной ΠΎΡ†Π΅Π½ΠΊΠΈ

Π”Π°Ρ‚Π° ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ Oct 28, 2019

Π—Π°ΠΌΠ΅Ρ‚ΠΊΠ°:Π­Ρ‚ΠΎΡ‚ пост состоит ΠΈΠ· Π΄Π²ΡƒΡ… частСй.Π’ ΠΏΠ΅Ρ€Π²ΠΎΠΉ части(Ρ‚Π΅ΠΊΡƒΡ‰ΠΈΠΉ пост), я расскаТу ΠΎ 10 ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡˆΠΈΡ€ΠΎΠΊΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ классификации ΠΈ рСгрСссии. А Ρ‚Π°ΠΊΠΆΠ΅Π²ΠΎ Π²Ρ‚ΠΎΡ€ΠΎΠΉ частиЯ расскаТу ΠΎ 10 ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для ΠΎΡ†Π΅Π½ΠΊΠΈ Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³Π°, ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠ³ΠΎ зрСния, ΠΠ›ΠŸ ΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ обучСния.

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅

Π’Ρ‹Π±ΠΎΡ€ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΈΠΌΠ΅Π΅Ρ‚ Ρ€Π΅ΡˆΠ°ΡŽΡ‰Π΅Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈ ΠΎΡ†Π΅Π½ΠΊΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ машинного обучСния (ML). Π Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ΡΡ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ML Π² Ρ€Π°Π·Π½Ρ‹Ρ… прилоТСниях, ΠΈ я ΠΏΠΎΠ΄ΡƒΠΌΠ°Π», Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²ΠΈΡ‚ΡŒ сводку популярных ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ здСсь, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ ΠΈ прилоТСния, для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΎΠ½ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ. Π’ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… прилоТСниях просмотр ΠΎΠ΄Π½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π΅ Π΄Π°Ρ‚ΡŒ Π²Π°ΠΌ ΠΏΠΎΠ»Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρ‹ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π²Ρ‹ Ρ€Π΅ΡˆΠ°Π΅Ρ‚Π΅, ΠΈ Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ подмноТСство ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ, обсуТдаСмых Π² этом постС, для ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ Π²Π°ΡˆΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Π—Π΄Π΅ΡΡŒ я ΠΏΡ€ΠΈΠ²Π΅Π΄Ρƒ сводку ΠΈΠ· 20 ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ машинного обучСния, Π― Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΡƒΡŽ эти ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π² Ρ€Π°Π·Π½Ρ‹Π΅ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ Π½Π° основС ΠΌΠΎΠ΄Π΅Π»ΠΈ / прилоТСния ML, для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΎΠ½ΠΈ Π² основном ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ, ΠΈ ΠΏΠΎΠΊΡ€Ρ‹Π²Π°ΡŽ популярныС ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Π·Π°Π΄Π°Ρ‡Π°Ρ…:

НСт нСобходимости ΡƒΠΏΠΎΠΌΠΈΠ½Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… прилоТСниях ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ (FDR, FOR, hit @ k ΠΈ Ρ‚. Π”.), ΠšΠΎΡ‚ΠΎΡ€Ρ‹Π΅ я здСсь ΠΏΡ€ΠΎΠΏΡƒΡΠΊΠ°ΡŽ.

НСкоторыС ΠΈΠ· обсуТдаСмых здСсь ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ Ρ‚Ρ€ΠΈΠ²ΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Π½ΠΎ я Ρ€Π΅ΡˆΠΈΠ» Ρ€Π°ΡΡΠΊΠ°Π·Π°Ρ‚ΡŒ ΠΎ Π½ΠΈΡ… для ΠΏΠΎΠ»Π½ΠΎΡ‚Ρ‹ этого поста.Π’Π°ΠΊ Ρ‡Ρ‚ΠΎ Π½Π΅ ΡΡ‚Π΅ΡΠ½ΡΠΉΡ‚Π΅ΡΡŒ ΠΏΡ€ΠΎΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Ρ‚Π΅, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ Π²Ρ‹ Π·Π½Π°ΠΊΠΎΠΌΡ‹. Π‘Π΅Π· Π΄Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠΈΡ… дСйствий, Π΄Π°Π²Π°ΠΉΡ‚Π΅ Π½Π°Ρ‡Π½Π΅ΠΌ нашС ΠΏΡƒΡ‚Π΅ΡˆΠ΅ΡΡ‚Π²ΠΈΠ΅.

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, связанныС с классификациСй

ΠšΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ являСтся ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡˆΠΈΡ€ΠΎΠΊΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ с Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΎΠΌΡ‹ΡˆΠ»Π΅Π½Π½Ρ‹ΠΌΠΈ прилоТСниями, ΠΎΡ‚ распознавания Π»ΠΈΡ†, ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ·Π°Ρ†ΠΈΠΈ Π²ΠΈΠ΄Π΅ΠΎ Π½Π° Youtube, ΠΌΠΎΠ΄Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Π°, мСдицинской диагностики Π΄ΠΎ классификации тСкста, обнаруТСния нСнавистничСской Ρ€Π΅Ρ‡ΠΈ Π² Twitter.

Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ способы ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ классификации, ΠΈ Π½ΠΈΠΆΠ΅ я расскаТу ΠΎ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠ· самых популярных.

1- ΠœΠ°Ρ‚Ρ€ΠΈΡ†Π° ΠΏΡƒΡ‚Π°Π½ΠΈΡ†Ρ‹ (Π½Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°, Π½ΠΎ Π²Π°ΠΆΠ½ΠΎ Π·Π½Π°Ρ‚ΡŒ!)

Π”Π°Π²Π°ΠΉΡ‚Π΅ сначала удостовСримся, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ основныС Ρ‚Π΅Ρ€ΠΌΠΈΠ½Ρ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ рассмотрим ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ.Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΡ€ΠΎΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ этот Ρ€Π°Π·Π΄Π΅Π», Ссли Π²Ρ‹ ΡƒΠΆΠ΅ Π·Π½Π°ΠΊΠΎΠΌΡ‹ с Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΎΠ»ΠΎΠ³ΠΈΠ΅ΠΉ.

Одним ΠΈΠ· ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… понятий Π² эффСктивности классификации являСтсяматрица ΠΏΡƒΡ‚Π°Π½ΠΈΡ†Ρ‹(ΠœΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок AKA), которая прСдставляСт собой Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΡƒΡŽ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ прСдсказаний ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² сравнСнии с ΠΌΠ΅Ρ‚ΠΊΠ°ΠΌΠΈ достовСрности. КаТдая строка ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΏΡƒΡ‚Π°Π½ΠΈΡ†Ρ‹ прСдставляСт экзСмпляры Π² ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΌ классС, Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ столбСц прСдставляСт экзСмпляры Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ классС.

Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим это Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅. Π”Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ создаСм Π΄Π²ΠΎΠΈΡ‡Π½ΡƒΡŽ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ для классификации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ кошСк ΠΏΠΎ изобраТСниям, ΠΎΡ‚Π»ΠΈΡ‡Π½Ρ‹ΠΌ ΠΎΡ‚ кошСк. И Π΄Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π² нашСм тСстовом Π½Π°Π±ΠΎΡ€Π΅ 1100 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ (1000 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, ΠΎΡ‚Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΎΡ‚ кошСк, ΠΈ 100 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ кошСк) с ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΉ Π½ΠΈΠΆΠ΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ ΠΏΡƒΡ‚Π°Π½ΠΈΡ†Ρ‹.

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Как ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Π΄ΠΈΠ°Π³ΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ элСмСнты этой ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°ΡŽΡ‚ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠ΅ прСдсказаниС для Ρ€Π°Π·Π½Ρ‹Ρ… классов, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ Π½Π΅Π΄ΠΈΠ°Π³ΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ элСмСнты ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°ΡŽΡ‚ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹Π»ΠΈ Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ классифицированы.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ, ΠΊΠΎΠ³Π΄Π° Ρƒ нас Π΅ΡΡ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅Π΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΏΡƒΡ‚Π°Π½ΠΈΡ†Ρ‹, Π΄Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΠ΅Ρ€Π΅ΠΉΠ΄Π΅ΠΌ ΠΊ фактичСским ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌ.

2- Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ классификации

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ классификации являСтся, ΠΏΠΎΠΆΠ°Π»ΡƒΠΉ, самой простой ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠΆΠ½ΠΎ сСбС ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ, ΠΈ опрСдСляСтся какколичСство ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ², Π΄Π΅Π»Π΅Π½Π½ΠΎΠ΅ Π½Π° ΠΎΠ±Ρ‰Π΅Π΅ количСство ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ²,ΡƒΠΌΠ½ΠΎΠΆΠΈΡ‚ΡŒ Π½Π° 100,Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π² ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΈΠ· 1100 Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ 1030 ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ точности классификации:

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ классификации= (90 + 940) / (1000 + 100) = 1030/1100 = 93,6%

3- Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ

ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π½Π°ΠΌ Ρ‚Π°ΠΊΠΆΠ΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π²Π·Π³Π»ΡΠ½ΡƒΡ‚ΡŒ Π½Π° ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, спСцифичныС для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса. Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ являСтся ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Ρ‚Π°ΠΊΠΈΡ… ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ, которая опрСдСляСтся ΠΊΠ°ΠΊ:

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ = True_Positive / (True_Positive + False_Positive)

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ классов Cat ΠΈ Non-Cat Π² ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ рассчитана ΠΊΠ°ΠΊ:

Precision_cat= # ΠΎΠ±Ρ€Π°Π·Ρ†Ρ‹ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ прСдсказали ΠΊΠΎΡˆΠΊΡƒ / # ΠΎΠ±Ρ€Π°Π·Ρ†Ρ‹ прСдсказали ΠΊΠ°ΠΊ кошка =90 / (90 + 60) = 60%

Precision_NonCat = 940/950 = 98,9%

Как ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, модСль ΠΈΠΌΠ΅Π΅Ρ‚ Π³ΠΎΡ€Π°Π·Π΄ΠΎ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Π² ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ, Π½Π΅ относящихся ΠΊ кошкам, ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с кошками. Π­Ρ‚ΠΎ Π½Π΅ ΡƒΠ΄ΠΈΠ²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ модСль Π²ΠΈΠ΄Π΅Π»Π° большС ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, ΠΎΡ‚Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΎΡ‚ кошСк, Π²ΠΎ врСмя Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΠΊ, Ρ‡Ρ‚ΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ этого класса.

4- Напомним

Напомним, Π΅Ρ‰Π΅ ΠΎΠ΄Π½Π° ваТная ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°, которая опрСдСляСтся ΠΊΠ°ΠΊ доля Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ΠΈΠ· класса, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΡŽΡ‚ΡΡ модСлью. Π‘ΠΎΠ»Π΅Π΅ Ρ„ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ:

Напомним = True_Positive / (True_Positive + False_Negative)

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, для нашСго ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Π²Ρ‹ΡˆΠ΅ частота повторСния классов cat ΠΈ non-cat ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π½Π°ΠΉΠ΄Π΅Π½Π° ΠΊΠ°ΠΊ:

Recall_cat = 90/100 = 90%

Recall_NonCat = 940/1000 = 94%

5- F1 Π‘Ρ‡Π΅Ρ‚

Π’ зависимости ΠΎΡ‚ прилоТСния Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΡ€ΠΈΠ΄Π°Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ высокий ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚ ΠΎΡ‚Π·Ρ‹Π²Ρƒ ΠΈΠ»ΠΈ точности. Но Π΅ΡΡ‚ΡŒ ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΉ, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Π°ΠΆΠ½Ρ‹ ΠΊΠ°ΠΊ ΠΎΡ‚Π·Ρ‹Π², Ρ‚Π°ΠΊ ΠΈ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ СстСствСнно ΠΏΡ€ΠΈΠ΄ΡƒΠΌΠ°Ρ‚ΡŒ способ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ эти Π΄Π²Π° Π² ΠΎΠ΄Π½Ρƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ.Один популярный ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сочСтаСт Π² сСбС Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΎΡ‚Π·Ρ‹Π², называСтся F1-счСт, Ρ‡Ρ‚ΠΎ являСтся гармоничСским срСдним Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ точности ΠΈ ΠΎΡ‚Π·Ρ‹Π²Π°, опрСдСляСмым ΠΊΠ°ΠΊ:

F1-ΠΎΡ†Π΅Π½ΠΊΠ° = 2 * Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ * Π’ΡΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ / (Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ + Π’ΡΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ)

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, для нашСго ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° классификации с ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ ΠΏΡƒΡ‚Π°Π½ΠΈΡ†Ρ‹ Π½Π° рисункС 1, F1-ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ рассчитан ΠΊΠ°ΠΊ:

F1_cat = 2 * 0,6 * 0,9 / (0,6 + 0,9) = 72%

ΠžΠ±ΠΎΠ±Ρ‰Π΅Π½Π½Π°Ρ вСрсия F-счСта опрСдСляСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ. Как ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, F1-счСт являСтся частным случаСм F_ℬ, ΠΊΠΎΠ³Π΄Π° ℬ = 1.

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Π₯ΠΎΡ€ΠΎΡˆΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ всСгда Π΅ΡΡ‚ΡŒ компромисс ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ ΠΈ ΠΎΡ‚Π·Ρ‹Π²ΠΎΠΌ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ссли Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ слишком высокой, Π²Ρ‹ Π² ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΌ ΠΈΡ‚ΠΎΠ³Π΅ ΡƒΠ²ΠΈΠ΄ΠΈΡ‚Π΅ сниТСниС скорости ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎΠ³ΠΎ Π²Ρ‹Π·ΠΎΠ²Π°, ΠΈ Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚.

6- Π§ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ Π‘ΠΏΠ΅Ρ†ΠΈΡ„ΠΈΠΊΠ°

Π§ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ = НапоминаниС = TP / (TP + FN)

Π‘ΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ = истинный ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ коэффициСнт = TN / (TN + FP)

7- РПЦ ΠšΡ€ΠΈΠ²Π°Ρ

кривая Ρ€Π°Π±ΠΎΡ‡ΠΈΡ… характСристик приСмникаявляСтся Π³Ρ€Π°Ρ„ΠΈΠΊΠΎΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Π΄Π²ΠΎΠΈΡ‡Π½ΠΎΠ³ΠΎ классификатора ΠΊΠ°ΠΊ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π΅Π³ΠΎ ΠΏΠΎΡ€ΠΎΠ³Π° отсСчки.По сути, ΠΎΠ½ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ ΠΈΡΡ‚ΠΈΠ½Π½ΡƒΡŽ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ (TPR) ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Π»ΠΎΠΆΠ½ΠΎΠΉ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ (FPR) для Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ. Π”Π°Π²Π°ΠΉΡ‚Π΅ объясним большС.

МногиС ΠΈΠ· классификационных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΡΠ²Π»ΡΡŽΡ‚ΡΡ вСроятностными, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΠΎΠ½ΠΈ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΎΠ±Ρ€Π°Π·Π΅Ρ† являСтся кошкой. Π—Π°Ρ‚Π΅ΠΌ ΠΎΠ½ΠΈ ΡΡ€Π°Π²Π½ΠΈΠ²Π°ΡŽΡ‚ эту Π²Ρ‹Ρ…ΠΎΠ΄Π½ΡƒΡŽ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ с Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠΌ отсСчки ΠΈ, Ссли ΠΎΠ½ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Π΅Π³ΠΎ ΠΌΠ΅Ρ‚ΠΊΡƒ ΠΊΠ°ΠΊ ΠΊΠΎΡˆΠΊΡƒ, Π² ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΎΠΌ случаС ΠΊΠ°ΠΊ Π½Π΅ΠΊΠ°Ρ‚Ρ‡ΠΈΠΊ. Π’ качСствС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° ваша модСль ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½Ρ‹Π΅ Π½ΠΈΠΆΠ΅ вСроятности для 4 ΠΎΠ±Ρ€Π°Π·Ρ†ΠΎΠ² ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ:[0,45, 0,6, 0,7, 0,3], Π’ΠΎΠ³Π΄Π° Π² зависимости ΠΎΡ‚ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π½ΠΈΠΆΠ΅ Π²Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΊΠΈ:

отсСчка = 0,5: ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ ΠΌΠ΅Ρ‚ΠΊΠΈ = [0,1,1,0] (ΠΏΠΎΡ€ΠΎΠ³ ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ)
отсСчка = 0,2: ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ ΠΌΠ΅Ρ‚ΠΊΠΈ = [1,1,1,1]
отсСчка = 0,8: ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ ΠΌΠ΅Ρ‚ΠΊΠΈ = [0,0,0,0]

Как Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π²ΠΈΠ΄Π΅Ρ‚ΡŒ, измСняя ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Π΅ значСния, ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΊΠΈ. И, ΠΊΠ°ΠΊ Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ сСбС ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· этих сцСнариСв ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Ρ‚ ΠΊ Ρ€Π°Π·Π½ΠΎΠΉ точности ΠΈ скорости ΠΎΡ‚Π·Ρ‹Π²Π° (Π° Ρ‚Π°ΠΊΠΆΠ΅ TPR, FPR).

ΠšΡ€ΠΈΠ²Π°Ρ ROC ΠΏΠΎ сущСству ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ TPR ΠΈ FPR для Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΈ строит Π³Ρ€Π°Ρ„ΠΈΠΊΠΈ TPR ΠΏΡ€ΠΎΡ‚ΠΈΠ² FPR. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ROC ΠΏΠΎΠΊΠ°Π·Π°Π½ Π½Π° рисункС 2.

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Как Π²ΠΈΠ΄Π½ΠΎ ΠΈΠ· этого ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°, Ρ‡Π΅ΠΌ Π½ΠΈΠΆΠ΅ ΠΏΠΎΡ€ΠΎΠ³ отсСчСния для ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса, Ρ‚Π΅ΠΌ большС Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ прогнозируСтся ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ класс, Ρ‚. Π•. Π§Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ истинный ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ (Π½Π°ΠΏΠΎΠΌΠ½ΠΈΠΌ), Π° Ρ‚Π°ΠΊΠΆΠ΅ Ρ‚Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ Π»ΠΎΠΆΠ½Ρ‹ΠΉ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ (ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ ΠΏΡ€Π°Π²ΠΎΠΉ сторонС этой ΠΊΡ€ΠΈΠ²ΠΎΠΉ ). Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, сущСствуСт компромисс ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‚Π΅ΠΌ, насколько высоким ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‚Π·Ρ‹Π², ΠΈ Ρ‚Π΅ΠΌ, насколько сильно ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΡΠ²ΡΠ·Π°Ρ‚ΡŒ ΠΎΡˆΠΈΠ±ΠΊΡƒ (FPR).

8- AUC

ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ(AUC), являСтся Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΌΠ΅Ρ€ΠΎΠΉ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ классификатора для всСх Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ (ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΎΠ½ являСтся ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹ΠΌ ΠΈΠ½Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠΌ),

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

На высоком ΡƒΡ€ΠΎΠ²Π½Π΅, Ρ‡Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ AUC ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅. Но ΠΈΠ½ΠΎΠ³Π΄Π° пороговая нСзависимая ΠΌΠ΅Ρ€Π° Π½Π΅ Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΠΎΠ·Π°Π±ΠΎΡ‚ΠΈΡ‚ΡŒΡΡ ΠΎ ΠΎΡ‚Π·Ρ‹Π²Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½Π° Π±Ρ‹Π»Π° Π²Ρ‹ΡˆΠ΅ 99% (хотя ΠΎΠ½Π° ΠΈΠΌΠ΅Π΅Ρ‚ Ρ€Π°Π·ΡƒΠΌΠ½ΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΈΠ»ΠΈ FPR). Π’ этом случаС Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π½Π°ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΠΎΡ€ΠΎΠ³ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ соотвСтствовал ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ трСбованиям ΠΊ этим показатСлям (ΠΈ Π²Π°ΠΌ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ всС Ρ€Π°Π²Π½ΠΎ, Π΄Π°ΠΆΠ΅ Ссли модСль AUC Π½Π΅ слишком высока).

ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ вашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ классификации, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΈΠΌΠ΅Ρ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠ΅Π΅ прСдставлСниС ΠΎ трСбованиях ΠΊ бизнСсу / ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ΅ ΠΈ влиянию Π½ΠΈΠ·ΠΊΠΎΠ³ΠΎ ΠΎΡ‚Π·Ρ‹Π²Π° ΠΈ Π½ΠΈΠ·ΠΊΠΎΠΉ точности ΠΈ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ, для ΠΊΠ°ΠΊΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.

Π‘ практичСской Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния модСль классификации, которая Π²Ρ‹Π²ΠΎΠ΄ΠΈΡ‚ вСроятности, ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½Π΅Π΅, Ρ‡Π΅ΠΌ Π²Ρ‹Π²ΠΎΠ΄ с ΠΎΠ΄Π½ΠΎΠΉ ΠΌΠ΅Ρ‚ΠΊΠΎΠΉ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΠ½Π° обСспСчиваСт Π³ΠΈΠ±ΠΊΠΎΡΡ‚ΡŒ настройки ΠΏΠΎΡ€ΠΎΠ³Π° Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ соотвСтствовал вашим ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ трСбованиям ΠΊ ΠΎΡ‚Π·Ρ‹Π²Ρƒ / точности. НС всС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΠ²Π°ΡŽΡ‚ Ρ‚Π°ΠΊΠΈΠ΅ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ вСроятностныС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SVM Π½Π΅ прСдоставляСт ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π² качСствС Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… (хотя ΠΎΠ½ прСдоставляСт запас, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для настройки Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, Π½ΠΎ ΠΎΠ½ Π½Π΅ Ρ‚Π°ΠΊ прост ΠΈ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌ, ΠΊΠ°ΠΊ Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… вСроятностСй).

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, связанныС с рСгрСссиСй

Π’Π°ΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠ°ΠΊ линСйная рСгрСссия, случайный лСс, XGboost, свСрточная нСйронная ΡΠ΅Ρ‚ΡŒ, рСкуррСнтная нСйронная ΡΠ΅Ρ‚ΡŒ, ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΠ΄Π½ΠΈΠΌΠΈ ΠΈΠ· самых популярных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ рСгрСссии.

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ для ΠΎΡ†Π΅Π½ΠΊΠΈ этих ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ (с бСсконСчным количСством элСмСнтов) ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ ΠΎΡ‚ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ классификации.

9- MSE

«БрСднСквадратичСская ошибка», ΠΏΠΎΠΆΠ°Π»ΡƒΠΉ, самая популярная ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠ°Ρ для Π·Π°Π΄Π°Ρ‡ рСгрСссии. По сути, ΠΎΠ½ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ ΡΡ€Π΅Π΄Π½Π΅ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΡƒΡŽ ΠΎΡˆΠΈΠ±ΠΊΡƒ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌΠΈ ΠΈ фактичСскими значСниями.

Π”Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ рСгрСссионная модСль, которая прСдсказываСт Ρ†Π΅Π½Ρƒ Π΄ΠΎΠΌΠΎΠ² Π² Ρ€Π°ΠΉΠΎΠ½Π΅ Биэтла (ΠΏΠΎΠΊΠ°ΠΆΠΈΡ‚Π΅ ΠΈΡ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ε·α΅’), ΠΈ, скаТСм, для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΌΠ° Ρƒ нас Ρ‚Π°ΠΊΠΆΠ΅ Π΅ΡΡ‚ΡŒ фактичСская Ρ†Π΅Π½Π°, Π·Π° ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π΄ΠΎΠΌ Π±Ρ‹Π» ΠΏΡ€ΠΎΠ΄Π°Π½ (обозначаСтся ΠΊΠ°ΠΊ yα΅’). Π’ΠΎΠ³Π΄Π° MSE ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ:

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

Иногда люди ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ RMSE, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ с ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΎΠΌ Π² качСствС Ρ†Π΅Π»Π΅Π²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠΎ сути являСтся ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π½Ρ‹ΠΌ ΠΊΠΎΡ€Π½Π΅ΠΌ ΠΈΠ· MSE.

Глядя Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Ρ†Π΅Π½ Π½Π° ТильС, RMSE, ΠΏΠΎ сути, ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, ΠΊΠ°ΠΊΠΎΠ²ΠΎ срСднСС ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ Π² вашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Ρ… Ρ†Π΅Π½ Π½Π° ТильС ΠΎΡ‚ Ρ†Π΅Π»Π΅Π²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ (Ρ†Π΅Π½Ρ‹, Π·Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΎΠ΄Π°ΡŽΡ‚ΡΡ Π΄ΠΎΠΌΠ°).

10- MAE

ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это. Π€ΠΎΡ‚ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Ρ‚ΠΎ это

MAE, ΠΊΠ°ΠΊ извСстно, Π±ΠΎΠ»Π΅Π΅ устойчив ΠΊ выбросам, Ρ‡Π΅ΠΌ MSE. Основная ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π° Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π² MSE ΠΏΡƒΡ‚Π΅ΠΌ возвСдСния Π² ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ ошибок, выбросы (ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΠΌΠ΅ΡŽΡ‚ Π±ΠΎΠ»Π΅Π΅ высокиС ошибки, Ρ‡Π΅ΠΌ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ) ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ большС внимания ΠΈ Π΄ΠΎΠΌΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‚ Π² ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ошибкС ΠΈ Π²Π»ΠΈΡΡŽΡ‚ Π½Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π‘Ρ‚ΠΎΠΈΡ‚ Ρ‚Π°ΠΊΠΆΠ΅ ΡƒΠΏΠΎΠΌΡΠ½ΡƒΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π·Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌΠΈ MSE ΠΈ MAE сущСствуСт Ρ…ΠΎΡ€ΠΎΡˆΠ°Ρ интСрпрСтация максимального правдоподобия (MLE). Если ΠΌΡ‹ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ ΠΈ цСлями, Ρ‚ΠΎ MSE ΠΈ MAE ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‚ MLE Π½Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°Ρ… ΠΌΠΎΠ΄Π΅Π»ΠΈ, прСдполагая, Ρ‡Ρ‚ΠΎ Π°ΠΏΡ€ΠΈΠΎΡ€Π½Ρ‹Π΅ значСния Гаусса ΠΈ Лапласа Π½Π° ΠΌΠΎΠ΄Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΎΡˆΠΈΠ±ΠΊΠ°Ρ… соотвСтствСнно.

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½Π΅Π³ΠΎ коэффициСнта:

БущСствуСт Ρ‚Π°ΠΊΠΆΠ΅ другая ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° для ΠΎΡ†Π΅Π½ΠΊΠΈ рСгрСссионных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, называСмая ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΡ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, которая, ΠΏΠΎ сути, прСдставляСт собой ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ Ρ‚ΠΎΡ‡Π΅ΠΊ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΡŽΡ‚ΡΡ с ошибкой, мСньшСй ΠΏΡ€Π΅Π΄Π΅Π»ΡŒΠ½ΠΎΠΉ. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ Π² основном ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ RANSAC⁴ ΠΈ Π΅Π΅ Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΡΡ… (сСмСйство Π½Π°Π΄Π΅ΠΆΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ)

РСзюмС

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ прСдставили Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² 10 популярных ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ML, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… для ΠΎΡ†Π΅Π½ΠΊΠΈ эффСктивности ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ классификации ΠΈ рСгрСссии. Π’ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ части этого поста ΠΌΡ‹ собираСмся ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π²10 Π±ΠΎΠ»Π΅Π΅ ΠΏΡ€ΠΎΠ΄Π²ΠΈΠ½ΡƒΡ‚Ρ‹Ρ… ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… для ΠΎΡ†Π΅Π½ΠΊΠΈ эффСктивности ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ранТирования, статистики, ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠ³ΠΎ зрСния, ΠΠ›ΠŸ ΠΈ Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ обучСния.

Бсылки

[1] Π―Π½ Π“ΡƒΠ΄Ρ„Π΅Π»Π»ΠΎΡƒ, Π™ΠΎΡˆΡƒΠ° Π‘Π΅Π½ΠΆΠΈΠΎ ΠΈ Аарон ΠšΡƒΡ€Π²ΠΈΠ»Π»ΡŒ. Β«Π“Π»ΡƒΠ±ΠΎΠΊΠΎΠ΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Β»,MIT press, 2016.

[2] ΠšΡ€ΠΈΡΡ‚ΠΎΡ„Π΅Ρ€ М. Π‘ΠΈΡˆΠΎΠΏ, «РаспознаваниС ΠΎΠ±Ρ€Π°Π·ΠΎΠ² ΠΈ машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Β»,Π‘ΠΏΡ€ΠΈΠ½Π³Π΅Ρ€, 2006.

[3] Π”ΠΆΠ΅Ρ€ΠΎΠΌ Π€Ρ€ΠΈΠ΄ΠΌΠ°Π½, Π’Ρ€Π΅Π²ΠΎΡ€ Π₯асти ΠΈ Π ΠΎΠ±Π΅Ρ€Ρ‚ Π’ΠΈΠ±ΡˆΠΈΡ€Π°Π½ΠΈ. Β«Π­Π»Π΅ΠΌΠ΅Π½Ρ‚Ρ‹ статистичСского обучСния Β»,БСрия Springer ΠΏΠΎ статистикС, 2001.

[4] Π’ΠΈΠ»ΠΎ Π‘Ρ‚Ρ€ΡƒΡ†, Β«ΠŸΠΎΠ΄Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Π½Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΡΡ‚ΡŒ: практичСскоС Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Π²Π·Π²Π΅ΡˆΠ΅Π½Π½Ρ‹Π΅ наимСньшиС ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Ρ‹ ΠΈ Π΄Π°Π»Π΅Π΅ Β»,Vieweg and Teubner, 2010.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *