Datele cu capacitatea de a explica, cunoscute și ca date SHAP

Înțelegerea capacității de explicare a „De ce” se află în spatele predicțiilor

În articolul nostru din blog despre evoluția Qlik AutoML®: https://qqinfo.ro/evolutia-qlik-automl/, v-am prezentat un material video despre cum să creați o aplicație predictivă simplă, folosind doar setul de date predictive, precum și un material video despre cum să creați un model predictiv Qlik AutoML®.

În acest articol, la final, vă vom prezenta un material video în care ne vom concentra pe datele cu capacitatea de a explica.
Acest subiect poate fi confuz pentru unii, de aceea credem că acest material video va explica pas cu pas ce sunt și cum funcționează.

După cum vă amintiți, după ce a fost creat experimentul Qlik AutoML® utilizând algoritmul recomandat, Qlik™ a implementat modelul care urmează să fie utilizat pentru a crea un set de date de predicție. Atunci când facem acest lucru, furnizăm opțional datele privind capacitatea de a explica, cunoscute sub denumirea de „SHAP Data”.

SHAP Data Shapley Additive exPlanations – este o metodă utilizată în învățarea automată pentru a explica cât de mult contribuie fiecare caracteristică la predicțiile unui model. Aceasta atribuie o „valoare SHAP” fiecărei caracteristici, arătând modul în care caracteristica respectivă afectează predicția.

În termeni simpli, SHAP – explică de ce un algoritm a luat o anumită decizie prin defalcarea predicției în contribuții din partea fiecărei caracteristici. Acest lucru ajută la înțelegerea părților din date care au avut cea mai mare influență asupra rezultatului final al predicției.

Generarea seturilor de date SHAP în timpul predicțiilor

Există două tipuri de SHAP Data pe care le includem: predicția SHAP și coordonarea SHAP.

Predicția SHAP împarte fiecare caracteristică aleasă în coloane proprii și atribuie un interval de valori pozitive sau negative în funcție de dimensiunea datelor și de modul în care caracteristica influențează predicția. Dacă o caracteristică crește predicția modelului, Valoarea SHAP va fi pozitivă, dacă nu, este negativă. Prin urmare, în ceea ce privește datele noastre, aceasta arată modul în care caracteristicile influențează întreaga comandă, fie pentru a fi prezisă sau nu cu întârziere.

Coordinarea SHAP nu este altceva decât o versiune pivotată a setului de date SHAP. Qlik™ oferă acest lucru ca un alt set de date care poate fi utilizat pentru a analiza cu ușurință care caracteristici au avut cel mai mare impact asupra predicțiilor.

Pentru o prezentare, vă rugăm să vizionați materialul video de mai jos!

Pentru informații despre Qlik™, clic aici: qlik.com.
Pentru soluții specifice și specializate de la QQinfo, clic aici: QQsolutions.
Pentru a fi în contact cu ultimele noutăți în domeniu, soluții inedite explicate, dar și cu perspectivele noastre personale în ceea ce privește lumea managementului, a datelor și a analiticelor, clic aici: QQblog !