Isolation Forest

2018/10/18 posted in  MachineLearning

scikit-learn返回:是异常点(-1)或者不是异常点(1)

孤立森林-->查看数据页面,如上所示
原始数据的所有列,预测出来是否是异常值,也即是是否偏离(偏移即是-1),偏移度也就是decision_function算出来的值,返回样本的异常评分,值越小表示越有可能是异常样本
data,model.predict(X_train),model.decision_function(X_train)

df=pd.concat([pd.DataFrame(X_train),pd.Series(clf.predict(X_train)), pd.Series(clf.decision_function(X_train))], axis=1)

df.columns = ['a', 'b', 'c', 'd']