为了缓解高维情形下出现的数据样本稀疏、距离计算困难等问题,一个重要途径是降维。主成分分析(PCA)是应用最为广泛的一种降维技术。本文将介绍主成分分析的基本原理及算法实现。
AdaBoost算法
发表于
|
分类于
机器学习
AdaBoost算法是一种串行化的集成学习算法。其工作机制是:先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个学习期,如此反复进行,直到基学习器数目达到实现制定的个数\(T\),最终将这\(T\)个基学习器进行加权结合,得到最终的预测结果。本文首先介绍AdaBoost算法的工作原理,然后介绍MLiA一书中该算法的实现以及该算法在马疝病的应用,最后介绍针对不平衡问题学习器的一些评估指标,包括查准率、查全率、AUC、代价敏感错误率、\(F1\)、\(PR\)曲线、\(ROC\)曲线、代价曲线等,以及对样本集的改造方法。
Python特殊函数
发表于
|
分类于
Python
本文主要介绍Python语言的一些特殊函数、属性、迭代器、生成器,属于Python语言的高级用法,也是真正体现Python语言特点的内容,十分精彩!