用于数据挖掘的分类算法有哪些,各有何优劣

来源：学生作业帮助网编辑：作业帮时间：2024/11/07 21:41:42

用于数据挖掘的分类算法有哪些,各有何优劣
用于数据挖掘的分类算法有哪些,各有何优劣

1. 朴素贝叶斯(Naive Bayes, NB)

超级简单,就像做一些数数的工作.如果条件独立假设成立的话,NB将比鉴别模型（如Logistic回归）收敛的更快,所以你只需要少量的训练数据.即使条件独立假设不成立,NB在实际中仍然表现出惊人的好.如果你想做类似半监督学习,或者是既要模型简单又要性能好,NB值得尝试.

2. Logistic回归(Logistic Regression, LR)

LR有很多方法来对模型正则化.比起NB的条件独立性假设,LR不需要考虑样本是否是相关的.与决策树与支持向量机（SVM）不同,NB有很好的概率解释,且很容易利用新的训练数据来更新模型（使用在线梯度下降法）.如果你想要一些概率信息（如,为了更容易的调整分类阈值,得到分类的不确定性,得到置信区间）,或者希望将来有更多数据时能方便的更新改进模型,LR是值得使用的.

3.决策树（Decision Tree, DT）

DT容易理解与解释.DT是非参数的,所以你不需要担心野点（或离群点）和数据是否线性可分的问题（例如,DT可以轻松的处理这种情况：属于A类的样本的特征x取值往往非常小或者非常大,而属于B类的样本的特征x取值在中间范围）.DT的主要缺点是容易过拟合,这也正是随机森林（Random Forest, RF）（或者Boosted树）等集成学习算法被提出来的原因.此外,RF在很多分类问题中经常表现得最好（我个人相信一般比SVM稍好）,且速度快可扩展,也不像SVM那样需要调整大量的参数,所以最近RF是一个非常流行的算法.

4.支持向量机（Support Vector Machine, SVM）

很高的分类正确率,对过拟合有很好的理论保证,选取合适的核函数,面对特征线性不可分的问题也可以表现得很好.SVM在维数通常很高的文本分类中非常的流行.由于较大的内存需求和繁琐的调参,我认为RF已经开始威胁其地位了.

用于数据挖掘的分类算法有哪些,各有何优劣贝叶斯分类算法在数据挖掘中有什么应用贝叶斯分类算法在数据挖掘中的应用研究有哪些? 数据挖掘知识引起过拟合的原因有哪些? 数据挖掘中分类与预测的联系和区别?数据挖掘的问题,什么是分类?什么是预测?两者有什么关系?有什么区别? 繁简汉字各有何优劣? 挖掘能力强的有哪些动物可用于分类的算法有哪些?例如神经网络、支撑向量机.除了这些还有哪些算法能做分类,如果有该算法用于分类问题的参考文献请给出文献的名字.我说的是除了这两种(神经网络、支撑向量机) 什么是数据挖掘?从事相关的工作有什么要求? 什么是svm分类数据挖掘数学处理数据常用的算法有哪些? 数据挖掘中分类分析和聚类分析的区别数据挖掘中分类和回归的区别是什么? 求一个数据挖掘的算法贝叶斯改进算法或者决策树改进算法1个就可以,2个最好可以下到这个，但是我没PUDN的帐号，下不了，如果你有帮忙下下书房书架是否安装玻璃门?各有何优劣? 喜怒哀惧四种情绪各有何优劣干式空心电抗器和干式铁芯电抗器有什么区别,有何优劣,如何取舍是35kV的户外电抗器,用于无功平衡 META分析一般有哪些分类方式?或者说META分析的数据来源一般有哪些?不同数据来源有何特点?常用的META分析方法有哪些, 什么是正交变换?用于图像处理的正交变换有哪些?各有何作用?