五步学会朴素贝叶斯算法(Python版)
1、什么是朴素贝叶斯算法:朴素贝叶斯算法是一种基于贝叶斯定理的分类技术,假设在预测变量之间具有独立性。给定一个水果,如果水果是黄色的,圆形的,直径约30厘米,则可以认为它是橘子。即使对于橘子描述的这些特征彼此依赖或依赖于其他特征的存在,但所有的这些特征都促成了这个水果是橘子的可能性,这就是它被称为“朴素”的原因。朴素贝叶斯模型易于构建,特别适用于非常大的数据集。贝叶斯定理提供了一种从P(c),P(x)和P(x | c)计算后验概率P(c | x)的方法。简单来说,贝叶斯定理是基于假设的先验概率、给定假设下观察到不同数据的概率,提供了一种计算后验概率的方法(计算公式如下图所示)。


4、朴素贝叶斯算法的应用:-实时预测朴素贝叶斯是一个非常快速的学习分类器,因此,它可以用于实时预测。-多类预测可以预测多类目标变量的概率。-文本分类/垃圾邮件过滤/情感分析朴素贝叶斯分类器对于多类问题和独立性规则具有更高的成功率,因此,它被广泛用于文本分类、垃圾邮件过滤和情感分析。-推荐系统朴素贝叶斯分类器和协同过滤一起构建一个推荐系统,这有助于预测用户是否愿意提供资源。

5、在Python中使用Naive Bayes构建基本模型:同样,scikit learn(python库)将帮助在这里用Python构建绿覆冗猩Naive Bayes模型。在scikit学习库下有三种类型的朴素贝叶斯模型:-高斯模型它用于分类,假设特征属于某个类别的观测值符合高斯分布。在处理连续的特征变量时,采用高斯模型。-多项式模型用于离散计数。例如,假设我们有文本分类问题。在这里我们可以考虑更进一步的bernoulli试验,而不是“在文档中出现的单词”,我们“计算文档中出现单词的频率”,你可以将其视为“观察到结果数x_i的次数”超过n次试验“。-伯努利模型与多项式模型一样,伯努利模型适用于离散特征的情况,所不同的是,伯努利模型中每个特征的取值只能是1和0(以文本分类为例,某个单词在文档中出现过,则其特征值为1,否则为0).根据你的数据集,您可以选择上面讨论的任何模型。以下是高斯模型的示例。

6、以上就是学习朴素贝叶斯的五个简单步骤,现在就开始学习吧!