目录
一、图解朴素贝叶斯算法知识图谱
二、基本概念
三、核心思想
四、为什么叫“朴素”?
五、算法流程图
六、常见模型类型
七、优点 与 缺点
八、实战代码 (以文本分类为例)
九、应用举例

一、图解朴素贝叶斯算法知识图谱
该图描述了朴素贝叶斯分类的工作流程。
朴素贝叶斯分类的流程:
第一阶段:训练数据,生成训练样本集:TF-IDF.
第二阶段1:对每个类别计算 P(yi)。(计算先验概率);
第二阶段2:对每个特征属性计算所有划分的条件概率。
第三阶段1:对每个类别计算 P(x|yi)P(yi)。(计算分子)
第三阶段2:以 P(x|yi)P(yi)的最大项作为 x 的所属类别。
二、基本概念
朴素贝叶斯是一种基于贝叶斯定理与特征条件独立假设的概率分类算法。
适用于:文本分类、垃圾邮件识别、情感分析、医学诊断、舆情分类 等领域。
三、核心思想
根据已知样本特征,计算其属于某类的概率,选取最大概率的类别作为预测结果。
基于 贝叶斯公式:
其中:
-
P(C|X):在特征 X 条件下属于类 C 的概率(后验概率)
-
P(X|C):在类 C 条件下特征 X 出现的概率(似然)
-
P(C):类 C 的先验概率
-
P(X)&