常见分析方法

描述性分析 (Descriptive Analysis)

  • 方法:频数统计、均值、中位数、标准差、分布图表(柱状图、饼图、箱线图)

  • 用途:了解数据的总体情况

推断性分析 (Inferential Analysis)

  • 方法:假设检验(t检验、卡方检验、方差分析 ANOVA)、置信区间

  • 用途:从样本推断总体特征

相关与回归分析

  • 相关分析:皮尔森相关、斯皮尔曼相关

  • 回归分析:线性回归、逻辑回归、多元回归

  • 用途:研究变量之间的关系

聚类与分类分析

  • 聚类 (Clustering):K-means、层次聚类(无监督学习)

  • 分类 (Classification):决策树、支持向量机、随机森林、神经网络(有监督学习)

  • 用途:分组、预测类别

时间序列分析

  • 方法:趋势分析、移动平均、ARIMA、季节性分解

  • 用途:预测股价、天气、销售量

文本与非结构化数据分析

  • 方法:文本挖掘、情感分析、主题建模、图像识别

  • 用途:分析社交媒体评论、客服反馈、图片分类

总结

  • 描述性:告诉你“发生了什么”。

  • 诊断性:告诉你“为什么发生”。

  • 预测性:告诉你“未来会怎样”。

  • 规范性:告诉你“该怎么做”。

  • 探索性:帮助你“发现新的问题和模式”。