Contents

机器学习

万物皆可机器学习🤣

机器学习体系

机器学习3个组成成分

数据(数据集)+特征(参数或变量)+算法

似乎与平差具有一些共有的东西。

组成

几个重要的概念

包含关系

机器学习世界一览1

Alt text


Alt text
经典机器学习算法分为有监督学习和无监督学习两大类

有监督学习

  • 分类:预测对象所属类别(异常监测)
    • 朴素贝叶斯
    • 决策树(CART、C4.5)
    • Logistic回归
    • K近邻
    • 支持向量机(most popular)

数据与算法复杂度正相关。文本、数字、表格经典方法足矣,图像、视频、复杂数据需要神经网络

  • 回归:预测数轴特定点

    • 线性回归
    • 多项式回归

分类与回归是具有联系的,回归用来评价分类结果的逼近度

无监督学习

  • 聚类:基于未知特征区分事物
    • K均值聚类
    • Mean shift
    • DBSCAN

没有事先标注类别的情况下、此算法尝试找到共性事物(基于某些特征),将它们聚集称簇

  • 降维:将特定的特征组装成跟高级的特征(可用于推荐系统和协同过滤)
    • 主成分分析PCA
    • 奇异值分解SVD
    • 潜在迪利克雷分配LDA
    • 潜在语义分析LSA、pLSA、GLSA
    • t-SNE

11种开源降维算法: https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes

通过丢失一些信息来突出某些特征

  • 关联规则学习:在订单流水中查找商业模式
    • Apriori
    • Euclat
    • FP-growth

营销策略、电子商务

数据科学中距离度量方法(欧式距离、切比雪夫距离等)

https://mp.weixin.qq.com/s/FNihrA5sc4jS1UBRgxD0-A

关于损失函数

https://mp.weixin.qq.com/s/1_nZbwxf1bm8wVZTR5xsjQ https://mp.weixin.qq.com/s/IJxPrIzqFSaUnLhlUn911Q

总体

Alt text
Alt text
Alt text


  1. https://mp.weixin.qq.com/s/eSIEzrXVVEQ2s_xp60FRVw ↩︎