Contents

Home / 数学 / 机器学习

机器学习

数学 2021-03-03 58 words One minute

Contents

万物皆可机器学习🤣

机器学习体系

机器学习3个组成成分

数据(数据集)+特征(参数或变量)+算法

似乎与平差具有一些共有的东西。

Alt text — 组成

几个重要的概念

Alt text — 包含关系

机器学习世界一览¹

经典机器学习算法分为有监督学习和无监督学习两大类

有监督学习

分类：预测对象所属类别（异常监测）
- 朴素贝叶斯
- 决策树（CART、C4.5）
- Logistic回归
- K近邻
- 支持向量机（most popular）

数据与算法复杂度正相关。文本、数字、表格经典方法足矣，图像、视频、复杂数据需要神经网络

回归：预测数轴特定点
- 线性回归
- 多项式回归

分类与回归是具有联系的，回归用来评价分类结果的逼近度

无监督学习

聚类：基于未知特征区分事物
- K均值聚类
- Mean shift
- DBSCAN

没有事先标注类别的情况下、此算法尝试找到共性事物（基于某些特征），将它们聚集称簇

降维：将特定的特征组装成跟高级的特征（可用于推荐系统和协同过滤）
- 主成分分析PCA
- 奇异值分解SVD
- 潜在迪利克雷分配LDA
- 潜在语义分析LSA、pLSA、GLSA
- t-SNE

11种开源降维算法： https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes

通过丢失一些信息来突出某些特征

关联规则学习：在订单流水中查找商业模式
- Apriori
- Euclat
- FP-growth

营销策略、电子商务

数据科学中距离度量方法（欧式距离、切比雪夫距离等）

https://mp.weixin.qq.com/s/FNihrA5sc4jS1UBRgxD0-A

关于损失函数

https://mp.weixin.qq.com/s/1_nZbwxf1bm8wVZTR5xsjQ https://mp.weixin.qq.com/s/IJxPrIzqFSaUnLhlUn911Q

总体

https://mp.weixin.qq.com/s/eSIEzrXVVEQ2s_xp60FRVw ↩︎