Contents
万物皆可机器学习🤣
机器学习体系
机器学习3个组成成分
数据(数据集)+特征(参数或变量)+算法
似乎与平差具有一些共有的东西。
几个重要的概念
机器学习世界一览1


有监督学习
- 分类:预测对象所属类别(异常监测)
- 朴素贝叶斯
- 决策树(CART、C4.5)
- Logistic回归
- K近邻
- 支持向量机(most popular)
数据与算法复杂度正相关。文本、数字、表格经典方法足矣,图像、视频、复杂数据需要神经网络
-
回归:预测数轴特定点
- 线性回归
- 多项式回归
分类与回归是具有联系的,回归用来评价分类结果的逼近度
无监督学习
- 聚类:基于未知特征区分事物
- K均值聚类
- Mean shift
- DBSCAN
没有事先标注类别的情况下、此算法尝试找到共性事物(基于某些特征),将它们聚集称簇
- 降维:将特定的特征组装成跟高级的特征(可用于推荐系统和协同过滤)
- 主成分分析PCA
- 奇异值分解SVD
- 潜在迪利克雷分配LDA
- 潜在语义分析LSA、pLSA、GLSA
- t-SNE
11种开源降维算法: https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes
通过丢失一些信息来突出某些特征
- 关联规则学习:在订单流水中查找商业模式
- Apriori
- Euclat
- FP-growth
营销策略、电子商务
数据科学中距离度量方法(欧式距离、切比雪夫距离等)
https://mp.weixin.qq.com/s/FNihrA5sc4jS1UBRgxD0-A
关于损失函数
https://mp.weixin.qq.com/s/1_nZbwxf1bm8wVZTR5xsjQ https://mp.weixin.qq.com/s/IJxPrIzqFSaUnLhlUn911Q
总体


