做网站需注意事项全屋定制家具品牌排行榜前十名
 
 个人主页:在线OJ的阿川
大佬的支持和鼓励,将是我成长路上最大的动力 
阿川水平有限,如有错误,欢迎大佬指正 
 

 
目录
- 三大方向
 - 机器学习产生的原因
 - 机器如何学习
 - 模型评价
 - 应用层
 - 适用条件
 - 学习要弄清楚
 - 数据什么样
 - 研究哪些问题
 - 如何分门别类
 - 常见误区与局限
 
- 工具栏
 - 四大必备工具
 - Anaconda
 - [Jupyter notebook](https://jupyter.org/)
 - Numpy(重点)
 - Matplotlib
 
机器学习
- 计算机 从数据中学习规律并改善自身进行预测的过程
 
三大方向

 其中深度学习为重点
机器学习产生的原因
- 人与计算机理解方式不同
 - 规律系统不够用
 - 逻辑判断专家参与耗时耗力
 
机器如何学习

 注意:我们期望机器在没有见过的数据集中表现良好,所以在训练中会采用28原则
- 80%的历史数据用来训练
 - 20%的数据用来测试
 

模型评价
模型要进行模型评价

应用层
- 商品画像
 - 用户画像
 - 商品推荐
 - 搜索算法
 - 以画搜画
 - 商品排序
 - 人脸检测
 - 活体检测
 - 人脸识别
 
适用条件
- 问题存在某种模式 
- 一般是人能够解决的,若人解决不了的,作为强人工智能领域
 
 - 难以人工总结定义
 - 有足够样本数据 
- 小数据下会失效
 
 
学习要弄清楚
学习机器学习要弄清楚

数据什么样
- 常用的公开数据集
 - 典型实例
 - 如何使用数据
 - 高维特征空间
 - 结构化与非结构化数据
 
研究哪些问题
- 任务地图
 

-  
分类任务(重点)
-  
特征
- 已知样本特征
 - 判断样本类别
 - 二分类,多分类,多标签分类
 
 -  
二分类
 -  
多分类
 -  
多标签分类
- 标签间不互斥
 - 概率和不为1
 
 -  
更多实例
 
 -  
 -  
回归任务(重点)
-  
特征
- 用于预测
 
 -  
线性回归
 -  
多项式回归
- 一个因变量
 - 一个或多个自变量
 - 任何函数都可以用多项式逼近
 
 -  
逻辑回归
- 实际上是分类
 - 细节很多,求法不同,导致在回归类
 
 
 -  
 
不管是分类还是回归,都属于监督学习
- 类别标记
 - 直接反馈
 
无监督学习
- 无标准答案,去探索某种规律或结构
 
强化学习
- 研究环境与行动之间的互动,以获取最大化结果
 
如何分门别类
划分依据
-  
监督学习
- 训练数据有标记
 - 基础而重要
 
 -  
无监督学习
- 训练数据未有标记
 - 聚类
 - 降维 
- 主成分分析 
- K均值算法
 - 密度聚类
 - 最大期望算法
 
 - 核方法
 
 - 主成分分析 
 
 -  
半监督学习
- 少量标记,大量无标记
 
 -  
强化学习
- 观测环境
 - 估计状态
 - 执行操作
 - 获得回报或惩罚
 
 -  
批量学习
- 先训练再使用
 - 需要大量的时间和计算资源
 - 通常都是高线完成
 
 -  
在线学习
- 循序渐进
 - 边学边用
 
 -  
基于实例的学习
 -  
基于模型的学习
 
常见误区与局限
-  
数据越多越好吗
- 数据质量是关键
 - 多不意味着准确
 - 传统方法依然有用
 
 -  
模型真的可信吗
- 可解释性难题
 - 深度学习是个黑盒子
 - 深层学习有具优势
 
 -  
随机和确定性哪个更好
- 机器学习本质上是统计
 - 确定性依然十分重要
 - 随机与确定性间的平衡
 
 -  
小样本集怎么办
- 机器学习适合大数据
 - 很多问题是天然小数据
 - 小样本学习是机器学习的挑战
 
 -  
推理而不只是判断
- 机器学习尚在判断阶段
 - 抽象思维和逻辑思维推理远未实现
 - 数学依旧是汪洋大海
 
 -  
机器学习是机会
- 深度学习局限性凸显
 - 本质上是几何空间变换
 - 具体问题应具体分析
 
 
工具栏
四大必备工具

Anaconda

Jupyter notebook
- 基础使用 
- 基础操作 
- 快捷键
 - markdown
 
 
 - 基础操作 
 - 高级使用 
- %%writefile
 - %pycat
 - %run
 - %timeit
 - %time
 - %%timeit
 - %%time
 - %whos
 - %lsmagic
 - %magic
 
 
Numpy(重点)
-  
基础知识
- 性能对比
 
 -  
数组创建
- 常用属性 
- ndim\shape\size
 
 
 - 常用属性 
 -  
创建数组
- np.array()
 - ones/ones_alike
 - zeros/zeros_like
 - full/full_like 指定数值
 - empty/empty_like 实数组
 - arange/linspace 等量数组
 - random/rand/randint/randn/nomal/uniform/seed 随机数组
 - reshape 改变形状
 - help/? 查看文档
 
 -  
基础索引
 -  
数据合并与拆分
- 合并 
- concatnade/vstack/hstack
 
 - 拆分 
- split/vsplit/hsplit
 
 
 - 合并 
 -  
矩阵运算
- 一元运算 
- abs/sqrt/square/exp/log/ceil/floot/round/sincostan
 
 - 二元运算 
- dot/加速乘除/取余/幂运算
 
 - 矩阵运算 
- 加速乘除/dot/转查/逆矩阵/行列式
 
 
 - 一元运算 
 -  
统计运算
- min/max
 - sum/mean/median/std/var
 - ptp/percentile/cumsum/diff/prod
 
 -  
arg运算
- argmin/argmax/argsort/argpartition
 
 -  
补齐索引和布尔索引
 
Matplotlib
- 数据可视化基础 
- 拆线
 - 散点
 - 绘制设置
 
 
好的,到此为止啦,祝您变得更强

| 道阻且长 行则将至 | 
|---|
个人主页:在线OJ的阿川
大佬的支持和鼓励,将是我成长路上最大的动力 
