2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲
净化,将异常数据去除
集成,统一
变换,转换编码
归约,降维,降低数据量
数据才是最重要的吧?
可视化结果,好说
A,B,C,y=f(A,B,C)
回归分析
比如
按照成绩分组学生
90以上:优秀
80-90:良好
60-80:及格
60以下:垃圾
这就是分类
分别分开
反正每个节点都要满足条件,各个特征就会区分开
其余特征了,OK的吧
这能听懂?
二叉树哦
10个训练集
6个是,4个否
则总的基尼系数
三种分组情况,看看谁基尼系数更小呢?
天气这种最合适
第一次分叉
继续,对晴和阴雨划分
再看左边
只看别的仨特征
俩都行的
右边的话
每一个特征都是二叉树
这样按照不同的特征就组合分开了,这就决策树
美滋滋了
预测阶段
按照规则划分即可
这样就搞定了决策树
怎么说
如果样本量太少,肯定没法训练
样本需要足够大,才能训练出来哦
可是聚类是不知道有多少类的
骚
举例
考察业绩——年盈利额
这就是基于层次聚类了
骚吧
反过来,就是分裂
合体
done
提示:重要经验:
1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。
上一篇:C语言强制类型转换
下一篇:案例20-内存长期占用导致系统慢