李勇华的互联网思维 - 关于互联网的深度思考和践行
  • 首页
  • 微语
  • 关于

现在位置:首页 » 能力修炼 » 转行大数据的知识结构要求

转行大数据的知识结构要求
liyonghua   2017年12月24日   能力修炼   评论(0)   浏览(2278)  


1. Hadoop,HIVE,SQL数据库操作需要会。
Hive用于提取数据,做基本的数据分析。hive的基本函数,比如聚合函数,数学函数,字符串的函数,连接表格函数等。hive的各种语句,比如if else,case等语句。
EXCEL的基本操作需要掌握,用熟悉了其实挺方便的。

2. 编程语言最好会python,c/c++,或者java,至少一种。做机器学习的话感觉用python会多一些。

3. Linux系统,脚本语言Shell。

4. 数据挖掘和机器学习的基础知识和算法:
LR,SVM,聚类算法,神经网络算法,决策树,随机森林,GBDT,异常值检测等常用算法需要掌握。
特征工程的基础知识:根据相应的产品进行必要的特征构造,物品特征,交叉特征等。

工程上的最优化论文推荐:
Ad Click Prediction a View from the Trenches:
需要了解的是相关论文的背景SGD算法,Truncated Gradient算法,RDA算法,FOBOS算法,FTRL算法等。

5. 统计学:
时间序列模型,变量的相关系数,ROC和AUC曲线,交叉验证,主成分分析。

6. 大数据,推荐系统,计算广告学的科普书籍。


·END·


  • 上一篇:如何准备谷歌的产品经理面试?
  • 下一篇:月薪10万的人都在用的文案方法论
  • 本文固定链接:http://www.liyonghua.com/?post=334
    本文由liyonghua原创或编辑,互联分享,尊重版权,转载请以链接形式标明本文地址

    取消回复

    发表评论:

    • 搜索

    • 最新微语

      • 秋高气爽的时节到了,适合户外各类运动!

        2024-09-26 09:06

      • updated my blog on 6/17/2024

        2024-06-17 23:23

      • 天生的产品经理:1、对产品槽点的忍耐度,是否可以察觉细微的槽点;2、新产品和行业趋势的探索欲;3、用户同理心,随时考虑到用户的各类场景;4、直击问题本源,化繁为简的能力;5、把任何事物都看成产品的独特视角;

        2022-03-17 03:01

      • 工作中如何持续保持自身价值的成长,才是需要考虑的最重要的点。

        2022-02-16 15:36

      • 不要把希望放在别人身上,只有自己的强大才是立身之本。

        2021-01-16 01:26

      • 更多»


    Copyright © 2015 李勇华的互联网思维