SQL:数据分析岗位必备,SQL是结构化查询语言,基于数据库的语言。不同公司用的数据库不一样,SQL语句也不同,但是底层逻辑是相同的。比较多的是Oracle、MySQL、SQL Server
Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件 。
最流行的 Python 环境管理工具 。
Excel是最基础的数据分析工具,没有Excel函数以及数据处理相关知识基础,用其他软件还是会有些困难,很多函数的定义都是互通的 做图用Excel效率很低
可视化Tableau和Power BI这两款比较火,Power Query是微软开发的智能数据处理工具,可以说它弥补了Excel处理数据的短板,并且微软还为它“配备”了专门的M函数,直接下载Power BI,里面就已经包含Power Query
Tableau做数据地图超级方便,图表设计速度快,便于做Dashboard,收费的
Power BI,最小设计颗粒度为Dashboard(Tableau最小颗粒度为工作表)个人版免费而且它以DAX语言为支撑,度量值用起来香,看板顺手,但图表色彩比不过Tableau
Grafana 是一款开源的数据可视化工具,使用 Grafana 可以非常轻松的将数据转成图表
Pandas库,可以说是Python中的excel,用Pandas做数据分析时常搭配numpy库和matplotlib库进行使用,适用于批量处理数据和可视化
Eviews和Stata,专业统计软件简便,建时间序列预测模型和回归模型主要使用软件
bigml,可交互的,可用于处理机器学习算法在线平台,免费版提供16M数据库
finebi,也是国内bi工具,这公司搞了很多相关软件如FineReport,跟Tableau类似
分析师常见的种类
1.数据产品经理
//在产品经理的能力基础上,增加数据思维
2.数据分析师
//核心是监控、挖掘、有价值和服务是眼睛与大脑的角色
3.数据建模师
//算法工程师,是数理统计 编程 业务思维集一身的模型大师 推荐反欺诈算法等灵魂工作
4.数据工程师
//数据仓库、创建ETL、进行数据治理、数据安全等 维护速度 数据结构服务使用方
5.数据科学家
//数据分析能力、统计学基础、业务能力、算法与沟通能力集聚一身
编程技能
数据处理
数据清洗:缺失值、异常值、特殊值
数据整合:查找、筛选、分类、组合
分析算法构建:基本特征、统计分析、数学建模、功能封装
数据可视化:图表
数学技能
统计
数学
建模
沟通技能
业务技能