一定管到底
武汉大数据分析培训班,课程培养专门从事数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人才,课程内容:据分析入门——数据分析的【道】与【术】、数据分析入门——逻辑为先——XMIND、数据分析入门——专业展现——PPT、数据分析工具安装与环璄配置等等
1、数据分析入门
2、数据分析的意义
3、数据分析的流程控制
4、数据分析的思路与方法
数据分析入门——逻辑为先——XMIND
1、xmind简介与基本使用
2、学习方法课堂案例
3、滴答拼车实战演练
4、其他思维导图介绍
数据分析入门——专业展现——PPT
1、专业展现——PPT
2、基本简介
3、几个不得不说的真相
4、经验分享
5、实战动画
数据分析工具安装与环璄配置
1、Excel工具的安装、配置与环璄测试
2、Power BI工具的安装、配置与环璄测试
3、Tableau工具的安装、配置与环璄测试
4、MySQL数据库的安装、配置与环璄测试
5、SPSS数据挖掘工具安装、配置与环璄测试
6、SAS数据挖掘工具安装、配置与环璄测试
7、Python开发工具的安装、配置与开发环璄测试
Linux基础应用之大数据必知必会
1、虚拟机的安装配置
2、虚拟机网络配置
3、安装Linux
4、利用SSH连结Linux
5、Linux基础命令
6、Linux系统管理
数据分析的Python语言基础
1、python课程的目的
2、使用JupyterLab
3、python数据类型
4、元组、列表、字典
5、python分支结构
6、python字符串处理+随机函数
7、pthon循环结构
8、python面向过程函数操作
9、python面向对象
数据分析项目流程
问题界定
问题拆分
指标确定
数据收集
报告方案
趋势预测
数据分析
趋势预测
报告方案
问题的定义
边界:明确问题的边界
逻辑:确定业务的关键指标和逻辑
定性分析与定量分析
分析问题的模型 基于经典的模型-1:5W2H、SWORT、4P管理模型、CATWOE、STAR原则、波士顿5力模型
基于业务的模型-2:用户画像、销售影响因素、市场变化因素、AARRR流量模型、金定塔思考方法
数据清洗与处理
数据科学过程
数据清洗定义
数据清洗任务
数据清洗流程
数据清洗环境
数据清洗实例说明
数据标准化
数据格式与编码
数据清洗常用工具
数据清洗基本技术方法
数据抽取
数据转换与加载
内部数据的获取
产品数据
用户数据
行为数据
订单数据
外部公开数据
开放网站
政务公开数据
数据科学竞赛
数据交易平台
行业报告
指数平台
Web网站数据抓取
财经数据抓取
投资数据抓取
房产数据抓取
舆情数据抓取
娱乐数据抓取
新媒体数据抓取
实战-1:51job招聘网站数据抓取与清洗
实战-2:链家网数据的抓取与数据清洗
SQL基础操作
建库
建表
建约束
创建索引
添加、删除、修改数据
利用SQL完成数据的预处理
缺失值处理:对缺失数据行进行删除或填充
重复值处理:重复值的判断与删除
异常值处理:清除不必要的空格和极端、异常数据
利用SQL进行业务数据查询
利用SQL进行简单的业务数据查询
利用SQL完成复杂条件查询
利用多表关联完成复杂业务查询
利用嵌套子查询完成复杂业务数据分析
高级SQL分析
聚合、分组、排序
函数
行列切换
视图与存储过程
业务指标统计分析
业务数据表关联查询及查询
结果纵向融合
⽇常业务需求数据宽表构建
应⽤⼦查询处理复杂业务
数据分析的统计学基础
基本统计量-1:均值、中位数、众数、异常值 .......
概率论基础-2:独立事件、条件概率、全概率公式、贝叶斯定律 ......
数据分布-3:几何分布、正态分布、二项分布、泊松分布.....
统计抽样
置信区间
假设检验
数据分析的数学基础
极限的计算和连续函数的性质
导数/微分的概念和运算法则
积分的概念和运算法则
幂级数、泰勒级数、傅里叶级数、傅里叶变换
向量的概念和运算
矩阵的转置、乘法、逆矩阵、正交矩阵、SVD奇异值分解、特征值
行列式的计算和性质
凸优化
基于Numpy库的Python数据科学计算
创建数组
切片索引
数组操作
字符串函数
数学函数
统计函数
......
案例-1:Numpy在金融领域中的分析应用
案例-2:基于Numpy的股价统计分析应用
基于Pandas库的Python数据处理与分析
利用Pandas重成数据表
利用Pandas进行数据查看
Pandas数据清洗
基于Pandas的数据预处理:数据表合并、数据表拆分与排序
利用Pandas进行数据提取
Pandas数据统计
......
案例-1:抖音用户行为分析
案例-2:淘宝天猫乐高的全国销售情况分析
利用Matplotlib/Seaborn/pyechart进行Python数据可视化
直方图:探索变量的分布规律
条形图:展示数值变量的集中趋势
散点图:表示整体数据的分布规律
箱线图:表示数据分散性,极值,中位数
提琴图:分位数的位置及数据密度
回归图:寻找数据之间的线性关系
热力图:表未数值的大小或者相关性的高低
案例-1:抖音用户行为可视化分析
案例-2:淘宝天猫乐高的全国销售情况可视化分析
实战-1:基于Python实现的链家网业务数据分析
实战-2:基于Python实现的51JOB简历分析
HIVE大数据查询平台搭建 大数据概述
⼤数据集群 Hadoop 架构
Hive开发环璄搭建
HIVE与MySQL进行数据交换
从MySQL中导入数据到Hive
从Hive导出数据到MySQL
HQL 海量业务数据需求查询
Hive数仓
HQL 数据查询基础语法
HQL 海量业务数据需求查询
从MySQL中导入数据到Hive
从Hive导出数据到MySQL
HQL 业务数据指标统计分析
分区表
分桶表
关联表
数据查询
HQL 海量数据查询优化
常⽤内置函数及开窗函数
特殊类型数组查询⽅式
HQL 查询语句优化技巧
实战-1:基于Hive的电商日志点击流量分析案例
实战-2:基于Hive的企业员工行为大数据分析
数据挖掘与分析算法
描述统计
相关分析
判别分析
方差分析
时间序列分析
主成分分析
信度分析
因子分析
回归分析
对应分析
列联表分析
聚类分析
数据挖掘工具——SPSS
课程规划与简介
数据挖掘项目生命周期
简单必备的统计学基础
用Modeler试手挖掘流程
数据挖掘的知识类型
商业分析基础简介
回归模型
决策树模型
支持向量机
聚类模型
关联规则
数据挖掘工具——SAS SAS概述:SAS简介与教育版安装
SAS概述:教育版基本使用
SAS编程基础
SAS编程基础7-循环
SAS数据集操作1-合并
SAS数据集操作2-排序与对比
SAS数据集操作3-查重与筛选
练习-斐波那契数列
练习-百元百鸡问题
实战:证券业市场绩效与市场结构关系的实证分析
人工智能:实战十大预测数据算法
机器学习入门
sk-learn机器学习库
十大预测算法原理与使用场景
算法调用、参数设置
特征选择、特征工程
回归预测模型实战
分类预测试模型实战
聚类模型实战
集成学习
模型优化
数据可视化的概念
数据可视化的意义
数据可视化的对比
数据可视化的分类
数据可视化图表举例
数据可视化应用领域
数据可视化步骤
数据可视化工具梯度
图标呈现流程
数据报告撰写
资深教育专家
中科大计算机专业,工信部大数据专家评委,十年技术开发经验,十年教学管理经验,中国最早的一批在线教育践行者。近些年专注于大数据、人工智能及区块链等方面的研究与落地教学实践工作。长期与企业一线技术总监、项目经理,互联网企业接触合作进行课程联合研制,产品的落地实践工作,对技术、架构和教育与商业有极深的理解和敏锐洞察力。
博为峰,中国职业人才培训领域的先行者,隶属于上海博为峰软件技术股份有限公司(股票代码:836392,2020年4月入选新三板创新层)。 公司总部位于上海,在北京、深圳、广州、成都、南京、西安、武汉、杭州、重庆、济南、合肥、苏州、长沙、南昌、石家庄、济南、郑州、昆山等地均设有分支服务机构。十数年来,博为峰始终坚守教学品质,真诚服务学员,发展至今,每年毕业学员10000+,就业率长期保持在99%以上。博为峰已先后为7000多家国内外 企业输送软件技术精英,未来还将根据产业变迁和技术革新开设更多的紧缺人才实训项目:帮助更多的应届毕业生和职场新人找到满意工作,实现职业梦想;帮助更多 的用人单位轻松招到可用之才,推动企业发展和产业进步。孵化出国内最 大的软件测试品牌、社区-51testing,是中国软件测试人才的摇篮。博为峰累计已毕业50000+学员,开班上千期,就业率99%以上,学员入职7000多家企业,为1000+家企业提供服务,举办90场公益沙龙,出版16本丛书,发型电子杂志57期,网站注册会员金百万。
70000+学员入职7000+国内外企业