首页 > 新闻详情

数据挖掘犹如屠龙之技

来源:南京西线学院

时间: 2017/10/25 9:12:05

数据挖掘目前在的尚未流行开,犹如屠龙之技;

据挖掘本身融合了统计学、数据库、机器学习、模式识别、知识发现等,并不是新的技术。

数据挖掘之所以能够应用不是因为算法,算法是以前就有的。数据挖掘应用的原因是大数据和云计算。比如阿尔法狗的后台有上千台计算机同时运行神经网络算法;

数据初期的准备工作,也称Data Warehousing。通常占整个数据挖掘项目工作量的70%左右。在前期你需要做大量的数据清洗和字段扩充的工作。数据挖掘和报告展现只占30%左右;

数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更)

目前国内的数据挖掘人员工作领域大致可分为三类

1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告;

2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析;

3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。

你自己的定位与学习

基于以上一点的介绍,你大概可以明确你需要努力的方向。如果你不是致力于科研方向,那么你需要掌握如下的技能:

1. 需要理解主流机器学习算法的原理和应用。按照需要解决的问题,主要分为类,见下图:

南京西线学院数据挖掘培训

2. 需要熟悉至少一门编程语言。如R,Python,SPSS Modeler,SAS,WEKA等。

关于软件,有三个原则:只要能达到目标的软件就是好软件;你研究的领域啥软件好用就用啥软件;不要妄想用一个软件解决所有问题。

3. 需要理解数据库基本原理,能够熟练操作至少一种数据库,如MySQL,OracelDB2等。

4. 熟悉数据挖掘常见的运用场景。如客户生命周期管理、客户画像和客户分群、客户价值预测模型构建、推荐系统设计等。这些需要依托于不同行业。

经典图书推荐

《数据挖掘:概念与技术》、《数据挖掘导论》、《机器学习实战》、《数据库系统概论》、《R语言实战》

当然,如果你能够接触到真实的数据挖掘项目和实战,你的提升将会非常快,西线学院开设的数据挖掘课程是个不错的选择。

南京西线学院 http://sizacollegenj.soxsok.com

南京西线学院 http://m.soxsok.com/sizacollegenj

优先领取试听课
版权所有:搜学搜课(wwww.soxsok com)