深入浅出Hadoop Mahout数据挖掘实战(算法分析、项目实战、中文分词技术)
适合人群:高级
课时数量:17课时
用到技术:MapReduce并行分词程序 Mahout
涉及项目:Hadoop综合实战-文本挖掘项目 Mahout数据挖掘工具
咨询QQ:1840215592
课程介绍
本课程主要涉及以下内容的讲解:
1、Mahout数据挖掘工具
2、Hadoop实现推荐系统的综合实战,涉及到MapReduce、Pig和Mahout的综合实战
课程针对人群
1、本课程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士
2、最好有Greenplum Hadoop、Hadoop2.0、YARN、Sqoop、FlumeAvro、 Mahout等大数据基础,学习过北风课程《Greenplum 分布式数据库开发入门到精通》、《全面深入Greenplum Hadoop大数据分析平台》、《Hadoop2.0、YARN深入浅出》、《MapReduce、Hbase进阶提升》、《MapReduce、Hbase进阶提升》为最佳。
课程大纲
Mahout数据挖掘工具(10课时)
数据挖掘概念、系统组成
数据挖掘常用方法及算法(回归分析、分类、聚类等)
数据挖掘分析工具
Mahout支持的算法
Mahout起源和特点
Mahout安装、配置及测试
实战:Mahout K-means聚类分析
Mahout实现Canopy算法
Mahout实现分类算法
实战:Mahout逻辑回归分类预测
实战:Mahout朴素贝叶斯分类
推荐系统的概念及分类
协同过滤推荐算法概念、分类及应用
实战:实现基于Mahout的电影推荐系统
Hadoop综合实战-文本挖掘项目(7课时)
文本挖掘的概念及应用场景
项目背景
项目流程
中文分词技术
庖丁分词器的使用
MapReduce并行分词程序的设计与实现
Pig划分数据集
Mahout构建朴素贝叶斯文本分类器
模型应用-计算用户偏好类别
- 浏览: 6496 次
- 性别:
- 来自: 上海
相关推荐
基于Hadoop的数据挖掘
【74】2017最新大数据10个小时快速入门hadoop3集群实战视频教程 .txt【74】2017最新大数据10个小时快速入门hadoop3集群实战视频教程 .txt【74】2017最新大数据10个小时快速入门hadoop3集群实战视频教程 .txt【74】...
第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件...
基于Hadoop与Mahout云数据挖掘推荐研究.pdf
第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式...
Hadoop平台数据挖掘技术研究.pdf
基于Hadoop大数据挖掘斑马线机动车违章系统研究.pdf
大数据Hadoop视频教程大数据Hadoop视频教程大数据Hadoop视频教程
第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大...
基于HADOOP的数据挖掘平台分析与设计.pdf
Hadoop数据挖掘工具Mahout.ppt
基于HADOOP的数据挖掘平台分析与设计.docx基于HADOOP的数据挖掘平台分析与设计.docx基于HADOOP的数据挖掘平台分析与设计.docx基于HADOOP的数据挖掘平台分析与设计.docx基于HADOOP的数据挖掘平台分析与设计.docx基于...
基于Hadoop的数据挖掘算法在葡萄酒信息数据分析系统中的应用.pdf
由于开源云计算平台Hadoop的出现,解决海量web日志信息的数据挖掘成为可能。 本文的研究内容主要包含以下几个方面: 一、对Hadoop云计算平台进行研究。Hadoop是Apache下的顶级开源项目,该平台能够利用成千上万的廉价...
10多位技术专家结合自己10多年的经验,以电信、航空、医疗等多个行业的实战案例为主线,深入浅出地讲解了如何基于Hadoop架构技术进行大数据挖掘建模、数据分析和二次开发。 本书共16章,分三个部分:基础篇、实战篇...
基于HADOOP的数据挖掘.pdf
尚硅谷Hadoop视频教程再次重磅升级!以企业实际生产环境为背景,增加了更全面、更细致、更硬核的生产调优手册,对源码解析部分进行了全新的扩充和升级,并增加大量企业实战案例! 视频大小: 12.9G
一种基于Hadoop的大数据挖掘云服务及应用研究.pdf