ISBN/价格: | 978-7-302-59899-2:CNY59.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | Spark 3.0大数据分析与挖掘/.王晓华,罗凯靖编著 |
出版发行项: | 北京:,清华大学出版社:,2022.3 |
载体形态项: | 214页:;+图:;+26cm |
丛编项: | 大数据技术丛书 |
提要文摘: | Spark作为新兴的、应用范围最为广泛的大数据处理开源框架引起了广泛的关注,吸引了大量的大数据分析与挖掘从业人员进行相关内容的学习与开发,其中ML是Spark 3.0机器学习框架使用的核心。本书用于Spark 3.0ML大数据分析与挖掘入门,配套示例源码、PPT课件、数据集、开发环境、思维导图和作者答疑服务。本书共分13章,从Spark 3.0大数据分析概述、基础安装和配置开始,依次介绍ML的DataFrame、ML基本概念,以及协同过滤、线性回归、分类、决策树与随机森林、聚类、关联规则、数据降维、特征提取和转换等数据处理方法;最后通过经典的鸢尾花分析实例,回顾了前面的学习内容,实现了一个完整的数据分析与挖掘过程。 |
题名主题: | 数据处理软件 机器学习 |
中图分类: | TP274 |
个人名称等同: | 王晓华 编著 |
个人名称等同: | 罗凯靖 编著 |
记录来源: | CN 湖北三新 20220305 |
记录来源: | CN HNLY 20221110 |