首页
发现
标签
搜索
注册
登录
首页
发现
榜单
标签
收录
注册
登录
10天吃掉那只pyspark
文档评分:
4.0 (
0 个有效评分
)
文档语言:
中文
章节数量:
12
阅读人次:
2734
收藏数量:
0
内容来源:
AI千集
整理分享:
码涯
阅读
收藏
下载
分享
阅读
收藏
下载
分享
文档标签
Pyspark
文档概述
pyspark强于分析,spark-scala强于工程。如果应用场景有非常高的性能需求,应该选择spark-scala。如果应用场景有非常多的可视化和机器学习算法需求,推荐使用pyspark,可以更好地和python中的相关库配合使用。此外spark-scala支持spark graphx图计算模块,而pyspark是不支持的。pyspark学习曲线平缓,spark-scala学习曲线陡峭。如果读者学习时间有限,并对Python情有独钟,建议选择pyspark。pyspark在工业界的使用目前也越来越普遍。
书籍目录
书籍评论 (
0
)
目录
1-1,快速搭建你的Spark开发环境
1-2,1小时看懂Spark的基本原理
2-1, 2小时入门Spark之RDD编程
2-2, 7道RDD编程练习题
2-3,2小时入门SparkSQL编程
2-4,7道SparkSQL编程练习题
3-1,Spark性能调优方法
3-2,RDD和SparkSQL综合应用
4-1,探索MLlib机器学习
4-2,初识StructuredStreaming
前言
×
分享,让知识传承更久远
×
文档下载
请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
PDF
文档
EPUB
文档
MOBI
文档