首页技术总结正文内容

Windows下安装Spark（亲测成功安装）

技术总结

更新时间：2024-12-23 04:23:35 10

admin 管理员组

文章数量: 887021

Windows下安装Spark

Spark简介
- Spark 主要有三个特点
- Spark 性能特点
一、Spark安装前提
- 1.1、JDK安装（version：1.8）
- - 1.1.1、JDK官网下载
  - 1.1.2、JDK网盘下载
  - 1.1.3、JDK安装
- 1.2、Scala安装（version：2.11.12）
- - 1.2.1、Scala官网下载
  - 1.2.2、Scala网盘下载
  - 1.2.3、Scala安装
  - 1.2.4、验证Scala是否安装成功
- 1.3、Hadoop安装（version：2.7.2）
二、安装Spark（version：2.4.7）
- 2.1、Spark官网下载
- 2.2、Spark网盘下载
- 2.3、Spark安装
- 2.4、验证Spark是否安装成功

Spark简介

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎 [2] 。现在形成一个高速发展应用广泛的生态系统。

Spark 主要有三个特点

首先，高级 API 剥离了对集群本身的关注，Spark 应用开发者可以专注于应用所要做的计算本身。
其次，Spark 很快，支持交互式计算和复杂算法。
最后，Spark 是一个通用引擎，可用它来完成各种各样的运算，包括 SQL 查询、文本处理、机器学习等，而在 Spark 出现之前，我们一般需要学习各种各样的引擎来分别处理这些需求。

Spark 性能特点

更快的速度
内存计算下，Spark 比 Hadoop 快100倍。
易用性
Spark 提供了80多个高级运算符。
通用性
Spark 提供了大量的库，包括Spark Core、Spark SQL、Spark Streaming、MLlib、GraphX。开发者可以在同一个应用程序中无缝组合使用这些库。
支持多种资源管理器
Spark 支持 Hadoop YARN，Apache Mesos，及其自带的独立集群管理器
Spark生态系统
Shark：Shark基本上就是在Spark的框架基础上提供和Hive一样的HiveQL命令接口，为了最大程度的保持和Hive的兼容性，Spark使用了Hive的API来实现query Parsing和 Logic Plan generation，最后的PhysicalPlan execution阶段用Spark代替HadoopMapReduce。通过配置Shark参数，Shark可以自动在内存中缓存特定的RDD，实现数据重用，进而加快特定数据集的检索。同时，Spark通过UDF用户自定义函数实现特定的数据分析学习算法，使得SQL数据查询和运算分析能结合在一起，最大化RDD的重复使用。
SparkR：SparkR是一个为R提供了轻量级的Spark前端的R包。 SparkR提供了一个分布式的data frame数据结构，解决了 R中的data frame只能在单机中使用的瓶颈，它和R中的data frame 一样支持许多操作，比如select,filter,aggregate等等。（类似dplyr包中的功能）这很好的解决了R的大数据级瓶颈问题。 SparkR也支持分布式的机器学习算法，比如使用MLib机器学习库。 SparkR为Spark引入了R语言社区的活力，吸引了大量的数据科学家开始在Spark平台上直接开始数据分析之旅。

一、Spark安装前提

安装Spark之前，需要安装JDK、Hadoop、Scala。
本次安装版本选择：
JDK：1.8
Hadoop：2.7.2
Scala：2.11.12
Spark：2.4.7

1.1、JDK安装（version：1.8）

1.1.1、JDK官网下载

官网下载地址(需要oracle账号)
https://www.oracle/java/technologies/javase/javase-jdk8-downloads.html

1.1.2、JDK网盘下载

或者网盘下载：https://pan.baidu/s/1MMkFbzcf8ZYvGwdHreXtUg?pwd=yyds

1.1.3、JDK安装

安装方法就不赘述了。

1.2、Scala安装（version：2.11.12）

1.2.1、Scala官网下载

官网下载地址：https://downloads.lightbend/scala/2.11.12/scala-2.11.12.msi

1.2.2、Scala网盘下载

网盘下载地址：https://pan.baidu/s/1Qiy1aEndKn_Xs-zSSLaWIA?pwd=yyds

1.2.3、Scala安装

本地点击msi文件安装，安装目录为 D:\bigdata\scala\2.11.12\
设置环境变量 %SCALA_HOME%

环境变量Path添加条目%SCALA_HOME%\bin

1.2.4、验证Scala是否安装成功

为了验证Scala是否安装成功，开启一个新的cmd窗口。
输入：Scala

可以看到Scala安装成功。

1.3、Hadoop安装（version：2.7.2）

参考博文：Windows下安装Hadoop（手把手包成功安装）

二、安装Spark（version：2.4.7）

2.1、Spark官网下载

官网下载地址：https://archive.apache/dist/spark/spark-2.4.7/spark-2.4.7-bin-hadoop2.7.tgz
历史版本仓库：https://archive.apache/dist/spark/

2.2、Spark网盘下载

网盘下载地址：https://pan.baidu/s/1VyVLwnSvdMzSocj37xlErQ?pwd=yyds

2.3、Spark安装

本地解压spark文件，目录为 D:\bigdata\spark\2.4.7\
设置环境变量 %SPARK_HOME%

环境变量Path添加条目%SPARK_HOME%\bin
跟上面配置环境变量一样的配置方法。

2.4、验证Spark是否安装成功

为了验证Spark是否安装成功，开启一个新的cmd窗口。
输入：spark-shell

显示上面的正常运行界面，表示本地的spark环境已搭建完成！

本文标签： Windows spark

版权声明：本文标题：Windows下安装Spark（亲测成功安装）内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1716033374h663248.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

Windows下安装Spark（亲测成功安装）

Windows下安装Spark

Spark简介

Spark 主要有三个特点

Spark 性能特点

一、Spark安装前提

1.1、JDK安装（version：1.8）

1.1.1、JDK官网下载

1.1.2、JDK网盘下载

1.1.3、JDK安装

1.2、Scala安装（version：2.11.12）

1.2.1、Scala官网下载

1.2.2、Scala网盘下载

1.2.3、Scala安装

1.2.4、验证Scala是否安装成功

1.3、Hadoop安装（version：2.7.2）

二、安装Spark（version：2.4.7）

2.1、Spark官网下载

2.2、Spark网盘下载

2.3、Spark安装

2.4、验证Spark是否安装成功

更多相关文章

Windows搭建Nodejs【全网最详细】

Windows下使用PaddleOCR识别

yolov7环境搭建——Windows

BitLocker Repair Tool - Recover Drive in Windows 7 and 8

ESP32-S2 windows开发环境快速搭建

windows下安装filebeat

Windows痕迹清除技术

Windows程序奔溃后，禁止弹出“停止工作”对话框

彻底解决兼容问题：Windows 7下载安装 Visual C++ 6.0(VC6) 全程图解

Windows Update 升级补丁 错误 代码80072EE2

Windows键位映射

windows minio集群部署

Windows 终端 | Windows Terminal | 一款强大且高效的终端应用程序

【历史上的今天】11 月 30 日：Windows Vista 诞生；初代 Nook 电子书发布；自动驾驶先驱出生

windows 下日志切割，清理

GRUB 2：恢复被Windows 7覆盖的Ubuntu 9.10

Windows 7中使用HomeGroup需要打开的端口

Windows 7 IIS (HTTP Error 500.21 - Internal Server Error)解决

台电平板如何安装windows系统

苹果电脑windows系统换苹果系统

发表评论

推荐文章

中间显示内容_爱色丽i1 studio显示器校色详细流程

无线断开了怎么连接服务器,如何在BluezLinux上从GATT服务器断开连接事件

阿里香港虚拟主机比云服务器贵,云虚拟主机和云服务器哪种比较好？两者有什么区别？...

Windows系统ping不通同网段主机解决方法

捡垃圾！自己攒性价比超高，可上标压U的迷你主机，可选择性极高！

热门文章

【转载】试用版Windows Embedded Compact 7的下载地址

6.6 Hessenberg法求特征值

[BUGKU] [MISC] 多种方法解决

写出美观的html,这样写CSS,让你代码更美观

考研英语五附双语阅读：该如何要求涨工资？

[3D游戏开发实践] Cocos Cyberpunk 源码解读

windows7自带录制屏幕怎么用

Linux操作系统的下载与安装（保姆级教程）

官方正版 | Mailbird - 2024 年最佳电子邮件客户端

WINDOWS系统的正确安装-硬盘格式如何选择

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

Windows Update 升级补丁错误代码80072EE2

（Windows系统）详细介绍Windows系统含有英文版