首页技术总结正文内容

【Spark】Windows下安装Spark（亲测成功安装）

技术总结

更新时间：2024-12-23 04:40:47 11

admin 管理员组

文章数量: 887021

【Spark】Windows下安装Spark

Spark简介
- Spark 主要有三个特点
- Spark 性能特点
一、Spark安装前提
- 1.1、JDK安装（version：1.8）
- - 1.1.1、JDK官网下载
  - 1.1.2、JDK网盘下载
  - 1.1.3、JDK安装
- 1.2、Scala安装（version：2.11.12）
- - 1.2.1、Scala官网下载
  - 1.2.2、Scala网盘下载
  - 1.2.3、Scala安装
  - 1.2.4、验证Scala是否安装成功
- 1.3、Hadoop安装（version：2.7.2）
二、安装Spark（version：2.4.7）
- 2.1、Spark官网下载
- 2.2、Spark网盘下载
- 2.3、Spark安装
- 2.4、验证Spark是否安装成功

Spark简介

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎 [2] 。现在形成一个高速发展应用广泛的生态系统。

Spark 主要有三个特点

首先，高级 API 剥离了对集群本身的关注，Spark 应用开发者可以专注于应用所要做的计算本身。
其次，Spark 很快，支持交互式计算和复杂算法。
最后，Spark 是一个通用引擎，可用它来完成各种各样的运算，包括 SQL 查询、文本处理、机器学习等，而在 Spark 出现之前，我们一般需要学习各种各样的引擎来分别处理这些需求。

Spark 性能特点

更快的速度
内存计算下，Spark 比 Hadoop 快100倍。
易用性
Spark 提供了80多个高级运算符。
通用性
Spark 提供了大量的库，包括Spark Core、Spark SQL、Spark Streaming、MLlib、GraphX。开发者可以在同一个应用程序中无缝组合使用这些库。
支持多种资源管理器
Spark 支持 Hadoop YARN，Apache Mesos，及其自带的独立集群管理器
Spark生态系统
Shark：Shark基本上就是在Spark的框架基础上提供和Hive一样的HiveQL命令接口，为了最大程度的保持和Hive的兼容性，Spark使用了Hive的API来实现query Parsing和 Logic Plan generation，最后的PhysicalPlan execution阶段用Spark代替HadoopMapReduce。通过配置Shark参数，Shark可以自动在内存中缓存特定的RDD，实现数据重用，进而加快特定数据集的检索。同时，Spark通过UDF用户自定义函数实现特定的数据分析学习算法，使得SQL数据查询和运算分析能结合在一起，最大化RDD的重复使用。
SparkR：SparkR是一个为R提供了轻量级的Spark前端的R包。 SparkR提供了一个分布式的data frame数据结构，解决了 R中的data frame只能在单机中使用的瓶颈，它和R中的data frame 一样支持许多操作，比如select,filter,aggregate等等。（类似dplyr包中的功能）这很好的解决了R的大数据级瓶颈问题。 SparkR也支持分布式的机器学习算法，比如使用MLib机器学习库。 SparkR为Spark引入了R语言社区的活力，吸引了大量的数据科学家开始在Spark平台上直接开始数据分析之旅。

一、Spark安装前提

安装Spark之前，需要安装JDK、Hadoop、Scala。
本次安装版本选择：
JDK：1.8
Hadoop：2.7.2
Scala：2.11.12
Spark：2.4.7

1.1、JDK安装（version：1.8）

1.1.1、JDK官网下载

官网下载地址(需要oracle账号)
https://www.oracle/java/technologies/javase/javase-jdk8-downloads.html

1.1.2、JDK网盘下载

或者网盘下载：https://pan.baidu/s/1MMkFbzcf8ZYvGwdHreXtUg?pwd=yyds

1.1.3、JDK安装

安装方法就不赘述了。

1.2、Scala安装（version：2.11.12）

1.2.1、Scala官网下载

官网下载地址：https://downloads.lightbend/scala/2.11.12/scala-2.11.12.msi

1.2.2、Scala网盘下载

网盘下载地址：https://pan.baidu/s/1Qiy1aEndKn_Xs-zSSLaWIA?pwd=yyds

1.2.3、Scala安装

本地点击msi文件安装，安装目录为 D:\bigdata\scala\2.11.12\
设置环境变量 %SCALA_HOME%

环境变量Path添加条目%SCALA_HOME%\bin

1.2.4、验证Scala是否安装成功

为了验证Scala是否安装成功，开启一个新的cmd窗口。
输入：Scala

可以看到Scala安装成功。

1.3、Hadoop安装（version：2.7.2）

参考博文：Windows下安装Hadoop（手把手包成功安装）

二、安装Spark（version：2.4.7）

2.1、Spark官网下载

官网下载地址：https://archive.apache/dist/spark/spark-2.4.7/spark-2.4.7-bin-hadoop2.7.tgz
历史版本仓库：https://archive.apache/dist/spark/

2.2、Spark网盘下载

网盘下载地址：https://pan.baidu/s/1VyVLwnSvdMzSocj37xlErQ?pwd=yyds

2.3、Spark安装

本地解压spark文件，目录为 D:\bigdata\spark\2.4.7\
设置环境变量 %SPARK_HOME%

环境变量Path添加条目%SPARK_HOME%\bin
跟上面配置环境变量一样的配置方法。

2.4、验证Spark是否安装成功

为了验证Spark是否安装成功，开启一个新的cmd窗口。
输入：spark-shell

显示上面的正常运行界面，表示本地的spark环境已搭建完成！

本文标签： spark Windows

版权声明：本文标题：【Spark】Windows下安装Spark（亲测成功安装）内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1725050225h856607.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

【Spark】Windows下安装Spark（亲测成功安装）

【Spark】Windows下安装Spark

Spark简介

Spark 主要有三个特点

Spark 性能特点

一、Spark安装前提

1.1、JDK安装（version：1.8）

1.1.1、JDK官网下载

1.1.2、JDK网盘下载

1.1.3、JDK安装

1.2、Scala安装（version：2.11.12）

1.2.1、Scala官网下载

1.2.2、Scala网盘下载

1.2.3、Scala安装

1.2.4、验证Scala是否安装成功

1.3、Hadoop安装（version：2.7.2）

二、安装Spark（version：2.4.7）

2.1、Spark官网下载

2.2、Spark网盘下载

2.3、Spark安装

2.4、验证Spark是否安装成功

更多相关文章

Python 自动配置 pip 支持库（通过 Windows Bat 脚本）

Windows 7安装后anaconda 命令行jupyter lab 出现404页面

用永恒之蓝漏洞攻击Windows 7 的靶机

Windows Vista, Windows 7, Snipping tool 无法工作，提示需要从新启动电脑

ESP32-S2 windows开发环境快速搭建

windows下安装filebeat

Windows 7Windows 8都有上帝模式

windows系统下node、npm的安装和卸载

windows 修改背景颜色之后重启又恢复的解决方法

Windows修改java环境变量不生效

centos7下修改windows默认启动顺序

Windows Update 升级补丁 错误 代码80072EE2

Windows CMD 窗口中，查看历史操作命令

CentOs 7 下修改 Windows 默认启动顺序

windows 7 操作系统中Java开发环境的设置

Windows 终端 | Windows Terminal | 一款强大且高效的终端应用程序

系统封装失败遇到windows 无法分析或处理

Windows原理深入学习系列-强制完整性控制

Windows 7 IIS (HTTP Error 500.21 - Internal Server Error)解决

台电平板如何安装windows系统

发表评论

推荐文章

操作系统——概述

word度量单位无效_毕业论文Word技巧小结

使windows10的 ubuntu子系统默认以 root用户登陆

Leetcode题库练习笔记（Medium） 美区国区

苹果电脑win10蓝牙音响卡顿_win10系统蓝牙音箱卡顿声音断断续续的处理办法

热门文章

如何激活Windows server服务器

如何在Windows10上安装Vim

虚拟机安装过程记录

面试题总汇

《FreeSWITCH: VoIP实战》：FreeSWITCH 架构

Python基础入门（七）

VMware实现Windows7虚拟机、kali虚拟机和Windows10本机建立指定文件夹共享文件

Windows设置只允许运行某个或多个软件

windows系统下更新nodejs

windows 7 RTM build 7600.16385安装step by step（虚拟光驱双系统方式）

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

Windows Update 升级补丁错误代码80072EE2

Leetcode题库练习笔记（Medium）美区国区

（Windows系统）详细介绍Windows系统含有英文版