SparkSql-FreeNAS中文网

admin 管理员组

文章数量: 887044

SparkSql

2020.12.08号作业题

1.启动redis

redis-server /usr/local/redis/redis.conf

2.写代码

问题1.计算出总的成交量总额（结果保存到redis中）
问题2.计算每个商品分类的成交量（结果保存到redis中）
问题3.计算每个省份的成交总额（结果保存到redis）

object Work {def main(args: Array[String]): Unit = {Logger.getLogger("org").setLevel(Level.WARN)//1.连接redisval pool: JedisPool = new JedisPool(new GenericObjectPoolConfig, "qianfeng01", 6379)val jedis: Jedis = pool.getResourcejedis.auth("123456")//2.拿到数据val spark: SparkSession = SparkSession.builder().appName("work").master("local").getOrCreate()import spark.implicits._val df: DataFrame = spark.read.format("csv").load("data/producer.csv")val df1: DataFrame = df.toDF("id", "ip", "producer", "type", "price","province")df1.printSchema()df1.createTempView("t1")//问题1.计算出总的成交量总额（结果保存到redis中）val sql="""|select sum(cast(price as int)) as sum|from t1|""".stripMargin//spark.sql(sql).show()val frame: DataFrame = spark.sql(sql)val rows: Array[Row] = frame.collect()for(a<-rows){//保存到redisjedis.set("总的成交量总额",a.get(0).toString)}//问题2.计算每个商品分类的成交量（结果保存到redis中）val sql1="""|select producer,sum(cast(price as int)) as sum|from t1|group by producer|""".stripMarginval frame1: DataFrame = spark.sql(sql1)frame1.show()val rows1: Array[Row] = frame1.collect()for(b<-rows1){//保存到redisjedis.set(b.get(0).toString,b.get(1).toString)}//问题3.计算每个省份的成交总额（结果保存到redis）val sql2="""|select province,sum(cast(price as int)) as sum|from t1|group by province|""".stripMarginval frame2: DataFrame = spark.sql(sql2)frame2.show()val rows2: Array[Row] = frame2.collect()for(row<-rows2){//保存到redisjedis.set(row.get(0).toString,row.get(1).toString)}}}

3.参考数据

A0001,202.106.196.115,手机,iphone8,8000,海南省
A0002,202.106.196.116,服装,Tshirt,450,湖南省
A0003,202.106.196.117,药品,阿莫西林,40,广东省
A0004,202.106.196.118,药品,板蓝根,23,湖北省
A0005,202.106.196.119,手机,iphone9,8000,海南省
A0006,202.106.196.120,服装,Tshirt,320,海南省
A0007,202.106.196.121,药品,阿莫西林,40,湖北省
A0008,202.106.196.122,药品,板蓝根,23,湖北省
A0009,202.106.196.123,手机,iphone10,8000,湖北省
A0010,202.106.196.124,服装,Tshirt,450,湖北省
A0011,202.106.196.125,药品,阿莫西林,40,湖北省
A0012,202.106.196.126,药品,板蓝根,23,广东省
A0013,202.106.196.127,手机,iphone11,8000,湖南省
A0014,202.106.196.128,服装,Tshirt,450,湖南省
A0015,202.106.196.129,药品,阿莫西林,40,湖南省
A0016,202.106.196.130,药品,板蓝根,23,湖南省
A0017,202.106.196.131,手机,iphone12,9999,广东省
A0018,202.106.196.132,服装,Tshirt,340,湖南省

4.pom坐标

   <dependencies><dependency><groupId>org.apache.spark</groupId><artifactId>spark-streaming_2.11</artifactId><version>2.2.3</version></dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-streaming-kafka-0-10_2.11</artifactId><version>2.2.3</version></dependency><dependency><groupId>redis.clients</groupId><artifactId>jedis</artifactId><version>3.0.0</version></dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-core_2.11</artifactId><version>2.2.3</version></dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-sql_2.11</artifactId><version>2.2.3</version></dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-hive_2.11</artifactId><version>2.2.3</version></dependency><dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactId><version>5.1.28</version></dependency></dependencies>

本文标签： SparkSql

版权声明：本文标题：SparkSql 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1688394029h214685.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

SparkSql

SparkSql

1.启动redis

2.写代码

3.参考数据

4.pom坐标

更多相关文章

SparkSql

sparkSQL清洗埋点数据（java版）

发表评论

推荐文章

Python新冠疫情可视化分析系统—计算机毕业设计附源码08504

Windows10版本介绍

如何检查笔记本电脑是否支持USB3.0接口_百度知道

windows环境下利用bochs写一个简单的操作系统（Boot Sector)

windows 下载启动redis

热门文章

中信集团协同委员会山西区域分会召开2023年年中工作会议暨“转型金融”主题宣讲会

校验银行卡号是否正确

EXCEL2010打开多窗口

AsyncTask、Json、Spinner练习

6个最好用的网盘资源搜索引擎，大汇总！

NOI2012 骑行川藏解题报告

[数据结构]手写循环队列解决滑动窗口问题

移动端浏览器UA大全合集18248个

如何避免计算机被别人共享,win7如何防止别人偷窥电脑 win7防止别人偷窥电脑操作方法...

iZotope RX 11 for Mac 激活版：让您的音频焕发生机！

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Win11安全中心删除的文件如何恢复？

Win11怎么创建虚拟磁盘？Win11创建虚拟磁盘的方法

Deepin操作系统安装及系统相关设置

华为MateBook E Go Wi-Fi性能版(GK-W78、GK-W76)工厂模式win11原厂系统包,含F10智能恢复功能

【PC工具】win10关闭自带杀毒软件，win10关闭安全软件方法

技术交流 – FreeNAS中文网

SparkSql

SparkSql

1.启动redis

2.写代码

3.参考数据

4.pom坐标

更多相关文章

SparkSql

sparkSQL清洗埋点数据（java版）

发表评论

推荐文章

Python新冠疫情可视化分析系统—计算机毕业设计 附源码08504

Windows10版本介绍

如何检查笔记本电脑是否支持USB3.0接口_百度知道

windows环境下利用bochs写一个简单的操作系统（Boot Sector)

windows 下载启动redis

热门文章

中信集团协同委员会山西区域分会召开2023年年中工作会议暨“转型金融”主题宣讲会

校验银行卡号是否正确

EXCEL2010打开多窗口

AsyncTask、Json、Spinner练习

6个最好用的网盘资源搜索引擎，大汇总！

NOI2012 骑行川藏 解题报告

[数据结构]手写循环队列解决滑动窗口问题

移动端浏览器UA大全 合集18248个

如何避免计算机被别人共享,win7如何防止别人偷窥电脑 win7防止别人偷窥电脑操作方法...

iZotope RX 11 for Mac 激活版：让您的音频焕发生机！

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Win11安全中心删除的文件如何恢复？

Win11怎么创建虚拟磁盘？Win11创建虚拟磁盘的方法

Deepin操作系统安装及系统相关设置

华为MateBook E Go Wi-Fi性能版(GK-W78、GK-W76)工厂模式win11原厂系统包,含F10智能恢复功能

【PC工具】win10关闭自带杀毒软件，win10关闭安全软件方法

Python新冠疫情可视化分析系统—计算机毕业设计附源码08504

NOI2012 骑行川藏解题报告

移动端浏览器UA大全合集18248个