admin 管理员组文章数量: 887007
泰迪杯数据分析比赛2018年B题解答
泰迪杯数据分析比赛2018年B题解答-任务3
任务3-文章目录
- 泰迪杯数据分析比赛2018年B题解答-任务3
- 任务3.1
- 任务3.1全部代码
- 结尾
泰迪杯数据地址: .html#sHref.
泰迪杯数据分析2018年B题任务3题目:
任务 3.1 分析各售货机商品销售数据,总结规律,给出每台售货机饮料类商品的标签,结果保存在 CSV 文件中,文件名分别为 “task3-1A.csv”、 “task3-1B.csv”、…、“task3-1E.csv”,格式如下表所示。
任务 3.2 在任务 3.1 的基础上进行标签拓展,依据标签生成完整的售货机画像,结果保存在 CSV 文件中,文件名分别为“task3-2A.csv”、task3- 2B.csv”、…、“task3-2E.csv”。依据此画像进行总结描述,给出营销意见。
任务3.1
分析各售货机商品销售数据,总结规律,给出每台售货机饮料类商品的标签,结果保存在 CSV 文件中,文件名分别为 “task3-1A.csv”、 “task3-1B.csv”、…、“task3-1E.csv”,格式如下表所示。
目标:得出各售货机商品销售数据,并对各商品进行分类贴标签。
分析:首先我们得对各售货机的各商品销售量进行统计,然后使用聚类算法对商品进行分类。在此聚类算法中,我将会使用KMeans聚类算法。
首先我们需要对A-E五台售货机进行数据整理,将各商品的总实际金额与销售量制作成表单。
实现代码:
import pandas as pd
data=pd.read_csv(r'D:\大数据学习\数据分析与挖掘\B题\task1-A.csv',encoding='gbk')
dalei=data['商品'].unique().tolist()#提取出商品总列表,方便之后进行分类
dalei
datasum=[]
datasem=[]
for i in dalei:data_x=data[data['商品']==i]['实际金额'].sum()data_t=data[data['商品']==i]['商品'].sizedatasum.append(data_x)#插入列表中datasem.append(data_t)
task1_2 = pd.DataFrame({'商品':dalei,'总实际金额':datasum,'销售量':datasem
本文标签: 泰迪杯数据分析比赛2018年B题解答
版权声明:本文标题:泰迪杯数据分析比赛2018年B题解答 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1732354637h1534078.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论