2019年全国大学生数学建模E题

2019年全国大学生数学建模E题

基于数据挖掘的薄利多销

摘要

“薄利多销”的规则广泛应用于商家的销售规则中,通过打折来实现商品销量的增加,从而获取利益,本篇论文将对这个“薄利多销”这个问题进行研究,利用python、Excel、IBM SPSS22等工具对问题进行分析,从而算出营业额、利润率、打折力度并用回归分析建立打折力度与商品销售额和利润率的统计模型。

问题1计算该商场从2016年11月30日到2019年1月2日每天的营业额和利润率(注意:由于未知原因,数据中非打折商品的成本价缺失。一般情况下,零售商的利润率在20%-40%之间)。针对问题1,通过python中pandas、Excel、IBM SPSS22对附件1、附件2中的异常值、缺失值进行数据预处理,并通过零售商利润率在20%-40%补全未打折的商品成本价,再通过SSPS22、Excel算出每天的营业额以及利润率,在画出营业额与利润率的透视图并发现隐藏信息,得到商场应在节假日或者双休加强打折力度,从而实现“利薄多销”。

问题2 建立适当的指标衡量商场每天的打折力度,并计算该商场从2016年11月30日到2019年1月2日每天的打折力度。对问题2

问题3分析打折力度与商品销售额以及利润率的关系。对问题3

关键词:SSPS22、数据预处理、数据挖掘

1问题描述

“薄利多销”是通过降低单位商品的利润来增加销售数量,从而使商家获得更多盈利的一种扩大销售的策略。对于需求富有弹性的商品来说,当该商品的价格下降时,如果需求量(从而销售量)增加的幅度大于价格下降的幅度,将导致总收益增加。在实际经营管理中,“薄利多销”原则被广泛应用。

附件1和附件2是某商场自2016年11月30日起至2019年1月2日的销售流水记录,附件3是折扣信息表,附件4是商品信息表,附件5是数据说明表。请根据这批数据,建立数学模型解决下列问????

1.计算该商场从2016年11月30日到2019年1月2日每天的营业额和利润率(注意:由于未知原因,数据中非打折商品的成本价缺失。一般情况下,零售商的利润率在20%-40%之间)。

2.建立适当的指标衡量商场每天的打折力度,并计算该商场从2016年11月30日到2019年1月2日每天的打折力度。

3.分析打折力度与商品销售额以及利润率的关系。

4.如果进一步考虑商品的大类区分,打折力度与商品销售额以及利润率的关系有何变化?

2分析问题

2.1对数据进行分析

第一步检查数据是否存在空值、缺失值、异常值,例如商品的UPC码存在缺失值,因为UPC码对问题的研究影响不大,可以直接剔除,商品的数量sku_cnt存在负值,这很有可能是人工误填的,可以直接剔除,商品的名称sku_name存在部分缺失,商品的名称对问题的研究影响较大,我们应该补全商品的名称。

2.2对问题分析

问题一要求计算出每天的营业额以及利润率,首先利用python、Excel对数据进行预处理之后,题目描述未打折的商品成本价已经缺失,可以根据零售商的20%对未打折的商品的成本价格进行填补,通过Excel按利润的20%计算出未打折商品的成本价,再把Excel中的数据导入到SSPS22中,根据营业额公式以及利润率公式计算出每天营业额和利润率。

对问题二,我们可以通过Excel计算出打折力度,然后建立数据透视图,从而更好的研究打折力度的。

对问题三,可以通关SPSS22导入数据,调用回归分析,判断是否共线,从而求出相关系数,确定回归模型。

3符号说明

符号含义单位
Zi第i天的折扣率%
Yi第i天的售出商品总门店价
Xi第i天的售出商品总销售价
yij第i天第j个商品门店价
xij第i天第j个商品销售价
Ci第i天的营业额
Ri第i天的利润率
Bi第i天的售出商品总成本价
bij第i天第j个商品的成本价

4模型建立与求解

4.1数据预处理

通过python、Excel、SSPS22对附件1、2的商品销售记录的分析,发现其存在无关数据、异常数据、缺失数据,因此首先要进行数据预处理工作。

4.1.1消除无关数据

通过python发现附件1、2存在未交易完成的订单,即属性is_finished的属性值为0,因此我们应该消除这些与主题无关的数据,如图所示:

在这里插入图片描述


图4.1.1消除订单未完成的数据
4.1.2删除异常数据

通过python发现附件1、2中商品的销数量存在问题,即sku_cnt存在负值,这很有可能是人工误写导致的,因此我们可以利用python将这些数据进行删除。如图所示:

在这里插入图片描述


图4.1.2商品数量异常值的清除

4.1.3异常数据的修改

通过Excel发现附件1、2中商品名称存在部分缺失,商品名称对我们的主题比较重要,所以我们应该根据商品的id(即附件4里面的商品名)来补全附件1、2的商品的名称,商品名称缺失的29个,占总数目的0.028%。通过Excel操作如图所示:
第一步筛选出附件1、2中商品名称缺失的数据:

在这里插入图片描述
在这里插入图片描述
第二步根据商品ID通过附件4筛选出商品名称:

在这里插入图片描述在这里插入图片描述第三步补全商品名称

4.1.4缺失数据的清除

通过Excel发现商品的upc_code存在缺失和异常,upc_code对主题的研究影响不大,因此我们可以通过Excel直接将其进行剔除,缺失和异常数据为98764,占比8.08%,如图所示:
第一步筛选出异常和缺失的upc_code:

在这里插入图片描述
在这里插入图片描述
第二步进行删除即可。

4.1.5对成本价补全

由题目描述知附件1、2中未打折的商品成本已经缺失,因此我们可以可以根据题目给出的一般商品销售利润在20%~40%之间,我们通过商品的40%销售利润进行计算,从而补全商品的成本价,通过Excel价附件1、2进行补全,销售利润率=(售价-成本)/售价,如图是补全后的商品成本价的数据:

在这里插入图片描述
图4.1.5部分商品成本价的补全图

4.2计算每天的营业额与利润

营业额的计算公式:

4.2.1利用SPSS22

利用SPSS22求营业额如下图所示

1.打开数据集附件1、附件2

在这里插入图片描述

2.将附件1、附件2合并,步骤如下图所示:

在这里插入图片描述

3.选择个案→选择条件满足→输入is_finshed* sku_cnt* sku_sale_prc→单击确定

在这里插入图片描述

4.部分营业额报表

在这里插入图片描述

4.2.2对日营业额进行分析

通过SPSS22将合并之后的数据集存为csv格式的,通过Excel创建数据透视图,如图所示:

在这里插入图片描述2016年营业额销售总额

在这里插入图片描述
2017年营业销售总额

在这里插入图片描述2018年营业销售总额

通过上述图片的分析可之峰值大部分是在周末或者节假日,在周末的时候商场应该打折或者举行其他方式的促销,吸引消费者,促进销量,从而减少库存,2017年、2018年营业销售总额在双11期间达到了最高峰值,其他峰值也是在周末或者其节假日,因此在节假日或者周末对需求量大的商品举行促销活动是有必要,加大促销,从而吸引消费者,提升商场人气,使消费者对商场产生依赖性,从而达到“薄利多销”的目的。

4.2.2营业额进一步分析

在这里插入图片描述
由于2016年只有12月的营业额、2019年只有1月份的营业额,所以只用考虑17、18年的月营业额,通过分析17、18年的月营业额,大部分七八月与九十月,即夏季和秋季,因此商场应该在夏季、秋季多举行促销活动,吸引消费者,从而促进销量,实现“薄利多销”。

4.2.3利润率的计算

通过Excel先计算出每天的销售额和成本,从而计算出每天的利润率,日销售额、日成本价以及日利润率,下面给出16、17、18、19年的日销售额、日成本价以及日利润率图(由于17、18篇幅过大,只展示部分):

在这里插入图片描述
在这里插入图片描述
通过Excel分析可知,四年日利润最大的为0.343047871610809,最小日利润为0.159053555003839,平均日利润为0.2399863105,由前文的营业额的计算可知17年的年营业额4914427.41999995,18年的年营业额为14513558.2400001,17年小于18年的营业额,18年的年利润比17年的大,但是18年的平均年利润率小于17年的平均年利润率,通过分析可知18年商场采取了“薄利多销”的方式,降低商品价格,从而增大商品的销售数量,可以得出结论,商场只要控制商品需求幅度大于商品价格下降幅度,从而可以从中获得比较大的利润。如下是利用Excel绘制的17、18年日利润率的折线图:

在这里插入图片描述

从图中分析可知,每天的利润率在不断波动,在节假日或者周末时,这天的利润率会出现较低的值,但是这天的润率却是个高值,例如在17年的12月11日、12月12日这两天的日利润率分别为0.211729774420964、0.167206955906349,日利润分别为3032.0719999999、7106.8240000006,由此可见12日的利润率低于11日的,但利润却高于11日的,所以商场应在周末或者节假日加大促销力度,以较低的利润率从而扩大商品的销售量,吸引消费者的购买欲望,导致整体收益变大,实现“薄利多销”。

4.2.4营业额与利润率的关系

通过Excel绘画出2017年、2018年营业额与利润率的趋势,如下图所示:

在这里插入图片描述
通过分析可知营业额的趋势大体上和利润率的趋势相反,当利润率降低时,营业额升高,由此可知可以降低商品的利润率,从而增大商品的销量,商品销量增大幅度大于商品利润率下降的幅度,导致商品的利润与营业额提升。所以我们应该找到销量增加幅度与利润率下降幅度的一个平衡点颇为重要,后面会研究如何找个这个平衡点。

4.2计算每天的打折力度

折扣力度Zi =(Yi-Xi)/Yi,(i=1,2,...,n),其中Zi为第i天折扣率,Yi为第i天的总门店价,Xi为第i天的总销售价。

4.2.3利用Excel计算出打折率

通过Excel的数据透视表分别计算出16、17、18、19年打折率,如图所示(由于17、18篇幅过大,所以只给部分)

在这里插入图片描述
在这里插入图片描述
通过分析四年中日打折率最高为:0.213152834104453,最低为;0.0336249558147755,商场每天都会打折,在周末和节假日打折力度会加强,因此我们利用Excel画出数据透视图来分析,如图所示:

在这里插入图片描述
在这里插入图片描述
通过分析在四年的商品日折扣率都在不断变化,在2016年末的时候商品折扣率不断增加,因为年底冲业绩以及春节的原因导致折扣率的增加,2017年前期波动较大,后期趋向平稳尤其是在春节后,商场的打折力度到达最高,给顾客最大折扣,从而促进销量,18年的折扣力度变化趋势波动整体平稳,得知18年主要是以打折为主的促销方式。所以商场应该以需求量较大的商品举行全年促销活动,扩大销售额。

4.3打折力度与销售额及利润率的关系
4.3.1分析打折率与销售额及利润率的关系

通过Excel画出月平均打折率与月销售额的折线图以及月平均打折率与月平均利润率的折线图,如图所示:

在这里插入图片描述
通过分析发现打折率与利润率存在负相关的线性关系,而与销售额存在正相关的线性关系,观察可知商场当月打折率维持在商场第18个到第26个月的利润率达到较大,销售额比较大,从而预测只要折扣率维持在0.134433988369119到0.140814005669584之间,商场收益是最高的。

4.3.2利用SPSS22确定三者关系

利用SPSS22来对折扣率、销售额、利润率做线性回归,步骤如下:

第一步导入数据到SPSS22,如下图所示:

在这里插入图片描述
第二步:选择→分析,选择回归→线性,因变量选择日折扣率,自变量选择日利润率与日营业额,点击Statistics按钮,选择共线性诊断,再点击绘图,勾选所有图,如下所示

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
共线性判断方法有如下三种:

判断方法1:特征值,存在维度为3和4的值约等于0,说明存在比较严重的共线性。

判断方法2:条件索引列第3第4列大于10,可以说明存在比较严重的共线性。

判断方法3:比例方差内存在接近1的数(0.99),可以说明存在较严重的共线性。

在这里插入图片描述
共线性诊断图

由上图知,维度2、3的特征值接近于0,且条件指标大于10,比例方差接近于1,因此可以得出结论折扣率与利润率、销售额存在严重的共线性。

由SPSS22得到的相关系数以及残差等如图所示:

在这里插入图片描述
回归系数图

在这里插入图片描述

在这里插入图片描述
残差统计直方图

在这里插入图片描述
预测折扣率与实际折扣率曲线图

在这里插入图片描述
折扣率与利润率回归图

在这里插入图片描述

折扣率与营业额回归图

通过以上分析从而得出折扣率与利润率、销售额共线两个标准化的系数分别为分别为-0.732196和0.219598,以及常数项0.265540,因此可以建立回归的线性模型为:
y=0.265540-0.725758x1+0.2195982

5模型评价

5.1模型优点

1.对数据进行预处理时,采用了不同的方法进行处理。

2.问题一中,对每天影响营业额和利润率情况的分析比较透彻,给出了合理的建议。

3.解决问题二,给出了合理的衡量指标。

4.问题三给出了不同折扣率对商场盈利的影响。

5.数据透视表给出了营业额等属性的分布规律。

5.2模型缺点

1.问题中只采取了一种指标来衡量打折力度。

2.没有更深层次挖掘其隐含信息。

附件:

软件工具Excel2018、IBM SPSS Statistics 22 Anaconda
问题三:SPSS运行代码求相关系数截图

在这里插入图片描述

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐