数据包络分析期望效率--DDF（方向距离函数）

DDF方向距离函数--文献文献介绍内容介绍方向距离函数DDF定义效率评估Directional calculation method(DVS)三级目录文献介绍文献名字是：Expected efficiency based on directional distance function in data envelopment analysis。首先，这篇文章是在2018年computerIndus

sylvia-xy

10797人浏览 · 2021-07-09 13:38:39

sylvia-xy · 2021-07-09 13:38:39 发布

DDF方向距离函数--文献

文献介绍
内容介绍

文献介绍

文献名字是：Expected efficiency based on directional distance function in data envelopment analysis。

在这里插入图片描述
首先，这篇文章是在2018年 $c o m p u t e r I n d u s t r i a l E n g i n e e r i n g$ 上发表的，还有李勇军老师!!!
这篇文章偏模型，是期望DDF模型，有兴趣的朋友可以看看。

内容介绍

方向距离函数DDF定义

首先，方向距离函数。也就是 $D D F$ 函数，是一种不受径向限制的、沿预先确定的方向向量估计决策单元相对效率的方法。

比如说，有 $n$ 个 $DMU_s$ ，且投入变量与产出变量分别用矩阵表示为 $X=(x_{ij})\in\Re^{m\times n}$ 和 $Y=(y_{rj})\in\Re^{s\times n}$ 。本文假设规模报酬是可变的，即是 $V R S$ 的，那么此时的生产可能集就变成：
$T=\lgroup(x_i,y_r)\vert\sum_{j}\lambda_jx_{ij}\leq{x_i},i=1,\dots,m,\sum_{j}\lambda_jy_{rj}\ge{}y_r,r=1,\dots,s,\sum_{j}\lambda_j=1,\lambda_{}j\ge0,j=1,\dots,n\rgroup$

把方向向量记作 $g=(-g_x,g_y)\ne0_{m+s},g_x\in{}R_{+}^{m},g_y\in{}R_{+}^{s}$ ，那么这个方向距离函数可以表示成：
$\vec{a}_T(x,y；g)=sup\{\beta: (x-\beta{}g_x, y+\beta{}g_y)\in{}T\}$

那么，接下来，给出最初始的 $D D F$ 模型：
$\beta\\s.t.\sum_{j=1}^{n}\lambda_jx_{ij}\leq{}x_{i0}-\beta{}g_x,i=1,\dots,m \\\sum_{j=1}^{n}\lambda_{j}y_{rj}\geq{}y_{r0}+\beta{}g_y,r=1,\dots,s\\\sum_{j=1}^{n}\lambda_{j}=1,j=1,\dots,n\\\lambda_j\ge0,\beta\ge0$

在上述模型中， $\beta$ 是用来衡量无效率的一个变量。当 $\beta=0$ 时候，意味着 $DMU_{0}$ 是有效的。但是存在着一个问题，方向向量 $g=(-g_x,g_y）$ 是可以任意选择的。（针对这一点，文献中用期望效率来解决。）

效率评估

如果按着上述公式，只看 $\beta=0$ 的值就进行是否有效的判断，是不合理的。因为 $\beta=0$ 的大小受方向向量大小的影响，若有些方向向量取得过小，可能会导致 $\beta>1$ 。

为解决这个问题，针对方向向量 $g=(-g_x,g_y),g_x\in{R_{+}^{m}},g_y\in{R_{+}^{s}},\forall{i,r}$ ，目标函数改为：

$\theta_{0}=\frac{1-\frac{1}{m}\sum_{i=1}^{m}\beta{\frac{g_{xi}}{x_{i0}}}}{1+\frac{1}{s}\sum_{r=1}^{s}\beta{\frac{g_{yr}}{y_{r0}}}}$

其中， $\beta{\frac{g_{xi}}{x_{i0}}}$ 和 $\beta{\frac{g_{yr}}{y_{r0}}}$ 分别是缩小投入的比例及扩大产出的比例。

基于新的目标函数，上述模型公式可转变成为：

$\theta_{0}=\frac{1-\frac{1}{m}\sum_{i=1}^{m}\beta{\frac{g_{xi}}{x_{i0}}}}{1+\frac{1}{s}\sum_{r=1}^{s}\beta{\frac{g_{yr}}{y_{r0}}}}\\s.t.\sum_{j=1}^{n}\lambda_jx_{ij}\leq{}x_{i0}-\beta{}g_x,i=1,\dots,m \\\sum_{j=1}^{n}\lambda_{j}y_{rj}\geq{}y_{r0}+\beta{}g_y,r=1,\dots,s\\\sum_{j=1}^{n}\lambda_{j}=1,j=1,\dots,n\\\lambda_j\ge0,\beta\ge0$

考虑到单位不变这个性质，这篇文献中是对原始数据做了归一化处理。由于在目标函数中，原始数据会作为分母进行运算，因此，处理的原则就是，数据不可以变为0。
归一化处理一般的有三种方式。这里只提及文献中所说的，令：
$\widehat{x}_{ij}=\frac{x_{ij}}{\mathop{max}\limits_{j}{x_{ij}}},\widehat{y}_{rj}=\frac{y_{rj}}{\mathop{max}\limits_{j}{y_{rj}}},i=1,\dots,m；r=1,\dots,s；j=1,\dots,n$

由于原始数据的改变，那么对应模型公式的符号作出相应的变化：
$\theta_{0}=\frac{1-\frac{1}{m}\sum_{i=1}^{m}\beta{\frac{g_{xi}}{\widehat{x}_{i0}}}}{1+\frac{1}{s}\sum_{r=1}^{s}\beta{\frac{g_{yr}}{\widehat{y}_{r0}}}}\\s.t.\sum_{j=1}^{n}\lambda_j\widehat{x}_{ij}\leq{}\widehat{x}_{i0}-\beta{}g_x,i=1,\dots,m \\\sum_{j=1}^{n}\lambda_{j}\widehat{y}_{rj}\geq{}\widehat{y}_{r0}+\beta{}g_y,r=1,\dots,s\\\sum_{j=1}^{n}\lambda_{j}=1,j=1,\dots,n\\\lambda_j\ge0,\beta\ge0$

文献中还特别提及，此时，不管方向向量取值多少，都不会改变目标函数的值。（若有兴趣看证明，可自行查阅文献，打公式太累了）

Directional calculation method(DVS)

这块知识，涉及到了辛钦大数定律的知识。

文献中简单介绍了DVS的内容：
$\widehat{U}$ 作为欧几里得空间非负象限中的所有单位向量的集合，是以圆点为中心，半径为1的向量集合，是无限集合。并且把 $\widehat{E}$ 作为从 $\widehat{U}$ 中均匀抽取的集合，这个 $\widehat{E}$ 就被叫做方向向量集合，是有限集合。

只要样本量足够大， $\widehat{E}$ 的集合接近 $\widehat{U}$ 。

核心思想就是：方向向量均匀取值得足够多，也就是方向向量旋转角度足够小，计算出来的效率值就接近真实期望值。

具体算法

这里只介绍三位情况：
对于三维情况，也就是两个投入、一个产出时， $\widehat{U}^{3}=\lbrace{(v_1,v_2,v_3)|0\leq{}v_1,v_2,v_3\leq{}1}\rbrace$ ，这是一个三维空间上非负象限里以圆点为中心，半径为1的球体部分。如图：
在这里插入图片描述

step1: 令 $v_1=\sin(d*\phi),d=0,1,2,\dots,\pi/2\phi$ ，其中 $\phi$ 是旋转区间角度。
step2:当 $d = 0$ 时，那么令 $v_1=0$ 。如果 $(l*\phi)/\sqrt{1-(\sin^2(d*\phi))}>\pi/2$ ，那么 $v_2=\sqrt{1-v_1^{2}}$ 并且 $v_3=0$ ；或者说如果 $v_1^{2}+(\sqrt{1-\sin^2(d*\phi)}*\sin(l*\phi/\sqrt{1-\sin^2(d*\phi)}))^2\le1$ ，那么令 $v_2=\sqrt{1-\sin^2(d*\phi)}*\sin(2\sin^{-1}(\sin{(l*\phi/2})/\sqrt{1-\sin^2(d*\phi)}))$ ，并且如果 $1-v_1^2-v_2^2>0$ ，那么 $v_3=\sqrt{1-v_1^2-v_2^2}$ 。当 $l=0,1,2,\dots,\pi/2\phi$ ，遍历step2。
step3:当 $d=0,1,2,\dots,\pi/2\phi$ 遍历步骤2。