需求

需求是这样的,要统计每一周的各个商品的销售记录,使用 echarts 图表呈现,如下图

image-20210830214556262

说实话,一开始听到这个需求的时候,我是有点慌的,因为 MongoDB 的分组玩的比较少(Mysql 也差不多),又要按照对应的星期来进行分组,这在之前学习 MongoDB 的时候还没接触过,于是就准备写了这篇文章,来记录下我是如何进行分组的

MongoDB 的一些时间操作符

时间操作符(专业术语应该不是这个,后文暂且使用这个来描述),后面会用到的

 $dayOfYear: 返回该日期是这一年的第几天。(全年366天)
 $dayOfMonth: 返回该日期是这一个月的第几天。(1到31)
 $dayOfWeek: 返回的是这个周的星期几。(1:星期日,7:星期六)
 $year: 返回该日期的年份部分
 $month: 返回该日期的月份部分(between 1 and 12.)
 $week: 返回该日期是所在年的第几个星期(between 0 and 53)
 $hour: 返回该日期的小时部分
 $minute: 返回该日期的分钟部分
 $second: 返回该日期的秒部分(以0到59之间的数字形式返回日期的第二部分,但可以是60来计算闰秒。)
 $millisecond:返回该日期的毫秒部分(between 0 and 999.)
 $dateToString:{ $dateToString: { format: <formatString>, date: <dateExpression> } }

日期分组

mongdb 聚合查询日期 统计每天数据

关于日期分组的话,我是借鉴了这篇文章,也确实带我解惑了下如何按照日期分组。这里贴下我的代码

 let list = await this.goodsModel
   .aggregate([
     { $project: { date: { $dateToString: ['$created_at', 0, 10] } } },
     { $group: { _id: '$date', count: { $sum: 1 } } },
     { $project: { date: '$_id', _id: 0, count: 1 } }, // 再使用$project将_id改名为date
     { $sort: { date: -1 } }, // 根据日期倒序
   ])
   .exec();

或者使用时间操作符(更准确一点)

 let list = await this.goodsModel
   .aggregate([
     {
       $project: { date: { $dateToString: { format: '%Y-%m-%d', date: '$created_at' } } },
     },
     { $group: { _id: '$date', count: { $sum: 1 } } },
     { $project: { date: '$_id', _id: 0, count: 1 } }, // 再使用$project将_id改名为date
     { $sort: { date: -1 } }, // 根据日期倒序
   ])
   .exec();

通过

要注意的是,$group 里的属性必须为_id,不然无法分组

获取到的数据如下(这里只显示一周)

 [
   { "count": 54, "date": "2021-08-30" },
   { "count": 29, "date": "2021-08-29" },
   { "count": 16, "date": "2021-08-28" },
   { "count": 17, "date": "2021-08-27" },
   { "count": 12, "date": "2021-08-26" },
   { "count": 6, "date": "2021-08-25" }
   // { "count": 0, "date": "2021-08-24" },
 ]

如果只是日期和总商品的话,上面就足以显示对应的数据了,可我要根据星期进行分组的话,就需要替换 MongoDB 的时间转化函数了

星期分组

星期分组的话,其实也挺简单的,只需要把上面的

 $project: { day: { $dateToString: { format: "%Y-%m-%d", date: "$created_at" } } }

替换成

 $project: {
   week: {
     $dayOfWeek: {
       date: '$created_at';
     }
   }
 }

完整代码如下

 // 要获取的是一周前的零点时间
 let lastweekDay = dayjs(dayjs().add(-7, 'day').format('YYYY-MM-DD')).valueOf();
 ​
 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } }, //范围时间
     { $project: { week: { $dayOfWeek: { date: '$created_at' } } } },
     { $group: { _id: '$week', count: { $sum: 1 } } },
     { $project: { week: '$_id', _id: 0, count: 1 } }, // 再使用$project将_id改名为week
     { $sort: { week: 1 } }, // 根据星期正序
   ])
   .exec();

获取的结果如下

 [
   { count: 29, week: 1 }, // 星期七(日)
   { count: 54, week: 2 }, // 星期一
   { count: 1, week: 3 }, // 星期二
   { count: 9, week: 4 }, // 星期三
   { count: 12, week: 5 }, // 星期四
   { count: 17, week: 6 }, // 星期五
   { count: 16, week: 7 }, // 星期六
 ];

但是,细心的你可能会发现,貌似数据对不上,注当天时间为 2021-08-30,星期一

 [
   { "count": 54, "date": "2021-08-30" }, // 星期一
   { "count": 29, "date": "2021-08-29" }, // 星期七(日)
   { "count": 16, "date": "2021-08-28" }, // 星期六
   { "count": 17, "date": "2021-08-27" }, // 星期五
   { "count": 12, "date": "2021-08-26" }, // 星期四
   { "count": 9, "date": "2021-08-25" }, // 星期三
   { "count": 1, "date": "2021-08-24" } // 星期二
 ]

其实只需要把星期向后排序一位就行,因为星期本来就是将星期日作为第一天的,至此,按照星期分组总商品就算完毕了。同理,要按照月份,年份,甚至小时,分钟,都可以直接利用时间操作符转化时间来进行分组。

多商品

上述只是获取了总商品了,要细分为多个商品的话,就需要再次利用聚合函数来进行分组了。

这里先演示分组多个商品先,就和正常分组一样

 let list = await this.goodsModel.aggregate([
 { $group: { _id: "$type", count: { $sum: 1 } } },
 ]).exec()

结果如下(这里输出_id,是因为没有进行$project 改别名,商品所采用的是数字表示)

 [
   { "_id": 1, "count": 111 },
   { "_id": 2, "count": 18 },
   { "_id": 4, "count": 2 },
   { "_id": 3, "count": 16 }
 ]

可以看到统计的是直接是所有商品的总和。

但问题来了,怎么样能分组星期的同时,又对每个商品所在星期进行分组,并且到底是优先分组星期期呢,还是优先分组商品呢,这让我陷入深深的思考。

最终实现

首先,绝对不可能使用两次$group,要么没有星期分组,要么没有商品分组,于是我就把思路放在$project$group内,看看内部是否有其他方法可以实现。

其中$group可以将属性添加为数组,注意 goods: { $push: "$goods" }

 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } },
     { $project: { week: { $dayOfWeek: { date: '$created_at' } }, goods: 1 } },
     { $group: { _id: '$week', goods: { $push: '$goods' } } },
     { $project: { week: '$_id', _id: 0, goods: 1 } },
     { $sort: { week: 1 } },
   ])
   .exec();

可得到的数据却是这样的

 [
   {
     "goods": [4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 4, 1, 1, 1, 1, 1, 1, 1],
     "week": 1
   },
   {
     "goods": [1, 1, 1, 1, 5, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 4, 1, 1, 1, 1, 1, 4, 1, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
     "week": 2
   },
   {
     "goods": [1],
     "week": 3
   },
   {
     "goods": [3, 3, 3, 3, 3, 3, 3, 3, 4],
     "week": 4
   },
   {
     "goods": [3, 1, 1, 1, 3, 4, 1, 1, 1, 1, 1, 1],
     "week": 5
   },
   {
     "goods": [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 3, 3, 1, 1, 1, 1, 1],
     "week": 6
   },
   {
     "goods": [4, 3, 1, 1, 3, 3, 3, 3, 3, 1, 1, 1, 1, 1, 1, 1],
     "week": 7
   }
 ]

数据很接近了,如果我能把对应的商品总和算起来就行了,但问题是怎么合起来。。。

待会,goods 既然是数组的话,那我能不能$unwind全部展开,然后我再来一次聚合,说干就干!

 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } },
     { $project: { week: { $dayOfWeek: { date: '$created_at' } }, goods: 1 } },
     { $group: { _id: '$week', goods: { $push: '$goods' } } },
     { $project: { week: '$_id', _id: 0, goods: 1 } },
     { $sort: { week: 1 } },
     { $unwind: '$goods' },
   ])
   .exec();

得到的数据(省略一堆)

 [
   { "goods": 4, "week": 1 },
   { "goods": 4, "week": 1 },
   { "goods": 1, "week": 1 },
   { "goods": 1, "week": 1 },
   { "goods": 1, "week": 2 },
   { "goods": 1, "week": 3 },
   { "goods": 1, "week": 4 }
 ]

然后我就卡住了,因为我无论如何都无法分组一个字段的时候,又加以限制条件,要么分组商品的时候,统计的是一周各商品总数据,要么就是分组星期的时候,统计的是总的商品数据。在搜索大量资料后,查看官方一些文档也未果,于是我决定自行写一个 js 函数来进行排序(实在是折腾不动了,能力有限 🥱)

最终完整代码

 let lastweekDay = dayjs(dayjs().add(-7, 'day').format('YYYY-MM-DD')).valueOf();
 ​
 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } },
     { $project: { week: { $dayOfWeek: { date: '$created_at' } }, goods: 1 } },
     { $group: { _id: '$week', goods: { $push: '$goods' } } },
     { $project: { week: '$_id', _id: 0, goods: 1 } },
     { $sort: { week: 1 } },
     // { $unwind: "$goods" },
   ])
   .exec();
 ​
 function getEleNums(data) {
   var map = {};
   data.forEach((e) => {
     if (map[e]) {
       map[e] += 1;
     } else {
       map[e] = 1;
     }
   });
   return map;
 }
 ​
 list = list.map((l) => {
   l.goods = getEleNums(l.goods);
   return l;
 });
 cosnole.log(list);

运行后的 list 结果为

 [
   { "goods": { "1": 26, "4": 3 }, "week": 1 },
   { "goods": { "1": 53, "4": 3, "5": 1 }, "week": 2 },
   { "goods": { "1": 1 }, "week": 3 },
   { "goods": { "3": 8, "4": 1 }, "week": 4 },
   { "goods": { "1": 9, "3": 2, "4": 1 }, "week": 5 },
   { "goods": { "1": 15, "3": 2 }, "week": 6 },
   { "goods": { "1": 9, "3": 6, "4": 1 }, "week": 7 }
 ]

如果是要 goods为分组的话,只需要把上面聚合代码中week和goods替换一下便可。

另一种实现方式

专门新建一个表,用于统计每天的销售记录,然后分组的时候就根据该表就行了,具体代码就实现了,思路是挺简单的,但是需要新建一个表,增加记录的时候有需要增加代码,如果业务复杂的话。。。

原文链接:MongoDB按时间分组 - 愧怍的小站 (kuizuo.cn)

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐