dc.js和crossfilter降低了一周中每天的平均计数

dc.js and crossfilter reduce average counts per day of week

本文关键字:每天 一周 js crossfilter dc      更新时间:2023-09-26

我很难正确设置交叉过滤器组。也许有人可以暗示一下!

我的数据结构看起来或多或少是这样的:

{datetime: "2014-01-01 20:00:00", id:1}
{datetime: "2014-01-01 22:21:08", id:2}
{datetime: "2014-01-02 12:00:23", id:3} etc...

维度是返回星期几的日期时间:

var weekdayDimension = ndx.dimension(function(d) {
    return new Date(d.datetime).getDay();
});

现在我对分组有问题。我想要每个工作日的平均事件数。到目前为止,我有(当然没有正确的)

var weekdayAvgGroup = weekdayDimension.group(function (d) {
    return d;
});

我想我不明白这个小组到底在做什么。。。

我的目标是有一些图表,比如:

Monday => Average 40.3 Events
Tuesday => Average 35.4 Events

我创建了一个JSFiddle,请看一看。

有人能暗示一下吗?

更新:

经过进一步思考,我可以在Date上创建一个维度。我所要做的就是知道为了计算而选择的天数

(total amount of events selected/number of selected days)

因此,我需要计算日期维度上的组数。但是还没有找到解决这个问题的办法。

感谢

带注释的股票示例显示了如何进行平均:http://dc-js.github.io/dc.js/docs/stock.html

基本上,您将使用自定义的reduce函数,保持一个计数和一个和,并将和除以计数(如果计数大于零)以获得平均值。

Reduction也让这变得非常容易:https://github.com/esjewett/reductio

编辑:回过头来看,我注意到你指的是一周中每一天的唯一日期的汇总计数的平均值。

我知道已经太晚了,但既然我们有很多这样的"二级汇总"问题,我想我应该回答这个问题,以防它对其他人有帮助。

因此,我们的结果应该在一周中的某一天对数据进行分类,因此我们将相应地设置维度和组:

// dimension on day of week
var dim1 = ndx.dimension(function(d) {
    return d[0].getDay();
});
// group on day of week
var grp1 = dim1.group().reduce(
    ... // what goes here?
);

但是我们如何进行二级聚合呢?crossfilter已经能够高效地提供一周中每一天的所有条目。我们需要做的是计算每个唯一日期的条目。

我们可以使用d3.map。我们将首先使用d3.time.day来删除一天中的时间信息,然后使用.getTime()来获得我们可以索引的整数。然后d3.map创建"所有周一"、"所有周二"的bin:

var grp1 = dim1.group().reduce(
    function(p, v) { // add
        var day = d3.time.day(v[0]).getTime();
        p.map.set(day, p.map.has(day) ? p.map.get(day) + 1 : 1);
        p.avg = average_map(p.map);
        return p;
    },
    function(p, v) { // remove
        var day = d3.time.day(v[0]).getTime();
        p.map.set(day, p.map.has(day) ? p.map.get(day) - 1 : 0);
        p.avg = average_map(p.map);
        return p;
    },
    function() { // init
        return {map: d3.map(), avg: 0};
    }
);    

最后,我们将使用以下函数计算d3.map中所有仓的平均值:

function average_map(m) {
    var sum = 0;
    m.forEach(function(k, v) {
        sum += v;
    });
    return m.size() ? sum / m.size() : 0;
}

每次添加一天时遍历d3.map可能效率不高,因此对average_map的调用可能会移动到我们将在图表中使用的valueAccessor中。我将把它作为练习。

这是一把小提琴,展示了这项技术:http://jsfiddle.net/gordonwoodhull/0woyhg3n/11/

并应用于原始小提琴:http://jsfiddle.net/gordonwoodhull/pkh03azq/6/