可以在恒定内存中对低维数据进行聚类
Possible to clustering low dimensional data in constant memory?
我希望将一些非常低维(2或3)的数据聚类为少量的聚类(<25)。我拥有的实例数量非常大(100M+的数量级)。我可以从数据库流式传输这些数据(并可能在每次传递时重新流式传输),但希望避免将整个集合带入内存。[如果我必须把它带到内存中,我希望它尽可能提高内存效率]
我正在寻找一种满足这些要求的算法(最好是Javascript实现)。
谢谢!
看看MacQueens k-means算法,它能很好地处理流数据,而且实现起来很简单。
哦,它从60年代左右就已经存在了。
但也要注意,您还可以在数据集的代表性样本上运行它。最有可能的是,结果不会有实质性的不同。数量不会改变统计学上的东西,比如意义很大。
相关文章:
- 开放层 3 ,聚类多边形或线
- 如何在不与谷歌地图重叠的情况下对标记进行聚类
- 单击过滤器后重新计算标记聚类
- 传单:如何使用聚类从不同图层的下拉菜单中选择标记
- 开放层,更改聚类标记
- 如何使用图层应用传单标记聚类
- 标记聚类不显示点
- 使用 JavaScript 向 HTML 添加数据、类和样式
- 我什么时候应该在 JavaScript 中使用数据类型类
- D3.js具有大(>500,000)点的散点图?聚类
- 在谷歌地图v3 API中使用信息窗口进行聚类标记
- 标记和聚类的问题
- JQuery 字符串“随机发生器”聚类字符
- 标记聚类器,也在 1 个标记处聚类
- Google 地图 API V3:从聚类分析中排除单个标记
- 基于点的聚类可在任何给定时间查找图钉聚类纬度经度
- 如何更改传单标记聚类扩展的单个标记节点图标
- 可以在恒定内存中对低维数据进行聚类
- 寻找一种算法来聚类三维点,围绕二维点
- 基于距离对数据进行聚类