Redian新闻
>
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
avatar
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?# DataSciences - 数据科学
s*h
1
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这
些圆内weight值最大。
多谢。
avatar
s*h
2
对了,给定的半径不同,这样的cluster/圆也会不同。
每个点和其最近N个neighbor的平均值是d,1M点的d的平均值是D。
对应不同的N,D不同。
假设给定一个N,求top(M)的圆,咋弄?
avatar
T*u
4
我没太看明白题。weight是做啥的,根据啥cluster啊
avatar
s*h
5
比如说,给你一个地图,刑事案件发生的地点和严重程度。
严重程度就是weight
或者说是商品销售的目的地,货物类型/数量/价格,这个数量/价格和运输费用就是
weight
avatar
t*g
6
这个有点意思。这种点有权重的以前没接触过。不过感觉还是有不少实际应用价值。
avatar
T*u
7
是类似于二维地图的hotmap吗?是给点做cluster还是给二维地图做segmentation?

【在 s****h 的大作中提到】
: 比如说,给你一个地图,刑事案件发生的地点和严重程度。
: 严重程度就是weight
: 或者说是商品销售的目的地,货物类型/数量/价格,这个数量/价格和运输费用就是
: weight

avatar
T*u
8
如果是后者的话,我用mixture of gaussians做过一个类似的,数据的前期整理比较麻
烦;后来有些不规则形状分布的,我的做法是每一个点当作一个rbf, weight当做
function的amplitude,train to get width matrix(can be location dependent)
,然后地图上任意一点的值都可以算,得到一个hot map,然后再做segmentation。其实
就是一堆点用rbf smooth成一个面,然后用这个面作为估计。
非专业人士的非专业做法,仅供参考。
avatar
c*z
9
heatmap?

【在 s****h 的大作中提到】
: 比如说,给你一个地图,刑事案件发生的地点和严重程度。
: 严重程度就是weight
: 或者说是商品销售的目的地,货物类型/数量/价格,这个数量/价格和运输费用就是
: weight

avatar
w*e
10
你圈圈大小要是给定的,来个K-means应该可以,EM块, E step 注意用weighted mean

开始也想说GMM,但是1M行的话,谨慎表示不客观,用gibbs fit过 GMM, 到50K就受不了了
而且企业里用K-MEANs可能性大,
另求内推DS,SDE。本人主业stat phd, data visualization和machine learning 方向。
副业主刷c++ 和副刷java。

【在 s****h 的大作中提到】
: 问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
: 假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这
: 些圆内weight值最大。
: 多谢。

avatar
h*7
11
想耍酷,在黎曼空间定义distance
想绕晕,拟合weight,套贝叶斯
想忽悠,直接上MDS

【在 s****h 的大作中提到】
: 问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
: 假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这
: 些圆内weight值最大。
: 多谢。

avatar
y*d
12
简单? 把weight看成第3维(每个点的高度),在3维空间中做K-means, K-medoids 或其他
算法.

【在 s****h 的大作中提到】
: 问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
: 假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这
: 些圆内weight值最大。
: 多谢。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。