Redian新闻
>
如何智能化合并数据库中属于相关objects的各种属性到一个object下?
avatar
如何智能化合并数据库中属于相关objects的各种属性到一个object下?# Programming - 葵花宝典
w*m
1
户口在湖北,在深圳中信银行还不能交预约费,说一定要去北京交。
真是信口开河,至少武汉的中信银行肯定能交北京签证的签证费的。
avatar
S*n
2
我这玩了玩,电池基本上撑不了几个小时就用光啊。
插着充电器电池都会跑光,太夸张了。
是不是哪儿设置不对
avatar
p*2
3
譬如三个department合并了,所有人都合并到了一个大数据库中,而合并前有部分人是
在其中两个或三个department同时兼职的,关于同一个人的各种attributes,可能被分
别列在了不同的department下,而且某些人可能有多个相似的first name或nick name
,但一样的last name,
这些attributes 可能包括first name, last name, email, phone number, ssn,
address 等等 中的部分attributes
也就是说,关于是否为同一个人的智能化判断,需要分别设定weights,请教版上各位
大佬什么样的方式处理比较好?有没现成的相关framework可以使用的?最好是java的
整个数据库 大概几百million左右条目
多谢了!
avatar
e*s
4
换一家,那家工作人员是二,不懂业务瞎扯

【在 w****m 的大作中提到】
: 户口在湖北,在深圳中信银行还不能交预约费,说一定要去北京交。
: 真是信口开河,至少武汉的中信银行肯定能交北京签证的签证费的。

avatar
S*n
5
自己顶一下,没人这么搞啊
avatar
d*n
6
找一个primary key啊,例如ssn可以做一个key。剩下的按照primary key做排序。
职位没法简单合并。
avatar
w*m
7
打过去问了,中信的总行,说确实要去辖区才能交
Orz
国内的签证预约真是越来越发指了
弄个这么折腾人不利己的规定
avatar
x*1
8
我搞过 还不错 估计因为你用的默认的超频了
光待机我还是能撑过12个小时的
我充电好好的 而且可以和google account同步联系人
其实也就这样了 速度是可以了 但是总是不是很爽
所以还是windows mobile了
andriod没啥杀手app 无视了
唯一喜欢的也就finance
avatar
p*2
9
但是就因为没有primary key,所以需要一个智能化的方案,譬如些machine learning
的方法
avatar
a*n
10
没这个说法。
avatar
S*n
11
我改了频率到了500m stock 频率,还是用电很快。
你觉得哪儿不是很爽?我现在觉得主要是没声音,电池不行,而且也不太稳定。
还不如我的mightyrom

【在 x**1 的大作中提到】
: 我搞过 还不错 估计因为你用的默认的超频了
: 光待机我还是能撑过12个小时的
: 我充电好好的 而且可以和google account同步联系人
: 其实也就这样了 速度是可以了 但是总是不是很爽
: 所以还是windows mobile了
: andriod没啥杀手app 无视了
: 唯一喜欢的也就finance

avatar
g*g
12
Not that complicated, you just need to integrate SOLR/Elastic Search, Lucene
provides fuzzy search.

learning

【在 p****2 的大作中提到】
: 但是就因为没有primary key,所以需要一个智能化的方案,譬如些machine learning
: 的方法

avatar
w*m
13
可是确实有~~~ 护照的复印件可以交钱,但是必须在辖区
已经交过了,预约号0003开头,跟深圳0021开头不一样
avatar
k*r
14
是啊,到现在也没发现android比WM6好多少,呵呵

【在 S***n 的大作中提到】
: 我改了频率到了500m stock 频率,还是用电很快。
: 你觉得哪儿不是很爽?我现在觉得主要是没声音,电池不行,而且也不太稳定。
: 还不如我的mightyrom

avatar
p*2
15
是想把所有人原先可能重复的各项attributes合并到一起,得到一个干净的database
要对每一个record用Solr/Elastic Search 进行fuzzy search么?
还是直接用Lucene进行index?

Lucene

【在 g*****g 的大作中提到】
: Not that complicated, you just need to integrate SOLR/Elastic Search, Lucene
: provides fuzzy search.
:
: learning

avatar
u*l
16
有wm可用的时候,android 就是拿来玩的
所以真正要用android,那还得没有wm可用~
avatar
g*g
17
You can get a score on match, obviously you can set a score threshold, use
one data source to search another as one time processing to merge the
records. And each column can be weighted. Lucene is probably more flexible
for you.

【在 p****2 的大作中提到】
: 是想把所有人原先可能重复的各项attributes合并到一起,得到一个干净的database
: 要对每一个record用Solr/Elastic Search 进行fuzzy search么?
: 还是直接用Lucene进行index?
:
: Lucene

avatar
N*n
18

既然要一个干净的DB那就把SCHEMA改良一下然后写个CONVERTER把数据重新
录一遍呗。数据有备份,做好了试一试就该够了,反正你的SCHEMA不会大改。

【在 p****2 的大作中提到】
: 是想把所有人原先可能重复的各项attributes合并到一起,得到一个干净的database
: 要对每一个record用Solr/Elastic Search 进行fuzzy search么?
: 还是直接用Lucene进行index?
:
: Lucene

avatar
p*2
19
就像好虫大侠讲的,因为包含模糊算法,这样子的schema和converter 怎么写呢?

【在 N********n 的大作中提到】
:
: 既然要一个干净的DB那就把SCHEMA改良一下然后写个CONVERTER把数据重新
: 录一遍呗。数据有备份,做好了试一试就该够了,反正你的SCHEMA不会大改。

avatar
p*2
20
很好的tips!
感觉Lucene用起来更加自由一些,现有三个 data source(每个department对应一个独
立的data source), 怎么搞index好呢?

【在 g*****g 的大作中提到】
: You can get a score on match, obviously you can set a score threshold, use
: one data source to search another as one time processing to merge the
: records. And each column can be weighted. Lucene is probably more flexible
: for you.

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。