@@数据库大牛请进来,我应该选择一个怎样的数据库? @@# DataSciences - 数据科学
h*0
1 楼
谢谢谢谢,请教请教, 呵呵。我什么都不懂。
我应该选择一个怎样的数据库?
我有一些数据,其特点如下:
1。单文件类别多(数字数据,符号序列/sequences, 分子结构图/structure,网络关
系图/network/pathway)
2。文件大小不一。有的单文件一个就20G, 有的一个才几百kb.
3。调用复杂。 就是搜索和分析数据时, 我们可能会同时利用不同的文件类别(参见1
。2。) 进行分析和计算。
4。统计甄别。 就是要对数据进行智能的筛选 (不知道是不是要用machine learning
), 去处“不合理”的数据, 建立“有效数据库”。
5。适时更新。 因为新的数据会从网络上不断涌现。 这些新的数据,可以是对原数据
库data的补充,也可以是对原数据库data的筛选。 所以每隔一定的时间, 估计就得更
新“有效数据”。这是不是就是所说的“动态数据”?
所以如果我要建立一个满足我这些数据特点的数据库。 是不是传统的数据库就很不合
适了?
另外一个让人头疼的问题是: 数据这么大, 数据的传输是个大问题。是不是放在云上
比较好。也就是说, 建立一个在云数据库(当然,我们可以利用已经做好的云, 给交
费就好了。虽然长远来说, 自己做个云是最合算的)。然后开发一些分析和搜索的工
具, 让用户可以直接在云上操作。这样的好处是避免了大数据的传输。 用户下载的只
是最后的结果(小数据或图片)。这样会更经济更有效率?
所以我想问大牛们,我应该选择一个怎样的数据库?
我应该选择一个怎样的数据库?
我有一些数据,其特点如下:
1。单文件类别多(数字数据,符号序列/sequences, 分子结构图/structure,网络关
系图/network/pathway)
2。文件大小不一。有的单文件一个就20G, 有的一个才几百kb.
3。调用复杂。 就是搜索和分析数据时, 我们可能会同时利用不同的文件类别(参见1
。2。) 进行分析和计算。
4。统计甄别。 就是要对数据进行智能的筛选 (不知道是不是要用machine learning
), 去处“不合理”的数据, 建立“有效数据库”。
5。适时更新。 因为新的数据会从网络上不断涌现。 这些新的数据,可以是对原数据
库data的补充,也可以是对原数据库data的筛选。 所以每隔一定的时间, 估计就得更
新“有效数据”。这是不是就是所说的“动态数据”?
所以如果我要建立一个满足我这些数据特点的数据库。 是不是传统的数据库就很不合
适了?
另外一个让人头疼的问题是: 数据这么大, 数据的传输是个大问题。是不是放在云上
比较好。也就是说, 建立一个在云数据库(当然,我们可以利用已经做好的云, 给交
费就好了。虽然长远来说, 自己做个云是最合算的)。然后开发一些分析和搜索的工
具, 让用户可以直接在云上操作。这样的好处是避免了大数据的传输。 用户下载的只
是最后的结果(小数据或图片)。这样会更经济更有效率?
所以我想问大牛们,我应该选择一个怎样的数据库?