Redian新闻
>
Career path 呀,career path!
avatar
Career path 呀,career path!# EE - 电子工程
f*e
1
开始以为邓紫棋的歌肯定不咋地,根本不值得听的那种,因为不属于老歌手,所以像我
这种80后对她的歌就一点兴趣都没有,
宁可翻回去听老歌,也不想听她这种新人的歌,
但是偶尔听到了几首,像《给你的歌》、《画》,虽然唱功我不敢恭维,确实算不上是
唱功是多么好的实力派,但是那个感觉还是不错的,有那个意境,音色也还是可以听听,
而且还有点小清新小文艺的感觉,
适合文艺女青年,午后的咖啡时光,听着邓紫棋的《画》也不错,
《给你的歌》也唱得比较清新,总体还是不错的。
avatar
S*y
2
看了微微觉得很好看,不知道有没有别人看过啊。
有点白...
avatar
y*3
3
Design a backend store for storing metadata about files and directories
belonging to different users as part of an online storage service. The
logical data model is as follows:
--a user has zero or more files or directories
--a directory contains zero or more files or sub-directories
--a file or directory has a relative path that is up to 32KB in length
--a file has a size and last modified time
This store should handle the following online queries efficiently:
--lookups on single files or sub-directory given a user and relative path
--listing all files and sub-directories belonging to a user or at a given
level of the hierarchy inserting new files and directories
It should also support the following batch operations that run on a daily
basis:
--count the total number of files per user, and the aggregate file size.
--count the number of files and sub-directories added per day for each user.
I can think of creating such a schema:
1. User table (userName, userId, etc)
2. File table (userId, file/dirName, relativePath, size, lastModified,
isFile) whereas as key, and is a foreign key
to User table.
Not sure if this the right answer. Also, if the data grow to say, billions
of rows, would sharding a good enough solution?
avatar
s*l
4
最近很多国内的网站上不了,特别是工商银行的个人银行打不开,为啥?有啥好办法?
avatar
s*a
5
为进一步提高我校经济学科的建设水平,增强经济学科学研究和人才培养的国际性,推
进与美国一流大学的实质性交流,开阔工作视野和发展思路,应美国康奈尔大学、普林
斯顿大学等名校的邀请,经济学院院长杨瑞龙教授率团于3月23日-4月4日成功访问了
美国普林斯顿大学、耶鲁大学、康奈尔大学、加州大学伯克利分校、斯坦福大学和加州
大学圣地亚哥分校等6所美国著名学府。随行的代表团成员有:经济学院副院长刘凤良
教授、副院长刘元春教授、经济学-数学双学位实验班项目主管陈彦斌副教授、院长助
理丁凯博士。
3月24日上午,经济学院代表团访问了普林斯顿大学。普林斯顿大学国际教育与研究委
员会主任Jeremy Adelman教授热情会见了杨瑞龙院长一行。杨瑞龙院长介绍了人民大学
经济学科以及学科排名等的情况,Adelman教授介绍了普林斯顿大学在国际合作和科研
管理方面的管理体系和运作方式。双方还就国际小学期、教师互访、学生交流以及在中
国宏观经济方面的合作研究等问题进行了富有成效的讨论,彼此都认为会有很好的合作
前景。当日下午,杨瑞龙院长一行又会见了威尔逊公共与国际事务学院院长Mark
Watson教授。杨瑞龙院
avatar
w7
6
正在找工作当中,一直做的的东西偏重于high-speed I/O方面,也就是high speed
serial serdes,(一般serdes包括I/O driver, PLL, CDR, Equalizer)等等。在学校
期间对于power management,RF IC都有涉猎,但不是完全花时间在上面,所以也就是
有些皮毛的知识,做过一些相关的project而已。通过找工作,越发感觉high-speed I/
O不是个主流的方向,一些recruiter甚至认为那就是digital ckt design(虽然我个人
不同意这点)。确实Serdes处理的是大信号的东西,但是实现的基础还是analog based
的,尤其在速度越来越高的时候。
我还是希望能转到做一些hardcore analog的block,power management 是一方面,RF/
base band 是另一方面。因为第一个job对carrer path非常重要,所以有些困惑。不知
道interface (high speed I/O) 这方面以后的发展会怎样。有industry的老革命能不
能给我们讲一
avatar
a*7
7
可以吧。
俺觉得不管是什么小说,写好了就是经典。
红楼梦不就是个言情小说? :)
西游记不就是个玄幻小说? :-)
水浒传、三国演义不就是个武侠小说? :--)

【在 S*****y 的大作中提到】
: 看了微微觉得很好看,不知道有没有别人看过啊。
: 有点白...

avatar
i*a
8
What database?
Sql server 2008 and up has organization structure data type, can use for
this to store each folder and file as nodes.

[发表自未名空间手机版 - m.mitbbs.com]

【在 y****3 的大作中提到】
: Design a backend store for storing metadata about files and directories
: belonging to different users as part of an online storage service. The
: logical data model is as follows:
: --a user has zero or more files or directories
: --a directory contains zero or more files or sub-directories
: --a file or directory has a relative path that is up to 32KB in length
: --a file has a size and last modified time
: This store should handle the following online queries efficiently:
: --lookups on single files or sub-directory given a user and relative path
: --listing all files and sub-directories belonging to a user or at a given

avatar
kx
9
人大?

【在 s****a 的大作中提到】
: 为进一步提高我校经济学科的建设水平,增强经济学科学研究和人才培养的国际性,推
: 进与美国一流大学的实质性交流,开阔工作视野和发展思路,应美国康奈尔大学、普林
: 斯顿大学等名校的邀请,经济学院院长杨瑞龙教授率团于3月23日-4月4日成功访问了
: 美国普林斯顿大学、耶鲁大学、康奈尔大学、加州大学伯克利分校、斯坦福大学和加州
: 大学圣地亚哥分校等6所美国著名学府。随行的代表团成员有:经济学院副院长刘凤良
: 教授、副院长刘元春教授、经济学-数学双学位实验班项目主管陈彦斌副教授、院长助
: 理丁凯博士。
: 3月24日上午,经济学院代表团访问了普林斯顿大学。普林斯顿大学国际教育与研究委
: 员会主任Jeremy Adelman教授热情会见了杨瑞龙院长一行。杨瑞龙院长介绍了人民大学
: 经济学科以及学科排名等的情况,Adelman教授介绍了普林斯顿大学在国际合作和科研

avatar
c*l
10
听起来的确不是主流,而且可能不broad,换方向难

I/
based
RF/

【在 w7 的大作中提到】
: 正在找工作当中,一直做的的东西偏重于high-speed I/O方面,也就是high speed
: serial serdes,(一般serdes包括I/O driver, PLL, CDR, Equalizer)等等。在学校
: 期间对于power management,RF IC都有涉猎,但不是完全花时间在上面,所以也就是
: 有些皮毛的知识,做过一些相关的project而已。通过找工作,越发感觉high-speed I/
: O不是个主流的方向,一些recruiter甚至认为那就是digital ckt design(虽然我个人
: 不同意这点)。确实Serdes处理的是大信号的东西,但是实现的基础还是analog based
: 的,尤其在速度越来越高的时候。
: 我还是希望能转到做一些hardcore analog的block,power management 是一方面,RF/
: base band 是另一方面。因为第一个job对carrer path非常重要,所以有些困惑。不知
: 道interface (high speed I/O) 这方面以后的发展会怎样。有industry的老革命能不

avatar
S*y
11
呵呵,是JJ的原创文。
纯属休闲的时候看看,和你提到的那些文根本不能比。不过也就途个开心,读的时候比
较轻松。
校园+网游文,俊男美女的故事按说很老套,不过作者文笔不错,情节也比较轻快。
最近不知道怎么抽风,开始看言情小说。

【在 a*********7 的大作中提到】
: 可以吧。
: 俺觉得不管是什么小说,写好了就是经典。
: 红楼梦不就是个言情小说? :)
: 西游记不就是个玄幻小说? :-)
: 水浒传、三国演义不就是个武侠小说? :--)

avatar
g*l
12
是个FILE MANAGEMENT SYSTEM啊,我是这样DESIGN的,注意FOLDER和FILE都可以改名字
,所以要用ID,不要说FOLDER改了名字,就找不到FILE了。有一个SUBFOLDER存储FOLDER
和SUBFOLDER之间的HIERACHY关系,可以有好多LELVEL。
FILE
FILE_ID, FILE_NAME, FILE_ATTRIBUTES(SIZE, DATE,OWNER)..
FILE_FOLDER
FILE_ID, FOLDER_ID(last folder)
FOLDER
FOLDER_ID, FOLDER_NAME, FOLDER_ATTRIBUTES..
SUBFOLDER
FOLDER_ID SUB_FLODER_ID, LEVEL
USER
USER_ID, USER_NAME ETC
USER_FILE
USEER_ID, FILE_ID,TIME,ACTION(CREATE, MODIFY,DELETE,RENAME,MOVE)
avatar
w*g
13
没错,之前被爆学术造假,剽窃论文的那位。。

【在 kx 的大作中提到】
: 人大?
avatar
t*i
14
high speed好像听容易找的啊
avatar
r*x
15
我刚看了几本,什么翻译官,佳期如梦的,都一个套路的,属于yy
哪有那么多痴情男的呢,还那么有钱,呵呵
avatar
y*3
16
多谢指点。
如果把每一个folder都加为一个row,那么insert和lookup时,是否都要把file path都
parse开,每个folder都要在folder table 里做一个lookup?

FOLDER

【在 g***l 的大作中提到】
: 是个FILE MANAGEMENT SYSTEM啊,我是这样DESIGN的,注意FOLDER和FILE都可以改名字
: ,所以要用ID,不要说FOLDER改了名字,就找不到FILE了。有一个SUBFOLDER存储FOLDER
: 和SUBFOLDER之间的HIERACHY关系,可以有好多LELVEL。
: FILE
: FILE_ID, FILE_NAME, FILE_ATTRIBUTES(SIZE, DATE,OWNER)..
: FILE_FOLDER
: FILE_ID, FOLDER_ID(last folder)
: FOLDER
: FOLDER_ID, FOLDER_NAME, FOLDER_ATTRIBUTES..
: SUBFOLDER

avatar
z*j
17
So do not visit Harvard :)
in case they came to show him the paper face to face....

【在 w********g 的大作中提到】
: 没错,之前被爆学术造假,剽窃论文的那位。。
avatar
w7
18
小水葱,你觉得什么是主流呢?我记得你好像是做power 的吧?

【在 c*******l 的大作中提到】
: 听起来的确不是主流,而且可能不broad,换方向难
:
: I/
: based
: RF/

avatar
S*t
19
貌似是个很有潜力的坑,请继续深挖。。。。

【在 S*****y 的大作中提到】
: 呵呵,是JJ的原创文。
: 纯属休闲的时候看看,和你提到的那些文根本不能比。不过也就途个开心,读的时候比
: 较轻松。
: 校园+网游文,俊男美女的故事按说很老套,不过作者文笔不错,情节也比较轻快。
: 最近不知道怎么抽风,开始看言情小说。

avatar
B*g
20
这个和department-manager-employee设计有神马区别?

【在 y****3 的大作中提到】
: Design a backend store for storing metadata about files and directories
: belonging to different users as part of an online storage service. The
: logical data model is as follows:
: --a user has zero or more files or directories
: --a directory contains zero or more files or sub-directories
: --a file or directory has a relative path that is up to 32KB in length
: --a file has a size and last modified time
: This store should handle the following online queries efficiently:
: --lookups on single files or sub-directory given a user and relative path
: --listing all files and sub-directories belonging to a user or at a given

avatar
l*o
21
姓 名:刘刚
所在单位:经济研究所
毕业院校:中国人民大学经济学院
职 称:教授
研究方向:现代企业理论;演化经济学及创新政策
招生专业:产业经济学·现代企业理论
现任校内外职务:
南开大学经济研究所副所长
个人简历:

个人概况:刘刚,男,祖籍山东济宁,1965年2月10日出生;最高学历学位:经济学博
士。职称职务:教授,副所长;主要研究方向:现代企业理论;演化经济学及创新政策;
工作和学习经历:
1.1985年9月~1989年7月 安徽师范大学政治系本科生,获法学学士学位;
2.1989年7月~1994年9月 淮北煤炭师范学院教师;
3.1994年9月~1998年7月 华中师范大学经济学院硕士研究生,获经济学硕士学位;
4.1998年9月~2001年7月 中国人民大学经济学院博士研究生,获经济学博士学位;
5.2001年7月~2003年9月 南开大学经济学院理论经济学博士后工作人员;
6.2003年9月~ 南开大学经济研究所。
主讲课程与研究生指导:
“企业经济学”(硕士生专业课程);
“新制度经济学”(硕士
avatar
c*l
22
不是
我做analog滴

【在 w7 的大作中提到】
: 小水葱,你觉得什么是主流呢?我记得你好像是做power 的吧?
avatar
S*y
23
翻译官没看过,bbs上评价不是很高。
佳期如梦,好像很久以前看过,太小言了。情节都忘光了。
看文喜欢看推荐先。

【在 r**x 的大作中提到】
: 我刚看了几本,什么翻译官,佳期如梦的,都一个套路的,属于yy
: 哪有那么多痴情男的呢,还那么有钱,呵呵

avatar
y*3
24
多谢回复。我是初涉DB design,所以如果说的不对,请多指教。
我想主要区别还是在scale上吧。这个系统要求支持billion files with millions
users。 而且path最大值是32KB, 理论上可以有上千层的folder。所以如果用
department-manager-employee, 在lookup 和 insert时是否会太expensive?

【在 B*****g 的大作中提到】
: 这个和department-manager-employee设计有神马区别?
avatar
l*o
25
对《新语丝》举报抄袭问题的严正回应
经他人提醒,看到发表于《新语丝》网站上题为“揭发人民大学经济学院院长杨瑞龙和
南开大学刘刚抄袭”的文章,本人作为被指控文章作者之一,深感震惊,特发表如下严
正声明。
首先,为《新语丝》提供了这么一个反学术腐败的阵地表示高兴,这会促进中国学术水
平的提高和净化学术空气。
其次,澄清我们发表于《经济学季刊》上的论文是否存在抄袭一事。
1. 本人认为,我们发表于《经济学季刊》上的学术论文“双重成本约束条件下的最优
企业所有权安排”与詹森和麦克林论文“专用和一般知识与组织结构”一文,无论是在
观点、逻辑、分析方法和结论上都不是一回事。我们论文中讨论的是企业优所有权安排
问题,是一个经济学问题,而詹、麦文讨论的是组织结构问题,属于管理学问题。相信
任何认真阅读了两篇文章的人都能得出这个清晰的判断!
2. 对于图的来源,本人在写作过程时,最早是在网上查资料时,看到有人使用类似詹
和麦文中的图,用于讨论集权和分权问题,并没有注明出处,本人以为该图是一个一般
的讨论集权与分权问题的图,就把它借用过来讨论知识成本和代理成本、企业的最优所
有安排问题。同时,因为网上资料
avatar
w7
26
Analog太广了,power controller and data path 都是analog。

【在 c*******l 的大作中提到】
: 不是
: 我做analog滴

avatar
S*y
27
问题好像只有我一个人看啊,像说单口一样。
其实,也是很白;不过有时候就想白一下。hoho

【在 S*******t 的大作中提到】
: 貌似是个很有潜力的坑,请继续深挖。。。。
avatar
i*a
28
hierarchy data type is more efficient.
you may have to do some research on the limit:
http://msdn.microsoft.com/en-us/library/bb677290(v=sql.100).asp
The encoding used in the hierarchyid type is limited to 892 bytes.
Consequently, nodes which have too many levels in their representation to
fit into 892 bytes cannot be represented by the hierarchyid type.

【在 y****3 的大作中提到】
: 多谢回复。我是初涉DB design,所以如果说的不对,请多指教。
: 我想主要区别还是在scale上吧。这个系统要求支持billion files with millions
: users。 而且path最大值是32KB, 理论上可以有上千层的folder。所以如果用
: department-manager-employee, 在lookup 和 insert时是否会太expensive?

avatar
l*o
29
http://bbs.cenet.org.cn/dispbbs.asp?boardid=92504&replyid=453599&id=91180&skin=0&page=1&star=3
代发刘刚老师发给本站的说明:
看到贵网站转贴“新语丝”网站指责我们论文抄袭的帖子,我们表示深切关注!无论从
讨论的问题、考察的对象还是从分析逻辑和研究的结论看,都可以发现这是两篇完全不
同的学术论文。大家可以从网上下载这两篇文章的电子版,并认真比较。
关于论文中的图1,在我们论文的写作和资料搜集过程中,看到许多管理学教材和相关
经济学论文广泛地运用该图讨论管理中的集权与分权问题,并没有明确注明该图的来源
。而且在经济学分析中,加总的成本曲线也是一种常用的工具。因而,我们把该图看作
是管理学中用于讨论集权与分权的一般性通用工具,并借鉴该图考察了一个不同的问题
,即企业共同治理中的企业所有权最优安排。在论文的写作时,刘刚是杨瑞龙老师的博
士研究生,这部分资料和写作任务主要是由刘刚承担的,由于对文献的不熟悉和缺乏严
谨而出现的引文的疏漏是我们应当汲取的教训。
从2003年底有人开始“揭露”这件事情开始,我
avatar
c*l
30
多谢指教

【在 w7 的大作中提到】
: Analog太广了,power controller and data path 都是analog。
avatar
g*l
31
是的,因为LEVEL可以有很多的

【在 i****a 的大作中提到】
: hierarchy data type is more efficient.
: you may have to do some research on the limit:
: http://msdn.microsoft.com/en-us/library/bb677290(v=sql.100).asp
: The encoding used in the hierarchyid type is limited to 892 bytes.
: Consequently, nodes which have too many levels in their representation to
: fit into 892 bytes cannot be represented by the hierarchyid type.

avatar
c*b
32
现在国内大学的学霸们的成长经历都非常相似:3本的本科,2本的硕士,1本的博士,
留校或转场到另一1本,逐渐变成学霸。

【在 l****o 的大作中提到】
: 姓 名:刘刚
: 所在单位:经济研究所
: 毕业院校:中国人民大学经济学院
: 职 称:教授
: 研究方向:现代企业理论;演化经济学及创新政策
: 招生专业:产业经济学·现代企业理论
: 现任校内外职务:
: 南开大学经济研究所副所长
: 个人简历:
:

avatar
y*3
33
Thank you very much!
HierarchyId does seems to be a nice choice. However, as you said, if the
levels cannot be fit into 892 bytes, it will not work.
In my case, I guess with a relative path size limit of 32KB, it could be the
case that the levels will exceed 892 bytes.

【在 i****a 的大作中提到】
: hierarchy data type is more efficient.
: you may have to do some research on the limit:
: http://msdn.microsoft.com/en-us/library/bb677290(v=sql.100).asp
: The encoding used in the hierarchyid type is limited to 892 bytes.
: Consequently, nodes which have too many levels in their representation to
: fit into 892 bytes cannot be represented by the hierarchyid type.

avatar
t*3
34
所以,要掰着看人简历

【在 c**b 的大作中提到】
: 现在国内大学的学霸们的成长经历都非常相似:3本的本科,2本的硕士,1本的博士,
: 留校或转场到另一1本,逐渐变成学霸。

avatar
B*g
35
不明白,你在design阶段,为啥要有限制

the

【在 y****3 的大作中提到】
: Thank you very much!
: HierarchyId does seems to be a nice choice. However, as you said, if the
: levels cannot be fit into 892 bytes, it will not work.
: In my case, I guess with a relative path size limit of 32KB, it could be the
: case that the levels will exceed 892 bytes.

avatar
j*w
36
中国有本土培养的经济学家么?都是一帮乌合之众.
avatar
y*3
37
因为如果在已知数据里有无法用HierarchyId的,那design里就不能用了吧。否则可能
会有Data Corruption。

【在 B*****g 的大作中提到】
: 不明白,你在design阶段,为啥要有限制
:
: the

avatar
h*0
38
国内外媒体的两篇文章
http://acafubai.blog.sohu.com/
《财经》杂志: 杨瑞龙涉嫌抄袭事件
曾被视为 “象牙之塔”的学术界,近年来正遭受学术腐败行为的困扰,其中尤以抄
袭剽窃为最大公害。而抄袭本身又形形色色,国内外不同机构界定抄袭的标准也可能出
现差异,使问题愈加复杂化。
近期最引人瞩目者,为中国人民大学经济学院院长杨瑞龙涉嫌抄袭事件。杨瑞龙和
另一作者刘刚2002年在《经济学季刊》第一卷第3期上发表了学术论文《双重成本约束
下的最优企业所有权安排——企业共同治理的经济学分析》(下称杨文)。此后,该文
曾被海外网站指责为抄袭,抄袭对象系哈佛大学商学院詹森教授(Michael C. Jensen
) 和迈克林教授(William Meckling)在1992年发表的论文《专用和一般知识与组织
结构》(Specific and General Kownledge and Organization Structure)(下称詹
文)。
2005年1月12日,《经济学季刊》编辑部对杨文是否抄袭做出鉴定,承认杨文的第
四节——从知识成本和代理成本权衡的角度来分析最优
avatar
g*l
39
其实就是个TREE结构吧
avatar
t*a
40
范仲淹老人家说得好啊:“兴百姓苦,亡百姓苦”。江西财经的那个如果也像杨瑞龙,
刘刚一样是领导,那结局也只会变成“学术不端”。
avatar
y*w
41
更灵活,没那么多"现实"限制。 假如我添一个需求,可以很方便的把一个有1000个sub
folder,2000000个files的目录挪到另一个子目录下去。 这算是经常地用法吧,典型
tree问题,再去检查一下大家的设计是不是有比较好的支持。

【在 B*****g 的大作中提到】
: 这个和department-manager-employee设计有神马区别?
avatar
D*a
42
这跟天下兴亡有啥关系?
而且这话咋是老范说的??
他说的是先天下之忧而忧。。

【在 t*******a 的大作中提到】
: 范仲淹老人家说得好啊:“兴百姓苦,亡百姓苦”。江西财经的那个如果也像杨瑞龙,
: 刘刚一样是领导,那结局也只会变成“学术不端”。

avatar
B*g
43
一个director,手下10个manager,100个team lead,1000个developer,要从一个VP手
下转到另外一个VP手下,就是数量级的区别。

sub

【在 y****w 的大作中提到】
: 更灵活,没那么多"现实"限制。 假如我添一个需求,可以很方便的把一个有1000个sub
: folder,2000000个files的目录挪到另一个子目录下去。 这算是经常地用法吧,典型
: tree问题,再去检查一下大家的设计是不是有比较好的支持。

avatar
g*y
44
兴百姓苦,亡百姓苦 是张养浩的山坡羊里的吧,元曲
avatar
y*w
45
我觉得这个题目出的蛮有水平的:
1. tree结构设计。效率与灵活性如何兼顾。
2. 注意那个32k,可以考察下对dbms大字段支持的了解,是不是可以inline一部分,80
/20准则。
3. 接着可以考怎么写sql,一般的到recusrive的。基本上developer需要知道的query写
法基本上都能考察到。
4. 这个model涉及的东西是每个人都非常熟悉的。

【在 y****3 的大作中提到】
: Design a backend store for storing metadata about files and directories
: belonging to different users as part of an online storage service. The
: logical data model is as follows:
: --a user has zero or more files or directories
: --a directory contains zero or more files or sub-directories
: --a file or directory has a relative path that is up to 32KB in length
: --a file has a size and last modified time
: This store should handle the following online queries efficiently:
: --lookups on single files or sub-directory given a user and relative path
: --listing all files and sub-directories belonging to a user or at a given

avatar
r*n
46
不知道一次失败的访问会是什么样的,去了别人不接待?
avatar
y*w
47
tree model里面只要改director的parent就行了.
假如reporting chain短了或长了一截,有没有用level区别就很大。o(1) vs. O(n**level).

【在 B*****g 的大作中提到】
: 一个director,手下10个manager,100个team lead,1000个developer,要从一个VP手
: 下转到另外一个VP手下,就是数量级的区别。
:
: sub

avatar
r*1
48
wo pei
avatar
B*g
49
我是没明白这两个设计有什么区别。

level).

【在 y****w 的大作中提到】
: tree model里面只要改director的parent就行了.
: 假如reporting chain短了或长了一截,有没有用level区别就很大。o(1) vs. O(n**level).

avatar
y*w
50
level会变啊. 这个update代价可能会很大。
看挪动目录的case,你比较下和下面这个model的区别.假设你 mv /home/beijing/.../...<1000level>/somefolder /home/yhangw/somefolder
user: user_id, user_root_dir_id, other_attributes
directiory: dir_id, dir_name, parent_dir, other_attributes
file: file_id, file_name, parent_dir, size, mtime, ...
无论如何,这个需求interviewer没提出来,所以这种优点也未必被采纳。

【在 B*****g 的大作中提到】
: 我是没明白这两个设计有什么区别。
:
: level).

avatar
B*g
51
我是说manager-employee和directory-folder的设计区别

/...<1000level>/somefolder /home/yhangw/somefolder

【在 y****w 的大作中提到】
: level会变啊. 这个update代价可能会很大。
: 看挪动目录的case,你比较下和下面这个model的区别.假设你 mv /home/beijing/.../...<1000level>/somefolder /home/yhangw/somefolder
: user: user_id, user_root_dir_id, other_attributes
: directiory: dir_id, dir_name, parent_dir, other_attributes
: file: file_id, file_name, parent_dir, size, mtime, ...
: 无论如何,这个需求interviewer没提出来,所以这种优点也未必被采纳。

avatar
y*w
52
奥~ 在我看来没区别,但对用level来说就有区别。
n久前在这儿讨论tree时候说的就是dept模型。一哥当时提到有些情况不太现实,比如每个人级别都得动啥的。但挪挪目录就无所谓了。
可以更复杂些,比如考虑link文件,这样的文件系统允许同一个文件在不同的级别上,而且有可能出现循环的情况。

【在 B*****g 的大作中提到】
: 我是说manager-employee和directory-folder的设计区别
:
: /...<1000level>/somefolder /home/yhangw/somefolder

avatar
y*3
53
Again, thank you very much for everyone who kindly helped me in this. I am
already learning a lot as a db design newbie....
Yes, I totally agree with you.
2 is a very interesting point.Sql Server supports varchar(8000), and for
larger data you have to use varchar(max), which may not be in row.
I am thinking about adding a hash column so that I can do easy comparison
and also index.
1. is also very interesting. I am debating if I should add a table to
capture the sub-directory information like gekjl suggested.
SUBFOLDER FOLDER_ID SUB_FLODER_ID, LEVEL.
Currently, here is what I have, do you think this is a good design?
CREATE TABLE Users
(
UserID int PRIMARY KEY NOT NULL,
UserName varchar(256) NOT NULL
)
go
CREATE TABLE Directories
(
DirectoryID bigint PRIMARY KEY NOT NULL,
UserId int NOT NULL FOREIGN KEY REFERENCES Users (UserId),
RelativePath varchar(max) NOT NULL,
LastModified datetime NOT NULL,
CreateTime datetime NOT NULL
)
CREATE TABLE SubDirectories
(
DirectoryID bigint NOT NULL FOREIGN KEY REFERENCES Directories(DirectoryID),
SubDirectoryId bigint NOT NULL FOREIGN KEY REFERENCES Directories(
DirectoryID)
)
CREATE TABLE Files
(
FileId bigint PRIMARY KEY NOT NULL,
FileName varchar(256) NOT NULL,
UserID int NOT NULL FOREIGN KEY REFERENCES Users (UserId),
DirectoryId bigint NOT NULL FOREIGN KEY REFERENCES Directories(DirectoryID),
FileSize int NOT NULL,
LastModified datetime NOT NULL,
CreateTime datetime NOT NULL
)

80

【在 y****w 的大作中提到】
: 我觉得这个题目出的蛮有水平的:
: 1. tree结构设计。效率与灵活性如何兼顾。
: 2. 注意那个32k,可以考察下对dbms大字段支持的了解,是不是可以inline一部分,80
: /20准则。
: 3. 接着可以考怎么写sql,一般的到recusrive的。基本上developer需要知道的query写
: 法基本上都能考察到。
: 4. 这个model涉及的东西是每个人都非常熟悉的。

avatar
y*w
54
subdir没必要。用不用level掌握90/10原则,问问会有多少更新,这个设计需不需要极
端照顾层次查询---而且,要想真正拿到level的好处,还得加上root。

【在 y****3 的大作中提到】
: Again, thank you very much for everyone who kindly helped me in this. I am
: already learning a lot as a db design newbie....
: Yes, I totally agree with you.
: 2 is a very interesting point.Sql Server supports varchar(8000), and for
: larger data you have to use varchar(max), which may not be in row.
: I am thinking about adding a hash column so that I can do easy comparison
: and also index.
: 1. is also very interesting. I am debating if I should add a table to
: capture the sub-directory information like gekjl suggested.
: SUBFOLDER FOLDER_ID SUB_FLODER_ID, LEVEL.

avatar
y*3
55
非常感谢各位的指点。
我最后的design是:
/****** Object: Table [dbo].[Users] ******/
CREATE TABLE [dbo].[Users](
[UserID] [int] NOT NULL,
[UserName] [varchar](256) NOT NULL,
PRIMARY KEY CLUSTERED
(
[UserID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF
, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]
/****** Object: Table [dbo].[Directories] ******/
CREATE TABLE [dbo].[Directories](
[DirectoryID] [bigint] NOT NULL,
[UserId] [int] NOT NULL,
[RelativePath] [nvarchar](max) NULL,
[LastModified] [datetime] NOT NULL,
[CreateTime] [datetime] NOT NULL,
[ParentDirectoryId] [bigint] NULL,
[PathHash] [varchar](50) NOT NULL,
PRIMARY KEY CLUSTERED
(
[DirectoryID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF
, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]
ALTER TABLE [dbo].[Directories] WITH CHECK ADD FOREIGN KEY([UserId])
REFERENCES [dbo].[Users] ([UserID])
/****** Object: Table [dbo].[Files] ******/
CREATE TABLE [dbo].[Files](
[FileId] [bigint] NOT NULL,
[FileName] [varchar](256) NOT NULL,
[UserID] [int] NOT NULL,
[DirectoryId] [bigint] NOT NULL,
[FileSize] [bigint] NOT NULL,
[LastModified] [datetime] NOT NULL,
[CreateTime] [datetime] NOT NULL,
CONSTRAINT [PK_Files] PRIMARY KEY CLUSTERED
(
[FileId] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF
, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]
ALTER TABLE [dbo].[Files] WITH CHECK ADD FOREIGN KEY([DirectoryId])
REFERENCES [dbo].[Directories] ([DirectoryID])
ALTER TABLE [dbo].[Files] WITH CHECK ADD FOREIGN KEY([UserID])
REFERENCES [dbo].[Users] ([UserID])
然后在join的column上建立non-clustered index。把solution交上去后好像他们还算
满意,所以给了on-site。再次感谢各位的帮助。

【在 y****w 的大作中提到】
: subdir没必要。用不用level掌握90/10原则,问问会有多少更新,这个设计需不需要极
: 端照顾层次查询---而且,要想真正拿到level的好处,还得加上root。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。