Redian新闻
>
讨论:linux终端下的表格数据处理?
avatar
讨论:linux终端下的表格数据处理?# Linux - Linux 操作系统
y*d
1
我们要搬家去一个OR和WA两州交界的地方OR和WA,我在OR工作,lg在WA,WA收入不用交state
income,OR需要.lg工资比我高,我们希望至少他那部分不用交州税的。现在问题是,我
们可以住在WA么?因为考虑到离我上班近一点。听说必须住在那个州并且工作在那个州
还可以income免州税。如果我们住在OR,是不是算OR的resident,这样就算lg在WA工作,还
是要交OR的州税呢?麻烦知情人解答一下。谢谢啦
avatar
r*y
2
土土的问一声, 我现在是H1B 要是递上绿卡申请以后,在没有批下来之前能回国吗?
谢谢!
avatar
a*y
3
☆─────────────────────────────────────☆
gracefei (菲菲) 于 (Fri Jul 31 23:15:26 2009, 美东) 提到:
情况是这样的,我一闺蜜很想买iphone,但是国内只有水货又贵,所以主意就打到我这
边了。
请问手机买好之后给她带回国去用,然后我这边付两年的plan的钱,这样是否可行?
头一次遇见这样的问题来这个版问,请达人们谅解指教,先谢过各位
☆─────────────────────────────────────☆
SETI (天青如水,飞龙在天) 于 (Fri Jul 31 23:23:21 2009, 美东) 提到:
手机+2年plan的钱差不多2000刀;还是在ebay上搞一个吧。

☆─────────────────────────────────────☆
gracefei (菲菲) 于 (Fri Jul 31 23:24:55 2009, 美东) 提到:
-__-! 还真不少银子呢。。。
☆─────────────────────────────────────☆
avatar
n*7
4
windows下处理表格数据用的最多的是excel。查找,排序,归类,作图,简单分析,都
很方便。可能有人觉得excel不专业,但是对我来说,随便浏览下数据,获得一些大致
的概念完全够了。关键是方便,迅速,交互。
linux下一直在寻觅实现类似功能的方法(不考虑作图)。这里不想讨论open office
或者 gnumeric,我宁可去用虚拟机而不想用它们。 另外,它们也不能在终端下使用。
我平时用以下方法,但是都不是特别完美:
1. vim + shell
vim和shell都用的不是很精,不过简单数据处理也够了,再复杂的就写代码了。vim浏
览数据还可以,简单查询也方便,纵向滚动也不错。但是我一直不知道能不能横向滚动
,如果很多列的话。另外,也不知道怎么让同一列对齐。需要复杂一点数据操作的话,
就要用sort,uniq,awk,sed,cut,paste,wc,grep等shell命令配合了,可能还要产生一些
临时文件,这点我不喜欢。我希望能在一个工具内部完成所有需要的操作
2. R
有段时间试图用R做所有类似的工作,基本胜任。问题是感觉浏览数据不是很方便。比
如我想挨个观察id=ABC的数据,vim里面按n就ok了,R只能把所有id=ABC的数据提取出
来再看。这个区别对我还是挺重要的,因为有时候要人肉观察数据,发现一些可能的规
律或者问题,比如临近的行可能有一些关联什么的。另外跟vim一样太长的行会折返,
而不能横向滚动,column多了很麻烦。比vim好的是,每个column是对齐的。
3. MySQL
跟R差不多的感觉,相对R的缺点是load数据麻烦点,要先定义一个table,优点是做表
格之间的mapping很方便,用R我还不清楚怎么实现hash结构(use list?)。其他相对vim
的比较跟R差不多。不知道有没有更方便的MySQL环境?(类似iPython之于Python)
可能我的用法比较蠢,先写出来,抛砖引玉:)
avatar
w*s
5
可以。很多人都回过
avatar
t*a
6
个人以为,多花点时间好好学学R吧,之后就不需要excel了。
一点小技巧:在R里用fix命令看data.frame / matrix
另外,基于归纳来观察和分析数据,用一些descriptive的函数来生成表格和图,比直
接用眼睛看来有效率的多。你可以参考R的Hmisc, lattice, plyr, reshape这些
package.
avatar
r*y
7
thanks a bunch!
avatar
M*P
8
还是用R吧。

【在 n******7 的大作中提到】
: windows下处理表格数据用的最多的是excel。查找,排序,归类,作图,简单分析,都
: 很方便。可能有人觉得excel不专业,但是对我来说,随便浏览下数据,获得一些大致
: 的概念完全够了。关键是方便,迅速,交互。
: linux下一直在寻觅实现类似功能的方法(不考虑作图)。这里不想讨论open office
: 或者 gnumeric,我宁可去用虚拟机而不想用它们。 另外,它们也不能在终端下使用。
: 我平时用以下方法,但是都不是特别完美:
: 1. vim + shell
: vim和shell都用的不是很精,不过简单数据处理也够了,再复杂的就写代码了。vim浏
: 览数据还可以,简单查询也方便,纵向滚动也不错。但是我一直不知道能不能横向滚动
: ,如果很多列的话。另外,也不知道怎么让同一列对齐。需要复杂一点数据操作的话,

avatar
n*7
9
谢谢,R是用得不好。 Rgui下试了一下fix,挺不错。但是terminal下有点乱。。。
我们处理的不光是数值数据,还有很多不能简单做统计的,比如一些gene名称,每个
gene可能有什么功能还是人脑处理比较靠谱。或者有些raw data还需要考虑怎么处理,
需要manual check先...

【在 t****a 的大作中提到】
: 个人以为,多花点时间好好学学R吧,之后就不需要excel了。
: 一点小技巧:在R里用fix命令看data.frame / matrix
: 另外,基于归纳来观察和分析数据,用一些descriptive的函数来生成表格和图,比直
: 接用眼睛看来有效率的多。你可以参考R的Hmisc, lattice, plyr, reshape这些
: package.

avatar
t*n
10
为什么不用open office?我老天天用,没什么不好的。楼主的linux能跑x吗?

【在 n******7 的大作中提到】
: windows下处理表格数据用的最多的是excel。查找,排序,归类,作图,简单分析,都
: 很方便。可能有人觉得excel不专业,但是对我来说,随便浏览下数据,获得一些大致
: 的概念完全够了。关键是方便,迅速,交互。
: linux下一直在寻觅实现类似功能的方法(不考虑作图)。这里不想讨论open office
: 或者 gnumeric,我宁可去用虚拟机而不想用它们。 另外,它们也不能在终端下使用。
: 我平时用以下方法,但是都不是特别完美:
: 1. vim + shell
: vim和shell都用的不是很精,不过简单数据处理也够了,再复杂的就写代码了。vim浏
: 览数据还可以,简单查询也方便,纵向滚动也不错。但是我一直不知道能不能横向滚动
: ,如果很多列的话。另外,也不知道怎么让同一列对齐。需要复杂一点数据操作的话,

avatar
M*9
11
我在linux下用R, 产生的pdf图怎么看? 我现在都sftp下来看。。。很烦。。。可我
又不会其他的。。。
avatar
t*a
12
如果你的linux不支持xwindow,那么你可以开一个apache httpd,直接用浏览器连上去
看。
更有趣的做法是使用orgmode + babel,做分析绘图做表,直接嵌入你的html报告里,
用apache httpd + 浏览器直接看。

【在 M*********9 的大作中提到】
: 我在linux下用R, 产生的pdf图怎么看? 我现在都sftp下来看。。。很烦。。。可我
: 又不会其他的。。。

avatar
t*a
13
不好意思,没想到你需要交互式观察字符串数据,这确实不是R的长项。

【在 n******7 的大作中提到】
: 谢谢,R是用得不好。 Rgui下试了一下fix,挺不错。但是terminal下有点乱。。。
: 我们处理的不光是数值数据,还有很多不能简单做统计的,比如一些gene名称,每个
: gene可能有什么功能还是人脑处理比较靠谱。或者有些raw data还需要考虑怎么处理,
: 需要manual check先...

avatar
l*y
14
做 bioinformatics?那推荐 Bioconductor。
输入输出是基本功啊。所谓表格,就是 spreadsheet 么,用 tvs 的格式显示和编辑就
很方便。
另外,建议 samba 映射到 windows 上去,这边用 putty 处理数据,生成图形文件,
那边浏览。或者 X11 forwarding 过来用 xming 看,也行。

【在 n******7 的大作中提到】
: 谢谢,R是用得不好。 Rgui下试了一下fix,挺不错。但是terminal下有点乱。。。
: 我们处理的不光是数值数据,还有很多不能简单做统计的,比如一些gene名称,每个
: gene可能有什么功能还是人脑处理比较靠谱。或者有些raw data还需要考虑怎么处理,
: 需要manual check先...

avatar
n*7
15
嫌R太慢,平时主要用来作图,算算统计量了。。。
我这里想讨论的,是怎么交互的,所见即所得的浏览表格比较好。有时候我们还会一行
行的看下去,而不是简单算一些统计量,看看数据分布什么的
我这标题可能起的不太合适。。。

【在 l***y 的大作中提到】
: 做 bioinformatics?那推荐 Bioconductor。
: 输入输出是基本功啊。所谓表格,就是 spreadsheet 么,用 tvs 的格式显示和编辑就
: 很方便。
: 另外,建议 samba 映射到 windows 上去,这边用 putty 处理数据,生成图形文件,
: 那边浏览。或者 X11 forwarding 过来用 xming 看,也行。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。