avatar
R的地位不可动摇# Programming - 葵花宝典
f*u
1
北京飞JFK
UA的tax是30多
刚在CA网站上搜了一下,发现一张票的tax就快150了啊
用UA里程换CA的票的话出哪个tax费啊
谢谢
avatar
x*1
2
我叔在国内挣了几个小钱,一直对我不错。现在退休了。想到这里看看。上次说让我给
他办手续,该申请什么签证呢?
我给自己父母办过探亲签证,可以给叔婶办同样的签证么?
avatar
d*a
3
比如最基本的分析 ERGM
Python根本不支持
avatar
s*t
4
就是旅游签证呗

【在 x****1 的大作中提到】
: 我叔在国内挣了几个小钱,一直对我不错。现在退休了。想到这里看看。上次说让我给
: 他办手续,该申请什么签证呢?
: 我给自己父母办过探亲签证,可以给叔婶办同样的签证么?

avatar
m*r
5
不是跟你抬杠, 我觉得从最近一两年的趋势看,是走下坡路。
另外, 啥是ergm ?
avatar
t*b
6
只有B2
avatar
m*n
7
他的意思是比较前沿的统计方法,会被不知道哪里的教授,把算法写进R里。
统计届喜欢用R代码来发论文,已经是业界惯例。
avatar
x*1
8
3x
avatar
d*a
9
Exponential random graph models
其实我是两种都用的
先用Python准备数据,处理数据,然后临门一脚是R

【在 m******r 的大作中提到】
: 不是跟你抬杠, 我觉得从最近一两年的趋势看,是走下坡路。
: 另外, 啥是ergm ?

avatar
q*n
10
旅游签证不要跟团吗?

【在 s*********t 的大作中提到】
: 就是旅游签证呗
avatar
b*b
11
我一直用sas来准备数据 然后R或者matlab踢进门。新地方没有买sas,就想用py来代替
sas的工作,请问py能处理10-20g的数据么?py对sql支持如何?请赐教,谢谢

【在 d******a 的大作中提到】
: Exponential random graph models
: 其实我是两种都用的
: 先用Python准备数据,处理数据,然后临门一脚是R

avatar
m*r
12
我也一直用sas.
10g~20g这么大的数据, sas就算能干,恐怕也要overnight了。 python应该比sas更快
,这是python的强项。
不过等你处理完了,R能handle吗?

【在 b*******b 的大作中提到】
: 我一直用sas来准备数据 然后R或者matlab踢进门。新地方没有买sas,就想用py来代替
: sas的工作,请问py能处理10-20g的数据么?py对sql支持如何?请赐教,谢谢

avatar
m*r
13
我也一直用sas.
10g~20g这么大的数据, sas就算能干,恐怕也要overnight了。 python应该比sas更快
,这是python的强项。
不过等你处理完了,R能handle吗?

【在 b*******b 的大作中提到】
: 我一直用sas来准备数据 然后R或者matlab踢进门。新地方没有买sas,就想用py来代替
: sas的工作,请问py能处理10-20g的数据么?py对sql支持如何?请赐教,谢谢

avatar
l*n
15
最近正好有个东西在用ERGM处理,可以交流一下
我知道的就是statsnet,你还用什么?

【在 d******a 的大作中提到】
: Exponential random graph models
: 其实我是两种都用的
: 先用Python准备数据,处理数据,然后临门一脚是R

avatar
m*n
17
data.table 比 pandas好用100倍
可是scikit-learn 又比caret 好用100倍

我一般是R处理数据,R做统计,时间序列等等
machine learning再弄到python
avatar
b*b
18
我相信python肯定比sas快。主要问题是,sas在硬盘操作,基本不用考虑内存不够用的
情况,虽然慢点。但是如果用python来处理大size的data,在coding的时候,是否需要
特别处理,比如slicing,才行。如果是这样,python快出来的那些时间,都用来琢磨
coding恐怕还不够。
我一般用sas处理完了,最后就剩不多的variables,总共也就1-2g,export到matlab做
optimization,基本上没问题了。用matlab多于R,因为感觉debug要方便些。

【在 m******r 的大作中提到】
: 我也一直用sas.
: 10g~20g这么大的数据, sas就算能干,恐怕也要overnight了。 python应该比sas更快
: ,这是python的强项。
: 不过等你处理完了,R能handle吗?

avatar
l*n
19
sas底层算法内存操作全部是C写的,python不会比sas快
做optimization为啥要用matlab,sas或者r都可以做

【在 b*******b 的大作中提到】
: 我相信python肯定比sas快。主要问题是,sas在硬盘操作,基本不用考虑内存不够用的
: 情况,虽然慢点。但是如果用python来处理大size的data,在coding的时候,是否需要
: 特别处理,比如slicing,才行。如果是这样,python快出来的那些时间,都用来琢磨
: coding恐怕还不够。
: 我一般用sas处理完了,最后就剩不多的variables,总共也就1-2g,export到matlab做
: optimization,基本上没问题了。用matlab多于R,因为感觉debug要方便些。

avatar
d*a
20
用ergm的时候,需要用network package
但是network是个半成品
很多操作iGraph更方便
所以经常要igraph network
这东西(ergm)很不稳定

【在 l******n 的大作中提到】
: 最近正好有个东西在用ERGM处理,可以交流一下
: 我知道的就是statsnet,你还用什么?

avatar
d*a
21

pandas已经很好用了

【在 m******n 的大作中提到】
: data.table 比 pandas好用100倍
: 可是scikit-learn 又比caret 好用100倍
: 唉
: 我一般是R处理数据,R做统计,时间序列等等
: machine learning再弄到python

avatar
n*3
22
try dplyr from R,
it is the best .....
pandas is just a copy cat of "old style" R

【在 d******a 的大作中提到】
:
: pandas已经很好用了

avatar
n*3
23
try dplyr from R,
it is the best .....
pandas is just a copy cat of "old style" R

【在 d******a 的大作中提到】
:
: pandas已经很好用了

avatar
n*3
24
second this.....
sas/matlab/python/R are all fast enough if you just use some building in
functions, since they are c coded compiled...
but for big chunk of logics, with loops .... they are all slow...

【在 l******n 的大作中提到】
: sas底层算法内存操作全部是C写的,python不会比sas快
: 做optimization为啥要用matlab,sas或者r都可以做

avatar
m*r
25
有什么可哎的? caret基本就是一个玩具级别的东西。 好处是整合了200多种算法,
whickham写的算是出自名门。 坏处是又有新的东西学。 本来你一个算法只要看他本身
的文档就够了, 现在又出一套新的语法糖。
语法糖有语法糖的一套命名规则; 原来的算法又有自己的一套命名规则。 折腾吧。

【在 m******n 的大作中提到】
: data.table 比 pandas好用100倍
: 可是scikit-learn 又比caret 好用100倍
: 唉
: 我一般是R处理数据,R做统计,时间序列等等
: machine learning再弄到python

avatar
m*r
26
你不懂了吧, 这流行的东西一旦走下坡路, 基本就完蛋了。

【在 d******k 的大作中提到】
: 拿2018半年的数据和2017全年的数据比较得出的结论可靠吗?
:
: machine-

avatar
d*a
27
基本盘不会丢
比如Ergm,出来有十年了,R的各种扩展都一堆,python还没有山寨版本。


: 你不懂了吧, 这流行的东西一旦走下坡路, 基本就完蛋了。



【在 m******r 的大作中提到】
: 你不懂了吧, 这流行的东西一旦走下坡路, 基本就完蛋了。
avatar
l*u
28
这个同意。python 比R好的地方很多,不过dplyr能做的事情,pandas做得太费劲了

【在 n*****3 的大作中提到】
: try dplyr from R,
: it is the best .....
: pandas is just a copy cat of "old style" R

avatar
d*a
29

比如dplyr,允许进行SQL 类的操作
但是对于字段名,直接要给出
比如
df_ret=df %>% group_by(name, work_year)) %>% summarise ...
这里,name 和 work_year都是字段名
在其他语言里,字段名需要引号,dplyr不用,实际是不能用,你用了还不行
但是假如我写了个过程,参数(f1)将作为字段名,就没法这么用了。google的结果,是
group_by 要改成 group_by_
library(dplyr)
get_f1 = function(f1, df){
df_ret=df %>% group_by_(.dots=c(f1, 'work_year')) %>% summarise ...

return(df_ret)
}
我猜,最初版本没有group_by_, 有人提出了,没法在原有框架满足,才新加的。其实
最初的版本要求字段名用引号比什么都强

【在 l****u 的大作中提到】
: 这个同意。python 比R好的地方很多,不过dplyr能做的事情,pandas做得太费劲了
avatar
m*n
30
PANDAS是中国人攒出来的山寨版R
处处透露着山寨气息
一点自己的改进都没有
真是给中国人丢人
avatar
d*a
31
创始人是老外。。。。


: PANDAS是中国人攒出来的山寨版R

: 处处透露着山寨气息

: 一点自己的改进都没有

: 真是给中国人丢人



【在 m*****n 的大作中提到】
: PANDAS是中国人攒出来的山寨版R
: 处处透露着山寨气息
: 一点自己的改进都没有
: 真是给中国人丢人

avatar
m*n
32
我记得别人讨论过这个问题
就是中国一个大学生
靠着这个移民美国了?

【在 d******a 的大作中提到】
: 创始人是老外。。。。
:
:
: PANDAS是中国人攒出来的山寨版R
:
: 处处透露着山寨气息
:
: 一点自己的改进都没有
:
: 真是给中国人丢人
:

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。