avatar
data science这行不妙啊# Programming - 葵花宝典
p*y
1
我12月开始上班。已经把OPT的申请交上去了。
公司找的律师非要给办H1B (公司已经同意sponser 加急的H1B)。
我之前发email已经说了,最近OPT办的很快,预计11月的时候可以下来。可以等到11月
的时候,如果OPT还没有下来,
咱们就办加急的H1B,这样一方面能保证12月可以上班,还有很大几率不浪费OPT,到时
申请明年的H1B还省了加急费。
公司回信说,听律师的意见。
今天律师发信说,他没有看出用OPT不用H1B有什么好处。
难道要我直接说,用OPT可以一年省我很多税才能说服他吗?
avatar
d*0
2
【 以下文字转载自 Programming 讨论区 】
发信人: d700 (nikon), 信区: Programming
标 题: 有懂obj-c 的吗?
发信站: BBS 未名空间站 (Tue Jul 26 20:09:27 2011, 美东)
若问一个简单的问题:
@interface {
NSIndexPath *currentPath;
}
@implementation
- (void)tableView:(UITableView *)tableView didSelectRowAtIndexPath:(
NSIndexPath *)indexPath {
...
currentPath = indexPath;
...
}
currentPath不alloc不init,后面也不release,cell每select一次就执行一次,这么用有什么
问题没有?
谢谢,
avatar
w*g
3
轮子太太太容易用了,上手非常快。
上手基本上就是跟会打开电视看似的。
马上就都要被自动化了。
avatar
f*r
4
为什么不可以直接说?

【在 p*******y 的大作中提到】
: 我12月开始上班。已经把OPT的申请交上去了。
: 公司找的律师非要给办H1B (公司已经同意sponser 加急的H1B)。
: 我之前发email已经说了,最近OPT办的很快,预计11月的时候可以下来。可以等到11月
: 的时候,如果OPT还没有下来,
: 咱们就办加急的H1B,这样一方面能保证12月可以上班,还有很大几率不浪费OPT,到时
: 申请明年的H1B还省了加急费。
: 公司回信说,听律师的意见。
: 今天律师发信说,他没有看出用OPT不用H1B有什么好处。
: 难道要我直接说,用OPT可以一年省我很多税才能说服他吗?

avatar
d*0
5
补充一下,
@implementation 里面还有其他很多的地方需要用到currentPath.
avatar
l*m
6
先是gui化。现在deap learning 都快 hello world了

【在 w***g 的大作中提到】
: 轮子太太太容易用了,上手非常快。
: 上手基本上就是跟会打开电视看似的。
: 马上就都要被自动化了。

avatar
c*g
7
你这样会有memory leak。
应该把currentPath 定义成property,然后赋值时用
self.currentPath = indexPath;
最后在dealloc里:
[currentPath release];

【在 d**0 的大作中提到】
: 补充一下,
: @implementation 里面还有其他很多的地方需要用到currentPath.

avatar
z*e
8

迟早的事
楼主就是死活不愿意认清这个现实
聪明人应该都看出来这个不可阻挡
很多理论已经被轮子化了

【在 l*******m 的大作中提到】
: 先是gui化。现在deap learning 都快 hello world了
avatar
d*0
9
我一直以为这样用没有问题,因为从来也没有new/alloc/retain/copy 所以release应
该都是系统handle的。profiler里面从来也没有发现过有Leak. 后来发现好像有些不妥。
象这样的private ivar,一定要做成property吗?
谢谢

【在 c********g 的大作中提到】
: 你这样会有memory leak。
: 应该把currentPath 定义成property,然后赋值时用
: self.currentPath = indexPath;
: 最后在dealloc里:
: [currentPath release];

avatar
c*y
10
DS重点是算法啊,抽象化问题和决定用什么数据来跑模型,编程那部分没有技术含量,
即使没有轮子以前也没啥编程门槛。
avatar
c*g
11
当然不一定都要做成property。通常如果没有external的access,就不一定用property
。但这样的话你要自己handle release/retain。比如上面的程序就会是:
if (currentPath) {
[currentPath release];
}
currentPath = [indexPath retain];
memory management很重要。你应该从一开始就尽量注意。不然到后来会很麻烦。你用
什么做profiling?Leak有些conservative,有些leak查不出来。应该用ObjAlloc和
Memory。

妥。

【在 d**0 的大作中提到】
: 我一直以为这样用没有问题,因为从来也没有new/alloc/retain/copy 所以release应
: 该都是系统handle的。profiler里面从来也没有发现过有Leak. 后来发现好像有些不妥。
: 象这样的private ivar,一定要做成property吗?
: 谢谢

avatar
w*g
12
随便暴力上一个万能算法,比如xgboost,或者上一个caffe,
精确度达到80%。你找一个最牛的人来做,精确度可能能达到85%。
这个是两个极端。实际雇一个比较靠谱的DS来做,精确度可能能到82%。
不自己雇人,等着技术进步,可能到明年万能算法也能直接到82%。
所以DS一般会ETL,能用万能算法就可以了,根本没有必要知道算法背后
的数学。会数学的,除非好到能推进state of art,其余的也会赚不到钱。

【在 c*******y 的大作中提到】
: DS重点是算法啊,抽象化问题和决定用什么数据来跑模型,编程那部分没有技术含量,
: 即使没有轮子以前也没啥编程门槛。

avatar
l*s
13
计算不重要,重要是的对行业的理解和演讲能力

【在 w***g 的大作中提到】
: 随便暴力上一个万能算法,比如xgboost,或者上一个caffe,
: 精确度达到80%。你找一个最牛的人来做,精确度可能能达到85%。
: 这个是两个极端。实际雇一个比较靠谱的DS来做,精确度可能能到82%。
: 不自己雇人,等着技术进步,可能到明年万能算法也能直接到82%。
: 所以DS一般会ETL,能用万能算法就可以了,根本没有必要知道算法背后
: 的数学。会数学的,除非好到能推进state of art,其余的也会赚不到钱。

avatar
l*m
14
ml算法随便写一个很容易,写得性能好很不容易。比如boosting trees, 实现很多,但
是xgboost确实很快,overfiting 小。看看了code, 还是很牛的

【在 c*******y 的大作中提到】
: DS重点是算法啊,抽象化问题和决定用什么数据来跑模型,编程那部分没有技术含量,
: 即使没有轮子以前也没啥编程门槛。

avatar
d*r
15
其实上手不快的东西,基本只有2个原因:
1. 设计太烂, 想改简单点都不行.
2. 政治原因, 故意不改简单, 就是要留着门槛.
avatar
z*e
16

我们一致致力于解决第一种问题
第二种说的就是楼主这种
你觉得有戏吗?

【在 d*******r 的大作中提到】
: 其实上手不快的东西,基本只有2个原因:
: 1. 设计太烂, 想改简单点都不行.
: 2. 政治原因, 故意不改简单, 就是要留着门槛.

avatar
w*g
17
有个词叫IP,翻译成中文叫知识产权。
最牛B的创新,像可口可乐的秘方,都是商业机密,连patent都不会申请。
差点的,估计别人或早或晚也能想到的点子,或者别人一看产品也能
想出来怎么做的,才申请patent保护。
再差点的,知识产权本身没法变钱的,或者patent也没法保护的,才做开源软件。
光手机行业每年就有$10billion砸到patent war上,你尽可以当他们都是傻B。
开源自然也是一条路,但未必是最容易走的一条路。

【在 z****e 的大作中提到】
:
: 我们一致致力于解决第一种问题
: 第二种说的就是楼主这种
: 你觉得有戏吗?

avatar
t*d
18
有推荐这方面的书或者快速教程么?

【在 w***g 的大作中提到】
: 轮子太太太容易用了,上手非常快。
: 上手基本上就是跟会打开电视看似的。
: 马上就都要被自动化了。

avatar
w*g
19
我建议不要看书。书都是二手货。
要快速上手就两条,第一条是去看轮子自带的文档,
比如这个http://scikit-learn.org/stable/modules/classes.html
第二条是去查以前各种比赛的winning code。自从kaggle搞起来后,
这种code网上多的是。
还有就是学校教的课也不行。之前umich两门data science课程
没人教了来找我,我就去谈了下。他们只给1w一门课。我当时忍不住就笑了。
折腾几个月还不如我赚的一个零头。这种课要是能学到真本事就怪了。
像吴恩达开的那种网上的课,没见过的应该去看看他长什么样。
要练本事,捷径还是对着文档写代码。

【在 t*****d 的大作中提到】
: 有推荐这方面的书或者快速教程么?
avatar
p*u
20

OMG...

【在 w***g 的大作中提到】
: 我建议不要看书。书都是二手货。
: 要快速上手就两条,第一条是去看轮子自带的文档,
: 比如这个http://scikit-learn.org/stable/modules/classes.html
: 第二条是去查以前各种比赛的winning code。自从kaggle搞起来后,
: 这种code网上多的是。
: 还有就是学校教的课也不行。之前umich两门data science课程
: 没人教了来找我,我就去谈了下。他们只给1w一门课。我当时忍不住就笑了。
: 折腾几个月还不如我赚的一个零头。这种课要是能学到真本事就怪了。
: 像吴恩达开的那种网上的课,没见过的应该去看看他长什么样。
: 要练本事,捷径还是对着文档写代码。

avatar
d*r
21
这个是干货,mark了

【在 w***g 的大作中提到】
: 我建议不要看书。书都是二手货。
: 要快速上手就两条,第一条是去看轮子自带的文档,
: 比如这个http://scikit-learn.org/stable/modules/classes.html
: 第二条是去查以前各种比赛的winning code。自从kaggle搞起来后,
: 这种code网上多的是。
: 还有就是学校教的课也不行。之前umich两门data science课程
: 没人教了来找我,我就去谈了下。他们只给1w一门课。我当时忍不住就笑了。
: 折腾几个月还不如我赚的一个零头。这种课要是能学到真本事就怪了。
: 像吴恩达开的那种网上的课,没见过的应该去看看他长什么样。
: 要练本事,捷径还是对着文档写代码。

avatar
n*6
22
看不明白,吴恩达的课到底行不

【在 w***g 的大作中提到】
: 我建议不要看书。书都是二手货。
: 要快速上手就两条,第一条是去看轮子自带的文档,
: 比如这个http://scikit-learn.org/stable/modules/classes.html
: 第二条是去查以前各种比赛的winning code。自从kaggle搞起来后,
: 这种code网上多的是。
: 还有就是学校教的课也不行。之前umich两门data science课程
: 没人教了来找我,我就去谈了下。他们只给1w一门课。我当时忍不住就笑了。
: 折腾几个月还不如我赚的一个零头。这种课要是能学到真本事就怪了。
: 像吴恩达开的那种网上的课,没见过的应该去看看他长什么样。
: 要练本事,捷径还是对着文档写代码。

avatar
N*m
23
没有基础的学学挺好的
卫东这种大牛,当然没必要学了

【在 n****6 的大作中提到】
: 看不明白,吴恩达的课到底行不
avatar
w*g
24
应该是业内最好的吧。但是应该还是不如自己上手练。
课上教的和实际用的非常不一样。

【在 n****6 的大作中提到】
: 看不明白,吴恩达的课到底行不
avatar
e*o
25
看来办学是一本万利啊
http://datascience.berkeley.edu/
一个ms 6万刀,还是online的。

【在 w***g 的大作中提到】
: 我建议不要看书。书都是二手货。
: 要快速上手就两条,第一条是去看轮子自带的文档,
: 比如这个http://scikit-learn.org/stable/modules/classes.html
: 第二条是去查以前各种比赛的winning code。自从kaggle搞起来后,
: 这种code网上多的是。
: 还有就是学校教的课也不行。之前umich两门data science课程
: 没人教了来找我,我就去谈了下。他们只给1w一门课。我当时忍不住就笑了。
: 折腾几个月还不如我赚的一个零头。这种课要是能学到真本事就怪了。
: 像吴恩达开的那种网上的课,没见过的应该去看看他长什么样。
: 要练本事,捷径还是对着文档写代码。

avatar
n*7
26

长什么样是什么意思?比吴孟达还是好些吧

【在 w***g 的大作中提到】
: 我建议不要看书。书都是二手货。
: 要快速上手就两条,第一条是去看轮子自带的文档,
: 比如这个http://scikit-learn.org/stable/modules/classes.html
: 第二条是去查以前各种比赛的winning code。自从kaggle搞起来后,
: 这种code网上多的是。
: 还有就是学校教的课也不行。之前umich两门data science课程
: 没人教了来找我,我就去谈了下。他们只给1w一门课。我当时忍不住就笑了。
: 折腾几个月还不如我赚的一个零头。这种课要是能学到真本事就怪了。
: 像吴恩达开的那种网上的课,没见过的应该去看看他长什么样。
: 要练本事,捷径还是对着文档写代码。

avatar
ET
27
3年前我上过他coursera的课.那时对ML的需求和热度还不如今天
他讲得不错,容易懂。课后联系也比较实际。

【在 w***g 的大作中提到】
: 应该是业内最好的吧。但是应该还是不如自己上手练。
: 课上教的和实际用的非常不一样。

avatar
z*e
28

那不一定啊
法律上,很多东西是不受法律保护的
其中包括了这几个东西
algorithm算法,mathematical formulas数学公式,ideas
在欧洲,算法是一定不能patentable
在美国,法律上也不保护,但是有一定可操作的空间
但是总体上看,法官会倾向于不保护数学,算法这些东东
因为太抽象,如果这种东西可以申请专利的话
我把吃饭这个动作直接抽象化之后申请专利
那岂不是每一个人吃一口饭都要向我纳税?
这不是搞笑嘛
法律patent保护的是什么呢?
主要不是抽象的东西,是具体的实现
同样一个算法,你自己吭哧吭哧写出来了
不让别人抄袭你的源代码,这个法律是保护的
但是如果同样一个算法,别人同样看懂了
然后他根本不看你的impl,然后自己通过某种方式实现了
那这个东西在市场上跟你的产品竞争,你是没有办法告它的
最典型的例子就类似hadoop,hadoop的实现根本就是狗的三篇论文的实现
但是你不能告它们,因为从头到尾都是它们自己写出来的
记住啊,算法,数学,ideas这些都不能patentable
这里有灰色地带,比如压缩算法有好几个都有patent
但是这个只能说一般法律倾向于不发patent
因为这样有利于市场自由竞争
所以你就算打算申请什么patent,过不过都先不说
就算申请过了,我换个国家publish,你能怎么办?
要求us把apache.org给ban掉?可能么?
欧洲可不保护你哦,还有天朝,日本,多的是国家随便玩
而且就算全世界都保护了,你来告,也有很大的风险,能不能告赢呢?
所以别闹了,没戏,估计第一步就挂了
比如最近一个案例就是us courts把一个判定信用卡欺诈的算法的专利申请给干掉了
我不认为你的算法会高级多少,这里面有很大的争议,但是一般要求一个specific
program
就是要你自己实现一个program,然后保护这个program,而不是algorithm
我认为你有空玩这种小算盘,不如好好把系统给做好
对谁都有好处,别一天到晚琢磨怎么插管吸血
都是拉仇恨的,小心到时候闹起来被送集中营
当年元首为啥送了一堆犹太人进集中营毒气室?
这可不是什么没有民意基础的,你也没时间跟法官那边去扯这个蛋
而且开源的意义在于
你不做,别人会做
这不是世界求着你去做
而是你得赶紧去做
如果你不做,别人做了
名气什么都是别人的
地球离开了谁一样转,有的是炮灰想投入开源的伟大事业
别太把自己当回事,地球上聪明人很多

【在 w***g 的大作中提到】
: 有个词叫IP,翻译成中文叫知识产权。
: 最牛B的创新,像可口可乐的秘方,都是商业机密,连patent都不会申请。
: 差点的,估计别人或早或晚也能想到的点子,或者别人一看产品也能
: 想出来怎么做的,才申请patent保护。
: 再差点的,知识产权本身没法变钱的,或者patent也没法保护的,才做开源软件。
: 光手机行业每年就有$10billion砸到patent war上,你尽可以当他们都是傻B。
: 开源自然也是一条路,但未必是最容易走的一条路。

avatar
z*e
29
一般认为algorithm是math的一种
而你要patent math,hoho
good luck
全世界范围内都不太可能成功
你的竞争对手只要抓住这一条狠狠打你
你基本上就挂了
What Are Abstract Ideas? Abstract ideas are concepts like pure mathematics
and algorithms. You cannot patent a formula. However, you can patent an
application of that formula. Thus, while you cannot patent a mathematical
formula that produces nonrepeating patterns, you can patent paper products
that use that formula to prevent rolls of paper from sticking together. -
See more at: http://www.legalmatch.com/law-library/article/what-cant-be-patented.html#sthash.we4KDOxk.dpuf
avatar
z*e
30
而离开了algorithm,其他算个p啊
一点crud和impl,我不知道patent有个毛意义
真有人觉得有些algorithm只有某个语言才能做么?
显然不可能嘛,哎哟,所以从头到尾这个东西就不可能受到多少法律的保护
所以我只需要argue说,我知道的只有algorithm
剩下的东西都是我自己写的,你就没办法告我
除非你证明我抄袭了你的源代码,那我们用的语言都不一样
抄袭个p啊,别闹了,这种小算盘人家早有人打过了
avatar
s*y
31
zhaoce 童鞋回帖也是Java范的:原贴说什么不重要,我把我的组合拳打完就行了。^_^

【在 z****e 的大作中提到】
: 而离开了algorithm,其他算个p啊
: 一点crud和impl,我不知道patent有个毛意义
: 真有人觉得有些algorithm只有某个语言才能做么?
: 显然不可能嘛,哎哟,所以从头到尾这个东西就不可能受到多少法律的保护
: 所以我只需要argue说,我知道的只有algorithm
: 剩下的东西都是我自己写的,你就没办法告我
: 除非你证明我抄袭了你的源代码,那我们用的语言都不一样
: 抄袭个p啊,别闹了,这种小算盘人家早有人打过了

avatar
z*e
32

_^
我的意思是这个东西没有办法patentable
最核心的东西无法patentable的话,你想用这个赚钱是不可能的
迟早被开源干掉,而开源可不是非你不可
你不做,有的是人做
这个趋势无法阻挡,你要么顺应这个趋势,要么die
我回的是它的回帖

【在 s******y 的大作中提到】
: zhaoce 童鞋回帖也是Java范的:原贴说什么不重要,我把我的组合拳打完就行了。^_^
avatar
s*y
33
他说的是最能赚钱的保密,能赚一段钱的就patent,都做不到的就开源。原帖是个分类
问题。
你举了个例子说核心的东西,不能patent,所以不能赚钱。首先,核心的东西可能是最
能赚钱的,所以,有可能属于保密级,和patent无关;其次,你是怎么从所谓核心不能
patent推出不能用核心赚钱的呢?最后,你怎么从核心不能赚钱,推到必会被开源干掉
的?这个脑洞大的让人敬仰。

【在 z****e 的大作中提到】
:
: _^
: 我的意思是这个东西没有办法patentable
: 最核心的东西无法patentable的话,你想用这个赚钱是不可能的
: 迟早被开源干掉,而开源可不是非你不可
: 你不做,有的是人做
: 这个趋势无法阻挡,你要么顺应这个趋势,要么die
: 我回的是它的回帖

avatar
z*e
34

一步步来吧
首先,big data这些东西,核心就是一点算法
其他实现不重要
算法你要想赚钱
你一定要公开,否则别人没办法跟你合作
你连维护的人都找不到,总不能写代码,维护代码都你一个人做吧?
迟早你都要公开,要么你带到坟墓里面去,那跟没做出来有什么区别?
而且理论突破是有一定名望的,所以一般人都publish到各种杂志上去
让别人来挑刺,来验证这个理论是否正确,这一步很重要吧?
你如果不publish,别人没法验证理论正确与否
那就算你实现了,别人也不敢用,鬼知道这里面有什么猫腻
所以publish是一定的
从这一步开始
后面就全部完蛋了
因为你publish到杂志上去之后,这个东西就已经无法保密了
而法律是不保护算法本身作为patent的
所以别人完全可以看懂了你的理论也就是核心算法之后,自行实现
而这个实现有可能是开源的方式实现,再往后就完全无法控制了
全部是水到渠成的事,最后开源轮子变得简单易用
你的产品都不要说收费了,只要是不好用,别人都不会去用
所以只有你抢先一步,在别人把这个东西做成开源之前
你就把你的理论给实现,并开源,这样别人就无法跟你竞争
最后名望才有可能是你的,这就是spark他们一开始就把项目交给apache的原因
有人觉得自己比做spark那几个斯坦福的叫兽们更牛掰?
我不厚道滴笑了笑
至于你,先把核心,算法,patent以及开源这些关系理清楚再说
我觉得你没看懂我在说什么

【在 s******y 的大作中提到】
: 他说的是最能赚钱的保密,能赚一段钱的就patent,都做不到的就开源。原帖是个分类
: 问题。
: 你举了个例子说核心的东西,不能patent,所以不能赚钱。首先,核心的东西可能是最
: 能赚钱的,所以,有可能属于保密级,和patent无关;其次,你是怎么从所谓核心不能
: patent推出不能用核心赚钱的呢?最后,你怎么从核心不能赚钱,推到必会被开源干掉
: 的?这个脑洞大的让人敬仰。

avatar
z*e
35
可口可乐可是让每个人直接尝尝就好了
ml你怎么告诉客户你这个更好?
没法看啊,后台的轮子几乎无一例外今天都是开源的天下
为啥?因为后台的轮子不像前台那样直观
比如你说我做了一个东西,好看,是不是真好看,人家看了自有公论
好吃,比如可口可乐这种,人家喝了自有公论
都很容易通过感官直接判断出来
问题是软件轮子这种东西,你怎么证明呢?
你只能通过一堆乱七八糟的图表啊去解释半天
其实没用,人家还是看不懂,你只说结论不说过程是没有用的
所以只有通过把算法解释一遍,然后好坏,别人自己去试了才知道
抽象的东西就这点不好,不像具体的东西,好坏很容易判断
抽象的理论,没有办法直观上判断好坏
只能通过证明这种方式来验证,那你要想证明,就一定要让别人看到这个证明过程
这样别人才会承认你这个算法ok,否则没戏
而从这一步开始,之后全部不受法律保护
所以结论是一定挂,唯一的胜机就是抢先一步
抢在别人开源之前开源,而且还要尽可能迎合市场上的需求
就是jvm,你就是用c++开源,人家用java开源,你的轮子最后还是会输给对方
因为jvm更简单,更便于使用,所以spark在第一时间就在apache上开源了
wdong打的那点算盘人家早算过了
avatar
s*y
36
所以我才说你不管别人怎么说,你都自己打自己的一套拳。
另外,算法实现为什么不重要?实现了做成产品为什么不能赚钱?为什么一个算法必须
要和别人合作,要给别人用,才能赚钱?
越来越不知道你在说什么了。好了最后一帖留给你了。^_^

【在 z****e 的大作中提到】
: 可口可乐可是让每个人直接尝尝就好了
: ml你怎么告诉客户你这个更好?
: 没法看啊,后台的轮子几乎无一例外今天都是开源的天下
: 为啥?因为后台的轮子不像前台那样直观
: 比如你说我做了一个东西,好看,是不是真好看,人家看了自有公论
: 好吃,比如可口可乐这种,人家喝了自有公论
: 都很容易通过感官直接判断出来
: 问题是软件轮子这种东西,你怎么证明呢?
: 你只能通过一堆乱七八糟的图表啊去解释半天
: 其实没用,人家还是看不懂,你只说结论不说过程是没有用的

avatar
z*e
37

因为算法是抽象的东西,你要说服别人用你的轮子
最重要的是让别人明白,你这个轮子为什么好过其他轮子
这个过程其实是一个证明的过程
如果你无法从理论上证明自己的算法优于其他人的算法
那用户对于你的算法是不感兴趣的,也不敢用
而要证明这个过程,必需publish,而一旦publish
人家就看到了了,就看懂了,所有人都可以impl了
剩下impl之类的,就看谁做得更傻瓜了
这个jvm上的开源几乎必胜,因为jvm更傻瓜,更便于使用
你不做,有人会去做,只要有人在jvm上实现,这个轮子就赢了
所以wdong一开始的打算是保密
但是保密没用啊,你要证明自己的算法优于其他人算法
而这个证明过程你一定要公开算法,否则人家怎么判断呢?
只要你公开,其他人就能看得到,看得到的话,就有人看得懂
只要其他人看得懂,其他人就可以在jvm上实现
只要其他人在jvm上实现了,你用其他语言的实现
都会被这个其他人在jvm上实现的轮子干掉,因为这个轮子最简单
然后wdong还想公开了之后申请patent,但是算法不能patentable
所以还是不行,算法重要,不是说算法必需要跟人合作
说的是算法不受法律保护,看明白了没有?

【在 s******y 的大作中提到】
: 所以我才说你不管别人怎么说,你都自己打自己的一套拳。
: 另外,算法实现为什么不重要?实现了做成产品为什么不能赚钱?为什么一个算法必须
: 要和别人合作,要给别人用,才能赚钱?
: 越来越不知道你在说什么了。好了最后一帖留给你了。^_^

avatar
z*e
38
wdong的算盘就是
第一我保密
第二我申请专利
第三我再开源
保密肯定是不行的
理论的东西,就需要一个证明的过程
得让其他人来看你这个理论对还是错
光嘴巴上说,我这个好,这个好,没用的
客户不买账
跟可口可乐不一样,可口可乐你一喝就知道了
跟艺术也不一样,艺术好不好看,人家一看就知道了
这个秘方不用公开,但是算法优劣, 你见过不公开直接跑test cases的么?
就按照test cases的结果为准?
好像没有吧?而且一般这种客户也不敢用,我不知道你怎么实现的,我就不用
ml可不是什么必需品哦,不用不会挂掉哦,所以保密不可行
其次想打算patent,法律说了,算法不能patentable
所以别人只要看懂了你的理论,他们自己的impl,你是没有办法阻止的
如果你的理论正确,你的竞争对手一定会出现
那前两条路都挂了,怎么办?
只能开源了吧?开源了之后,对方再开源就没有太大意义了
对,而且动作还要快
要抢在别人在jvm上开源之前在jvm上开源
否则你用c++实现,人家用java实现,最后用的还是java的实现
因为更简单,所以必需一步到位,直接在jvm上开源,这样最简单
这也是spark,flink这些项目正在做的
而且就算是这样,这些项目互相之间都面临着巨大的竞争
因为弱点不断被暴露出来,比如streaming api,spark就做得不是很好
其他开源项目逮到这个机会,马上就做出另外一个开源项目来竞争
所以后端几乎是开源必胜,没啥疑问的
apache走到今天,也不是一蹴而就的,现在越来越强
一般商业公司很难跟apache在后端竞争
avatar
w*g
39
老赵已经进入无逻辑乱写模式了,还写这么长。
算法写成程序后,不需要publish,不需要别人看懂就可以让人用,
就可以比较优劣,这个需要动很多脑子才能想明白吗?
我见过几类人,我最喜欢一类:我们知道wdong牛x,钱拍出来了,
你去写吧。写出来我们也看不懂,也找不到能看懂的人,你写的东西
还是你自己来维护。你最好源代码都别给我,省得我手下的人偷出去
自己干。
第二类,我们想做这个但是我们不认识你,也不知道你能做多好。
我做个prototype让他们看下至少能做成这样。他们看了喜欢,钱
拍出来了,你去写吧。
第三类,自己以为自己懂技术,但又做不出来,过来问这问那。
问两下觉得自己能了,其实还是不行,过了十天半个月又回来问。
这种我现在一两个邮件就能鉴别出来,直接就不理了。
我原来还自做多情地想,我不在了你们看不懂源码怎么办。让他们
赶紧招个人我给培训培训,以后好接手。后来发现,出钱的那些根本
都不care这个。

【在 z****e 的大作中提到】
: wdong的算盘就是
: 第一我保密
: 第二我申请专利
: 第三我再开源
: 保密肯定是不行的
: 理论的东西,就需要一个证明的过程
: 得让其他人来看你这个理论对还是错
: 光嘴巴上说,我这个好,这个好,没用的
: 客户不买账
: 跟可口可乐不一样,可口可乐你一喝就知道了

avatar
z*e
40

哦, 你回到最开始的状态上去了
你打算不publish算法,就直接做产品了?
那客户凭什么相信你的算法比其他人的算法要强呢?
黑箱测试很危险哦,这是一
其次,安全性如何保证?我怎么知道你这里面有没有什么猫腻?
你以为开源仅仅是性能上的考虑?

【在 w***g 的大作中提到】
: 老赵已经进入无逻辑乱写模式了,还写这么长。
: 算法写成程序后,不需要publish,不需要别人看懂就可以让人用,
: 就可以比较优劣,这个需要动很多脑子才能想明白吗?
: 我见过几类人,我最喜欢一类:我们知道wdong牛x,钱拍出来了,
: 你去写吧。写出来我们也看不懂,也找不到能看懂的人,你写的东西
: 还是你自己来维护。你最好源代码都别给我,省得我手下的人偷出去
: 自己干。
: 第二类,我们想做这个但是我们不认识你,也不知道你能做多好。
: 我做个prototype让他们看下至少能做成这样。他们看了喜欢,钱
: 拍出来了,你去写吧。

avatar
z*e
41

另外,目测你已经看懂了算法patent没戏了
开始转向,不再说patent了
哈哈,写那么长看下来不容易吧?
你该感谢我
不过你也够落伍的,都什么年代了
后端现在谁掏钱买产品,都是开源+consulting赚钱
后端产品都快死绝了
这么说吧你如果上来就开源,就在jvm上开源
或许还有点戏,如果不是的话 -> die

【在 w***g 的大作中提到】
: 老赵已经进入无逻辑乱写模式了,还写这么长。
: 算法写成程序后,不需要publish,不需要别人看懂就可以让人用,
: 就可以比较优劣,这个需要动很多脑子才能想明白吗?
: 我见过几类人,我最喜欢一类:我们知道wdong牛x,钱拍出来了,
: 你去写吧。写出来我们也看不懂,也找不到能看懂的人,你写的东西
: 还是你自己来维护。你最好源代码都别给我,省得我手下的人偷出去
: 自己干。
: 第二类,我们想做这个但是我们不认识你,也不知道你能做多好。
: 我做个prototype让他们看下至少能做成这样。他们看了喜欢,钱
: 拍出来了,你去写吧。

avatar
l*s
42
对data mining来说这真不是啥问题。

【在 z****e 的大作中提到】
:
: 另外,目测你已经看懂了算法patent没戏了
: 开始转向,不再说patent了
: 哈哈,写那么长看下来不容易吧?
: 你该感谢我
: 不过你也够落伍的,都什么年代了
: 后端现在谁掏钱买产品,都是开源+consulting赚钱
: 后端产品都快死绝了
: 这么说吧你如果上来就开源,就在jvm上开源
: 或许还有点戏,如果不是的话 -> die

avatar
z*e
43

都是问题,现在靠卖后端产品license的公司利润都在下滑
当然也可以自我欺骗说不是问题,去试试吧,看看有多少个傻蛋会上当

【在 l*********s 的大作中提到】
: 对data mining来说这真不是啥问题。
avatar
l*s
44
你卖服务一样也不需要给客户看源代码/解释算法。

【在 z****e 的大作中提到】
:
: 都是问题,现在靠卖后端产品license的公司利润都在下滑
: 当然也可以自我欺骗说不是问题,去试试吧,看看有多少个傻蛋会上当

avatar
z*e
45

你怎么还停留在手工作坊阶段呢?
凡事都亲力亲为,连training都不给
那跟你干活的程序猴要多傻逼?
人家也为自己的career着想,跟你干,什么都得不到
那为啥跟你干呢?你是不是就希望别人给钱就好了
然后什么都你来干?你挂了怎么办?
这不就是手工作坊式的搞法吗?
还停留在单枪匹马单挑的阶段
所以我就能明白为什么每次说到核心问题
你总是含糊其辞,敷衍而过
当然我也在敷衍,但是我不会装得好像我不是在敷衍一样
哈哈
拉倒吧,你觉得你把别人都当傻逼来忽悠
别人真会上当?

【在 w***g 的大作中提到】
: 老赵已经进入无逻辑乱写模式了,还写这么长。
: 算法写成程序后,不需要publish,不需要别人看懂就可以让人用,
: 就可以比较优劣,这个需要动很多脑子才能想明白吗?
: 我见过几类人,我最喜欢一类:我们知道wdong牛x,钱拍出来了,
: 你去写吧。写出来我们也看不懂,也找不到能看懂的人,你写的东西
: 还是你自己来维护。你最好源代码都别给我,省得我手下的人偷出去
: 自己干。
: 第二类,我们想做这个但是我们不认识你,也不知道你能做多好。
: 我做个prototype让他们看下至少能做成这样。他们看了喜欢,钱
: 拍出来了,你去写吧。

avatar
z*e
46

第一,我不卖服务,我经常在甲方做
是别人来跟我卖服务
其次,我可能不看源代码,但是我信不过那些兜售服务和产品的
所以一般我都自己动手做,so far so good
反而跳槽了几次,一次比一次好,因为其他公司都看中了我动手的经验
因为他们觉得我知道这里面是怎么回事
而不是什么都交给consultant去搞
现在乙方还有市场吗?我看全世界基本上都是甲方在养马农
facebook, netflix这些不都是甲方?谁这年头还去买什么服务之类的?
ibm的利润在下滑,醒醒,多看点新闻

【在 l*********s 的大作中提到】
: 你卖服务一样也不需要给客户看源代码/解释算法。
avatar
w*g
47
第一算法可以patent,第二算法patent了可以license出去收钱。
第三算法patent了可以提供竞争优势。这几点都是明显的事实。
“纯”算法不能patent只是一个神话而已。

【在 z****e 的大作中提到】
:
: 第一,我不卖服务,我经常在甲方做
: 是别人来跟我卖服务
: 其次,我可能不看源代码,但是我信不过那些兜售服务和产品的
: 所以一般我都自己动手做,so far so good
: 反而跳槽了几次,一次比一次好,因为其他公司都看中了我动手的经验
: 因为他们觉得我知道这里面是怎么回事
: 而不是什么都交给consultant去搞
: 现在乙方还有市场吗?我看全世界基本上都是甲方在养马农
: facebook, netflix这些不都是甲方?谁这年头还去买什么服务之类的?

avatar
l*s
48
听上去你和consultant其别不大呀。

【在 z****e 的大作中提到】
:
: 第一,我不卖服务,我经常在甲方做
: 是别人来跟我卖服务
: 其次,我可能不看源代码,但是我信不过那些兜售服务和产品的
: 所以一般我都自己动手做,so far so good
: 反而跳槽了几次,一次比一次好,因为其他公司都看中了我动手的经验
: 因为他们觉得我知道这里面是怎么回事
: 而不是什么都交给consultant去搞
: 现在乙方还有市场吗?我看全世界基本上都是甲方在养马农
: facebook, netflix这些不都是甲方?谁这年头还去买什么服务之类的?

avatar
w*g
49
他连名字都不敢报上来。因为一旦被东家看到这些逻辑不清的帖子马上工作就都没了。
其实说来说去就是java, eclipse, open source会统治宇宙。你们要想活命
就赶紧转java,学eclipse,把代码都open了。
往小里说,整个IT业,往大力說整个人类社会,一种模式能长时间处于统治地位
的情况是很罕见的。甚至人类本身都是违背整个宇宙熵增的大趋势下的局部自组织
现象的产物。

【在 l*********s 的大作中提到】
: 听上去你和consultant其别不大呀。
avatar
z*e
50

这一切都建立在算法能够patent的基础之上
这个也许可以argue,但是美国法律倾向于不保护纯粹的算法
你可以试试,但是我觉得你没戏哈哈
神话与否,我反正是不信你说的,我相信我自己看到的
如果算法可以patentable的话,那你现在用的算法里面
就没有侵权的?你学算法的时候,写个impl,给谁上税了?
用点脑子

【在 w***g 的大作中提到】
: 第一算法可以patent,第二算法patent了可以license出去收钱。
: 第三算法patent了可以提供竞争优势。这几点都是明显的事实。
: “纯”算法不能patent只是一个神话而已。

avatar
z*e
51

因为你比对方懂得更多的时候,就不会被对方忽悠
当然不代表所有人都不会上当,有的是各种傻瓜不是?

【在 l*********s 的大作中提到】
: 听上去你和consultant其别不大呀。
avatar
z*e
52

哈哈哈,看把你悲愤得,你要不要过来见个面啊?
机票自理就好了,我负责去机场接你
或者你赌个实在的,比如拼图姐的20w人肉费
我就告诉你我现在在哪
别玩人肉这么低贱的游戏ok?

【在 w***g 的大作中提到】
: 他连名字都不敢报上来。因为一旦被东家看到这些逻辑不清的帖子马上工作就都没了。
: 其实说来说去就是java, eclipse, open source会统治宇宙。你们要想活命
: 就赶紧转java,学eclipse,把代码都open了。
: 往小里说,整个IT业,往大力說整个人类社会,一种模式能长时间处于统治地位
: 的情况是很罕见的。甚至人类本身都是违背整个宇宙熵增的大趋势下的局部自组织
: 现象的产物。

avatar
k*i
53
AI,ML,NN现在又火起来,主要是理论及算法有突破,还是系统及应用发展驱动的?后者
的话,还是要靠black arts试错。

【在 w***g 的大作中提到】
: 轮子太太太容易用了,上手非常快。
: 上手基本上就是跟会打开电视看似的。
: 马上就都要被自动化了。

avatar
p*u
54

bcoz of rise of big data, which was brought by more Internet users and
mobile apps (more Internet time). Steve Jobs did create a new era.

【在 k****i 的大作中提到】
: AI,ML,NN现在又火起来,主要是理论及算法有突破,还是系统及应用发展驱动的?后者
: 的话,还是要靠black arts试错。

avatar
z*e
55

如果你想在后端survive得久一点的话,差不多是这样
轮子全open,然后各自实现应用逻辑
你以为把同样的东西翻来覆去滴做很好玩吗?
不知道程序员最讨厌的就是需求变动吗?

【在 w***g 的大作中提到】
: 他连名字都不敢报上来。因为一旦被东家看到这些逻辑不清的帖子马上工作就都没了。
: 其实说来说去就是java, eclipse, open source会统治宇宙。你们要想活命
: 就赶紧转java,学eclipse,把代码都open了。
: 往小里说,整个IT业,往大力說整个人类社会,一种模式能长时间处于统治地位
: 的情况是很罕见的。甚至人类本身都是违背整个宇宙熵增的大趋势下的局部自组织
: 现象的产物。

avatar
w*g
56
需求变动才能有新的经济,这点你都理解不了,和我的层次差得还很远。
最牛B的,都是没有需求创造出需求的人。差点的,能从需求变动中看到机会。
最差的,只知道需求变动的时候骂娘。

【在 z****e 的大作中提到】
:
: 如果你想在后端survive得久一点的话,差不多是这样
: 轮子全open,然后各自实现应用逻辑
: 你以为把同样的东西翻来覆去滴做很好玩吗?
: 不知道程序员最讨厌的就是需求变动吗?

avatar
z*e
57

那不叫需求变动,那叫新增需求
为什么会有轮子?就是不希望在同样的需求上反反复复地浪费时间去写同样的代码
20年前有一种预测说是可以预测程序员的代码量进而推断工作量
根据需求的大小,切割成一小块一小块,然后分别预测工作量etc.
后来这个之所以挂了就是因为有了轮子,有了可以复用的部分
人们就不再需要重复性地劳动了,所以开发变得不太可预测
你居然认为同样的需求重复开发是什么新经济
这就跟经济学家吃狗屎差不多,制造gdp?
听过那个笑话吧,你把狗屎吃了,我给你十万
然后他就把狗屎吃了,给了他十万,然后对方说,你再把这狗屎吃了
我再把十万还给你,这么一来二去,创造了二十万的gdp
你这个理论就跟这两经济学家差不多了

【在 w***g 的大作中提到】
: 需求变动才能有新的经济,这点你都理解不了,和我的层次差得还很远。
: 最牛B的,都是没有需求创造出需求的人。差点的,能从需求变动中看到机会。
: 最差的,只知道需求变动的时候骂娘。

avatar
l*s
58
视频,压缩的专利算法不要太多,连window现在都要自己花钱买dvd回放软件了。

【在 z****e 的大作中提到】
:
: 那不叫需求变动,那叫新增需求
: 为什么会有轮子?就是不希望在同样的需求上反反复复地浪费时间去写同样的代码
: 20年前有一种预测说是可以预测程序员的代码量进而推断工作量
: 根据需求的大小,切割成一小块一小块,然后分别预测工作量etc.
: 后来这个之所以挂了就是因为有了轮子,有了可以复用的部分
: 人们就不再需要重复性地劳动了,所以开发变得不太可预测
: 你居然认为同样的需求重复开发是什么新经济
: 这就跟经济学家吃狗屎差不多,制造gdp?
: 听过那个笑话吧,你把狗屎吃了,我给你十万

avatar
z*e
59

是的,这个领域好像比较特殊,至于为什么,我不是很清楚
但是其他领域,貌似没看到什么专利放在算法上
我们刚提交了一个关于信用卡fraud检测的算法专利申请
直接被干掉,这种专利很难通过,反正这一块有明显可以争论的空间
你可以试试,但是我显然不看好你的申请
一般认为,这种专利需要一个impl,然后保护的是impl,而非抽象的algorithm
这里面如何搞,那就不知道了,真有心的话,应该问问专利律师

【在 l*********s 的大作中提到】
: 视频,压缩的专利算法不要太多,连window现在都要自己花钱买dvd回放软件了。
avatar
g*g
60
新增需求不要紧,得加钱。把需求写清楚就不会口说无凭。

【在 w***g 的大作中提到】
: 需求变动才能有新的经济,这点你都理解不了,和我的层次差得还很远。
: 最牛B的,都是没有需求创造出需求的人。差点的,能从需求变动中看到机会。
: 最差的,只知道需求变动的时候骂娘。

avatar
l*s
61
那是你们太弱了,连双击都有专利。
“In May 2010, Microsoft sued Salesforce.com for infringement of nine
patents, including patents on:
[1]system and method for providing and displaying a Web page having an
embedded menu
[2] method and system for stacking toolbars in a computer display”

【在 z****e 的大作中提到】
:
: 是的,这个领域好像比较特殊,至于为什么,我不是很清楚
: 但是其他领域,貌似没看到什么专利放在算法上
: 我们刚提交了一个关于信用卡fraud检测的算法专利申请
: 直接被干掉,这种专利很难通过,反正这一块有明显可以争论的空间
: 你可以试试,但是我显然不看好你的申请
: 一般认为,这种专利需要一个impl,然后保护的是impl,而非抽象的algorithm
: 这里面如何搞,那就不知道了,真有心的话,应该问问专利律师

avatar
z*e
62

这不是算法,哈哈,m$耍流氓并不代表其他人也都可以耍成功
ibm的流氓专利也不少
基本上各个国家法律都有这么一条
Patent protection - software
You should seek professional advice on whether your particular software
falls within the definition of what may be patented.
Software inventions must be industrially applied. Software that is merely a
procedure for solving a given type of mathematical problem is not patentable.
Similarly mathematical algorithms and abstract intellectual concepts on
their own, are not patentable.
你非要钻空子,折腾,也许可以成功,不把话说死,但是很难
ml的那些算法,我没听说哪个是专利,一般意义上的算法,没有多少是专利
压缩解码什么另说

【在 l*********s 的大作中提到】
: 那是你们太弱了,连双击都有专利。
: “In May 2010, Microsoft sued Salesforce.com for infringement of nine
: patents, including patents on:
: [1]system and method for providing and displaying a Web page having an
: embedded menu
: [2] method and system for stacking toolbars in a computer display”

avatar
z*e
63

另外open source在道义上站得住脚,所以你告open source
尤其是非赢利组织这种,很难,法官搞不好还没开庭
心里就倾向于对方了,因为这个时候,你代表的是红果果的资本家
对方可是非盈利组织哦,那形象太好了,就跟公益慈善差不多了
估计到时候舆论也是一边倒反你,谁会站在资本家一边说话呢?
这种操作空间很大的case,舆论怎么看,太重要了
不管是法官还是陪审团,都会倾向于开源组织的
我觉得就算你拿到了专利,被告或者主动提告后胜算也不大

【在 l*********s 的大作中提到】
: 那是你们太弱了,连双击都有专利。
: “In May 2010, Microsoft sued Salesforce.com for infringement of nine
: patents, including patents on:
: [1]system and method for providing and displaying a Web page having an
: embedded menu
: [2] method and system for stacking toolbars in a computer display”

avatar
w*g
64
当年SCO告IBM,结局一开始就是注定的。但这未必就不是MS的一步好棋。
SCO完蛋了,但未必SCO中的每一个人都没有受益。
法律只是一套游戏规则,可以正着玩,也可以反这玩,更别说有一批人
成天loby来loby去,一天到晚出新的法律玩了。
你前面吃屎的比喻很经典。在0和博弈环境下类似双方都吃屎的情况很常见。
经济学就是这么运转的。

【在 z****e 的大作中提到】
:
: 另外open source在道义上站得住脚,所以你告open source
: 尤其是非赢利组织这种,很难,法官搞不好还没开庭
: 心里就倾向于对方了,因为这个时候,你代表的是红果果的资本家
: 对方可是非盈利组织哦,那形象太好了,就跟公益慈善差不多了
: 估计到时候舆论也是一边倒反你,谁会站在资本家一边说话呢?
: 这种操作空间很大的case,舆论怎么看,太重要了
: 不管是法官还是陪审团,都会倾向于开源组织的
: 我觉得就算你拿到了专利,被告或者主动提告后胜算也不大

avatar
l*m
65
数学定理和证明不是patentable,但是算法是可以的,比如ms的lamdamart, Google的
dropout

a
patentable.

【在 z****e 的大作中提到】
:
: 另外open source在道义上站得住脚,所以你告open source
: 尤其是非赢利组织这种,很难,法官搞不好还没开庭
: 心里就倾向于对方了,因为这个时候,你代表的是红果果的资本家
: 对方可是非盈利组织哦,那形象太好了,就跟公益慈善差不多了
: 估计到时候舆论也是一边倒反你,谁会站在资本家一边说话呢?
: 这种操作空间很大的case,舆论怎么看,太重要了
: 不管是法官还是陪审团,都会倾向于开源组织的
: 我觉得就算你拿到了专利,被告或者主动提告后胜算也不大

avatar
z*e
66

经济学也许是这么运作的,但是并不代表这其中的荒谬之处就会永远地荒诞下去
你不是北大的么?北大当年可是天朝民主的灯塔
难道没有告诉你,你不可能永远滴欺骗所有人吗?
老把别人当傻子,最终吃亏的往往是自己
说回法律游戏,你没那个时间,大公司养了一堆文科生
没事就打官司互相攻击,你个人哪有那个时间去浪费在法庭上
把心思放在正道上,君子爱财,取之有道

【在 w***g 的大作中提到】
: 当年SCO告IBM,结局一开始就是注定的。但这未必就不是MS的一步好棋。
: SCO完蛋了,但未必SCO中的每一个人都没有受益。
: 法律只是一套游戏规则,可以正着玩,也可以反这玩,更别说有一批人
: 成天loby来loby去,一天到晚出新的法律玩了。
: 你前面吃屎的比喻很经典。在0和博弈环境下类似双方都吃屎的情况很常见。
: 经济学就是这么运转的。

avatar
z*e
67

alogirthm从本质上说就是math的一种,这个东西根本就是从math上弄过来的
这一块有钻空子的地方,但是大多数时候,倾向于不patentable
我不看好你能够成功,可以试试,提交申请都可以提交,但是通过不通过
那就是另外一回事了

【在 l*******m 的大作中提到】
: 数学定理和证明不是patentable,但是算法是可以的,比如ms的lamdamart, Google的
: dropout
:
: a
: patentable.

avatar
l*s
68
算法和数学的区别在于你可以发明算法,但是你只能发现数学。对一般个人来说玩不起
专利,也没必要,没人吃饱了撑的来搞你。对公司来说,你不玩就等着被别人玩到死吧。

【在 z****e 的大作中提到】
:
: alogirthm从本质上说就是math的一种,这个东西根本就是从math上弄过来的
: 这一块有钻空子的地方,但是大多数时候,倾向于不patentable
: 我不看好你能够成功,可以试试,提交申请都可以提交,但是通过不通过
: 那就是另外一回事了

avatar
z*e
69

吧。
数学就是被发明的,发现什么?数分就教你怎么发明数学

【在 l*********s 的大作中提到】
: 算法和数学的区别在于你可以发明算法,但是你只能发现数学。对一般个人来说玩不起
: 专利,也没必要,没人吃饱了撑的来搞你。对公司来说,你不玩就等着被别人玩到死吧。

avatar
l*s
70
你跟我说没用,你得去找专利局说。

【在 z****e 的大作中提到】
:
: 吧。
: 数学就是被发明的,发现什么?数分就教你怎么发明数学

avatar
z*e
71

你跟我说有毛用,专利还是通过不了
打算利用算法冲击专利的你又不是第一个
早就有人打这个主意了,失败的比比皆是
当然还是会有各种忽悠,wishful thinking,认为自己可以通过
那就尽管去试吧,我已经找到一个国家的法律明确跟你说
不行

【在 l*********s 的大作中提到】
: 你跟我说没用,你得去找专利局说。
avatar
z*e
72
又看了下wikipedia
https://en.wikipedia.org/wiki/Software_patent
有几个国家是肯定不行的
而且就算允许,也多数是针对软件本身,并不涉及算法
对于算法,多数国家倾向的态度是不行
包括中国在内,就是不行
http://www.zhihu.com/question/26590241
你们几个小瘪三,一天到晚不琢磨如何创造价值
成天琢磨这种手段插管吸血,呵呵,看了还是挺好玩的
小算盘打得噼里啪啦响
看人家文科生境界多高
吴云,一个不想写案子的专利代理师
算法大多是利用了数学公式,虽然现在有很多算法是利用程序来实现的,但是本质上还
是对相关公式进行了利用,而专利相当于是一个垄断性的保护,如果算法也被保护起来
了,那么相当于只能专利权人才能使用这些公式,别人都不行了,这显然是不公平的。
avatar
w*g
73
我既没有申请过专利也没有起诉过别人。我说的是对工业界历史现实的理解。
你可千万别当真了。不排除有人拿雇我开发的算法去申请专利了,那个我根本
不care。卖出去了就不是自己的了,人家爱干嘛干嘛去。

【在 z****e 的大作中提到】
: 又看了下wikipedia
: https://en.wikipedia.org/wiki/Software_patent
: 有几个国家是肯定不行的
: 而且就算允许,也多数是针对软件本身,并不涉及算法
: 对于算法,多数国家倾向的态度是不行
: 包括中国在内,就是不行
: http://www.zhihu.com/question/26590241
: 你们几个小瘪三,一天到晚不琢磨如何创造价值
: 成天琢磨这种手段插管吸血,呵呵,看了还是挺好玩的
: 小算盘打得噼里啪啦响

avatar
g*r
74
DS的大头是statistic和ml啊

【在 w***g 的大作中提到】
: 轮子太太太容易用了,上手非常快。
: 上手基本上就是跟会打开电视看似的。
: 马上就都要被自动化了。

avatar
b*s
75
直接被秒否估计是量纲搞错了,尤其是交到瑞士专利局的,回去再仔细检查一下

【在 z****e 的大作中提到】
: 又看了下wikipedia
: https://en.wikipedia.org/wiki/Software_patent
: 有几个国家是肯定不行的
: 而且就算允许,也多数是针对软件本身,并不涉及算法
: 对于算法,多数国家倾向的态度是不行
: 包括中国在内,就是不行
: http://www.zhihu.com/question/26590241
: 你们几个小瘪三,一天到晚不琢磨如何创造价值
: 成天琢磨这种手段插管吸血,呵呵,看了还是挺好玩的
: 小算盘打得噼里啪啦响

avatar
h*t
76
US has a lot of algorithm patterns. e.g, SIFT by David Lowe

【在 z****e 的大作中提到】
: 又看了下wikipedia
: https://en.wikipedia.org/wiki/Software_patent
: 有几个国家是肯定不行的
: 而且就算允许,也多数是针对软件本身,并不涉及算法
: 对于算法,多数国家倾向的态度是不行
: 包括中国在内,就是不行
: http://www.zhihu.com/question/26590241
: 你们几个小瘪三,一天到晚不琢磨如何创造价值
: 成天琢磨这种手段插管吸血,呵呵,看了还是挺好玩的
: 小算盘打得噼里啪啦响

avatar
z*e
77

把前面原文认真阅读,该说的都说了,重复就无聊了
另外这个算法owner主体是加拿大大学ubc,这个主体跟没有owner没啥区别

【在 h***t 的大作中提到】
: US has a lot of algorithm patterns. e.g, SIFT by David Lowe
avatar
c*v
78
这个帖子当初我为什么没有在上面留名字?
回国度假了吗?
如果按title算。我10年的algorithm engineer工龄啊。


: 把前面原文认真阅读,该说的都说了,重复就无聊了

: 另外这个算法owner主体是加拿大大学ubc,这个主体跟没有owner没啥区别



【在 z****e 的大作中提到】
:
: 把前面原文认真阅读,该说的都说了,重复就无聊了
: 另外这个算法owner主体是加拿大大学ubc,这个主体跟没有owner没啥区别

avatar
N*r
79

我之前讲过这个问题啊
很多问题,特征自动衍生,自动筛选,上 xgboost ,基本上效果就还可以,最后的准确
度差百分之几真无所谓、
实际上最重要的其实是数据的获取,和结果的解释,然后做商业决定,这个都是需要对
业务极端了解的
单纯的做cs ds都是没前途的,除非你做到最前沿, 否则更重要的是对业务的了解

【在 w***g 的大作中提到】
: 随便暴力上一个万能算法,比如xgboost,或者上一个caffe,
: 精确度达到80%。你找一个最牛的人来做,精确度可能能达到85%。
: 这个是两个极端。实际雇一个比较靠谱的DS来做,精确度可能能到82%。
: 不自己雇人,等着技术进步,可能到明年万能算法也能直接到82%。
: 所以DS一般会ETL,能用万能算法就可以了,根本没有必要知道算法背后
: 的数学。会数学的,除非好到能推进state of art,其余的也会赚不到钱。

avatar
c*v
80
(1)
何為前途?去goog,fb?如果以此為目標。
那麼你花兩年時間寫五萬行最流行的
語言的代碼。可以輕鬆達到。例如現在最流行DS,那麼你找二百個算法。
自己實現一遍python。再來一遍C plus。能進不去goog?
我說的這個辦法看上去慢。實際上很快。而且確定性很高。
java的話,實用的商業case難找。數據科學簡直是為中國人設置的專業。
數據和算法到處都是的時代。閉門寫碼即可。
其實實現一個自己的DL引擎。也要不了一年。因為未知的部份已經比較少了。
算法收斂的差不多了。
(2)
回到技術上來。『效果是不是可以』這可不是簡單的問題。
現有的ML庫這部分極其簡陋,只給個分數。
所以通用軟件給出的『效果都還可以』這個答案多數是錯誤的。
這不是因為效果是不是可以就應該這麼簡單。
而是這一部分,通用的工具處理不了!
簡單的說,一個算法的優劣衡量是極難的。
哪個效果好?這個問題一般人連注意到都不會注意到。
極難的問題往往就是如此。

【在 N*****r 的大作中提到】
:
: 我之前讲过这个问题啊
: 很多问题,特征自动衍生,自动筛选,上 xgboost ,基本上效果就还可以,最后的准确
: 度差百分之几真无所谓、
: 实际上最重要的其实是数据的获取,和结果的解释,然后做商业决定,这个都是需要对
: 业务极端了解的
: 单纯的做cs ds都是没前途的,除非你做到最前沿, 否则更重要的是对业务的了解

avatar
N*r
81

算法的确到处都是
数据是非常贵的
贵到一般人根本承受不起
不说别的, 做股票方面的研究,level2的数据是必须的吧, 公司的财报分析是必须的
吧, 请问哪里可能到处都有
我做股票研究,数据经常可以追溯到193x年

【在 c*******v 的大作中提到】
: (1)
: 何為前途?去goog,fb?如果以此為目標。
: 那麼你花兩年時間寫五萬行最流行的
: 語言的代碼。可以輕鬆達到。例如現在最流行DS,那麼你找二百個算法。
: 自己實現一遍python。再來一遍C plus。能進不去goog?
: 我說的這個辦法看上去慢。實際上很快。而且確定性很高。
: java的話,實用的商業case難找。數據科學簡直是為中國人設置的專業。
: 數據和算法到處都是的時代。閉門寫碼即可。
: 其實實現一個自己的DL引擎。也要不了一年。因為未知的部份已經比較少了。
: 算法收斂的差不多了。

avatar
c*v
82
我是做決定論算法為主的。概率一般按照Einstein-Wierner定律
翻譯成三角函數來思考。可謂小眾中的小眾。

【在 g****r 的大作中提到】
: DS的大头是statistic和ml啊
avatar
c*v
83
公開數據足夠一般人刷題轉碼了。
實在不行,自己python網上抓一下。
data driven product全working flow都有了,找工作更方便。
以炒股而言。美股數據保護嚴重。
A股無需多少數據。我在中股版現場抓過漲停板給人看。
這個daily data一般人都可以做到。但是你不知道該下多少本金。
也就是你說的現象:
1。很多算法A股可以弄出來看著不錯的紙面交易效果
2。但是你不知道自己的辦法效果真的好還是不好。所以無法給權重。也就是本金。

【在 N*****r 的大作中提到】
:
: 算法的确到处都是
: 数据是非常贵的
: 贵到一般人根本承受不起
: 不说别的, 做股票方面的研究,level2的数据是必须的吧, 公司的财报分析是必须的
: 吧, 请问哪里可能到处都有
: 我做股票研究,数据经常可以追溯到193x年

avatar
N*r
84

hehe
你不是真做股票的

【在 c*******v 的大作中提到】
: 公開數據足夠一般人刷題轉碼了。
: 實在不行,自己python網上抓一下。
: data driven product全working flow都有了,找工作更方便。
: 以炒股而言。美股數據保護嚴重。
: A股無需多少數據。我在中股版現場抓過漲停板給人看。
: 這個daily data一般人都可以做到。但是你不知道該下多少本金。
: 也就是你說的現象:
: 1。很多算法A股可以弄出來看著不錯的紙面交易效果
: 2。但是你不知道自己的辦法效果真的好還是不好。所以無法給權重。也就是本金。

avatar
c*v
85
我不是專業礦工。基本的常識還是有的。

【在 N*****r 的大作中提到】
:
: hehe
: 你不是真做股票的

avatar
S*s
86
应该抱着marketing的心态去教教,别光看现金流啊

【在 w***g 的大作中提到】
: 我建议不要看书。书都是二手货。
: 要快速上手就两条,第一条是去看轮子自带的文档,
: 比如这个http://scikit-learn.org/stable/modules/classes.html
: 第二条是去查以前各种比赛的winning code。自从kaggle搞起来后,
: 这种code网上多的是。
: 还有就是学校教的课也不行。之前umich两门data science课程
: 没人教了来找我,我就去谈了下。他们只给1w一门课。我当时忍不住就笑了。
: 折腾几个月还不如我赚的一个零头。这种课要是能学到真本事就怪了。
: 像吴恩达开的那种网上的课,没见过的应该去看看他长什么样。
: 要练本事,捷径还是对着文档写代码。

avatar
S*s
87
老兄,你跳了个几年久的老坑

【在 c*******v 的大作中提到】
: 这个帖子当初我为什么没有在上面留名字?
: 回国度假了吗?
: 如果按title算。我10年的algorithm engineer工龄啊。
:
:
: 把前面原文认真阅读,该说的都说了,重复就无聊了
:
: 另外这个算法owner主体是加拿大大学ubc,这个主体跟没有owner没啥区别
:

avatar
m*n
88
这就是算法最后得加密的原因

【在 w***g 的大作中提到】
: 随便暴力上一个万能算法,比如xgboost,或者上一个caffe,
: 精确度达到80%。你找一个最牛的人来做,精确度可能能达到85%。
: 这个是两个极端。实际雇一个比较靠谱的DS来做,精确度可能能到82%。
: 不自己雇人,等着技术进步,可能到明年万能算法也能直接到82%。
: 所以DS一般会ETL,能用万能算法就可以了,根本没有必要知道算法背后
: 的数学。会数学的,除非好到能推进state of art,其余的也会赚不到钱。

avatar
H*r
89
Google的搜索引擎算法就是保密的,trade secret

【在 z****e 的大作中提到】
: wdong的算盘就是
: 第一我保密
: 第二我申请专利
: 第三我再开源
: 保密肯定是不行的
: 理论的东西,就需要一个证明的过程
: 得让其他人来看你这个理论对还是错
: 光嘴巴上说,我这个好,这个好,没用的
: 客户不买账
: 跟可口可乐不一样,可口可乐你一喝就知道了

avatar
x*u
90
保密的不是算法,是商业规则啊

【在 H**r 的大作中提到】
: Google的搜索引擎算法就是保密的,trade secret
avatar
H*r
91
你灌了三十年水还是坚持扯淡不打草稿,佩服佩服

【在 x****u 的大作中提到】
: 保密的不是算法,是商业规则啊
avatar
x*u
92
你个没文化的,谷歌的搜索的技术都发了无数篇论文了,人家保密的东西是设置具体商
业规则检测你点击欺诈
肯德基所有材料都可以从任何一家商店买到,机密是实际配比

【在 H**r 的大作中提到】
: 你灌了三十年水还是坚持扯淡不打草稿,佩服佩服
avatar
g*t
93
你为毛不睡觉?也炒A股吗?


: 你个没文化的,谷歌的搜索的技术都发了无数篇论文了,人家保密的东西是设置
具体商

: 业规则检测你点击欺诈

: 肯德基所有材料都可以从任何一家商店买到,机密是实际配比



【在 x****u 的大作中提到】
: 你个没文化的,谷歌的搜索的技术都发了无数篇论文了,人家保密的东西是设置具体商
: 业规则检测你点击欺诈
: 肯德基所有材料都可以从任何一家商店买到,机密是实际配比

avatar
x*u
94
我在日本啊

【在 g****t 的大作中提到】
: 你为毛不睡觉?也炒A股吗?
:
:
: 你个没文化的,谷歌的搜索的技术都发了无数篇论文了,人家保密的东西是设置
: 具体商
:
: 业规则检测你点击欺诈
:
: 肯德基所有材料都可以从任何一家商店买到,机密是实际配比
:

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。