avatar
想山寨palantir了# Programming - 葵花宝典
v*n
1
我妈妈上次B2入境待了5个月,今年1月离境。我刚毕业从F1转到J1,现在我妈妈再次来
美国,B2签证没有过期,机票返程显示是要待6个月。请问过海关的时候,会因为我的
身份改变带来什么麻烦吗?
这次过海关是从SFO,和上次不一样。我把自己的DS2019表和Offerletter都准备好了让
我妈带着。
avatar
i*t
2
小屁孩啊
avatar
z*e
3
为啥我觉得这个东西好像不是特别困难
第一步,获取数据
这个jdbc+nosql,无非是连接上
然后执行各种get,select语句而已
第二步,处理数据
spark这种就能用上了
无非各种map, reduce, filter, flatmap etc.
第三步,显示数据
这个倒是有点挑战性
但是java,android,swift,js,都有各种傻瓜化的工具来渲染
感觉也不是特别难
palantir应该不会被允许去修改客户数据吧?
不太可能做一些clustering之类的操作
顶多说从中建几个cache,但是整体的处理也有难度
诶,话说山寨一个这样的东东,有销路吗?
主要是没认真接触过p家的产品,所以不知道到底他们在做啥
如果让我看一遍,也许就能想出怎么山寨他们的东东
有视频没?
avatar
f*n
4
跟你身份没有关系
avatar
a*u
5
萝卜头与黑木耳,各有千秋

【在 i******t 的大作中提到】
: 小屁孩啊
avatar
e*o
6
第二步难

【在 z****e 的大作中提到】
: 为啥我觉得这个东西好像不是特别困难
: 第一步,获取数据
: 这个jdbc+nosql,无非是连接上
: 然后执行各种get,select语句而已
: 第二步,处理数据
: spark这种就能用上了
: 无非各种map, reduce, filter, flatmap etc.
: 第三步,显示数据
: 这个倒是有点挑战性
: 但是java,android,swift,js,都有各种傻瓜化的工具来渲染

avatar
e*o
8
销路是有
我东家有类似的东西。快做好了

【在 z****e 的大作中提到】
: 为啥我觉得这个东西好像不是特别困难
: 第一步,获取数据
: 这个jdbc+nosql,无非是连接上
: 然后执行各种get,select语句而已
: 第二步,处理数据
: spark这种就能用上了
: 无非各种map, reduce, filter, flatmap etc.
: 第三步,显示数据
: 这个倒是有点挑战性
: 但是java,android,swift,js,都有各种傻瓜化的工具来渲染

avatar
z*e
9
也不是特别难
就是visualize api而已
如果有vert.x的话,会更简单

【在 e*******o 的大作中提到】
: 第二步难
avatar
z*e
10
说说商业模式是怎样搞的?
我看palantir的产品gui就像我家车库里面做出来的
卖500-1000万美元,感觉有些夸张啊

【在 e*******o 的大作中提到】
: 销路是有
: 我东家有类似的东西。快做好了

avatar
e*o
11
面向企业的软件 大多ui 跟屎一样 主要不在这个
他那个卖多少钱 跟实际值多少毛关系 有个新闻说军方采购一个开关多少美金
我东家是做online survey的
以前主要是导出数据 现在可以直接把分析
plot ppt都做了
因为数据少 spark根本用不着

【在 z****e 的大作中提到】
: 说说商业模式是怎样搞的?
: 我看palantir的产品gui就像我家车库里面做出来的
: 卖500-1000万美元,感觉有些夸张啊

avatar
W*p
12
软件公司从来不是靠技术,靠sales和关系,
你的东西再好,军方不掉你

【在 z****e 的大作中提到】
: 为啥我觉得这个东西好像不是特别困难
: 第一步,获取数据
: 这个jdbc+nosql,无非是连接上
: 然后执行各种get,select语句而已
: 第二步,处理数据
: spark这种就能用上了
: 无非各种map, reduce, filter, flatmap etc.
: 第三步,显示数据
: 这个倒是有点挑战性
: 但是java,android,swift,js,都有各种傻瓜化的工具来渲染

avatar
g*e
13
你的数据哪里来?

【在 z****e 的大作中提到】
: 为啥我觉得这个东西好像不是特别困难
: 第一步,获取数据
: 这个jdbc+nosql,无非是连接上
: 然后执行各种get,select语句而已
: 第二步,处理数据
: spark这种就能用上了
: 无非各种map, reduce, filter, flatmap etc.
: 第三步,显示数据
: 这个倒是有点挑战性
: 但是java,android,swift,js,都有各种傻瓜化的工具来渲染

avatar
z*e
14

其实也不会,你看intellij idea就靠着很不错的gui取胜
还有一个就是,大部分软件,尤其是攻城狮用的软件
都比较难用,说白了就是gui比较少,没有特别傻瓜的工具
jira什么就是通过比较傻瓜化的操作占领市场
我考虑的是,把jdbc等操作,给傻瓜化
然后进一步把c*和flink的操作给傻瓜化
最后把vert.x的操作也给傻瓜化
这样一个完整的gui就可以搞出来了
我看了看这些api,应该都不难,因为本身就已经傻瓜化了不少
现在就缺一个gui而已,这个javafx应该问题不大

【在 e*******o 的大作中提到】
: 面向企业的软件 大多ui 跟屎一样 主要不在这个
: 他那个卖多少钱 跟实际值多少毛关系 有个新闻说军方采购一个开关多少美金
: 我东家是做online survey的
: 以前主要是导出数据 现在可以直接把分析
: plot ppt都做了
: 因为数据少 spark根本用不着

avatar
z*e
15
jdbc
剩下用户自己要去下载driver
nosql搞定cassandra就是了

【在 g*********e 的大作中提到】
: 你的数据哪里来?
avatar
n*j
16
阿拉小时候觉得很多东西都很简单,后来阿爸说了一句话:电视也很简单,光变成电、
电变成光。
avatar
y*m
17

主要是客户。人家ceo常年在外跑客户,这个不是一般人能做到的。

【在 z****e 的大作中提到】
: 为啥我觉得这个东西好像不是特别困难
: 第一步,获取数据
: 这个jdbc+nosql,无非是连接上
: 然后执行各种get,select语句而已
: 第二步,处理数据
: spark这种就能用上了
: 无非各种map, reduce, filter, flatmap etc.
: 第三步,显示数据
: 这个倒是有点挑战性
: 但是java,android,swift,js,都有各种傻瓜化的工具来渲染

avatar
k*g
18

难的是 security clearance + domain knowledge。有 security clearance 的员工估
计占双位数百分点吧。
雪巢事件後,招人估计更严格了。
不单是卖platform(更不是只卖stack),也提供很多「forward deployed engineer」

【在 z****e 的大作中提到】
: 为啥我觉得这个东西好像不是特别困难
: 第一步,获取数据
: 这个jdbc+nosql,无非是连接上
: 然后执行各种get,select语句而已
: 第二步,处理数据
: spark这种就能用上了
: 无非各种map, reduce, filter, flatmap etc.
: 第三步,显示数据
: 这个倒是有点挑战性
: 但是java,android,swift,js,都有各种傻瓜化的工具来渲染

avatar
m*r
19
这个公司之前投过
说让我去面试 然后。。就没然后了
关于楼主说的:获取高质量数据是很难得
avatar
z*e
20

同学们,如果你们认为高质量数据才是卖点的话
那这个公司的产品其实没啥竞争力,对比oracle而言
重要的是从垃圾数据中获取数据,如果仅仅是获取高质量的数据
这个怎么做都不如客户公司的dba在行

【在 m*********r 的大作中提到】
: 这个公司之前投过
: 说让我去面试 然后。。就没然后了
: 关于楼主说的:获取高质量数据是很难得

avatar
g*e
21
我的意思是数据本身哪里来?

【在 z****e 的大作中提到】
: jdbc
: 剩下用户自己要去下载driver
: nosql搞定cassandra就是了

avatar
m*p
22
哥们,不是我打击你,你第0步就错了
客户呢? 我前年在某f100大银行和P家都是vendor做poc,我们benchmark赢过他们,结
果呢?最后人家还是跟p家签了一个几个米的单,我们只拿了一个0.5m的service。
avatar
z*e
23

所以说到底这玩意其实技术也就是那么一回事,最终还是靠sales
看来三锅们认真修行ppt还是很有道理的

【在 m*p 的大作中提到】
: 哥们,不是我打击你,你第0步就错了
: 客户呢? 我前年在某f100大银行和P家都是vendor做poc,我们benchmark赢过他们,结
: 果呢?最后人家还是跟p家签了一个几个米的单,我们只拿了一个0.5m的service。

avatar
e*o
24
有时候 会有这样的疑问 连这个都能卖钱?
能满足对方的需要就好 技术如何 至少对方不关心
不少公司 就是db + 一个脚本语言 每年几个m 的收入也不是太难
现在的技术 对于很多公司 都是过剩的
拼的就是 能否整合一下 满足某个niche的需求 然后站稳那个niche

【在 z****e 的大作中提到】
:
: 所以说到底这玩意其实技术也就是那么一回事,最终还是靠sales
: 看来三锅们认真修行ppt还是很有道理的

avatar
m*p
25
你得到了它。

【在 z****e 的大作中提到】
:
: 所以说到底这玩意其实技术也就是那么一回事,最终还是靠sales
: 看来三锅们认真修行ppt还是很有道理的

avatar
l*t
26
属实。

【在 m*p 的大作中提到】
: 哥们,不是我打击你,你第0步就错了
: 客户呢? 我前年在某f100大银行和P家都是vendor做poc,我们benchmark赢过他们,结
: 果呢?最后人家还是跟p家签了一个几个米的单,我们只拿了一个0.5m的service。

avatar
e*v
27
lz是不是认为这样的软件和平台的核心就是数据的可视化?
能把数据拿过来画成图就行?
avatar
z*e
28
哦,那你说说到底是做啥的
我没有看到太多产品信息
从他们放出的有限的视频中看
差不多是这样,你是不是觉得可视化很容易做?

【在 e******v 的大作中提到】
: lz是不是认为这样的软件和平台的核心就是数据的可视化?
: 能把数据拿过来画成图就行?

avatar
w*g
29
可视化要做好并不容易。我4前关注过这个公司,当时感觉就是这个产品没啥出人意料
的东西。不过当时可视化的轮子没现在多,显然山寨一个没现在这么容易。但即便在
当时这东西也不是特别impressive。我觉得他们内部可能有一个non-trivial的数据集,
挖掘出来了一些政府觉得有用的东西。不然光凭表面上的东西说不过去。
我去他们那儿面试过,没中。印象最深的是一层层的铁门。

【在 z****e 的大作中提到】
: 哦,那你说说到底是做啥的
: 我没有看到太多产品信息
: 从他们放出的有限的视频中看
: 差不多是这样,你是不是觉得可视化很容易做?

avatar
z*e
30

集,
山寨他们可以从一些最简单的功能开始
比如可视化db操作,然后可视化flink和spark
因为这种平台软件一般不允许随便修改数据
所以clustering这些用到的概率不大,这就省了不少事
很多时候光count就能有很多应用了
光count的话,我觉得并不需要多复杂的数学
倒是需要对常用工具以及轮子的熟练程度
比如javafx,jdbc,c*的api,etc.
我个人觉得,其实很多攻城狮并不是对于数学有那么深刻的领悟的
例子我就不举了,省得得罪人
很多时候不需要多高深数学,一样可以有利益攫取的

【在 w***g 的大作中提到】
: 可视化要做好并不容易。我4前关注过这个公司,当时感觉就是这个产品没啥出人意料
: 的东西。不过当时可视化的轮子没现在多,显然山寨一个没现在这么容易。但即便在
: 当时这东西也不是特别impressive。我觉得他们内部可能有一个non-trivial的数据集,
: 挖掘出来了一些政府觉得有用的东西。不然光凭表面上的东西说不过去。
: 我去他们那儿面试过,没中。印象最深的是一层层的铁门。

avatar
w*g
31
你打算分析啥数据,怎么搞到数据?

【在 z****e 的大作中提到】
:
: 集,
: 山寨他们可以从一些最简单的功能开始
: 比如可视化db操作,然后可视化flink和spark
: 因为这种平台软件一般不允许随便修改数据
: 所以clustering这些用到的概率不大,这就省了不少事
: 很多时候光count就能有很多应用了
: 光count的话,我觉得并不需要多复杂的数学
: 倒是需要对常用工具以及轮子的熟练程度
: 比如javafx,jdbc,c*的api,etc.

avatar
z*e
32

第一步想不了那么远
第一步把数据获取以及count这些做出来就好
java有jdbc和hibernate以及javafx,我想我能够做出一些东西来

【在 w***g 的大作中提到】
: 你打算分析啥数据,怎么搞到数据?
avatar
z*e
33
palantir的很多demos里面不过就是把数据给plot到图片上去
这个我想我能做,分析需要复杂的数学应用
到时候可以通过plugins来扩充
avatar
w*g
34
除了business以外,折腾啥数据是最重要的吧。
我其实想做数据分析平台有好几年了,也是最近想到生物数据才做出来。
其实我也就能处理这么多生物数据中的RNA-seq一种,但是要拼RNA-seq,
我自信我的平台就是世界第一。别的数据我也能做,但是得等更多的钱来了
才做。没人出钱,就是没有市场。有人出钱,我两个星期就可以加一个pipeline。
你也可以想象一个一般性的平台,但没有应用实例的支持,
很多design decision就做不了,feature也没法prioritize。
而且个人的能力毕竟有限,如果做不到第一,或者至少能跟第一compete,
那就成了个作业题了。做了个软件,不说来钱,最低的要求得是有人用吧。
我其实也想过做一个security的demo。框架不用改,最多弄几个新的visualization。
后台拿metasploit扫一遍也就八九不离十了。
然后再预测个啥什么的。不过这一行我没有权威,只能去忽悠外行人,离赚钱太远。
上面安全来安全去的,有几个亲手跑过metasploit的?

【在 z****e 的大作中提到】
: palantir的很多demos里面不过就是把数据给plot到图片上去
: 这个我想我能做,分析需要复杂的数学应用
: 到时候可以通过plugins来扩充

avatar
z*e
35
所以说到底我也需要知道他们这个平台到底在干嘛的嘛
我也没见过,从demo上看,好像都是一些比较傻瓜的应用
我应该能做出来,但是再深入的,我也不知道了
所以我在问palantir的产品到底在做啥,要不然你以为我在干嘛?
另外,我们山寨的路边货呢,不需要做到top1
只需要做到top1的50%,市场前景就很不错了
有人用很容易啊,比如我可以自动生成jdbc连接的java代码啊
而且spark, flink,vert.x这些傻瓜化工具还少,这个能做出来肯定有人用
db的傻瓜化工具比较多,但是多数都不太好用,感觉gui设计得很反人类
还有就是,join这些数据,也是一个很不错的卖点
不过join估计需要server side
我看他们的一个卖点就是join

【在 w***g 的大作中提到】
: 除了business以外,折腾啥数据是最重要的吧。
: 我其实想做数据分析平台有好几年了,也是最近想到生物数据才做出来。
: 其实我也就能处理这么多生物数据中的RNA-seq一种,但是要拼RNA-seq,
: 我自信我的平台就是世界第一。别的数据我也能做,但是得等更多的钱来了
: 才做。没人出钱,就是没有市场。有人出钱,我两个星期就可以加一个pipeline。
: 你也可以想象一个一般性的平台,但没有应用实例的支持,
: 很多design decision就做不了,feature也没法prioritize。
: 而且个人的能力毕竟有限,如果做不到第一,或者至少能跟第一compete,
: 那就成了个作业题了。做了个软件,不说来钱,最低的要求得是有人用吧。
: 我其实也想过做一个security的demo。框架不用改,最多弄几个新的visualization。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。