avatar
我真的翻了42页# PDA - 掌中宝
g*t
1
天天都在搞算法 搞计算问题
说起很多统计方法,他们都不熟悉,教学上似乎也很不重视统计方法分析数据
avatar
h*g
2
Write a method to sort an array of strings so that all the anagrams are next
to each other
书上给的解法感觉不大好。有没有其他的idea?
先sort every string,再sort the whole array, 有没有更好的方法呢?
avatar
E*e
3
N82E16822145912
貌似fo了一年最低价了,快抢,外加VCOBF15再减10块。
avatar
a*a
4
【 以下文字转载自 Apple 讨论区 】
发信人: anoia (high estrogen man), 信区: Apple
标 题: 我真的翻了42页
发信站: BBS 未名空间站 (Mon Oct 1 00:32:43 2012, 美东)
还是不行,特此声明
avatar
d*a
5
软硬件设计,对就是对,错就是错,99.9%是不行的。
不过,概率论和统计是必修课程,搞性能分析和评价,或者搞可靠性分析,还是要知道
基本统计方法的。
avatar
g*t
7
计算机程序 = 算法 + 数据
数据也很重要啊,特别对于大尺度数据的distribution建模
完全就是统计的研究内容
不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?

【在 d***a 的大作中提到】
: 软硬件设计,对就是对,错就是错,99.9%是不行的。
: 不过,概率论和统计是必修课程,搞性能分析和评价,或者搞可靠性分析,还是要知道
: 基本统计方法的。

avatar
d*e
9
TCS里面会用到一些概率工具和统计模型,但他们和统计community关心的根本不是
一类问题。自然也不会熟悉那些统计方法。
做ML的人很多都有统计的training,尤其是做理论的,教学上和统计有很多共同点,但
和统计community关心的问题有时候差别也很大。

【在 g******t 的大作中提到】
: 天天都在搞算法 搞计算问题
: 说起很多统计方法,他们都不熟悉,教学上似乎也很不重视统计方法分析数据

avatar
n*t
10

Do you have comparison data for reliability?

【在 E***e 的大作中提到】
: 大部分人对于存储的第一要求还是可靠性吧
avatar
d*e
11
你应该是没get他的point。

【在 d***a 的大作中提到】
: 软硬件设计,对就是对,错就是错,99.9%是不行的。
: 不过,概率论和统计是必修课程,搞性能分析和评价,或者搞可靠性分析,还是要知道
: 基本统计方法的。

avatar
E*e
12
backblaze

【在 n***t 的大作中提到】
:
: Do you have comparison data for reliability?

avatar
d*a
13
当然重要。概率论和统计是计算机专业必修课程。

【在 g******t 的大作中提到】
: 计算机程序 = 算法 + 数据
: 数据也很重要啊,特别对于大尺度数据的distribution建模
: 完全就是统计的研究内容
: 不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?

avatar
n*t
14

got it. go get a pair of this.

【在 E***e 的大作中提到】
: backblaze
avatar
d*e
15
你不是计算机科班的吧。
CS可比“算法+数据”大太多了。

【在 g******t 的大作中提到】
: 计算机程序 = 算法 + 数据
: 数据也很重要啊,特别对于大尺度数据的distribution建模
: 完全就是统计的研究内容
: 不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?

avatar
d*a
16
专长不同罢了。搞统计的人也要学编程。:)

【在 d******e 的大作中提到】
: 你不是计算机科班的吧。
: CS可比“算法+数据”大太多了。

avatar
d*a
17
老兄,程序 = 算法 + 数据结构。数据结构和数据,差得可远了。:)
前面说了,专长不同而已。计算机科班出身,精通统计的人不是没有,但大多数人只要
知道最基本的统计知识就够了。搞统计的人多数也会编程,但能写操作系统内核代码的
,也是少数吧,呵呵。

【在 g******t 的大作中提到】
: 计算机程序 = 算法 + 数据
: 数据也很重要啊,特别对于大尺度数据的distribution建模
: 完全就是统计的研究内容
: 不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?

avatar
d*e
18
统计没几个人玩得明白coding,绝大部分用用Python和R。
但CS出身得数学基础足够学统计得了。

【在 d***a 的大作中提到】
: 专长不同罢了。搞统计的人也要学编程。:)
avatar
L*4
19
因为统计方法的假设太不现实,方法太老土,有效维数太低,大部分都被我们摒弃了。
少部分我们都用
的比如PCA什么的,名字叫的不一样。
machine learning自己也有理论,假设比传统统计弱多了。
统计这个领域大部分人闭门造车,守着自己那点p-value。只有少部分人能跟上形势。
LASSO在当年也算是跟上形势的少数人提出的方法,到了deep learning的时代,统计的
人能跟上形势的更加少了。

【在 g******t 的大作中提到】
: 天天都在搞算法 搞计算问题
: 说起很多统计方法,他们都不熟悉,教学上似乎也很不重视统计方法分析数据

avatar
d*e
20
很好奇,你在的领域管PCA叫啥?

【在 L*********4 的大作中提到】
: 因为统计方法的假设太不现实,方法太老土,有效维数太低,大部分都被我们摒弃了。
: 少部分我们都用
: 的比如PCA什么的,名字叫的不一样。
: machine learning自己也有理论,假设比传统统计弱多了。
: 统计这个领域大部分人闭门造车,守着自己那点p-value。只有少部分人能跟上形势。
: LASSO在当年也算是跟上形势的少数人提出的方法,到了deep learning的时代,统计的
: 人能跟上形势的更加少了。

avatar
L*4
21
我们叫PCA或各种变体的非线性PCA啊。是他们统计的人非要管这个叫什么factor
analysis。


: 很好奇,你在的领域管PCA叫啥?



【在 d******e 的大作中提到】
: 很好奇,你在的领域管PCA叫啥?
avatar
g*h
22
TCS方向的表示我们用很多概率, 但是不怎么关心统计...
事实上我们这个小方向的很多论文发在PTRF, Ann Prob, Ann Appl Prob这些纯概率期
刊上

【在 d******e 的大作中提到】
: TCS里面会用到一些概率工具和统计模型,但他们和统计community关心的根本不是
: 一类问题。自然也不会熟悉那些统计方法。
: 做ML的人很多都有统计的training,尤其是做理论的,教学上和统计有很多共同点,但
: 和统计community关心的问题有时候差别也很大。

avatar
r*e
23
感觉传统cs要解决的是计算问题
但是现在数据量很大以后 很多东西不是优化算法就可以解决的
首先要用统计的思想把问题简化为可计算的范畴

【在 g*****h 的大作中提到】
: TCS方向的表示我们用很多概率, 但是不怎么关心统计...
: 事实上我们这个小方向的很多论文发在PTRF, Ann Prob, Ann Appl Prob这些纯概率期
: 刊上

avatar
s*e
24
PCA是CS的人提出来的?

【在 L*********4 的大作中提到】
: 我们叫PCA或各种变体的非线性PCA啊。是他们统计的人非要管这个叫什么factor
: analysis。
:
:
: 很好奇,你在的领域管PCA叫啥?
:

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。