按你这么说所有的都没啥东西,GOOG 就一引擎,msft 就一操作系统,加办公软件,
aapl 就做一电话,加普通电脑跟电话之间的小板子,AMZEN 更没啥,就一网店。
废话别人做出来了看着都容易。你自己 TRY TRY 就知道水深水浅了。
前头有人说了,光一个 crawler 就能做死,
...“通过parse网页 找到链接之后再发送http请求之后接收网页,存放网页,再parse
网页”
做梦哪?现在的网页有 JS, Silverlight, flash, java applet, AJAX, picture,
video ... 还有很多华丽呼哨的东西,redirect N 次, n 多广告 link, iframe,
tracking beacons ...
慢慢做啊,