构建开源Google

Default, Google, News, Software No Comments »

这个文章是很久以前看见的了,现在很难找到原文的地址,就只好把原文附在后面了

Google就像一个年轻的猛犸象,虽然已经非常强大,但依然在成长。练好的极度业绩以及对在线广告市场持续增长的期望是她 能够与纳斯达克保持同步的的最大的影响因素。但是我现在要说的是一个Google杀手级的竞争对手方案。你可能知道我似乎对开源有强迫症(例如我的OpenHumanSimpleKDE项目),因此我的主张肯定是基于开源的,或许我会叫他Google@Home

首相让我来解释一下什么是Google@Home,简单地说,Google@Home就是Google的一个复制品,但是他是基于开源和分布式的。现在已经有很多的开源搜索引擎计划了,Apache Lucene是最出名的(他是Nutch的基础和Hadoop Distrubuted Filesystem的子项目)。所以Google@Home也可以是基于这些开源搜索引擎。当然要达到Google的成就还好似有很长的一段路要走。但是重要的是Google@Home是一个分布式、疏散的系统,这就是说我们的桌面计算机可以使用空余的时间来为这个搜索引擎提供支持,这样便可以和Google强大的数据中心一较高下了。这其实并不是什么新概念,SETI@HomeFolding@Home这两个著名的科研项目的核心便是如此,他是Google也是斯坦福大学Folding@Home项目的最大的支持者,Google吧Toolbar的资源也贡献给了这个项目

同Wikiasari的比较
这个新的搜索引擎同Jimmy Wales 的Wikiasari计划是很不同的。Wikiasari来源于wikipedia的支持,他的薄弱之处是他太依赖于人的力量。尽管大规模协调,社区驱动的百科全书计划工作的很好,但是破坏行为依旧存在(即使是在一个可以控制的水平之下)。所以我对他能否在搜索引擎下工作的很好持怀疑态度

为什么要创建开源搜索引擎
尽管你已经清楚的知道了这其中的概念,但可能依然对这背后的动力感到困惑不已。为什么一个组织或者一群松散的人会共同效力于这个计划?为什么有人会把计算机的空余时间贡献出来?有以下几点原因:

1、搜索引擎应该是开放的平台,就像操作系统一样。Alex写过一篇关于图像搜索的文章,以自己为例,试图证明当前的图像搜索结果是多么的差。我的回应是或许可以通过公共信息访问和人脸识别算法来提高搜索质量,比如Riya就在这样做。但是我们无法访问搜索引擎的数据库,而且绝大多数的搜索引擎提供的API是有访问量的限制的

2、需要更好的搜索引擎。协同总能产生更好的结果。假想一下,假如全世界的研究者和Google的竞争对手都为这个系统有所贡献,那产生的“大脑”肯定比Mountain View的那个大。这和现在的微软一样,微软在他的研发中心有着世界最优秀的开发人员,但是 依然不能够和全世界的开发者相比较。这也就是为什么Linux在服务器市场领先,甚至在桌面系统也有所建树的原因。看看Dell和Ubuntu的交易以及3D的桌面吧

3、隐私。作为OpenHuman的发起人,这不应该是我讨论的。但事实上很多人为G’eye的关注而感到恐慌。Google在中国市场上的妥协让那些将自己的杂乱的,但依旧有用的搜索数据提供给Google的人要多加思量了。Matt Cutts最近写了一篇关于Google这么处理隐私的文章,但是我依然有一些问题悬而未决。Google在被传唤的时候交出了大量的数据事件让他饱受批评。

4、持续增长的竞争对手。不是每个都乐意看见Google在纳斯达克的风光的。比如最近的Yahoo,ebay,Microsoft的交易。同时也有很多小的刚刚起步的公司也同样郁闷,Google抢了他们的创意,但是他们没有受到任何回报。例如Google Calendar打碎了30Boxes,kiko的美梦。还有Google Spreedsheet和Toolbar。这样的事情微软在80-90年代干过,sun、hp、IBM就是受害者

谁会创建开源的Google?
很可能是Google,或者是Ask,yahoo这样的竞争对手,或者像Nikla zennstorm和Janus Frisk这样的P2P领域的高手。什么都可能发生,但是要我看,最有可能的就是直接竞争对手组成的攻守同盟。很可能就是一向闭源的微软

还有最后一点,没有什么意思了,就不翻译了(看原文请点击浏览全文)

喜欢本博客?推荐订阅    

Read the rest of this entry »

阅读(196 次)

翻译文章

Default, Me, News No Comments »

现在想做一点翻译国外的文章,由于水平有限,要做到“信、雅、达”很是困难。初期主要是忠于原文的翻译,过一段时间可能会就是提炼一下其中的重要的观点。这些文章可能集中于Google,web2.0,和营销方面一点。

就算是考验自己的能力和耐心吧(翻译和输入文字是很费劲的,但是比Ctrl+C/V要更加有成就感的),不过有疏忽的地方还请大家指正。非常感谢,可以这样联系到我

喜欢本博客?推荐订阅    

阅读(222 次)

我看校内网

Default, Me, News 2 Comments »

在一段时间的新鲜感之后,终于有人不再那么关心这个网站 了。看看现在的页面上,都是那么几个熟悉的面孔,还有那么那个十分熟悉的大脚丫子

想想原因::估计是访客从这个页面得不到任何的信息(人际关系,学校,姓名等除外::况且好多的个人信息还是还不是很真实的)。难怪很少有人回来,难道是来看你的漂亮的网站设计??显然不可能吧,设计好的网页多得是(例如去看看Google韩国分站 的设计,虽然看不明白上面的文字,但是她的设计还是非常漂亮的),况且你所谓的设计还基本上是抄袭别人的,没有新意。。每天看来看取都是那些个老面孔,是个人都会腻的,久而久之,谁都不会再来了。

现在Twitter 有点小火,还有不少的跟风者,其实他本身就没有什么东西,但是她回答了一个问题“what are you doing?”..下面的这个蓝色的gadget里面的文字就是回答了关于我自己的“what are you doing?”。。别人不会在乎你在你的页面上和你的朋友说了些什么,这个似乎与他没有任何的关系。不知道谁提出过内容为王这样的说法,但是确实内容是页面里面最重要的内容,这里说的内容不是花里胡哨的flash以及一方给人发挥之外,好像根本就没有办法提供其他的任何东西,把这个日志当作博客?堆一堆的背景图片和多么优美的背景音乐,而是别人在你这里能够获得什么样的信息。而这里除了一个日志的地?估计没有几个人会这样做的,专业的BSP多得是,何必要在这么一个不成熟的地方写呢?

这里暂时也就能够当作一个校友录,一个还在发展的校友录,其他的算不上了

不过这里提供的涂鸦板编辑还是不错的,但是css是很多人都不会弄的,有点郁闷,咱也就只能找别人的部分的好的代码拼起来作成自己想要的效果。总归是别人写的东西,总觉得不能完整的表达自己的想法,但是也没有办法,谁叫自己不会的呢

喜欢本博客?推荐订阅    

阅读(294 次)

中国Linux的发展

Default, News, Software 2 Comments »

今天去了Ubuntu的中文站点看看,虽然Ubuntu在世界各地发展的是如火如荼,但是在中国似乎还没有能够形成气候,虽然有一批的人在忙着翻译国际社区的文章,但是翻译的质量还确实不能够恭维,至于说是原创那几乎就是没有的事情了,中国社区的原创几乎都是关注一些小的软件的使用和关注国际社区的新闻,仅仅是新闻而已。

另外由于Linux还没有能够为国人所认识,大家都在使用盗版的Vista和Windows,谁还会在乎取改变自己的习惯去使用Linux,毕竟两者还是有一定的区别的,尽管Linux现在的界面的友好程度不比Windows逊色,但是绝大多数的人是懒惰的,已经拥有的习惯不在一定的压力之下是不会轻易改变的。直到哪一天Microsoft举起版权的大棒向我们挥来,我们就措手不及。

最后我无意之中进了Ubuntu的IRC,那里面就几乎没有几个人,就是有人,也是在那边瞎扯,大家都把那里当作了聊天室,很可惜,就没有人在那里讨论一些技术问题。

很多人关心Linux只是一时的兴趣,他们不是也不会成为Linux的使用者

喜欢本博客?推荐订阅    

阅读(228 次)

看着世界,偶尔看看自己 , powered by 七十二松 (72pines). WP Theme & Icons by N.Design Studio
Entries RSS Comments RSS 登录