分类
互联网观察

百度2009技术大会[现场记录]

        时间:2009年8月18日
        从你开始,创新世界。2009百度技术创新大会
        花絮:记者在台上拍人,我在台下拍记者。会议即将开始

分类
搜索

从百度看互联网搜索的垂直趋势

        本世纪以来最有吸引力的互联网新业务:搜索,成为引领第二波互联网浪潮的动力引擎,在搜索正火的时候,人们总在急切的想知道,哪一种互联网服务将成为第二个搜索?一晃几年又过去了,搜索日渐成为成熟的业务,人们对于搜索之后的情况,却没有了当初关注的热情。
        关于搜索引擎的目前情况,有两个数据比较有意思,一个是搜索引擎的服务使用率,一个是搜索引擎的份额。根据CNNIC2009年1月的第23次互联网调查报告,搜索引擎使用率为68.0%;根据CNNIC2008搜索引擎研究报告,搜索引擎用户首选使用率百度76.9%,google(谷歌)16.6%,搜狗与雅虎分别为2.9%与1.6%,此前艾瑞公布的搜索引擎研究数据为百度73.2%,google(谷歌)20.8%,搜艘(soso)3.4%,搜狗1.4%,其余的低于1%。
        数据可能是个不太靠谱的事儿,统计数据就更有点不太靠谱,对繁杂的数据进行解读便见仁见智。
        从搜索引擎当前的情况来看,国内搜索市场基本上已经形成并巩固了百度一家独大的局面,中国搜索引擎领域开始出现“垄断”局面,这表明,通用搜索引擎作为一项新的互联网服务,短短几年,已经进入到成熟期,格局已初步形成,新的进入者很难再有机会。
        国内搜索引擎竞争,最有趣的莫过于百度与谷歌之间,中国的谷歌背靠全球搜索巨擘google,搜索引擎份额差距却在逐步拉大,当然可以一句“不懂国情”来解释,但真正的原因还是值得探讨。
        搜索引擎是提供给个人用户使用的“2C”服务(面向用户),人们容易忽略这背后重要的“2B”(面向企业)因素,搜索引擎提供给用户使用不假,但搜索内容却是来源于其他网站,从用户的角度看,判断“谁更懂中文”并不是容易的事情,与企业(被搜索网站)的广泛合作才是搜索引擎竞争的真正关键,这也从另一个角度解释了,为什么其他几个国产的搜索引擎,加大了技术投入,份额产出却依然不明显。尽管互联网经历了门户资讯到搜索引擎两波竞争,入口(portal)依然是互联网争夺的制高点。
        搜索引擎的使用率为68.0%,虽然较之前一年的72.4%略有下降,但由于网民整体增速较快,搜索用户还是有33.6%的增长。使用率下降,CNNIC认为是“由于互联网整体网民规模快速增长,新增网民中低学历网民比重增大,而该部分网民的搜索引擎的使用率较低,导致搜索引擎的整体使用率下降”。
        搜索的下降还可以做另一种解释,即:使用门槛增加,由于搜索引擎是pull(拉,用户主动要),而资讯服务的方式是push(推,网站推荐,用户被动接受或者被动选择),在连寻找“返回键”都能让一批用户有犯难的浏览器上,只需要点鼠标与输入既定文字相比,门槛提高是不言而喻的,不过,门槛提高的原因更多在于是操作更复杂,需要更熟练的技巧,而与学历关系不大。
        搜索与门户新闻,是互联网两种相对服务pull(拉)、push(推)的两个极端模式,简单的搜索框,几乎没有任何信息推荐,新闻列表则是网站和盘托出,许多情况下,这两种服务并不矛盾,各有各的使用场景,早期的互联网服务基本就是这两种方式。
        随着标签(TAG)、订阅(RSS)、聚合(Mashup)等所谓web2.0传播形式的出现,非单纯的pull与push服务形式增加,许多新的服务,用简单搜索框式的pull并不能很好解决,搜索引擎使用率的下降,应该预示着搜索引擎面临升级的压力与动力。
        从搜索引擎的变化来看,视频搜索、博客搜索、新闻搜索等可以看成是垂直搜索的例子,当信息越来越多样,垂直化能够加入一定的语义含义,促使搜索更精准,垂直搜索不仅仅摆脱只有一个简单搜索框的情况,提供一些参数选择,还将根据领域不同,通过热门词、排行榜等样式,以push特征引导用户pull行为。
        百度视频搜索中提供排行榜、热词与分类,google视频中直接的内容推荐,从通用搜索引擎分化出来的垂直搜索,呈现出与此前pull时代单一简洁的不同特征,百度看上去更倾向于简洁性与引导性,google(谷歌)向内容推荐(push)走得更多,在通用搜索引擎竞争告一段落之后,垂直搜索引擎将成为新一轮争夺点,而竞争中,网站的push与用户的pull的将扮演非常重要的角色。
        垂直搜索领域是搜索领域的新机会,几年前,视频、博客等出现了一些新的公司,而今,似乎他们的声音越来越小,如果新进入者抓不住近期的机会,一些垂直搜索领域还将是老一代搜索引擎的天下。

分类
搜索

为什么是搜索

        上帝说需要信息,于是有了互联网,上帝说需要秩序,于是有了搜索。
        说到搜索引擎(google把这个关键字第一个位置给了百度,有意思),我第一想到的是目录,无论你是想了解一本新书的内容,或者在一本看过的书中找一个遗忘的公式,翻看目录都是一个不错的选择,目录是一种信息查找的索引,通过检索比目标少得多的信息找到你想要的目标。
        搜索引擎具有和目录类似的功能,也有很大的不同,比如:由于互联网的动态性,搜索引擎提供的索引是动态、非完全、滞后、甚至错误的,尽管如此,搜索引擎目前已经成为信息索引最优秀的工具。
        操作引擎真正变得流行,还是近几年的事情,看看不管是先起的百度还是后起的搜狗,起个大早赶个晚集的雅虎,还是风华正茂的google,大有一番“搜场风云,舍我其谁”的姿态,搜索很火了。
        搜索需要较高的技术支撑,对于华尔街技术加团队的评判方式,是难得投资题材,但这并不是搜索引擎流行的原因。真正的理由在于,每天打开浏览器,除了固定的几个网址,如果你想找一些你感兴趣的信息,搜索引擎几乎是唯一选择。
        在互联网初期,信息提供者比较少,几个网站挨个看过去并不是什么问题,随着信息量的增加,地毯式的方法已经成为不可能事件,为日渐增多的信息提供索引成为必要。
        早期的互联网提供了类似图书馆检索的目录服务,但目录服务并没有成为主流的互联网服务。九十年代,雅虎开始提供分类为特点的信息索引服务,随着信息量的快速增长,基于人工分类的信息索引服务难以满足用户需要。
        通过搜索引擎,用户得到与关键词匹配的信息,与分类相比,具有更大的方便性和灵活性,而且信息是服务器从各个网站自动抓过来的(蜘蛛或者机器人),效率比人工要高很多,在海量的互联网信息中,搜索引擎成为导航者。
         农耕时代是自给自足的自然经济,工业文明带来的社会大分工,生产和流通成为不同的产业。信息产业也正在经历这样的过程,信息的生产(创作)与传播正在分离,信息越来越海量,如何保证信息流向(传播到)正确的地方也越来越重要。
         也正如计算机发展,初期是保证更高的效率和功能,逐渐变为保证安全和可靠。信息从广泛传播正在转向准确传播,信息需要秩序,保证信息的按照正确的渠道流通的秩序,这是信息的价值所在。
         搜索引擎的真正价值在于提供了信息秩序,但搜索引擎显然不是秩序的终极提供者,对于传播秩序的建立并不完善,当翻过检索结果多页也找不到自己想要到信息时,搜索引擎已经走到了边缘。
        毫无疑问,2006年最值钱的是什么,是搜索。那2006年之后呢?

分类
社区与传播

SNS:百度是否知道社会网络

        网友 cnsns 发过一篇blog,百度知道社会性网络cnsns 说“百度正式开始进行用户管理,用户经营,如果是这样的话,SNS将是一个必然的选择。”,基于此,cnsns得出一个结论:百度知道社会性网络。

        如果把服务涉及到用户或者用户之间的关联的网络服务看成社会网络服务的话,百度确实在做社会网络服务,但是百度是否“知道”社会网络服务,却不是一个简单的问题。

        百度“知道”社会网络服务是个什么意思呢?

        这个“知道”应该不是仅仅知道这个名词,百度那么多员工,知道社会网络这个热门词的是个很容易的事情,光是知道了这个名词也不能带来过多的价值。

         我想这里的“知道”应该是实践的意思,就是百度在有意识的实践着社会网络服务,从结果看,这个结论似乎是肯定的,百度的所有服务都有一些社会网络的痕迹。

        这个结论究竟有什么意义呢,好比甲乙两个人争论天上的月亮应该属于谁,最终甲获胜,月亮归甲,但对于甲乙的生活却没有任何影响。又想起一个关于庄子和惠子的故事。

        庄子和惠施站在一座桥上观鱼。庄子说:“你看这些鱼游来游去,多么快乐!”惠施说:“你不是鱼,怎么知道鱼儿快乐?”庄子反问:“你不是我,怎么知道我不知道鱼快乐?”惠施回答:“我不是你,固然不知道你;但你也不是鱼,你也不能知道鱼的快乐,这不是很明显的道理吗?”

        鱼的快乐不是观察者能说清楚的,百度是否在从事社会网络也不是旁观者能说得清的,至少在目前对社会网络理解众说纷纭的时候,即便百度知道社会网络,又知道是哪一家的“社会网络”呢?

        说了这么多,应该表明一下我讨论这一问题的目的了,当前web相关的新概念层出不穷,许多互联网网站都在按照自己的理解进行探索和实践,如果我们硬要把别人的实践按照往自己的理论框框上套,就会犯庄子的错误。

        互联网业务除了社会网络还有很多的形式,你用博客、wiki等的各种观点,都能找到一些影子,我们应该多看看互联网公司实践的趋势,而不要急着先画圈子,这对于开放自由的互联网研究有好处。

Web Counters