| 1996
年4月,我到赌城拉斯维加斯开一个有关信息检索方面的学术会议,
会议的内容就象拉斯维加斯的天气一样,照例比较枯燥乏味。但远离公司的我,难得有一个静下心来认真思考问题的机会。就在听一个毫不相干的论文演讲的时候,
我突然把科学引文索引的机制跟Web上的超级链接联系起来了
感谢北大,她在我上大三的时候就教授了我科学引文索引的机制,美国恐怕没有一所大学会在你本科的时候教这玩艺儿。
科学引文索引的机制,说
白了就是谁的论文被引用次数多,谁就被认为是权威,论文就是好论文。这个思路移植到网上就是谁的网页被链接次数多,那个网页就被认为是质量高,人气旺。在
加上相应的链接文字分析,就可以用在搜索结果的排序上了。这就引出了搜索引擎的第二定律:人气质量定律。根据这一定律,搜索结果的相关性排序,并不完全依
赖于词频统计,而是更多地依赖于超链分析。
我意识到这是一个突破性的东西,回去以后就很快总结了思路,于96年6月申请了这一方面的美国
专利。1999年7月6号,美国专利和商标局批准了专利号为5,920,859的,以我为唯一发明人的专利。大约在96年底,斯坦福大学计算机系的两位研
究生也想到了同样的解决方法,他们后来创立了一个叫Google的搜索引擎,Google的网站上至今仍然说他们的这项技术是Patent-
pending (专利申请中)
,不知道美国专利局是不是还会再批这样的专利。Anyway,超链分析的方法98年以后逐渐被各大搜索引擎所接受,由于链接是网络内容的一个根本特性,这
时候的搜索引擎才开始真正利用网络时代的检索技术。
世事难料,2000年起网络泡沫迅速破灭,各大搜索引擎要么遭人收购,要么推迟上市,所有使用人气质量定律的搜索引擎公司都未能幸免。那么,搜索引擎的出路到底在哪儿? |