关于团购导航

最近看团购比较多,发现团购导航网站非常的多,但貌似没几个做的实在,做的像样的,所以有点小想法。

1、导航的核心就是团购信息的采集,采集到足够量的信息才能提供展示,给用户帮助

2、团购是一个周期性很强的产品,所以我们不需要实时采集,理论上只是每天一次,这对蜘蛛的要求就降低很多

3、数据的分析,产品信息采集回来了,将他们进行分类,给予相应的标签等等就是最核心的事情。

4、复杂的地方在于大部分团购站点的模板并不相同,所以现阶段无法一概而就的分析出产品信息,目前的想法,一个站点对应一个解释器(增加了工作量、降低了灵活度、增加了质量因为是可控的,暂时不考虑更新的问题)

5、地区分类,每个地区只需要使用一个蜘蛛(地区可以一个一个上)

6、对产品信息进行整合并分词,取出现几率最高的前几个作为这个产品的标签,并维护一个同义词库,达到机器分类的目的。

7、以更灵活的方式通过标签或者指定的分类进行产品的筛选,提高用户体验。

Published: April 20 2011

blog comments powered by Disqus