马上注册,免费下载更多dz插件网资源。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
比如一堆词中有艾玛电动车
电动车艾玛
艾玛的电动车
电动车艾玛
这类的词语义是差不多的,所以在生产内容的时候产出的内容大致都是差不多,这类词需要做下去重。
我参照了seo前线莫山的做法,对关键词分词,然后以分词为基点过滤重复。我用c#写了个小程序在处理,开了十几个线程速度还是非常慢,而且很吃内存。。。 你们有没有什么更好的方法来从语义上去重?
这个帖子查看人数在涨。。就是没人回帖。。
为了以表真诚,我把我用的代码附上。
有没有做过类似的进来分享下方法
©DZ插件网所发布的一切资源仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 网站部分内容来源于网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,得到更好的正版服务。 您在本站任何的赞助购买、下载、查阅、回复等行为等均表示接受并同意签订《DZ插件网免责声明协议》。 如有侵权请邮件与我们联系处理: discuzaddons@vip.qq.com 并出示相关证明以便删除。敬请谅解!
|
|