说说出词率的几大影响因素
百度最近更新频繁,本渣又闲来无事把出词率整出来研究研究
出词率是个人自创的词,就是出词个数/收录网页数
都懂的道理,流量来自于出词率+排名
为了测试,搞个2个站,其实样本还是太少,不够严谨。
排除其他干扰,仿了一个单页模板,总共50字不到填充完了就上线了。
经过非同行业(排除干扰)引蜘蛛快速收录出词后,有一些现象是值得讨论的
要想找出这一影响因子,通过归纳观察现象-提出假设解释-通过假设提出理论-归纳法伪证推理。
50个字 分词后十几个 ,经过收录后原则上10个分词 几种排列组合后的词基本70%都出了
剩余10%有从来没有的相关词出现了。当然里面还有一影响因子在后面才发现遗漏了,就是分词数量占比会决定偏移到某些相关词程度。
先说部分结论
1 主关键词进入760排名内粗排后会逐渐带来更多长尾词,这里面还涉及到一个理论 760名排名和20名排名的关系,有人说是30,不重要,改天再吹牛逼。
2 分词数量每一个分词后的tfidf越高 会带来更多相关词分词的出词,也就是出现填充的分词没有出现的词,其实现在百度已经不靠tfidf了,升级了,但是基础原理一样。
这一原因个人猜测是索引库覆盖率的问题,有个高等数学词,咱数学不好忘了,比如词A 词B 词C 用3个椭圆形穿插,覆盖最多部分是主词,而边缘部分和词D 词E 覆盖更多就会出
懒得配图,发挥你们牛逼的3D大脑想象一下画面。 当然某一黑帽手法可以通过某种途径让他出词不在此讨论范围内。
大多讲课操作手法是内页是文章 列表 标签 热门推荐 等等 一顿操作猛如虎 往里面塞满 这一页面越相关,出词越高,有标题的,有关键词的相关,还有以前的标签,我见过的五花八门。他们自认为感觉很好,其实不知所以然,实际上由于百度索引库越大,随机性离散型越高,出词反而不受某一具体规则约束,所以效果往往很好,本渣以前在大型国企做优化,他们带我的就是这么来的,所以后面玩黑帽,也都是在白帽最基础性的东西上面添油加醋而已。基础还是非常有必要。套郭德纲一句名言,要想创新相声得是本行业创新,绝对不是公式相声说创新就创新的。
3 增加点击是可以加大和加快出词率,尤其在进入10名内带来更多相关词出词,当然多少也是由分词数量决定。参考反面k词,一k并非全k,想想很奇怪是吗,同理。顺便想抬杠以前的快排专家,说点击长尾词能带动主词,是有前提的。站在他们角度,多点不是消耗更多吗,有效率的多点才不花那冤枉钱。
4质量度 决定,这个质量度感觉很虚,没有量化指标,百度白皮书通篇都是这个词,看了很烦,其实大有文章,又要说到超级牛逼plus的东西,百度ai模型是质量判定标准的,只不过细分影响因子是很复杂的,咱也拿不到那核心玩意儿,只能靠白皮书和多年的经验瞎猜。言归正传,拿极端例子假设,填充内容虽然包含分词,但没有一句逻辑正确的完整句子,H2 当文章内容 tbody填充关键词,乱来,你猜出多少词,粗排又几何? 我见过有灰黑真这么干过,出词率还不低,所以百度越来越复杂,其实没有哪一条影响因子权重特别大,培训的说,有没有效果你照着做就行了。他们说的对,同样的手法100个相同站,为什么结果千差万别就是这个原因,你如果用蝴蝶效应解释那最通透明白了。
456 还很多不一一总结了。压箱底的说了还怎么继续装逼,对了,本渣不搞那9999的课程的小韭菜们,别私信我了,都没有回复过,大家都挣钱都不容易,而且靠这玩意儿岂不是拉低我的逼格。挣钱路子千万种,并非培训一条路。
有人说大佬从来不来论坛发帖,发帖都不是大佬,你说的对,本渣不是大佬,大佬大有人在,在马云面前,连他拿鞋子甩我都没这个资格。
想起以前的日子,比如iphone越狱贴,还有电玩巴士psp讨论等等各种技术贴曾经是多么辉煌,而现在分享干货少之又少,到底是时代变了还是人心浮躁,一切要以变现为目的。原来知识付费可以终结一个互联网共享精神。你可以理解为满足内心的虚荣心。
今天开心,洋洋洒洒码了这么多,又是一很湿很湿的贴,纯属吹牛逼。看完忘了,别实操,一实操就废。
出词率是个人自创的词,就是出词个数/收录网页数
都懂的道理,流量来自于出词率+排名
为了测试,搞个2个站,其实样本还是太少,不够严谨。
排除其他干扰,仿了一个单页模板,总共50字不到填充完了就上线了。
经过非同行业(排除干扰)引蜘蛛快速收录出词后,有一些现象是值得讨论的
要想找出这一影响因子,通过归纳观察现象-提出假设解释-通过假设提出理论-归纳法伪证推理。
50个字 分词后十几个 ,经过收录后原则上10个分词 几种排列组合后的词基本70%都出了
剩余10%有从来没有的相关词出现了。当然里面还有一影响因子在后面才发现遗漏了,就是分词数量占比会决定偏移到某些相关词程度。
先说部分结论
1 主关键词进入760排名内粗排后会逐渐带来更多长尾词,这里面还涉及到一个理论 760名排名和20名排名的关系,有人说是30,不重要,改天再吹牛逼。
2 分词数量每一个分词后的tfidf越高 会带来更多相关词分词的出词,也就是出现填充的分词没有出现的词,其实现在百度已经不靠tfidf了,升级了,但是基础原理一样。
这一原因个人猜测是索引库覆盖率的问题,有个高等数学词,咱数学不好忘了,比如词A 词B 词C 用3个椭圆形穿插,覆盖最多部分是主词,而边缘部分和词D 词E 覆盖更多就会出
懒得配图,发挥你们牛逼的3D大脑想象一下画面。 当然某一黑帽手法可以通过某种途径让他出词不在此讨论范围内。
大多讲课操作手法是内页是文章 列表 标签 热门推荐 等等 一顿操作猛如虎 往里面塞满 这一页面越相关,出词越高,有标题的,有关键词的相关,还有以前的标签,我见过的五花八门。他们自认为感觉很好,其实不知所以然,实际上由于百度索引库越大,随机性离散型越高,出词反而不受某一具体规则约束,所以效果往往很好,本渣以前在大型国企做优化,他们带我的就是这么来的,所以后面玩黑帽,也都是在白帽最基础性的东西上面添油加醋而已。基础还是非常有必要。套郭德纲一句名言,要想创新相声得是本行业创新,绝对不是公式相声说创新就创新的。
3 增加点击是可以加大和加快出词率,尤其在进入10名内带来更多相关词出词,当然多少也是由分词数量决定。参考反面k词,一k并非全k,想想很奇怪是吗,同理。顺便想抬杠以前的快排专家,说点击长尾词能带动主词,是有前提的。站在他们角度,多点不是消耗更多吗,有效率的多点才不花那冤枉钱。
4质量度 决定,这个质量度感觉很虚,没有量化指标,百度白皮书通篇都是这个词,看了很烦,其实大有文章,又要说到超级牛逼plus的东西,百度ai模型是质量判定标准的,只不过细分影响因子是很复杂的,咱也拿不到那核心玩意儿,只能靠白皮书和多年的经验瞎猜。言归正传,拿极端例子假设,填充内容虽然包含分词,但没有一句逻辑正确的完整句子,H2 当文章内容 tbody填充关键词,乱来,你猜出多少词,粗排又几何? 我见过有灰黑真这么干过,出词率还不低,所以百度越来越复杂,其实没有哪一条影响因子权重特别大,培训的说,有没有效果你照着做就行了。他们说的对,同样的手法100个相同站,为什么结果千差万别就是这个原因,你如果用蝴蝶效应解释那最通透明白了。
456 还很多不一一总结了。压箱底的说了还怎么继续装逼,对了,本渣不搞那9999的课程的小韭菜们,别私信我了,都没有回复过,大家都挣钱都不容易,而且靠这玩意儿岂不是拉低我的逼格。挣钱路子千万种,并非培训一条路。
有人说大佬从来不来论坛发帖,发帖都不是大佬,你说的对,本渣不是大佬,大佬大有人在,在马云面前,连他拿鞋子甩我都没这个资格。
想起以前的日子,比如iphone越狱贴,还有电玩巴士psp讨论等等各种技术贴曾经是多么辉煌,而现在分享干货少之又少,到底是时代变了还是人心浮躁,一切要以变现为目的。原来知识付费可以终结一个互联网共享精神。你可以理解为满足内心的虚荣心。
今天开心,洋洋洒洒码了这么多,又是一很湿很湿的贴,纯属吹牛逼。看完忘了,别实操,一实操就废。