SEO算法問題,如何借助分詞符號(hào)過濾重復(fù)內(nèi)容機(jī)制

閱讀 ?·? 發(fā)布日期 2020-04-13 10:23 ?·? admin
  這個(gè)知識(shí)點(diǎn)我SEO優(yōu)化課程里面講過分詞,但是沒有深度講,因?yàn)橹v了大多數(shù)人也聽不懂,畢竟實(shí)用性沒有做網(wǎng)站布局那么實(shí)在。分詞技術(shù)我們都知道是搜索引擎里面特有的一個(gè)算法歸類,但是對(duì)于百度這種搜索引擎來說,中文分詞占據(jù)了主要地位。我們繼續(xù)思維一個(gè)SEO邏輯,分詞符號(hào)在SEO優(yōu)化當(dāng)中能夠起到什么樣的作用,尤其是對(duì)于SEO從業(yè)人員來說,如果這個(gè)問題解決的好,相當(dāng)于可以直接解決一個(gè)知識(shí)點(diǎn)就是處理內(nèi)容重復(fù)。我們都知道百度在計(jì)算一個(gè)網(wǎng)頁內(nèi)容重復(fù)度的時(shí)候大多數(shù)是基于詞與詞之間的一種關(guān)系來進(jìn)行內(nèi)容結(jié)果排名,但是真正能夠滿足一個(gè)點(diǎn)的不僅僅是詞,而是詞之間構(gòu)建的符號(hào)。
分詞技巧
    一個(gè)網(wǎng)頁可以分成以上的一個(gè)結(jié)構(gòu)板塊,從最開始的文章篇到分割,分割的話除了共同部分區(qū)域,其他都是正文的一種表現(xiàn)形式出來。那么這里就有一個(gè)知識(shí)點(diǎn)了,分詞符號(hào)出現(xiàn)在不同的位置,實(shí)際上可以過濾的點(diǎn)就不一樣,什么意思的呢,我們?nèi)缦聢D所示:
中文分詞
    這是騰訊的中文分詞工具,大家需要使用的可以去直接了解使用下。從上面這張圖可以發(fā)現(xiàn),快排科技(vx:seokuaipai)網(wǎng)站的標(biāo)題分詞以后得到了這樣的一種詞庫組合,但是實(shí)際上我目前就用了一個(gè)橫線。我們?cè)诙嗉訋讉€(gè)分詞符號(hào),就可以出現(xiàn)完全不一樣的效果,如下圖所示:
算法匯總
    在來看這個(gè)搜索結(jié)果,是不是很奇妙,技術(shù)培訓(xùn)本身是一個(gè)詞,現(xiàn)在加了一個(gè)分詞符號(hào),是不是做到了分詞的結(jié)果。這里就有人肯定會(huì)問了,這個(gè)作用是什么,回到我本文標(biāo)題寫的東西,是處理內(nèi)容重復(fù)問題。實(shí)際上百度判斷一個(gè)網(wǎng)頁是否原創(chuàng),就在于內(nèi)容分詞后再次計(jì)算重復(fù)度,而分詞符號(hào)可以很好的借助這個(gè)特征點(diǎn)來處理一個(gè)內(nèi)容過濾采集問題,重點(diǎn)就是看大伙會(huì)不會(huì)深度研究和挖掘了。
    提示一個(gè)點(diǎn),上面兩個(gè)網(wǎng)頁截圖,加了分詞符號(hào)和不加分詞符號(hào)得到的一個(gè)詞數(shù)量和詞的內(nèi)容是完全不一樣的,這也是為什么目前一些市面上搞黑帽SEO作弊的人可以把百度玩的團(tuán)團(tuán)轉(zhuǎn)的根本原因。