10個人有9個人不知道中文分詞,也這是很多做SEO的硬傷,如果連最基本的搜索引擎中文分詞技術(shù)算法都不知道,只能用一句摸著石頭過河來形容了。深度了解百度中文技術(shù)可以讓搜索引擎排名變得簡單化,清晰化。那么如何理解中文分詞技術(shù)是本文的核心課點。首先在了解百度中文技術(shù)以前要了解一個語義分析系統(tǒng),搜索引擎不像人的大腦一樣可以很直接的通用意識行為來判別一個網(wǎng)頁的核心主題。
比如我們作為一個用戶看到一篇文章叫做我的父親,對于用戶而言,你最直觀的感覺的就是該網(wǎng)頁文章的核心關(guān)鍵詞就是父親,絕對不是我或者的,之所以有這種感覺那是因為所謂用戶來思考,父親是一個名詞,我是代詞,的是助詞。但是對于搜索引擎本身來講它是不可能像人的大腦一樣思考這個意識來決定網(wǎng)頁核心主題的,對于中國人來說,語義分析和詞性則是搜索引擎利用區(qū)別網(wǎng)頁核心關(guān)鍵詞的主要方式,比如我們都知道中文有名詞、形容詞、動詞、介詞、副詞等等。并且不同的詞性他的含義和作用也完全不一樣,那么搜索引擎如何借助詞性來判斷關(guān)鍵詞的核心主題呢?
如果我們從大范圍來講,一個網(wǎng)頁的主題包含的關(guān)鍵詞不少,但是真正有價值的關(guān)鍵詞其實就那么幾個,并且這些有價值的詞我們暫且稱為核心關(guān)鍵詞。從詞性來看,多數(shù)這些有價值的詞均為名詞形態(tài),如果不了解該詞到底屬于什么關(guān)鍵詞詞性可以通過語義分析系統(tǒng)去識別(網(wǎng)址:http://ictclas.nlpir.org/nlpir/),也可以對照一下自己網(wǎng)站的關(guān)鍵詞,核心詞絕對是以名詞為主。
一般來說,核心關(guān)鍵詞定位多數(shù)都是名詞+動詞,或者名詞+形容詞,比如小明在奔跑,該標(biāo)題對于用戶來說,都知道核心關(guān)鍵詞是小明,沒了小明奔跑就沒有任何價值了。但是對于搜索引擎來說肯定不理解,從上面我們所講到的分詞原理,可以了解到該詞的核心關(guān)鍵詞也是小明,因為小明是名詞,奔跑是動詞,也叫做名+動。當(dāng)然定位核心關(guān)鍵詞的首要條件是必須是詞性的頻次相等的情況下才會優(yōu)先將名詞定位核心關(guān)鍵詞,比如漂亮_漂亮同義詞_漂亮的含義,雖然該標(biāo)題里面漂亮是形容詞,并且也包含了其他名詞,但是為何核心詞是漂亮而不是其他名詞,因為頻次相同才會將名詞定位核心詞,頻次不相同優(yōu)先將頻次最大的關(guān)鍵詞定位核心關(guān)鍵詞。
|
SEO算法:中文分詞技術(shù)原理與應(yīng)用!
發(fā)布時間:2017.05.15 瀏覽:
次
2
贊一個
預(yù)約SEO顧問服務(wù)請聯(lián)系:185-1018-8870(手機微信同步) 領(lǐng)取免費VIP內(nèi)部課程
文章來源:北京SEO技術(shù)服務(wù)中心
文章標(biāo)題:SEO算法:中文分詞技術(shù)原理與應(yīng)用!
本文地址:http://www.m.hsxyv.cn/suanfa/627.html
版權(quán)所有 © 北京SEO技術(shù)服務(wù)中心(微信/QQ:zhizheseo/2052048546),歡迎分享本文,轉(zhuǎn)載請保留出處!