多用戶網(wǎng)店系統(tǒng)優(yōu)化必須先了解搜索引擎原理,再做SEO優(yōu)化(上)
你知道“百度”這個(gè)搜索引擎是怎么工作的嗎?你有過(guò)這樣的疑惑嗎,同樣多用戶網(wǎng)店系統(tǒng)主題,為什么在百度上他的排名在我前面?其實(shí)都是百度的排序算法左右著我們的多用戶網(wǎng)店系統(tǒng)排名。那好,我們只要摸清楚百度是如何給我們這些網(wǎng)站排名的話,我們就能對(duì)癥下藥把我們多用戶網(wǎng)店系統(tǒng)優(yōu)化成它喜歡的多用戶網(wǎng)店系統(tǒng),排名自然就上去嘍!
其實(shí),搜索引擎的工作過(guò)程大體上可分為三個(gè)階段:
一、爬行和抓取--搜索引擎蜘蛛通過(guò)跟蹤鏈接訪問(wèn)網(wǎng)頁(yè),獲得頁(yè)面HTML代碼存入數(shù)據(jù)庫(kù)。
二、預(yù)處理--索引程序?qū)ψト?lái)的頁(yè)面數(shù)據(jù)進(jìn)行文字提取,中文分詞,索引等處理,以備排名程序調(diào)用。
三:排名--用戶輸入關(guān)鍵詞后,排名程序調(diào)用索引庫(kù)數(shù)據(jù),計(jì)算相關(guān)性,然后按一定格式生成搜索結(jié)果頁(yè)面。
那么問(wèn)題來(lái)了!我們知道,要想讓我們的多用戶網(wǎng)店系統(tǒng)讓百度收錄到它的數(shù)據(jù)庫(kù)中,就必須讓百度蜘蛛在茫茫的互聯(lián)網(wǎng)中發(fā)現(xiàn)我們,蜘蛛的工作原理是順著網(wǎng)站的鏈接地址進(jìn)行爬行抓取頁(yè)面信息,單從理論上來(lái)說(shuō)蜘蛛可以爬行和抓取互聯(lián)網(wǎng)上所有頁(yè)面,但是實(shí)際上不能,也不會(huì)這么做,在這種前提下,蜘蛛所要做的就是盡量抓取重要頁(yè)面。 所以,我們SEO人員要想讓自己的更多頁(yè)面被收錄,就要想方設(shè)法吸引蜘蛛來(lái)抓取。
被搜索引擎認(rèn)為符合重要頁(yè)面的幾個(gè)因素:
1、網(wǎng)站和頁(yè)面權(quán)重
2、頁(yè)面更新度
3、導(dǎo)入鏈接
4、與首頁(yè)點(diǎn)擊距離
我們只有讓我們的網(wǎng)站向上面這4條信息靠攏,才會(huì)被蜘蛛發(fā)現(xiàn)并收錄到數(shù)據(jù)庫(kù)中。好了,當(dāng)我們的網(wǎng)站信息被百度收錄后接下來(lái)就可以分為以下幾個(gè)步驟:
1、預(yù)處理。在一些SEO材料中,“預(yù)處理”也被簡(jiǎn)稱為“索引”,因?yàn)樗饕穷A(yù)處理最主要的步驟。我們知道在百度數(shù)據(jù)庫(kù)中收錄的并不是現(xiàn)成的頁(yè)面,而是“HTML”標(biāo)簽源代碼,搜索引擎預(yù)處理的工作內(nèi)容首先除去HTML代碼后,剩下的用于排名的文字只是一行。
除了可見(jiàn)文字,搜索引擎也會(huì)提取出一些特殊的包含文字信息的代碼,如:META標(biāo)簽中的文字,圖片替代文字,F(xiàn)lash文件中的替代文字,鏈接錨文字等。
2、中文分詞(這是中文搜索引擎所獨(dú)有的,誰(shuí)讓我們的文化博大精深呢,沒(méi)辦法,就是任性!)。中文分詞方法基本上有兩種:
(1)、基于詞典匹配--將待分析的一段漢字與一個(gè)事先造好的詞典中的詞條進(jìn)行匹配,在待分析漢字串中掃描到詞典中已有的詞條則匹配成功,或者說(shuō)切分出一個(gè)單詞。
(2)、基于統(tǒng)計(jì)--指的是分析大量文字樣本,計(jì)算出字與字相鄰出現(xiàn)的統(tǒng)計(jì)概率,幾個(gè)字相鄰出現(xiàn)越多,就越可能形成一個(gè)單詞。
3、去停止詞 。停止詞--無(wú)論是英文還是中文,頁(yè)面內(nèi)容中都會(huì)出現(xiàn)頻率很高,卻對(duì)內(nèi)容沒(méi)有任何影響的詞,如“的”、“地”、“得”之類的助詞,“啊”、“哈”、“呀”之類的感嘆詞,“從而”、“以”、“卻”之類的副詞或介詞,這些詞被稱為停止詞。 因?yàn)檫@些停止詞對(duì)頁(yè)面的主要意思沒(méi)什么影響,所以搜索引擎索引頁(yè)面之前會(huì)去掉停止詞,使索引數(shù)據(jù)主題更為突出,減少無(wú)謂的計(jì)算量。
4、消除噪聲。所謂噪聲,就是除了停止詞以外,對(duì)頁(yè)面主題沒(méi)有什么貢獻(xiàn)的因素,比如:博客頁(yè)面的“文章分類”、“歷史存檔”等。
消噪的基本方法: 根據(jù)HTML標(biāo)簽對(duì)頁(yè)面分塊,區(qū)分出頁(yè)頭,導(dǎo)航,正文,頁(yè)腳,關(guān)高等區(qū)域,在網(wǎng)站上大量重復(fù)出現(xiàn)的區(qū)塊旺旺屬于噪聲。對(duì)頁(yè)面進(jìn)行消噪后,剩下的才是頁(yè)面主題內(nèi)容。
5、去重。搜索引擎在進(jìn)行索引前還需要識(shí)別和刪除重復(fù)內(nèi)容,這個(gè)過(guò)程就稱為“去重”。其意義在于提升用戶體驗(yàn)(搜索引擎不喜歡重復(fù)性內(nèi)容)。
去重方法: “去重”的基本方法是對(duì)頁(yè)面特征關(guān)鍵詞計(jì)算指紋,也就是說(shuō)從頁(yè)面主題內(nèi)容中選取最有代表性的一部分關(guān)鍵詞(經(jīng)常是出現(xiàn)頻率最高的關(guān)鍵詞),然后計(jì)算這些關(guān)鍵詞的數(shù)字指紋。
6、正向索引 。正向索引也可以簡(jiǎn)稱為索引 ,搜索引擎索引程序?qū)㈨?yè)面及關(guān)鍵詞形成詞表結(jié)構(gòu)存儲(chǔ)進(jìn)索引庫(kù)。并由文件ID映射著其關(guān)鍵詞內(nèi)容,一一對(duì)應(yīng)。
7、倒排索引。正向索引還不能用于排名,最終用于排名的是倒排索引。所以搜索引擎會(huì)將正向索引數(shù)據(jù)庫(kù)重新構(gòu)造為倒排索引,把文件對(duì)應(yīng)到關(guān)鍵詞的映射轉(zhuǎn)換為關(guān)鍵詞的文件的映射。
8、鏈接關(guān)系計(jì)算。鏈接關(guān)系計(jì)算也是預(yù)處理中很重要的一部分。 搜索引擎在抓取頁(yè)面內(nèi)容后,必須事前計(jì)算出: 頁(yè)面上有哪些鏈接指向哪些其他頁(yè)面 每個(gè)頁(yè)面有哪些導(dǎo)入鏈接 鏈接使用了什么錨文字 這些復(fù)雜的鏈接指向關(guān)系形成了網(wǎng)站和頁(yè)面的鏈接權(quán)重。
9、特殊文件處理。
搜索引擎除了可以抓取HTML文件外,通常還能抓取和索引以文字為基礎(chǔ)的多種文件類型,如:PDF、WORDS、WPS、PPT、TXT等文件。 目前搜索引擎還不能處理圖片、視頻、Flash這類非文字內(nèi)容,也不能執(zhí)行腳本和程序。
做完上面這幾件事后,最后的工作就是多用戶網(wǎng)店系統(tǒng)排名了。由于這里寫(xiě)不下,還望大家關(guān)注我下一篇文章哦,我會(huì)詳細(xì)講解搜索引擎是如何給我們的多用戶網(wǎng)店系統(tǒng)進(jìn)行排名的。也歡迎大家有什么問(wèn)題能跟我交流討論!
<本文由himall原創(chuàng),商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請(qǐng)標(biāo)明:himall原創(chuàng)>
滿足不同行業(yè)發(fā)展電商的需求,HiMall更有針對(duì)性的提供不同行業(yè)內(nèi)的電商解決方案
-
跨境電商解決方案
支持直郵/保稅模式
對(duì)接海關(guān)/保稅倉(cāng)
支持多國(guó)國(guó)際語(yǔ)言
對(duì)接Paypal國(guó)際支付
幫助跨境外貿(mào)企業(yè)搭建跨境進(jìn)口/出口電商平臺(tái),搶占國(guó)際電商市場(chǎng),針對(duì)企業(yè)需求定制個(gè)性化跨境電商解決方案 -
分賬解決方案
迎合金融監(jiān)管要求
規(guī)避“二清”結(jié)算
節(jié)約平臺(tái)財(cái)務(wù)成本
降低平臺(tái)招商成本
在合法、合規(guī)的前提下,為電商平臺(tái)提供資金收付、賬戶管理、資金合規(guī)等一體化整體解決方案 -
B2B批發(fā)解決方案
多級(jí)階梯批發(fā)價(jià)
布局全渠道批發(fā)入口
專屬批發(fā)訂貨市場(chǎng)
銀聯(lián)B2B大額支付
為企業(yè)快速搭建綜合性B2B批發(fā)電商平臺(tái),整合線下批發(fā)資源,拓展線上批發(fā)渠道,實(shí)現(xiàn)批發(fā)業(yè)務(wù)24小時(shí)在線經(jīng)營(yíng)
-
2024年c2c商城系統(tǒng)開(kāi)發(fā)需要多少錢(qián)?C2C開(kāi)發(fā)流程
最新消息:近些年互聯(lián)網(wǎng)+的是帶發(fā)展迅速,企業(yè)依靠各種方式都邁入互聯(lián)網(wǎng)時(shí)代,也許是走的人多了,c2c商城系統(tǒng)這種商城系統(tǒng)的模式...詳情
-
2023年外貿(mào)元旦新年祝福郵件模板
最新消息:元旦客戶郵件主題,外貿(mào)客戶的郵件模板,新年元旦來(lái)臨之即,在外國(guó)人的眼中,在這個(gè)非常重要的新年假期,你有電子郵件問(wèn)候你...詳情
【本站聲明】
1、本網(wǎng)站發(fā)布的該篇文章,目的在于分享電商知識(shí)及傳遞、交流相關(guān)電商信息,以便您學(xué)習(xí)或了解電商知識(shí),請(qǐng)您不要用于其他用途;
2、該篇文章中所涉及的商標(biāo)、標(biāo)識(shí)的商品/服務(wù)并非來(lái)源于本網(wǎng)站,更非本網(wǎng)站提供,與本網(wǎng)站無(wú)關(guān),系他人的商品或服務(wù),本網(wǎng)站對(duì)于該類商標(biāo)、標(biāo)識(shí)不擁有任何權(quán)利;
3、本網(wǎng)站不對(duì)該篇文章中所涉及的商標(biāo)、標(biāo)識(shí)的商品/服務(wù)作任何明示或暗示的保證或擔(dān)保;
4、本網(wǎng)站不對(duì)文章中所涉及的內(nèi)容真實(shí)性、準(zhǔn)確性、可靠性負(fù)責(zé),僅系客觀性描述,如您需要了解該類商品/服務(wù)詳細(xì)的資訊,請(qǐng)您直接與該類商品/服務(wù)的提供者聯(lián)系。