亚洲精品视频一区二区,一级毛片在线观看视频,久久国产a,狠狠狠色丁香婷婷综合久久五月,天天做天天欢摸夜夜摸狠狠摸

在線(xiàn)客服與您一對一交流
當前位置: 主頁(yè) > 行業(yè)新聞 > seo >

淺談搜索引擎的核心算法

外鏈是搜索引擎算法中,判斷網(wǎng)站權重高低的重要指標,當用戶(hù)在搜索框中輸入關(guān)鍵時(shí),搜索引擎面對大量擁有相同內容的網(wǎng)頁(yè),首先需要解決的就是,通過(guò)哪些參數覺(jué)得網(wǎng)頁(yè)排名的高低。今天,筆者就簡(jiǎn)單介紹外鏈建設中,比較有名的核心算法:PageRank算法、Hilltop算法、Direct Hit 算法。
  第一種算法、PageRank算法
  1998年,Sergey Brin和Lawrence Page提出了PageRank算法。該算法基于“從許多優(yōu)質(zhì)的網(wǎng)頁(yè)鏈接過(guò)來(lái)的網(wǎng)頁(yè),必定還是優(yōu)質(zhì)網(wǎng)頁(yè)”的回歸關(guān)系,來(lái)判定網(wǎng)頁(yè)的重要性。該算法認為從網(wǎng)頁(yè)A導向網(wǎng)頁(yè)B的鏈接可以看作是頁(yè)面A對頁(yè)面B的支持投票,根據這個(gè)投票數來(lái)判斷頁(yè)面的重要性。當然,不僅僅只看投票數,還要對投票的頁(yè)面進(jìn)行重要性分析,越是重要的頁(yè)面所投票的評價(jià)也就越高。根據這樣的分析,得到了高評價(jià)的重要頁(yè)面會(huì )被給予較高的PageRank值,在檢索結果內的名次也會(huì )提高。PageRank是基于對“使用復雜的算法而得到的鏈接構造” 的分析,從而得出的各網(wǎng)頁(yè)本身的特性。
  分析:PageRank算法的優(yōu)點(diǎn)在于它對互聯(lián)網(wǎng)上的網(wǎng)頁(yè)給出了一個(gè)全局的重要性排序,并且算法的計算過(guò)程是可以離線(xiàn)完成的,這樣有利于迅速響應用戶(hù)的請求。不過(guò),其缺點(diǎn)在于主題無(wú)關(guān)性,沒(méi)有區分頁(yè)面內的導航鏈接、廣告鏈接和功能鏈接等,容易對廣告頁(yè)面有過(guò)高評價(jià);另外,PageRank算法的另一弊端是,舊的頁(yè)面等級會(huì )比新頁(yè)面高,因為新頁(yè)面,即使是非常好的頁(yè)面,也不會(huì )有很多鏈接,除非他是一個(gè)站點(diǎn)的子站點(diǎn)。這就是PageRank需要多項算法結合的原因。西安醫療網(wǎng)站制作,西安網(wǎng)站專(zhuān)業(yè)制作推薦閱讀>>> 綠蘿算法2.0解讀官方版,
  第二種算法、Hilltop算法
  HillTop,是一項搜索引擎結果排序的專(zhuān)利,是Google的一個(gè)工程師Bharat在2001年獲得的專(zhuān)利。HillTop算法的指導思想和PageRank是一致的,即都通過(guò)反向鏈接的數量和質(zhì)量來(lái)確定搜索結果的排序權重。但HillTop認為只計算來(lái)自具有相同主題的相關(guān)文檔鏈接對于搜索者的價(jià)值會(huì )更大,即主題相關(guān)網(wǎng)頁(yè)之間的鏈接對于權重計算的貢獻比主題不相關(guān)的鏈接價(jià)值要更高。在1999-2000年,當這個(gè)算法被Bharat與其他Google開(kāi)發(fā)人員開(kāi)發(fā)出來(lái)的時(shí)候,他們稱(chēng)這種對主題有影響的文檔為“專(zhuān)家”文檔,而只有從這些專(zhuān)家文檔頁(yè)面到目標文檔的鏈接決定了被鏈接網(wǎng)頁(yè)“權重得分”的主要部分。
  Hilltop算法的過(guò)程:首先計算查詢(xún)主題最相關(guān)的“專(zhuān)家”資源列表;其次在選中的“專(zhuān)家”集中識別相關(guān)的鏈接,并追蹤它們以識別相關(guān)的網(wǎng)頁(yè)目標;然后將目標根據非關(guān)聯(lián)的指向它們的“專(zhuān)家”數量和相關(guān)性排序。由此,目標網(wǎng)頁(yè)的得分反映了關(guān)于查詢(xún)主題的最中立的專(zhuān)家的集體觀(guān)點(diǎn)。如果這樣的專(zhuān)家池不存在,Hilltop不會(huì )給出結果。
  從Hilltop算法過(guò)程可見(jiàn),該算法包括兩個(gè)主要的方面:尋找專(zhuān)家;目標排序。通過(guò)對搜索引擎抓取的網(wǎng)頁(yè)進(jìn)行預處理,找出專(zhuān)家頁(yè)面。對于一個(gè)關(guān)鍵詞的查詢(xún),首先在專(zhuān)家中查找,并排序返回結果。
  權威頁(yè)面是對于一個(gè)查詢(xún)主題來(lái)說(shuō)最好的專(zhuān)家指向的頁(yè)面。專(zhuān)家也有可能在更寬泛的領(lǐng)域或其它領(lǐng)域的主題上也是專(zhuān)家。在專(zhuān)家頁(yè)面中只有一部分鏈接與主題相關(guān)。因此,把查詢(xún)主題的專(zhuān)家中相關(guān)的外向鏈接合并,以找到查詢(xún)主題相關(guān)頁(yè)面高度認可的頁(yè)面。
  從排名在前的匹配專(zhuān)家頁(yè)面和相聯(lián)系的匹配信息中選擇專(zhuān)家頁(yè)面中一個(gè)超鏈接的子集。尤其選擇那些與所有的查詢(xún)相關(guān)的鏈接?;谶@些選中的鏈接找出一個(gè)它們的目標子集作為查詢(xún)主題最相關(guān)的網(wǎng)頁(yè)。這個(gè)目標子集包含至少被兩個(gè)非親屬的專(zhuān)家頁(yè)面鏈接到的網(wǎng)頁(yè)。目標集根據指向它們的專(zhuān)家的綜合成績(jì)來(lái)排序。西安做網(wǎng)站的公司哪家好,西安網(wǎng)頁(yè)制作公司推薦閱讀>>> 石榴算法—低質(zhì)量頁(yè)面終結者,
  Hilltop在應用中還存在一些不足。專(zhuān)家頁(yè)面的搜索和確定對算法起關(guān)鍵作用,專(zhuān)家頁(yè)面的質(zhì)量決定了算法的準確性;而專(zhuān)家頁(yè)面的質(zhì)量和公平性在一定程度上難以保證。Hiltop忽略了大多數非專(zhuān)家頁(yè)面的影響。在Hiltop的原型系統中,專(zhuān)家頁(yè)面只占到整個(gè)頁(yè)面的1.79%,不能全面代表整個(gè)互聯(lián)網(wǎng)。
  Hiltop算法在無(wú)法得到足夠的專(zhuān)家頁(yè)面子集時(shí)(少于兩個(gè)專(zhuān)家頁(yè)面),返回為空,即Hiltop適合于對查詢(xún)排序進(jìn)行求精,而不能覆蓋。這意味著(zhù)Hilltop可以與某個(gè)頁(yè)面排序算法結合,提高精度,而不適合作為一個(gè)獨立的頁(yè)面排序算法。Hilltop中根據查詢(xún)主題從專(zhuān)家頁(yè)面集合中選取與主題相關(guān)的子集也是在線(xiàn)運行的,這與前面提到的HITS算法一樣會(huì )影響查詢(xún)響應時(shí)間。隨著(zhù)專(zhuān)家頁(yè)面集合的增大,算法的可伸縮性存在不足之處。
  分析:HITS算法的優(yōu)點(diǎn)在于它能更好地描述互聯(lián)網(wǎng)的組織特點(diǎn),由于它只是對互聯(lián)網(wǎng)中的很小的一個(gè)子集進(jìn)行分析,所以它需要的迭代次數更少,收斂速度更快,減少了時(shí)間復雜度。
  但HITS算法也存在如下缺點(diǎn):中心網(wǎng)頁(yè)之間的相互引用以增加其網(wǎng)頁(yè)評價(jià),當一個(gè)網(wǎng)站上的多篇網(wǎng)頁(yè)指向一個(gè)相同的鏈接,或者一個(gè)網(wǎng)頁(yè)指向另一個(gè)網(wǎng)站上的多個(gè)文件時(shí)會(huì )引起評分的不正常增加,這會(huì )導致易受“垃圾鏈接”的影響;網(wǎng)頁(yè)中存在自動(dòng)生成的鏈接;
  主題漂移,在鄰接圖中經(jīng)常包括一些和搜索主題無(wú)關(guān)的鏈接,如果這些鏈接自身也是中心網(wǎng)頁(yè)或權威網(wǎng)頁(yè)就會(huì )引起主題漂移:對于每個(gè)不同的查詢(xún)算法都需要重新運行一次來(lái)獲取結果。這使得它不可能用于實(shí)時(shí)系統,因為對于上千萬(wàn)次的并發(fā)查詢(xún)這樣的開(kāi)銷(xiāo)實(shí)在太大。
  第三種算法、Direct Hit 算法
  與前面的算法相比,Ask Jeeves公司的Direct Hit算法是一種注重信息的質(zhì)量和用戶(hù)反饋的排序方法。它的基本思想是,搜索引擎將查詢(xún)的結果返回給用戶(hù),并跟蹤用戶(hù)在檢索結果中的點(diǎn)擊。如果返回結果中排名靠前的網(wǎng)頁(yè)被用戶(hù)點(diǎn)擊后,瀏覽時(shí)間較短,用戶(hù)又重新返回點(diǎn)擊其它的檢索結果,那么可以認為其相關(guān)度較差,系統將降低該網(wǎng)頁(yè)的相關(guān)性。另一方面,如果網(wǎng)頁(yè)被用戶(hù)點(diǎn)擊打開(kāi)進(jìn)行瀏覽,并且瀏覽的時(shí)間較長(cháng),那么該網(wǎng)頁(yè)的受歡迎程度就高,相應地,系統將增加該網(wǎng)頁(yè)的相關(guān)度??梢钥闯?,在這種方法中,相關(guān)度在不停地變化,對于同一個(gè)詞在不同的時(shí)間進(jìn)行檢索,得到結果集合的排序也有可能不同,它是一種動(dòng)態(tài)排序。
  分析:該算法的優(yōu)點(diǎn)是能夠節省大量時(shí)間,因為用戶(hù)閱讀的是從搜索結果中篩選出來(lái)的更加符合要求的結果。同時(shí),這種算法直接融入用戶(hù)的反饋信息,能夠保證頁(yè)面的質(zhì)量。西安哪家公司做網(wǎng)站便宜又好呢,西安做網(wǎng)站最好的公司推薦閱讀>>> 移動(dòng)搜索冰桶算法2.0更新公告:預期于2周后上線(xiàn),希望廣大站長(cháng)及時(shí)進(jìn)行處理,
  然而,統計表明,Direct Hit算法只適合于檢索關(guān)鍵詞較少的情況,因為它實(shí)際上并沒(méi)有進(jìn)行排序,而是一種篩選和抽取,在檢索數據庫很大、關(guān)鍵詞很多的時(shí)候,返回的搜索結果成千上萬(wàn),用戶(hù)不可能一一審閱。因此,這種方式也不能作為主要的排序算法來(lái)使用,而是一種很好的輔助排序算法,目前在許多搜索引擎當中仍然在使用。
  其實(shí)對于網(wǎng)頁(yè)的搜索排名,都是多種算法綜合作用的結果,簡(jiǎn)單分析上面的三種算法,Pagerank可以給網(wǎng)站上的所有網(wǎng)頁(yè)給予一個(gè)重要性的排序,但是沒(méi)有針對性、相關(guān)性,而且現在PR值作弊已經(jīng)到了一個(gè)泛濫的地步,所以PR就網(wǎng)頁(yè)排名的重要性已經(jīng)大為下降;
  Hilltop算法的提出,對于廣大站長(cháng)做外部鏈接建設,將起到指導作用。在Hilltop算法中,每個(gè)領(lǐng)域都會(huì )有若干專(zhuān)家頁(yè)面,如果搜索相關(guān)關(guān)鍵詞,搜索引擎首先會(huì )從專(zhuān)家頁(yè)面查找,如果匹配度不夠,再從專(zhuān)家頁(yè)面鏈接的下一級頁(yè)面查找,以此類(lèi)推。
  Direct Hit算法可以作為Hilltop和pagerank很好的補充,Direct Hit更多的是,考慮了用戶(hù)體驗的影響,對搜索結果的質(zhì)量,進(jìn)行實(shí)時(shí)的更新,一個(gè)最符合搜索用戶(hù)要求的頁(yè)面,應該是用戶(hù)從搜索框中點(diǎn)擊頁(yè)面鏈接開(kāi)始,用戶(hù)瀏覽網(wǎng)站超過(guò)一定時(shí)間,則被認為結果頁(yè)面,更符合用戶(hù)搜索的要求,長(cháng)期有效的點(diǎn)擊,頁(yè)面在搜索引擎中排名,就會(huì )有相應的提高。
  通過(guò)以上三種算法,就可以明白,無(wú)論是做外鏈還是網(wǎng)站內容建設,首先需要考慮的就是相關(guān)性,在外鏈建設中,要努力尋找主題相關(guān)中,權威度高的網(wǎng)站,軟文、友情鏈接等,都可以看作是這些網(wǎng)站,對你的支持,同時(shí),注意網(wǎng)站的跳出率和瀏覽時(shí)間,時(shí)刻反饋用戶(hù)數據,對一些重點(diǎn)頁(yè)面,用戶(hù)點(diǎn)擊量較高的頁(yè)面,做好相關(guān)性推薦,引導用戶(hù)點(diǎn)擊更多的頁(yè)面。
    來(lái)源:月光博客

相關(guān)文章:

  • 尊敬的各位站長(cháng),您好: 近期,經(jīng)過(guò)技術(shù)挖掘,我們發(fā)現部分網(wǎng)頁(yè)通過(guò)色情動(dòng)圖、露骨文本、賭博等等吸引眼球的形態(tài)誘導用戶(hù)點(diǎn)擊非法廣告,為了改善用戶(hù)體驗以及引導行業(yè)生態(tài)向積極健康...

  • 尊敬的各位站長(cháng),您好: 為提升搜索用戶(hù)體驗、建設健康穩定的移動(dòng)搜索生態(tài),百度搜索將針對移動(dòng)搜索結果頁(yè)廣告過(guò)多、影響用戶(hù)體驗的頁(yè)面,進(jìn)行策略調整。在此提醒各位站長(cháng):請盡快對...

  • 親愛(ài)的網(wǎng)站管理員: 秉承用戶(hù)至上的原則,百度移動(dòng)搜索不斷更新系統、升級算法,一切都為了讓用戶(hù)擁有更順暢的搜索體驗。百度移動(dòng)搜索冰桶算法近期將升級至2.0版本。 2.0版本將嚴厲打擊...

  • 百度站長(cháng)平臺站點(diǎn)整改反饋功能已于今晨上線(xiàn),首批通知會(huì )通過(guò)站內消息、郵件和短信三種方式同時(shí)發(fā)送給命中石榴算法的站點(diǎn)站長(cháng)。消息送達后的96小時(shí)內,站長(cháng)對站點(diǎn)進(jìn)行整改后進(jìn)行反饋,...

  • 在站長(cháng)平臺與百度反作弊團隊共同努力下,百度站長(cháng)平臺即將推出站點(diǎn)整改反饋功能:提前通知站長(cháng)站點(diǎn)內容存在低質(zhì)與作弊問(wèn)題,站長(cháng)若在一定時(shí)間內修正問(wèn)題,可避免被搜索引擎懲罰。希...

  • 外鏈建設,其實(shí)更多的是小公司或者個(gè)人站長(cháng)的外鏈建設。對于大型的電子商務(wù)網(wǎng)站而言,公司管理層的一個(gè)發(fā)言、一次調整,可能就會(huì )引起新聞媒體報道。但是對于個(gè)人站長(cháng)及小公司,在百...

  • 百度持續打擊新聞源售賣(mài)軟文、目錄行為,近日百度反作弊團隊發(fā)現部分新聞源站點(diǎn)售賣(mài)目錄,發(fā)布大量低質(zhì)內容現象仍然存在,此舉嚴重違反新聞源規則,并影響用戶(hù)搜索體驗。針對此情況...

  • 近日,百度網(wǎng)頁(yè)搜索發(fā)現部分站點(diǎn)存在盜取用戶(hù)隱私的行為,主要表現為網(wǎng)頁(yè)嵌惡意代碼,用于盜取網(wǎng)民的QQ號、手機號。而許多網(wǎng)民卻誤認為這是百度所為。為此,百度網(wǎng)頁(yè)搜索和百度安全聯(lián)...

  • 親愛(ài)的網(wǎng)站管理員: 秉承用戶(hù)至上的原則,百度移動(dòng)搜索不斷更新系統、升級算法,一切都為了讓用戶(hù)擁有更順暢的搜索體驗。百度移動(dòng)搜索冰桶算法近期將升級至3.0版本。3.0版本將嚴厲打擊...

  • 百度搜索7月15日上線(xiàn)冰桶算法3.0,嚴厲打擊在百度移動(dòng)搜索中,打斷用戶(hù)完整搜索路徑的調起行為。 至此,百度算法發(fā)布和更新共累計7次,每一次都會(huì )影響相當一部分站點(diǎn)。 究竟近些年來(lái)到...

  • 公司:西安蟠龍網(wǎng)絡(luò )科技有限公司
  • 聯(lián)系人:張經(jīng)理
  • 手機/微信:
  • Q Q: 點(diǎn)擊這里給我發(fā)消息
  • 地址:西安市雁塔區唐延南路11號逸翠園i都會(huì )
亚洲精品视频一区二区,一级毛片在线观看视频,久久国产a,狠狠狠色丁香婷婷综合久久五月,天天做天天欢摸夜夜摸狠狠摸