色欲狠狠躁天天躁无码中文字幕_国产肉体XXXX裸体784大胆_夜夜夜高潮夜夜爽夜夜爰爰_黑色丝袜老师自慰喷水浪潮免费

您正在使用版本過時的瀏覽器!


過舊的瀏覽器無法支持全新的功能與特效,若希望獲得完整瀏覽體驗請升級瀏覽器

谷歌搜索引擎背后的秘密:搜索算法的平衡藝術

發布時間:2007-12-25 點擊:3571
  搜索是重中之重

  隨著企業規模不斷擴大,谷歌開始向多個領域進軍,包括網絡地圖、數字圖書館、視頻共享以及桌面軟件等等。但是,谷歌的重中之重仍然是搜索引擎。通過谷歌搜索引擎,用戶可以在浩如煙海的大量信息中找到自己需要的內容。正因為有了出色的搜索引擎,谷歌才成為了訪問量最大、利潤最為豐厚、甚至最為強大的互聯網公司。

  不過,搜索引擎給谷歌招致的抱怨也最多。每天都有數百萬用戶在使用谷歌搜索引擎之后感到失望,因為他們無法找到自己需要的旅館、醫藥處方、或者人物背景。谷歌經常能幫助用戶找到想要的東西,但并非總能做到這一點。基于這一原因,阿米特·辛格哈爾(Amit Singhal)和其它數百名工程師一直致力于改進谷歌搜索引擎,希望能縮小“經常”和“總是”之間的差距。

  互聯網的生命之源

  辛格哈爾是谷歌搜索引擎排名算法的大師。這一算法主要用于確定哪些網頁是用戶問題的最佳答案,它是谷歌核心團隊——搜索質量部門的重要組成部分。長期以來,該部門一直是個謎,谷歌很少允許團隊成員拋頭露面。谷歌對辛格哈爾及其團隊的評價非常高,將他們視為公司最為根本的競爭優勢。谷歌認為,要想抵御來自雅虎和微軟的強勢入侵,就必須降低讓用戶失望的頻度。而在這一過程中,搜索質量部門發揮著不可替代的作用。

  Federated Media首席執行官約翰·巴特勒(John Battelle)表示:“谷歌創建的核心價值就是排名算法。”數據顯示,網絡商店有四分之一到二分之一的訪問者來自于搜索引擎;很多用戶都無視媒體網站的網頁,而是通過谷歌直接訪問所需的特定頁面。他說:“從上述事實可以看出,谷歌已經成為了互聯網的‘生命之源’,誰也離不開它。”

  用戶無法看到搜索引擎背后的算法和藝術,但事實上,谷歌搜索質量團隊每周都要對搜索引擎算法做數次改進。在他們的努力下,谷歌搜索引擎可以更加有效地理解用戶的真實意圖。例如,有些人搜索“蘋果”是為了了解同水果相關的信息,有些人則在研究蘋果公司的Mac或iPod。盡管搜索內容相同,但用戶的意圖卻有著天壤之別。辛格哈爾表示:“過去幾年里,搜索已經由‘給我輸入的東西’轉變為‘給我想要的東西’。”

  不為人知的內幕

  辛格哈爾今年39歲,是一名印度人,于2000年加盟谷歌。他目前是一名谷歌研究員,這是谷歌專門為精英工程師設立的職位。不久前,一名《紐約時報》的記者獲準采訪了辛格哈爾和其它搜索質量團隊成員。盡管谷歌對很多問題都諱莫如深,但這名記者仍然獲得了很多以前不為人知的內幕。

  在谷歌不斷改進搜索引擎的過程中,面臨的最大挑戰是日漸龐大的規模。目前,谷歌已經成為全球訪問量最大的網站,支持112種語言,將數百億個網頁納入索引,每天處理數億次搜索請求。更為糟糕的是,很多網頁創建的目的就是吸引眼球,里面充斥了大量的廣告、色情內容和財務欺騙信息。因此,用戶希望谷歌能在搜索結果中排除這些無用網頁,幫助他們找到最相關的信息。

  谷歌搜索質量團隊主管尤迪·馬恩伯(Udi Manber)表示:“用戶的期望值非常高。當我們剛剛推出搜索服務時,如果用戶能通過搜索引擎找到想要的東西,就會感到是一個奇跡。現在的情況則完全不同,如果用戶在前三個搜索結果頁面中找不到想要的東西,就認為搜索引擎存在問題。”

  谷歌搜索業務充分展現了其打破常規的管理模式。谷歌擁有數百名工程師,其中包括來自學術機構的頂級搜索專家,這些人通常被松散地組織在一起,從事自己感興趣的項目。但在搜索引擎方面,谷歌會仔細、嚴格地檢查工程師的獨立成果,以確保新的搜索算法帶來的好處多于壞處。大多數情況下,改進和質量控制都涉及平衡的藝術。馬恩伯表示:“改進總會同時帶來正面和負面的效應,我們必須衡量哪一種影響更大。只有正面效果,沒有負面效果的改進不存在。”

  搜索團隊大揭秘

  谷歌搜索質量團隊在谷歌辦公園區的43號樓(Building 43)工作。由于公司聯合創始人拉里·佩奇(Larry Page)向往太空旅行,一個與“太空船一號”同樣大小的復制品占據了43號樓的休息室。這一復制品也隨時提醒參觀者,谷歌就像火箭一樣迅速升起。辛格哈爾和其它三名頂級工程師的辦公室就坐落于43號樓的頂層,在他辦公桌附近的黑板上,到處涂滿了圖表、問題和數學公式,當然還有用戶對谷歌引擎提出的各種意見。

  谷歌的所有員工都可以使用“Buganizer”系統報告搜索問題,而辛格哈爾正是負責解決問題的人。辛格哈爾的同事馬特·卡茲(Matt Cutts)表示:“辛格哈爾收到他人提出的問題之后,總是視若珍寶,并努力通過修正算法解決問題。”有些時候,用戶或其它谷歌員工提出的問題需要立即得到解決。例如,如果不久前通過谷歌搜索“法國大革命”,就會出現大量與法國總統大選相關的信息,而不是打倒法國國王路易十六的那場革命。谷歌搜索質量團隊很快改變了網頁的權值,從而解決了這一問題。

  當然,有時會出現更為復雜的問題。2005年,谷歌產品經理比爾·布羅格(Bill Brougher)指出,當用戶搜索“teak patio Palo Alto”時,并不會返回這家名叫“Teak Patio”的本地商店。辛格哈爾隨即啟動了一項名為“Debug”的內部計劃,檢查計算機系統對每一個查詢和網頁的評價。

  辛格哈爾最終發現,Theteakpatio.com之所以沒有在搜索結果中顯現,主要因為谷歌搜索算法并沒有賦予來自Palo Alto的其它網站足夠的權值。收到投訴后的兩個月內,辛格哈爾及其團隊改進了搜索算法,從而解決了相關問題。不過,辛格哈爾并不能匆忙地解決所有問題,因為搜索引擎的每一次調整都會影響到很多網站。因此,他將很多問題都記在黑板上,如果同樣的問題再次出現,他就會調整其優先級。

  人才是成功根本

  為了提高搜索引擎的質量,谷歌一直致力于從研究實驗室和大學招募人才。例如,辛格哈爾就來自于AT&T實驗室;馬恩伯最初曾經在亞利桑那大學擔任計算機教員,隨后加盟雅虎擔任首席科學家,之后還曾運營過亞馬遜搜索部門。他去年從亞馬遜加盟谷歌,很快就發現谷歌搜索引擎遙遙領先于學術實驗室和其它企業競爭對手。他回憶道:“加入谷歌后的前三個月里,我經常會說,‘我有一個想法’。但他們總是告訴我,‘已經有人提出過這個想法,它無法發揮作用’。”

  谷歌搜索質量團隊的分工非常明確:辛格哈爾等工程師主要負責用戶輸入關鍵字后的系統處理;一部分人主要負責改進搜索結果,例如優化網站描述,讓用戶更容易了解一個網站的內容;以馬恩伯為首的其它成員則主要負責維護龐大的網頁索引。在早期階段,谷歌每六到八周創建一個新索引,而現在該公司每隔幾天就要重新核對很多網頁。

  在編輯索引的過程中,谷歌主要考慮每一個網頁的“PageRank”。PageRank是谷歌聯合創始人佩奇和塞吉·布林(Sergey Brin)的重要發明,它主要用于標識其它網站鏈接到特定網頁的次數。網頁的PageRank越高,在搜索結果中的排名也就越高。辛格哈爾已經開發出一個更為精確的系統來為網頁排名,它涉及了200多種信息,PageRank只是其中之一。

  要完全了解谷歌搜索引擎所采用的技術是一項不可能完成的任務,因為這是谷歌賴以成功的根本,同時也是其它競爭對手夢寐以求的東西。只從搜索結果來看,很多時候并不能看出谷歌搜索引擎與競爭對手的差異。但搜索專家丹尼·沙利文(Danny Sullivan)認為,谷歌仍然領先于競爭對手。巴特勒也表示:“人們仍然認為谷歌是搜索的黃金標準。”(馬丁)

列表