色欲狠狠躁天天躁无码中文字幕_国产肉体XXXX裸体784大胆_夜夜夜高潮夜夜爽夜夜爰爰_黑色丝袜老师自慰喷水浪潮免费

您正在使用版本過時的瀏覽器!


過舊的瀏覽器無法支持全新的功能與特效,若希望獲得完整瀏覽體驗請升級瀏覽器

Google 以外的17個搜索引擎創新

發布時間:2007-12-25 點擊:3195
 17Tech 06月06日 消息:有許多新的搜索引擎(最新統計有100多個)都在開創一些搜索技術的創新.下面是一份17大搜索創新清單,我們認為,這些創新將來會是破壞性的(譯者:關于破壞性創新,請參見這里).這些創新分為4類:查詢預處理;信息來源;算法改進;結果可視化和后處理.
       其中的某些創新也在Google的存在各種產品中,但是,正如下文所述,Google的主搜索頁中不是缺失了這些功能,就是功能還很有限.

查詢預處理

這類改進的主要目的是應用邏輯來盡量預測用戶的意圖,并由此改進查詢的輸入。

1. 自然語言處理

這 一功能最初是由Ask.com開創的。同期最著名的例子是Hakia 和 Powerset,二者以不同的方式試圖理解用戶查詢背后的語義或意思。這些搜索引擎與Google的很大的不同,是他們認為“忽略詞” (stopwords)非常重要,如次要的連詞,像by, for, about, of, in等,Google通常會忽略它們。

2. 個人相關性(亦稱“個性化”)
長 久以來,大家認為按某特定用戶的興趣和要求處理查詢,能獲得更高相關性的搜索結果。 Google已在其搜索引擎中支持這一功能,但需要登陸才能使用。很多用戶理所當然地不情愿這樣做,因為這樣可能會給Google提供追蹤其特殊的搜索內 容的條件。 [即使John Battelle也認為這個想法有點可怕,盡管Google的Matt Cutts并不同意這個看法。] 所需要的就是一種雖然是匿名方式,但能提供個性化的搜索方式。從更廣泛的角度來說,提供多個網站上的個性化會更加有用。 Collarity就是擁有這一功能的搜索引擎。

3. 定制的、專門的搜索

這是一個簡單但強大的功能。這一應用的典型代表是SimplyHired,一個求職招聘的垂直搜索引擎,能提供強大的、預設的搜索,比如“適合年紀大的員工的雇主”、“允許上班帶狗的雇主”等。

信息來源

這些改進著重于潛在的數據來源:額外的內容類型和對數據來源的限制,提高了搜索結果的可靠性(減少垃圾信息)。

4. 新的內容類型

今天的年輕人正像交流文字信息一樣,在手機上舒服地交流照片和視頻,成為這個時代的標記。在網上,富媒體內容-圖片、音頻、視頻、電視等,及與其內容有關的語義信息一起正在爆炸性地增長。搜索引擎也愈加需要相應地支持這些內容類型。一些支持豐富內容的搜索引擎的示例如下:



-富媒體搜索:音頻 (odeo, podzinger ),視頻(Youtube, truveo),電視 (Blinkx ),圖片 (Picsearch, Netvue )



-專業化內容搜索:博客 (Technorati ),新聞(Topix ),分類廣告 (oodle )



當 然,Google在這一領域也非常活躍,如Google Blogsearch(博客),Searchmash (圖片), Google視頻, Google新聞等,因此,也許將這一項放在這個清單里不大公平。盡管如此,理想的情況是,將不同的媒體結果集合在一個搜索里,正如Searchmash 已經做的那樣(Retrevo是另外一個好例子)。

5. 限定的數據來源

最 使搜索用戶煩心的問題之一是垃圾信息。由于營銷商們更加聰明,正日益使用更多侵略性的SEO(搜索引擎優化)技巧,搜索結果的質量就又下降了。 (Google,作為最流行的搜索引擎,更是眾矢之的。) 對一系列受信任站點的限制性搜索排除了這一問題,盡管它也縮小了搜索內容的領域—它為某些類型的搜索很好地提供了真實的、優質的結果,比如,當為一個小學 項目研究火山時,搜索維基百科(Wikipedia)、國家地理(National Geographic)和科學/教育站點。



這一應用最好的例子來自A9.com,它能從多種數據來源中提供內容,并允許用戶對每一個搜索作出清楚的選擇。Google Co-op 和 Yahoo! Search Builder 能使第三方可以創建這種解決方案;Rollyo早已經是這一領域的先行者!

6. 特定領域的搜索(垂直搜索)

通過聚焦一個單一的垂直方向,搜索引擎能提供更好的用戶體驗,它對某一特定領域更加全面、簡明。針對不同的領域有令人難以置信的大量的垂直搜索引擎,更多資 料請查看Alex Iskold在讀寫網(Read/WriteWeb)上的文章或在Software Abstractions博客上的概述。 [要更全面地了解這方面的信息,Sramana Mitra的在線旅游服務概述介紹了垂直搜索與通用搜索的關系。]

算法改進

這些改進著重于提高潛在的搜索算法以提高搜索結果的相關性并提供新的搜索能力。



7. 參數搜索

這類搜索更接近于數據庫查詢,而不象文本搜索。它回答的問題從本質上不同。參數搜索有助于發現問題解決方案,而不是文本文檔。比如,Shopping.com允許你用 材料、品牌、風格或價格不同來限定衣服搜索;像indeed 這樣的招聘搜索網站讓你限定搜索匹配的郵政編碼;GlobalSpec讓你搜索工程部件時指定多種參數(如搜索工業管道時輸入各種參數)。參數搜索是垂直搜索引擎的天然特性。



Google已在通用層面上組合了這一特性,比如在高級搜索頁面上的參數,但是沖淡了它的有用性。當你深入進標準的搜索結果,或當你限定搜索某一特定垂直領域時,附加參數的強大功能最能充分體現出來。

8. 社會化信息輸入

Yahoo! 的Bradley Horowitz相信社會化輸入未來將是搜索技術一個重要的分水嶺(微軟也 有同樣看法)。來自大量用戶的聚集信息輸入使搜索引擎受益于群眾的智慧而提供優質的搜索結果。當然,如果某些個別的輸入缺乏獨立性或可能是故意搗亂,搜索 結果可能會無效。 在這一領域中提供的不同的服務中,del.icio.us 是根據這一方法提供優質搜索能力的典范。[在我較早發布的文章中,作了一個基于“外包給群眾(crowd-sourcing)”的不同解決方案的可搜索性 能的對比。] 其他基于用戶評價的系統包括StumbleUpon, Squidoo, About.com,當然也有Wikipedia。盡管嚴格來說,它們不是搜索引擎,它們都可以歸結于可搜索性的總體框架之內。



當然,Google那功勛卓著的網頁排名(PageRank)算法也隱含地根據社會化輸入。由于網頁排名(PageRank)的一個重要組成部分是基于不同網站的外部鏈接的數量和特點,那些外部鏈接擔當了收集群體智慧的隱含投票。

9. 人工輸入

為了有一個完整的認識,把這一類包括進來。像ChaCha這樣的搜索引擎正在試驗用人工操作員來回答搜索查詢。 值得討論,Yahoo! Answers是否也是這一領域中的另一種解決方案,盡管這些答案由其他用戶,而不是為搜索引擎工作的人來提供。



很難看出ChaCha這類方法怎樣擴大規模,除非它設法利用社區資源。

10. 語義搜索

最 近搜索領域一些令人激動的新發展與從整個網絡中提取智能信息有關。 這些應用剛剛開始,他們表達了語義網絡的巨大潛能。這一領域早期的先行者包括:Monitor110,它試圖從網絡上提取可作為行動參考的金融信息,金融 機構投資者們可能對這些信息有興趣;Spock,“搜人”引擎(現在正處于封閉測試階段),它計劃在啟動時數據庫中有1億份檔案;Riya,一個視覺搜索 引擎,其技術能提供照片的面部和文本識別。

11. 對發現的支持

與個性化和代理技術并肩的是發現技術,這是搜索的圣杯。盡管即時需求的搜索現在是最流行的,但大部分用戶在長時間內有相當穩定的興趣。如果你能發現新的數據源,特別是當優質的feed出現時,豈不是很爽?



在 這一方向上已經有了一些試探性的嘗試,將搜索與RSS的力量聯合起來,比如你已經能建立一個RSS feed來輸出許多 Google 和 Yahoo!中的搜索內容。Bloglines已經支持“特薦Feed”的功能--很明顯,feed讀者很適合在你感興趣的領域推薦新的博客和feed (基于你的OPML文檔的內容)。這一領域中還有Aggregate Knowledge,它通過從多處網站匿名收集信息來為零售和媒體提供專業化服務。總體而言,這將來會是一個令人激動的領域!

結果顯示和后處理

這些改進著重于改善結果顯示和為查詢后提供的“下一步”功能。

12. 分類、標簽云和聚類

像Quintura和Clusty這樣的搜索引擎根據標簽和關鍵詞提供結果的聚類。它不僅讓用戶看到結果本身,也使結果的聚類及結果之間的關系可視化。這一元信息(meta-information)能幫助用戶領會結果并發現相關主題的新信息。

13. 結果可視化

圖片比文本結果更容易讓人的大腦理解和記憶。在比聚類更普遍的水平上,用專門的圖形用戶界面來顯示搜索結果及結果之間的關系,能傳達給用戶更多的意義并使用戶感覺到“大方向”。在某一特定 的上下文中,這一方法效果特別好,比如垂直搜索引擎。 Thinkmap的Visual Thesaurus,Inxight Software的VizServer和房地產搜索引擎Trulia的HeatMaps都是使信息可視化的新方法的例子,盡管在這一領域的研究還處于早期階段。更簡單的一個應用,HousingMaps是一個顯示可租/售房屋位置的聚合。

14. 結果提煉與過濾

搜 索后下一步經常是通過進一步的對結果的提煉并“深入進”結果里去。這不同于我們在Google已經用到的“關鍵詞修改”,它不僅僅是用關鍵詞組合來試驗提 交新的查詢,而是試圖確實地提煉結果[等于是在SQL查詢的“where”子句中增加更多的條件],這將使用戶收縮其結果并趨近于想要的答案。



查 詢提煉是搜索處理的重要部分,盡管它還沒有引起應有的注意。一個好例子是醫療搜索引擎Healia,它允許用戶通過使用人口特質過濾器來改動衛生保健搜索 結果。這很重要,因為人口特質,比如年齡、種族和性別可能對癥狀、疾病和治療用藥的搜索結果有很大的影響;還有基于發現結果的復雜性、來源和類型的過濾 器。



Google最近在其結果頁面底端引入了一個新按鈕:“在結果中搜索”,這是正確的一步;結果還可以通過現有的 OneBox插件和相關的Plusbox新功能來提煉。隨著時間的過去,我們可以期待這一功能會日益成熟。

15. 結果輸出平臺

由于社會化媒體和在線內容變得更加流行,用戶數字信息可選擇的數量繼續增加;相應地,搜索引擎必須支持多種輸出平臺,包括:網絡搜索,移動設備,RIA(豐富互聯網應用程序 Rich Internet Applications), RSS,電子郵件等。隨著從不同設備接入網絡更加普遍,未來的用戶很可能會將更加非傳統的資源來連接搜索引擎,比如:用TiVo(譯者:一種可以錄制數字 電視節目的系統。)系統來搜索感興趣的電影或節目,用Nintendo(任天堂)系統搜索在線游戲,甚至用冰箱的觸摸屏來搜索菜譜。

現在的一些搜索引擎已經支持標準的網絡瀏覽器和移動設備之外的附加的平臺。網絡搜索引擎Plazoo提供RSS feed 已經很長時間了;Quintura起初根本就是一個可下載的RIA應用,現在這個搜索引擎剛剛開始提供網絡界面。

為 許多不同的結果類型提供支持的最簡單的方法是提供開放的API,使第三方開發人員能為專業化的目標平臺創建定制的用戶界面。Alexa網絡搜索平臺是最先 提供開放的API的平臺之一(盡管你自己承擔使用該API的風險),其他可用的API包括oodle, zillow 和 trulia。

當 然,Google也為幾種不同的產品提供API,比如Google Base, Google Maps 和 AJAX 搜索API,盡管不是為主搜索引擎提供。手持設備能通過Google Mobile獲得支持;Google Base 和 Blogsearch已經提供了RSS輸出。

16. 相關服務

嚴格來講,這并不是搜索功能本身的一部分。但是,一旦你完成一個查詢,經常下一步自然地就是跟隨這一搜索的結果。比如,你搜索工作機會以后,你就會想申請你發現的招聘崗位。從最終用戶的有用性來看,這是搜索引擎全部功能的內在部分。



令 人吃驚的是,這一特征除了顯示與上下文相關的廣告外,還沒有被許多搜索引擎重點開發。這一方法的完美的例子是這個有一個有趣的名字的搜索引擎: the web's too big(互聯網太大了),它能使用戶搜索英國的公共關系機構的網站上的信息。他們提供一個有趣的附加功能:用戶能輸入他們的想查詢的有關公關的詳細情況, 點擊一下就可以直接提交給多個公關機構。類似地,房地產搜索引擎Zillow提供Zestimate(Zillow計算的房產的估計價值)的概念,以及房 產問答的功能。這些類型的附加服務增加了提供給用戶的搜索結果的價值,也使這個網站更有“粘性”。



Google在它的一些產品上也提供附加服務,比如在Google Maps上的“尋找商家”,但并不是在它的主搜索引擎上。

17. 搜索代理

搜 索代理與持久興趣的搜索和把搜索結果作為feed輸出這兩個方向密切相關。設想某個軟件有一種定期搜索查詢的功能,監控網上感興趣主題的更新信息,收集并 整理結果,移除重復信息并以匯總的形式定期報告給用戶。這對某些類型的、重要的但并不立刻需要結果的連續性搜索非常有用:比如,監控感興趣的招聘、按特定 參數設定的在售新房、降到某特定價格的衣服等。



Copernic是這一領域的有趣的服務—Copernic搜索代理能自動運行已存儲的搜索,提供新結果的匯總,還能跟蹤網頁的變化。來自Connotate Technologies的Information Agent Suite挖掘“深層網絡”并自動進行變化探測。更多搜索代理的例子,詳見讀寫網(Read/WriteWeb)的一篇文章,介紹了Allth.at及Swamii 和Searchbots.net。

結論

很明顯,Google不會坐以待斃的。正像它把個性化搜索引入到它主要的搜索引擎上,當這些其他的方法成功時,Google將繼續把這些方法集成到其主搜索引擎上。比如,垂直專業化搜索是Google肯定會用的強大工具。



將來很可能在Google首頁上簡單的“搜索框”后面會隱藏著多種專業化搜索引擎。另一方面,試圖勉強加入這些數量日益增加的復雜特性,將可能使 Google或任何其他主流網絡搜索引擎的整體結構非常復雜而難以改變,因此如何取舍將是越來越困難的挑戰。在Software Abstractions博客的一篇文章中,我們看一看集成了上述大部分功能的主流搜索引擎的概念結構。

列表