搜索引擎,就是根據(jù)用戶需求與一定算法,運用特定策略從互聯(lián)網(wǎng)檢索出制定信息反饋給用戶的一門檢索技術。搜索引擎依托于多種技術,如網(wǎng)絡爬蟲技術、檢索排序技術、網(wǎng)頁處理技術、大數(shù)據(jù)處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。
搜索引擎,就是根據(jù)用戶需求與一定算法,運用特定策略從互聯(lián)網(wǎng)檢索出制定信息反饋給用戶的一門檢索技術。搜索引擎依托于多種技術,如網(wǎng)絡爬蟲技術、檢索排序技術、網(wǎng)頁處理技術、大數(shù)據(jù)處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。搜索引擎技術的核心模塊一般包括爬蟲、索引、檢索和排序等,同時可添加其他一系列輔助模塊,以為用戶創(chuàng)造更好的網(wǎng)絡使用環(huán)境。
搜索引擎的整個工作過程視為三個部分:一是蜘蛛在互聯(lián)網(wǎng)上爬行和抓取網(wǎng)頁信息,并存入原始網(wǎng)頁數(shù)據(jù)庫;二是對原始網(wǎng)頁數(shù)據(jù)庫中的信息進行提取和組織,并建立索引庫;三是根據(jù)用戶輸入的關鍵詞,快速找到相關文檔,并對找到的結果進行排序,并將查詢結果返回給用戶。
我國截至目前,搜索引擎的使用群體在逐步增加,在很多的垂直搜索引擎上,百度在我國一路領先,整體流量達到85%以上,是我國大部分群體主要選擇的搜索引擎使用對象,其次就是神馬,占據(jù)了整個市場的15%左右,同時搜狗、360搜索等這些搜索引擎在我國也占有部分市場,現(xiàn)在用戶使用這些搜索引擎搜索的東西大部分為新聞、視頻、音樂等等。
1、社會化搜索
社交網(wǎng)絡平臺和應用占據(jù)了互聯(lián)網(wǎng)的主流,社交網(wǎng)絡平臺強調用戶之間的聯(lián)系和交互,這對傳統(tǒng)的搜索技術提出了新的挑戰(zhàn)。
傳統(tǒng)搜索技術強調搜索結果和用戶需求的相關性,社會化搜索除了相關性外,還額外增加了一個維度,即搜索結果的可信賴性。對某個搜索結果,傳統(tǒng)的結果可能成千上萬,但如果處于用戶社交網(wǎng)絡內其他用戶發(fā)布的信息、點評或驗證過的信息則更容易信賴,這是與用戶的心里密切相關的。社會化搜索為用戶提供更準確、更值得信任的搜索結果。
2、實時搜索引擎
對搜索引擎的實時性要求日益增高,這也是搜索引擎未來的一個發(fā)展方向。
實時搜索最突出的特點是時效性強,越來越多的突發(fā)事件首次發(fā)布在微博上,實時搜索核心強調的就是“快”,用戶發(fā)布的信息第一時間能被搜索引擎搜索到。不過在國內,實時搜索由于各方面的原因無法普及使用,比如Google的實時搜索是被重置的,百度也沒有明顯的實時搜索入口。
3、移動搜索
隨著智能手機的快速發(fā)展,基于手機的移動設備搜索日益流行,但移動設備有很大的局限性,比如屏幕太小,可顯示的區(qū)域不多,計算資源能力有限,打開網(wǎng)頁速度很慢,手機輸入繁瑣等問題都需要解決。
目前,隨著智能手機的快速普及,移動搜索一定會更加快速的發(fā)展,所以移動搜索的市場占有率會逐步上升,而對于沒有移動版的網(wǎng)站來說,百度也提供了“百度移動開放平臺”來彌補這個缺失。
4、個性化搜索
個性化搜索主要面臨兩個問題:如何建立用戶的個人興趣模型?在搜索引擎里如何使用這種個人興趣模型?
個性化搜索的核心是根據(jù)用戶的網(wǎng)絡行為,建立一套準確的個人興趣模型。而建立這樣一套模型,就要全民收集與用戶相關的信息,包括用戶搜索歷史、點擊記錄、瀏覽過的網(wǎng)頁、用戶E-mail信息、收藏夾信息、用戶發(fā)布過的信息、博客、微博等內容。比較常見的是從這些信息中提取出關鍵詞及其權重。為不同用戶提供個性化的搜索引擎結果,是搜索引擎總的發(fā)展趨勢,但現(xiàn)有技術有很多問題,比如個人隱私的泄露,而且用戶的興趣會不斷變化,太依賴歷史信息,可能無法反映用戶的興趣變化。
5、地理位置感知搜索
目前,很多手機已經(jīng)有GPS的應用了,這是基于地理位置感知的搜索,而且可以通過陀螺儀等設備感知用戶的朝向,基于這種信息,可以為用戶提供準確的地理位置服務以及相關搜索服務。目前,此類應用已經(jīng)大行其道,比如手機地圖APP。
6、跨語言搜索
如何將中文的用戶查詢翻譯為英文查詢,目前主流的方法有3種:機器翻譯、雙語詞典查詢和雙語語料挖掘。對于一個全球性的搜索引擎來說,具備跨語言搜索功能是必然的發(fā)展趨勢,而其基本的技術路線一般會采用查詢翻譯加上網(wǎng)頁的機器翻譯這兩種技術手段。
7、多媒體搜索
目前,搜索引擎的查詢還是基于文字的,即使是圖片和視頻搜索也是基于文本方式。那么未來的多媒體搜索技術則會彌補查詢這一缺失。多媒體形式除了文字,主要包括圖片、音頻、視頻。多媒體搜索比純文本搜索要復雜許多,一般多媒體搜索包含4個主要步驟:多媒體特征提取、多媒體數(shù)據(jù)流分割、多媒體數(shù)據(jù)分類和多媒體數(shù)據(jù)搜索引擎。
8、情境搜索
情境搜索是融合了多項技術的產(chǎn)品,上面介紹的社會化搜索、個性化搜索、地點感知搜索等都是支持情境搜索的,目前Google在大力提倡這一概念。所謂情境搜索,就是能夠感知人與人所處的環(huán)境,針對“此時此地此人”來建立模型,試圖理解用戶查詢的目的,根本目標還是要理解人的信息需求。
中研普華利用多種獨創(chuàng)的信息處理技術,對搜索引擎市場海量的數(shù)據(jù)進行采集、整理、加工、分析、傳遞,為客戶提供一攬子信息解決方案和咨詢服務,最大限度地降低客戶投資風險與經(jīng)營成本,把握投資機遇,提高企業(yè)競爭力。想要了解更多搜索引擎市場最新的專業(yè)分析請點擊中研普華產(chǎn)業(yè)研究院出版的《2020-2025年中國搜索引擎行業(yè)深度發(fā)展研究與“十四五”企業(yè)投資戰(zhàn)略規(guī)劃報告》。
2020-2025年中國無線城市行業(yè)深度發(fā)展研究與“十四五”企業(yè)投資戰(zhàn)略規(guī)劃報告
五年規(guī)劃是國家對經(jīng)濟社會發(fā)展的頂層設計,也是一種綱領性文件。目前中國也是世界上編制五年規(guī)劃(計劃)最多的國家?!笆奈濉睍r期是我國經(jīng)濟社會發(fā)展的重要歷史性窗口期,是全面完成小康社會...
查看詳情
產(chǎn)業(yè)規(guī)劃 特色小鎮(zhèn) 產(chǎn)業(yè)園區(qū)規(guī)劃 產(chǎn)業(yè)地產(chǎn) 可研報告 商業(yè)計劃書 細分市場研究 IPO上市咨詢
中研網(wǎng)
發(fā)現(xiàn)資訊的價值
研究院
掌握產(chǎn)業(yè)最新情報
中研網(wǎng)是中國領先的綜合經(jīng)濟門戶,聚焦產(chǎn)業(yè)、科技、創(chuàng)新等研究領域,致力于為中高端人士提供最具權威性的產(chǎn)業(yè)資訊。每天對全球產(chǎn)業(yè)經(jīng)濟新聞進行及時追蹤報道,并對熱點行業(yè)專題探討及深入評析。以獨到的專業(yè)視角,全力打造中國權威的經(jīng)濟研究、決策支持平臺!
廣告、內容合作請點這里尋求合作
2020硅鋼市場投資前景及供需格局預測硅鋼具有導磁率高、矯頑力低、電阻系數(shù)大等特性,因而磁滯損失 和渦流損失都小。...
衛(wèi)生紙,主要是供人們生活日常衛(wèi)生之用,是人民群眾不可缺少的紙種之一。為了使衛(wèi)生紙柔軟,通常利用機械方法使紙產(chǎn)生...
SaaS提供商為企業(yè)搭建信息化所需要的所有網(wǎng)絡基礎設施及軟件、硬件運作平臺,并負責所有前期的實施、后期的維護等一系...
無線城市,就是使用高速寬帶無線技術覆蓋城市行政區(qū)域,向公眾提供利用無線終端或無線技術獲取信息的服務,提供隨時隨...
2020有機硅膠行業(yè)投資前景規(guī)模分析有機硅化合物,是指含有Si-C鍵、且至少有一個有機基是直接與硅原子相連的化合物,習...
2020口服葡萄糖行業(yè)投資前景及趨勢分析葡萄糖在生物學領域具有重要地位,是活細胞的能量來源和新陳代謝中間產(chǎn)物,即生...
中研普華集團聯(lián)系方式廣告服務版權聲明誠聘英才企業(yè)客戶意見反饋報告索引網(wǎng)站地圖 Copyright ? 1998-2020 ChinaIRN.COM All Rights Reserved. 版權所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”) 粵ICP備18008601號