百度秘密研發推薦引擎技術 建立百人團隊 |
發布時間: 2012/9/5 11:28:14 |
6月19日消息,百度主任架構師、推薦引擎負責人廖若雪今日接受媒體采訪時透露,百度從去年起抽調技術人員成立獨立研發團隊,研發“推薦引擎”技術,目前團隊百余人。
百度推薦引擎是一項底層技術,目前已經在音樂隨身聽、百度知道、百度新首頁等項目中應用。 什么是推薦引擎? 推薦引擎是主動發現用戶當前或潛在需求,主動推送信息、應用和服務給用戶的互聯網技術。跨領域推薦是在推薦引擎基礎上,強調利用通用的推薦技術,進行信息、應用和服務的跨平臺推薦。 百度為什么涉足推薦引擎技術?廖若雪介紹,人們在互聯網上獲取信息的方式大致經歷了三代,第一代以分類目錄為代表,那時的全網信息量僅數萬個網頁;第二代即今天使用的搜索引擎,網頁數高達數百億,同時集成了圖片、視頻、應用等更多媒體內容;下一階段網頁數將超過數百萬億,搜索結果中符合要求的內容可能成百上千,用戶需要花費大量時間去尋找最適合自己的搜索結果,解決之道就是推薦引擎。 目前,百度、Google、有道、bing、搜索、Yahoo都是以搜索滿足用戶的主動表達需求。在國外,以推薦挖掘并滿足用戶潛在需求的如亞馬遜、Pandora、NETFLIX等。 “推薦依賴用戶個性化需求。那些用戶無法表達,或表達出來非常復雜的需求,我們定義為潛在需求。”廖若雪說。 百度推薦引擎應用于百度知道、百度新首頁 廖若雪介紹,百度推薦引擎有三個特點:一是跨領域,多語言、多媒體、全產品形態。亞馬遜進行商品推薦,Pandora進行音樂推薦,百度進行跨領域推薦;二是平臺化、通用算法、歸一化數據;三是智能化,智能需求感知,滿足用戶需求。 百度推薦引擎于2011年開始研發,早期實踐于音樂隨身聽,自適應用戶喜好變化、采用音樂專家系統技術。近期,推薦引擎實踐于百度新首頁、百度知道。 以百度知道為例,百度方面透露數據,從一個用戶在百度知道上提出問題,到這個問題被合適的回答者看到,平均需要12個小時;而推薦技術應用到百度知道后,時間縮短到最多不超過5分鐘,回答率提升了50%。 “當用戶使用搜索引擎搜索時,瀏覽網頁時,在移動終端上提交他的位置時,都有大量的行為動作。 根據用戶的行為提交,再規避掉他們的隱私數據,用一定的算法匹配,就能夠智能地感知用戶需求,并在短時間內給予他們需要的內容。”廖若雪說。 百度跨領域推薦引擎依托于百度原有的用戶數據庫。百度搜索引擎儲存了上千億的網頁,每天處理100PB級數據。目前,百度推薦引擎是一項基礎服務,融入到搜索中,尚未開發獨立的產品。“當傳統形態不適合時某項服務時,可能打造以推薦為核心的產品。” 廖若雪透露,如果百度推薦引擎發展成熟,不排除以開放平臺模式與國內垂直網站合作,如京東商城等電子商務網站。 推薦引擎技術處于早期階段 廖若雪說,推薦引擎還處于發展早期。“百度走的早些,但大家都處于0起跑線沒跑幾步的狀態。豆瓣電臺、電子商務網站做了很多工作,但還沒有人做到及格,推薦引擎還是非常新的領域。” 廖若雪描述了未來推薦引擎的一幅畫面:如果你是韓劇愛好者,不用再繁瑣的查詢,就能即使獲得最新韓劇推薦;查詢“好看的電影”,就能獲得符合該用戶喜好的電影;搜索“怎么向女友求婚”,就能獲得一套針對你和女友量身定制的方案 本文出自:億恩科技【www.vbseamall.com】 |