推薦系統實踐

推薦系統實踐

作者: 項亮
出版社: 人民郵電
出版在: 2012-06-01
ISBN-13: 9787115281586
ISBN-10: 7115281580
裝訂格式: 平裝
總頁數: 197 頁





內容描述


隨著信息技術和因特網的發展,人們逐漸從信息匱乏的時代走入了信息過載(information overload)的時代 。在這個時代,無論是信息消費者還是信息生產者都遇到了很大的挑戰:對於信息消費者,從大量信息中找到自己感興趣的信息是一件非常困難的事情;對於信息生產者,讓自己生產的信息脫穎而出,受到廣大用戶的關註,也是一件非常困難的事情。推薦系統是解決這一矛盾的重要工具。推薦系統的任務是聯系用戶和信息,一方面幫助用戶發現對自己有價值的信息,另一方面讓信息能夠展現在對它感興趣的用戶面前,從而實現信息消費者和信息生產者的雙贏。


目錄大綱


第1章好的推薦系統1 
1.1什麼是推薦系統1 
1.2個性化推薦系統的應用4 
1.2.1電子商務4 
1.2.2電影和視頻網站8 
1.2.3個性化音樂網絡電台10 
1.2.4社交網絡12 
1.2.5個性化閱讀15 
1.2.6基於位置的服務16 
1.2.7個性化郵件17 
1.2.8個性化廣告18 
1.3推薦系統評測19 
1.3.1推薦系統實驗方法20 
1.3.2評測指標23 
1.3.3評測維度34 
第2章利用用戶行為數據35 
2.1用戶行為數據簡介36 
2.2用戶行為分析39 
2.2.1用戶活躍度和物品流行度的分佈39 
2.2.2用戶活躍度和物品流行度的關係41 
2.3實驗設計和算法評測41 
2.3.1數據集42 
2.3.2實驗設計42 
2.3.3評測指標42 
2.4基於鄰域的算法44 
2.4.1基於用戶的協同過濾算法44 
2.4.2基於物品的協同過濾算法51
2.4.3 UserCF和ItemCF的綜合比較59 
2.5隱語義模型64 
2.5.1基礎算法64 
2.5.2基於LFM的實際系統的例子70 
2.5.3 LFM和基於鄰域的方法的比較72 
2.6基於圖的模型73 
2.6.1用戶行為數據的二分圖表示73 
2.6.2基於圖的推薦算法73 
第3章推薦系統冷啟動問題78 
3.1冷啟動問題簡介78 
3.2利用用戶註冊信息79 
3.3選擇合適的物品啟動用戶的興趣85 
3.4利用物品的內容信息89 
3.5發揮專家的作用94 
第4章利用用戶標籤數據96 
4.1 UGC標籤系統的代表應用97 
4.1.1 Delicious 97 
4.1.2 CiteULike 98 
4.1.3 Last.fm 98 
4.1. 4豆瓣99 
4.1.5 Hulu 99 
4.2標籤系統中的推薦問題100 
4.2.1用戶為什麼進行標註100 
4.2.2用戶如何打標籤101 
4.2.3用戶打什麼樣的標籤102 
4.3基於標籤的推薦系統103 
4.3 .1實驗設置104
4.3.2一個簡單的算法105 
4.3.3算法的改進107 
4.3.4基於圖的推薦算法110 
4.3.5基於標籤的推薦解釋112 
4.4給用戶推薦標籤115 
4.4.1為什麼要給用戶推薦標籤115 
4.4 .2如何給用戶推薦標籤115 
4.4.3實驗設置116 
4.4.4基於圖的標籤推薦算法119 
4.5擴展閱讀119 
第5章利用上下文信息121 
5.1時間上下文信息122 
5.1.1時間效應簡介122 
5.1.2時間效應舉例123 
5.1.3系統時間特性的分析125 
5.1.4推薦系統的實時性127 
5.1.5推薦算法的時間多樣性128 
5.1.6時間上下文推薦算法130 
5.1.7時間段圖模型134 
5.1. 8離線實驗136 
5.2地點上下文信息139 
5.3擴展閱讀143 
第6章利用社交網絡數據144 
6.1獲取社交網絡數據的途徑144 
6.1.1電子郵件145 
6.1.2用戶註冊信息146 
6.1.3用戶的位置數據146 
6.1.4論壇和討論組146
6.1.5即時聊天工具147 
6.1.6社交網站147 
6.2社交網絡數據簡介148 
   社交網絡數據中的長尾分佈149 
6.3基於社交網絡的推薦150 
6.3.1基於鄰域的社會化推薦算法151 
6.3.2基於圖的社會化推薦算法152 
6.3.3實際系統中的社會化推薦算法153 
6.3.4社會化推薦系統和協同過濾推薦系統155 
6.3.5信息流推薦156 
6.4給用戶推薦好友159 
6.4.1基於內容的匹配161 
6.4.2基於共同興趣的好友推薦161 
6.4.3基於社交網絡圖的好友推薦161 
6.4.4基於用戶調查的好友推薦算法對比164 
6.5擴展閱讀165 
第7章推薦系統實例166 
7.1外圍架構166 
7.2推薦系統架構167 
7.3推薦引擎的架構171 
7.3.1生成用戶特徵向量172 
7.3.2特徵-物品相關推薦173 
7.3.3過濾模塊174 
7.3.4排名模塊174 
7.4擴展閱讀178 
第8章評分預測問題179 
8.1離線實驗方法180
8.2評分預測算法180 
8.2.1平均值180 
8.2.2基於鄰域的方法184 
8.2.3隱語義模型與矩陣分解模型186 
8.2.4加入時間信息192 
8.2.5模型融合193 
8.2.6 Netflix Prize的相關實驗結果195


作者介紹


項亮
畢業於中國科學技術大學和中國科學院自動化所,研究方向為機器學習和推薦系統,現任職於北京Hulu軟件技術開發有限公司,從事視頻推薦的研究和開發。2009年參加Netflix Prize推薦系統比賽獲得團體名,且於當年參與創建了Resys China推薦系統社區。




相關書籍

Python Forensics: A workbench for inventing and sharing digital forensic technology (Paperback)

作者 Chet Hosmer

2012-06-01

Advanced Natural Language Processing with TensorFlow 2: Build real-world effective NLP applications using NER, RNNs, seq2seq models, Transformers, and

作者 Bansal Ashish

2012-06-01

R語言:實用數據分析和可視化技術, 2/e (R for Everyone: Advanced Analytics and Graphics, 2/e)

作者 [美] 賈里德·P.蘭德(Jared P. Lander)

2012-06-01