貫串 Elasticsearch & Lucene:輕鬆開發高強全文檢索搜尋引擎 (舊名: 世界排名第一的搜索引擎開發 -- Elasticsearch + Lucene 用 java 實作)
內容描述
.分散式搜尋分析系統.Java資訊檢索函式庫.高擴充性與可用性.強效資料處理.
大資料時代的資訊檢索技術:
騰訊、阿里巴巴、百度、東京等一線互聯網公司正大力推進Elasticsearch的使用場景,本書以豐富的實例介紹Elasticsearch,可幫助讀者快速應用Lucene庫處理全文檢索業務,掌握使用Elasticsearch搭建分散式搜尋引擎的方法與技巧。
本書為入門Lucene、Elasticsearch:
首先介紹資訊檢索領域中一些基本理論,也就是Lucene的數學模型,之後介紹如何使用Lucene 函數庫建置全文檢索系統,最後介紹Elasticsearch。按照從數學模型到入門基礎再到專案實戰的想法來撰寫,數學模型讓讀者知其然也知其所以然,入門基礎是理論到實際應用的必經之路,專案實戰則是為了學以致用。書中的每一部分都力圖簡明扼要,使用大量實例和程式,為讀者能夠快速掌握全文檢索技術掃除障礙。
適用:學生、Java 程式開發者、搜尋引擎研發人員
目錄大綱
前言
CHAPTER 01 資訊檢索模型
1.1 資訊檢索概述
1.2 斷詞演算法
1.3 倒排索引
1.4 布林檢索模型
1.5 tf-idf 加權計算
1.6 向量空間模型
1.7 機率檢索模型
1.8 本章小結
CHAPTER 02 Lucene開發入門
2.1 Lucene概述
2.2 Lucene開發準備
2.3 Lucene斷詞詳解
2.4 Lucene索引詳解
2.5 Lucene查詢詳解
2.6 Lucene查詢反白
2.7 Lucene新聞高頻詞分析
2.8 本章小結
CHAPTER 03 Lucene檔案檢索專案實戰
3.1 需求分析
3.2 架構設計
3.3 文字內容取出
3.4 專案架設
3.5 索引文件
3.6 查詢介面
3.7 檔案檢索
3.8 結果展示
3.9 本章小結
CHAPTER 04 從Lucene到Elasticsearch
4.1 Elasticsearch概述
4.2 安裝Elasticsearch
4.3 中文斷詞器設定
4.4 Head外掛程式使用指南
4.5 REST指令
4.6 本章小結
CHAPTER 05 Elasticsearch叢集入門
5.1 索引管理
5.2 文件管理
5.3 對映詳解
5.4 本章小結
CHAPTER 06 Elasticsearch搜索詳解
6.1 搜索機制
6.2 全文查詢
6.3 詞項查詢
6.4 複合查詢
6.5 巢狀結構查詢
6.6 位置查詢
6.7 特殊查詢
6.8 搜索反白
6.9 搜索排序
6.10 本章小結
CHAPTER 07 聚合分析
7.1 指標聚合
7.2 桶聚合
7.3 本章小結
CHAPTER 08 Elasticsearch Java API
8.1 Java API簡介
8.2 Maven依賴
8.3 依賴衝突
8.4 連接到叢集
8.5 索引管理
8.6 文件管理
8.7 搜索詳解
8.8 聚合分析
8.9 叢集管理
8.10 本章小結
CHAPTER 09 叢集管理
9.1 叢集規劃
9.2 索引規劃
9.3 分散式叢集
9.4 Cat API
9.5 Cluster API
9.6 監控外掛程式
9.7 本章小結
CHAPTER 10 新聞搜索專案實戰
10.1 需求分析
10.2 資料準備
10.3 資料匯入
10.4 查詢介面
10.5 搜索新聞
10.6 結果展示
10.7 本章小結
CHAPTER 11 Elasticsearch For Hadoop
11.1 Hadoop基礎
11.2 ES-Hadoop安裝
11.3 從HDFS到Elasticsearch
11.4 從Elasticsearch到HDFS
11.5 本章小結
CHAPTER A 參考文獻
作者介紹
姚攀
中國科學院大學碩士,擅長j2ee開發,對搜索引擎技術有濃厚的興趣和較深入研究,有豐富的Lucene和ElasticSearch開發經歷和項目經驗,活躍於CSDN社區,目前在一家公司做ES搜索業務開發。