Solr 權威指南:上捲
內容描述
本書以圖文並茂的形式、通俗易懂的語言講解了Solr使用中的各個知識點,能夠幫助對Solr感興趣的讀者快速瞭解Solr。由於目前有關Solr相關技術的書籍全部都是英文版的,所以對於英文不太好而又極其需要快速學會使用Solr的讀者來說,這是一個福音。下捲:主要針對中高端讀者,重點介紹了關於Solr查詢、SolrJ、SolrCloud、Solr性能優化等的相關知識。對於Solr查詢,下捲主要針對的是高階知識部分,包括使用光標實現高效的深度分頁查詢、實現對查詢返回的查詢結果集進行自定義排序、使用相關性權重來提高查詢返回結果集的相關性、FunctionQuery的使用方法、FunctionQuery的自定義方法等;對於SolrJ、SolrCloud的介紹,則均是從基礎概念開始,逐步深入到具體的使用和管理方法;對於Solr性能優化,則主要集中在註意事項、具體建議等實操部分的介紹。在全書後,還單獨利用一章對之前沒涉及的零散內容進行集中介紹,包括版本升級、自定義偽域、自定義Redis緩存、流式處理等內容。
目錄大綱
序言
第1章初識Solr 1
1.1 Solr是什麼1
1.2 Solr的歷史2
1.3為什麼要選擇Solr 2
1.4 Solr功能預覽3
1.5 Solr下載3
1.6 Solr學習資源5
1.7 Windows平台下部署Solr 7
1.7. 1部署Solr至Jetty 7
1.7.2部署Solr至Tomcat 13
1.8 Linux平台下部署Solr 16
1.9玩轉post.jar 20
1.10在Eclipse中編譯Solr源碼25
1.11本章總結27
第2章Solr基礎28
2.1 Solr Core 28
2.1.1 Solr Core簡介28
2.1.2 Core的基本管理30
2.1.3 Core Http接口35
2.1.4添加索引至Core 36
2.2 Solr DIH 38
2.2.1索引文件夾下的文本文件38
2.2.2索引JSON /XML/CSV文件42
2.2.3使用Tika索引Word/Excel/PDF 45
2.2.4索引網絡上的遠程文件52
2.2.5索引XML文件55
2.2.6從數據庫中導入數據至Solr 57
2.2.7 Solr DIH總結62
2.3 Solr Full Import全量導入78
2.4 Solr Delta-import增量導入80
2.5 Solr索引85
2.5.1 Lucene索引原理85
2.5.2 Lucene中常見術語詳解87
2.5.3創建Solr索引98
2.5.4 Solr Cell 99
2.5.5 Solr索引去重檢測102
2.5.6 Solr更新請求處理鏈104
2.5.7 Solr原子更新105
2.5 .8使用Luke查看索引107
2.6本章總結109
第3章Solr配置110
3.1 solr.xml配置詳解110
3.2 solrconf?ig.xml配置詳解112
3.3 schema.xml配置詳解139
3.3.1 Solr Schema設計思想139
3.3. 2 Solr眼裡的世界139
3.3.3域分詞140
3.3.4 Solr的schema文件140
3.3.5 Solr的域類型141
3.3.6 Solr的域153
3.3.7 Schema API 157
3.3.8 Schemaless Mode 165
3.4 data-conf?ig.xml配置詳解167
3.5 zoo.cfg配置詳解169
3.6本章總結169
第4章Solr分詞170
4.1分詞的基本概念170
4.1.1理解Analyzer 170
4.1.2理解Tokenizer 171
4.1.3理解TokenFilter 172
4.2 Solr分詞器172
4.2.1 Analyzer 173
4.2.2 Tokenizer 174
4.2.3 TokenFilter 182
4.2.4 CharFilter 202
4.2.5 Solr自定義分詞206
4.3中文分詞器217
4.3.1 IK分詞器217
4.3.2 Ansj分詞器223
4.3.3 MMSeg4J分詞器233
4.3.4 Paoding分詞器240
4.3.5 Jcseg分詞器245
4.3.6 Ictclas分詞器258
4.3.7 FudanNLP 259
4.3 .8 HanLP 262
4.3.9 Jieba分詞器266
4.3.10分詞器使用建議268
4.4本章總結270
第5章Solr查詢271
5.1 Solr查詢概述271
5.2 Solr查詢相關度簡述273
5.3 Solr的查詢語法解析器275
5.4 Lucene的基本查詢語法283
5.5 Solr的標準查詢語法解析器287
5.6 Solr DisMax 288
5.7 Solr eDisMax 291
5.8 Solr的其他查詢語法解析器298
5.9 Query VS Filter Query 305
5.9.1 fq VS q 306
5.9.2 Filter Query緩存307
5.9.3 Filter Query執行順序308
5.9.4 Post Filter 308
5.10 Solr返回結果309
5.10.1設置響應輸出格式309
5.10.2選擇返回域310
5.10.3分頁查詢312
5.11 Solr排序313
5.11.1根據域進行排序313
5.11.2缺失值處理314
5.11.3排序的內存佔用315
5.12調試查詢結果315
5.12.1返回調試信息315
5.12.2開啟調試模式316
5.13本章總結316
第6章Solr Facet 317
6.1理解Facet 317
6.2 Facet簡單示例319
6.3 Query Facet 326
6.4 Range Facet 328
6.5 FacetFilter 330
6.6 Multiselect Faceting 335
6.6.1 key 335
6.6.2 tag 336
6.7本章總結339
第7章Solr高亮340
7.1什麼是Solr高亮340
7.2 Solr高亮的工作原理342
7.2.1 Fragmenter 348
7.2.2 Scorer 349
7.2.3 Encoder & Formatter 349
7.3 Facet & Highlighting 350
7.4高亮多值域351
7.5高亮參數352
7.6 FastVectorHighlighter 355
7.7 PostingsHighlighter 356
7.8本章總結358
第8章Solr Query Suggestion查詢建議360
8.1 Spell-Check 361
8.1.1 Spell-Check簡單示例361
8.1.2 Spell-Check查詢組件362
8.2 Autosuggest 366
8.3基於N-Gram實現Autosuggest 369
8.4基於用戶行為實現Autosuggest 371
8.5本章總結375
第9章Solr Group分組376
9.1 Result grouping VS Field collapsing 377
9.2按照指定域分組377
9.3每個分組返回多個文檔381
9.4按照Function動態計算值分組382
9.5按照任意Query分組383
9.6 Group的分頁與排序383
9.7 Group& Facet 384
9.8 Group分佈式查詢387
9.9 Group緩存388
9.10使用Collapsing Query Parser實現高效的Field Collapsing 388
9.11 Solr Group VS SQL Group by 389
9.12本章總結390
第10章Solr企業級應用391
10.1 Solr源碼編譯與補丁應用391
10.2部署Solr 396
10.2.1構建你自己的Solr發布版本397
10.2.2 Embedded Solr 397
10.3 Solr硬件要求與系統配置397
10.3.1內存和SSD 397
10.3.2 JVM配置398
10.3.3思考Solr索引與查詢性能401
10.4 Solr數據批量導入405
10.5 Solr Shard與Replication 406
10.5 .1 Shard 406
10.5.2 Replicate 408
10.6 Core管理410
10.7 Solr集群管理412
10.7.1 Solr Ping健康檢測412
10.7.2 Solr配置文件管理413
10.8如何與Solr交互414
10.8.1使用REST API與Solr交互415
10.8.2使用SolrJ與Solr進行交互415
10.9監控你的Solr 418
10.9.1 Solr的性能統計418
10.9.2 Solr的緩存性能419
10.9.3 Solr JMX 419
10.9.4 Solr日誌424
10.9.5 Solr負載測試424
10.10 Solr版本升級428
10.11本章總結428