From 6d3dc2dcfdcbf220d661c86b0c0854e4772abaca Mon Sep 17 00:00:00 2001 From: Xargin Date: Thu, 12 Jul 2018 19:15:59 +0800 Subject: [PATCH] remove useless --- ch6-cloud/ch6-02-dist-search-engine.md | 10 ---------- 1 file changed, 10 deletions(-) diff --git a/ch6-cloud/ch6-02-dist-search-engine.md b/ch6-cloud/ch6-02-dist-search-engine.md index c37fcf6..2a6773d 100644 --- a/ch6-cloud/ch6-02-dist-search-engine.md +++ b/ch6-cloud/ch6-02-dist-search-engine.md @@ -49,16 +49,6 @@ elasticsearch 是开源分布式搜索引擎的霸主,其依赖于 Lucene 实 对 es 中的数据进行查询时,本质就是求多个排好序的序列求交集。非数值类型字段涉及到分词问题,大多数内部使用场景下,我们可以直接使用默认的 bi-gram 分词。什么是 bi-gram 分词呢: -``` - - 今天天气很好 - - -+--------|-----------|--------------|----------|--------------+ -| 今天 | 天天 | 天气 | 气很 | 很好 | -+--------|-----------|--------------|----------|--------------+ -``` - 即将所有 Ti 和 T(i+1) 组成一个词(在 es 中叫 term),然后再编排其倒排列表,这样我们的倒排列表大概就是这样的: ![terms](../images/ch6-terms.png)