1
0
mirror of https://github.com/apachecn/lmpythw-zh.git synced 2025-05-28 12:02:19 +00:00
This commit is contained in:
wizardforcel 2017-08-10 10:25:20 +08:00
parent 48bcea75b4
commit fe60b48785

12
ex23.md
View File

@ -10,9 +10,9 @@
我们将研究的最终数据结构称为三叉搜索树TSTree它可以在一组字符串中的快速查找字符串。它类似于`BSTree`,但是它有三个子节点,而不是两个,每个子节点只是一个字符而不是整个字符串。在`BSTree`中,左子节点和右子节点是树的“小于”和“大于”的分支。在`TSTree`中,左子节点,中子节点和右子节点是“小于”,“等于”和“大于”的分支。这可以让你选取一个字符串,将其分解成字符,然后遍历`TSTree`,每次一个字符,直到找到它或者你到达了末尾。
通过将你要搜索的一组键拆成单个字符的节点,`TSTree`高效地使用空间换取时间。每一个这些节点将占用比`BSTree`更多的空间,但这允许你仅仅通过比较键中的字符来搜索键。使用`BSTree`您必须比较每个节点的键和被搜索键中的大多数字符。使用`TSTree`,您只需要比较被搜索键的每个字母,当您到达末尾,就完成了。
通过将你要搜索的一组键拆成单个字符的节点,`TSTree`高效地使用空间换取时间。每一个这些节点将占用比`BSTree`更多的空间,但这允许你仅仅通过比较键中的字符来搜索键。使用`BSTree`你必须比较每个节点的键和被搜索键中的大多数字符。使用`TSTree`,你只需要比较被搜索键的每个字母,当你到达末尾,就完成了。
`TSTree`的另一件不错的事情是,它知道一个键何时不存在于集合中。想象一下,您的键的长度为 10 个字符,您需要在一组其他的键中找到它,但是如果键不存在,则需要快速停止。使用`TSTree`您可以在一到两个字符的地方停止,到达树的末尾,并且知道这个键不存在。您最多只能比较键中的 10 个字符来发现它,字符比较比`BSTree`少得多。
`TSTree`的另一件不错的事情是,它知道一个键何时不存在于集合中。想象一下,你的键的长度为 10 个字符,你需要在一组其他的键中找到它,但是如果键不存在,则需要快速停止。使用`TSTree`你可以在一到两个字符的地方停止,到达树的末尾,并且知道这个键不存在。你最多只能比较键中的 10 个字符来发现它,字符比较比`BSTree`少得多。
## 挑战练习
@ -75,15 +75,15 @@ class TSTree(object):
self.root = self._set(self.root, keys, value)
```
您需要使用您学到的“代码大师复制”方法学习。要特别注意如何处理`node.eq`路径以及如何设置`node.value`。一旦你了解了`get``set`的工作方式,你将实现剩下的函数和所有的测试。要实现的函数有:
你需要使用你学到的“代码大师复制”方法学习。要特别注意如何处理`node.eq`路径以及如何设置`node.value`。一旦你了解了`get``set`的工作方式,你将实现剩下的函数和所有的测试。要实现的函数有:
> `find_shortest`
> 给定一个关键字`K`,找到以`K`开头的最短键/值对。这意味着如果`set`中有`apple``application` ,那么调用`find_shortest("appl")`将返回关联`apple`的值。
> 给定一个关键字`K`,找到以`K`开头的最短键/值对。这意味着如果`set`中有`apple``application` ,那么调用`find_shortest("appl")`将返回关联`apple`的值。
> `find_longest`
> 给定一个关键字`K`,找到以`K`开头的最长键/值对。这意味着如果`set`中有`apple``application` ,那么调用`find_shortest("appl")`将返回关联`application`的值。
> 给定一个关键字`K`,找到以`K`开头的最长键/值对。这意味着如果`set`中有`apple``application` ,那么调用`find_shortest("appl")`将返回关联`application`的值。
> `find_all`
@ -97,5 +97,5 @@ class TSTree(object):
+ 查看原始代码的注释,看看在`_set`过程中,在哪里放置`value`。修改它会修改`get`的含义吗?为什么?
+ 确保你使用随机数据来测试,并测量一些性能。
+ 也可以在`TSTree`中进行模糊匹配。我认为这是一个附加题,所以尝试实现它们,看看你想出了什么。部分匹配是,`'a.p.e'`匹配`"apple"``"anpxe"``"ajpqe"`
+ 也可以在`TSTree`中进行模糊匹配。我认为这是一个附加题,所以尝试实现它们,看看你想出了什么。部分匹配是,`'a.p.e'`匹配`"apple"``"anpxe"``"ajpqe"`
+ 如何搜索字符串的结尾?提示:不要过度考虑它。