1
0
mirror of https://github.com/chai2010/advanced-go-programming-book.git synced 2025-05-23 20:02:22 +00:00
This commit is contained in:
lewgun 2018-01-03 11:26:36 +08:00 committed by GitHub
parent e3e8af9d13
commit b384d862a2
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -1,16 +1,16 @@
# 1.4. 函数、方法和接口
函数对应操作序列是程序的基本组成元素。Go语言中的函数有具名函数和匿名函数之分:具名函数一般对应包级的函数,具名函数是匿名函数的一种特例当匿名函数引用了外部作用域的变量时就成了闭包函数闭包函数是函数式编程语言的核心。方法是绑定到一个具体类型的特殊函数Go语言中的方法是依托于类型的必须在编译时静态绑定。接口定义方法的集合,接口定义的方法依托于运行时的接口对象因此接口对应的方法是在运行时动态绑定。Go语言通过隐式接口机制实现了鸭子面向对象模型。
函数对应操作序列是程序的基本组成元素。Go语言中的函数有具名和匿名之分具名函数一般对应包级的函数,是匿名函数的一种特例,当匿名函数引用了外部作用域的变量时就成了闭包函数闭包函数是函数式编程语言的核心。方法是绑定到一个具体类型的特殊函数Go语言中的方法是依托于类型的必须在编译时静态绑定。接口定义了方法的集合,这些方法依托于运行时的接口对象,因此接口对应的方法是在运行时动态绑定。Go语言通过隐式接口机制实现了鸭子面向对象模型。
Go语言程序的初始化和执行总是从`main.main`函数开始的。但是如果`main`导入了其它的包,则会按照顺序将它们包含进`main`包里(这里的导入顺序依赖具体实现,一般可能是以文件名或包路径名的字符串顺序导入)。如果某个包被多次导入的话,在执行的时候只会导入一次。当一个包被导入时,如果它还导入了其它的包,则先将其它的包包含进来,然后创建和初始化这个包的常量和变量。然后就是调用包里的`init`函数,如果一个包有多个`init`函数的话,实现可能是以文件名的顺序调用,同一个文件内的多个`init`则是以出现的顺序依次调用(`init`不是普通函数,可以定义有多个,所有也不能被其它函数调用)。最后,当`main`包的所有包常量、变量被创建和初始化,并且`init`函数被执行后,才会进入`main.main`函数程序开始正常执行。下图是Go程序函数启动顺序的示意图
Go语言程序的初始化和执行总是从`main.main`函数开始的。但是如果`main`包导入了其它的包,则会按照顺序将它们包含进`main`包里(这里的导入顺序依赖具体实现,一般可能是以文件名或包路径名的字符串顺序导入)。如果某个包被多次导入的话,在执行的时候只会导入一次。当一个包被导入时,如果它还导入了其它的包,则先将其它的包包含进来,然后创建和初始化这个包的常量和变量,再调用包里的`init`函数,如果一个包有多个`init`函数的话,调用顺序未定义(实现可能是以文件名的顺序调用),同一个文件内的多个`init`则是以出现的顺序依次调用(`init`不是普通函数,可以定义有多个,所有也不能被其它函数调用)。最后,当`main`包的所有包常量、变量被创建和初始化完成,并且`init`函数被执行后,才会进入`main.main`函数程序开始正常执行。下图是Go程序函数启动顺序的示意图
![](../images/ch1-04-init.png)
要注意的是,在`main.main`函数执行之前所有代码都运行在同一个goroutine,也就是运行在程序的主系统线程中。因此,如果某个`init`函数内部用go关键字启动了新的goroutine的话新的goroutine只有在进入`main.main`函数之后才可能被执行到。
要注意的是,在`main.main`函数执行之前所有代码都运行在同一个goroutine也就是程序的主系统线程中。因此如果某个`init`函数内部用go关键字启动了新的goroutine的话新的goroutine只有在进入`main.main`函数之后才可能被执行到。
## 函数
在Go语言中函数是第一类对象我们可以将函数保持到变量中。函数主要有具名函数和匿名的函数之分包级函数一般都是具名函数具名函数是匿名函数的一种特例。当然Go语言中每个类型还可以有自己的方法方法其实也是函数的一种。
在Go语言中函数是第一类对象我们可以将函数保持到变量中。函数主要有具名和匿名之分包级函数一般都是具名函数具名函数是匿名函数的一种特例。当然Go语言中每个类型还可以有自己的方法方法其实也是函数的一种。
```go
// 具名函数
@ -114,9 +114,9 @@ func main() {
}
```
第一种方法是在循环体内部再定义一个局部变量,这样每次迭代`defer`语句的闭包函数捕获的都是不同的变量,这些变量的值也是对应迭代时的值。第二种方式是将迭代变量通过闭包函数的参数传`defer`语句会马上对调用参数求值。两种方式都是可以工作的。不过一般在`for`循环内部执行`defer`语句并不是一个好的习惯,这里只是为了构造例子。
第一种方法是在循环体内部再定义一个局部变量,这样每次迭代`defer`语句的闭包函数捕获的都是不同的变量,这些变量的值对应迭代时的值。第二种方式是将迭代变量通过闭包函数的参数传`defer`语句会马上对调用参数求值。两种方式都是可以工作的。不过一般来说,`for`循环内部执行`defer`语句并不是一个好的习惯,此处仅为示例,不建议使用
Go语言中如果以切片为参数调用函数时函数参数有时候会有传引用的假象:因为在被调用函数内部可以修改传人切片的元素。其实,任何可以通过函数参数修改调用参数的情形,都是因为函数参数中显式或瘾式传人了指针参数。函数参数传值的规范更准确说是只针对数据结构中固定的部分传值,例如字符串或切片对应结构体中的指针和字符串长度结构体传值,但是并不包含指针间接指向的内容。将切片类型的参数替换为类似`reflect.SliceHeader`结构体就很好理解切片传值的含义了:
Go语言中如果以切片为参数调用函数时有时候会给人,参数采用了传引用的方式的假象:因为在被调用函数内部可以修改传入的切片的元素。其实,任何可以通过函数参数修改调用参数的情形,都是因为函数参数中显式或隐式传入了指针参数。函数参数传值的规范更准确说是只针对数据结构中固定的部分传值,例如字符串或切片对应结构体中的指针和字符串长度结构体传值,但是并不包含指针间接指向的内容。将切片类型的参数替换为类似`reflect.SliceHeader`结构体就很好理解切片传值的含义了:
```go
func twice(x int[]) {
@ -138,11 +138,11 @@ func twice(x IntSliceHeader) {
}
```
因为切片中的底层数组部分是通过隐式指针传递,指针本身依然是传值的,但是指针指向的却是同一份的数据,因此被调用函数是可以通过指针修改调用参数切片中的数据。除了数据之外切片结构还包含了切片长度和切片容量信息这2个信息也是传值的。如果被调用函数中修改了`Len``Cap`信息的话,就无法反映到调用参数的切片中,这时候我们一般会通过返回修改后的切片来更新之前的切片。这也是为何内置的`append`必须要返回一个切片的原因。
因为切片中的底层数组部分是通过隐式指针传递(指针本身依然是传值的,但是指针指向的却是同一份的数据),所以被调用函数是可以通过指针修改掉调用参数切片中的数据。除了数据之外切片结构还包含了切片长度和切片容量信息这2个信息也是传值的。如果被调用函数中修改了`Len``Cap`信息的话,就无法反映到调用参数的切片中,这时候我们一般会通过返回修改后的切片来更新之前的切片。这也是为何内置的`append`必须要返回一个切片的原因。
Go语言中函数还可以直接或间接地调用自己也就是支持函数的递归调用。不过Go语言函数的递归调用深度逻辑上没有限制函数调用的栈是不会出现溢出错误的因为Go语言运行时会根据需要动态地调整函数栈的大小。每个goroutine刚启动时只会分配很小的栈4或8KB具体依赖实现根据需要动态调整栈的大小栈最大可以达到GB级依赖具体实现。在Go1.4以前Go的动态栈采用的是分段式的动态栈通俗地说就是采用一个链表来实现动态栈每个链表的节点内存位置不会发生变化。但是链表实现的动态栈对某些导致跨越链表不同节点的热点调用的性能影响较大因为相邻的链表节点它们在内存位置一般不是相邻的这会增加CPU高速缓存命中失败的几率。为了解决热点调用的CPU缓存命中率问题Go1.4之后改用连续的动态栈实现也就是采用一个类似动态数组的结构来表示栈。不过连续动态栈也带来了新的问题当连续栈动态增长时需要将之前的数据移动到新的内存空间这会导致之前栈中全部变量的地址发生变化。虽然Go语言运行时会自动更新引用了地址变化的栈变量的指针但最重要的一点是要明白Go语言中指针不再是固定不变的了因此不能随意将指针保持到数值变量中Go语言的地址也不能随意保存到不在GC控制的环境中因此使用CGO时不能在C语言中长期持有Go语言对象的地址
Go语言中函数还可以直接或间接地调用自己也就是支持递归调用。Go语言函数的递归调用深度逻辑上没有限制函数调用的栈是不会出现溢出错误的因为Go语言运行时会根据需要动态地调整函数栈的大小。每个goroutine刚启动时只会分配很小的栈4或8KB具体依赖实现根据需要动态调整栈的大小栈最大可以达到GB级依赖具体实现。在Go1.4以前Go的动态栈采用的是分段式的动态栈通俗地说就是采用一个链表来实现动态栈每个链表的节点内存位置不会发生变化。但是链表实现的动态栈对某些导致跨越链表不同节点的热点调用的性能影响较大因为相邻的链表节点它们在内存位置一般不是相邻的这会增加CPU高速缓存命中失败的几率。为了解决热点调用的CPU缓存命中率问题Go1.4之后改用连续的动态栈实现也就是采用一个类似动态数组的结构来表示栈。不过连续动态栈也带来了新的问题当连续栈动态增长时需要将之前的数据移动到新的内存空间这会导致之前栈中全部变量的地址发生变化。虽然Go语言运行时会自动更新引用了地址变化的栈变量的指针但最重要的一点是要明白Go语言中指针不再是固定不变的了因此不能随意将指针保持到数值变量中Go语言的地址也不能随意保存到不在GC控制的环境中因此使用CGO时不能在C语言中长期持有Go语言对象的地址
因为Go语言函数的栈不会溢出普通Go程序员已经很少需要关心栈的运行机制的。在Go语言规范中甚至故意没有讲到栈和堆的概念。我们无法知道函数参数或局部变量到底是保存在栈中还是堆中我们只需要知道它们能正常工作就可以了。看看下面这个例子:
因为Go语言函数的栈不会溢出所以普通Go程序员已经很少需要关心栈的运行机制的。在Go语言规范中甚至故意没有讲到栈和堆的概念。我们无法知道函数参数或局部变量到底是保存在栈中还是堆中我们只需要知道它们能正常工作就可以了。看看下面这个例子:
```go
func f(x int) *int {
@ -317,13 +317,13 @@ func (p *Cache) Lookup(key string) string {
`Cache`结构体类型通过嵌入一个匿名的`sync.Mutex`来继承它的`Lock``Unlock`方法. 但是在调用`p.Lock()``p.Unlock()`时, `p`并不是`Lock``Unlock`方法的真正接收者, 而是会将它们展开为`p.Mutex.Lock()``p.Mutex.Unlock()`调用. 这种展开是编译期完成的, 并没有运行时代价.
在传统的C++或Java面向对象的继承中,子类的方法是在运行时动态绑定到对象的,因此基类实现的某些方法看到的`this`可能不是基类类型对应的对象这个特性会导致基类方法运行的不确定性。而在Go语言通过嵌入匿名的成员来继承的基类方法的`this`就是实现该方法的类型的对象Go语言中方法是编译时静态绑定的。如果需要虚函数的多态特性我们需要借助Go语言接口来实现。
在传统的面向对象语言(eg.C++或Java)的继承中,子类的方法是在运行时动态绑定到对象的,因此基类实现的某些方法看到的`this`可能不是基类类型对应的对象这个特性会导致基类方法运行的不确定性。而在Go语言通过嵌入匿名的成员来“继承”的基类方法,`this`就是实现该方法的类型的对象Go语言中方法是编译时静态绑定的。如果需要虚函数的多态特性我们需要借助Go语言接口来实现。
## 接口
Go语言之父Rob Pike曾说过一句名言那些避免白痴行为的语言最终自己变成了白痴语言Languages that try to disallow idiocy become themselves idiotic。一般静态编程语言都有着严格的类型系统这使得编译器可以深入检查程序员没有作出什么出格的举动。但是过于严格的类型系统却会使得编程太过繁琐让程序员把大好的青春都浪费在了和编译器的斗争中。Go语言试图让程序员能在安全和灵活的编程之间取得一个平衡。它在提供严格的类型检查的同时通过接口类型实现了对鸭子类型的支持使得安全动态的编程变得相对容易。
Go语言之父Rob Pike曾说过一句名言那些试图避免白痴行为的语言最终自己变成了白痴语言Languages that try to disallow idiocy become themselves idiotic。一般静态编程语言都有着严格的类型系统这使得编译器可以深入检查程序员没有作出什么出格的举动。但是过于严格的类型系统却会使得编程太过繁琐让程序员把大好的青春都浪费在了和编译器的斗争中。Go语言试图让程序员能在安全和灵活的编程之间取得一个平衡。它在提供严格的类型检查的同时通过接口类型实现了对鸭子类型的支持使得安全动态的编程变得相对容易。
Go的接口类型是对其它类型行为的抽象和概括因为接口类型不会和特定的实现细节绑定在一起通过这种抽象的方式我们可以让对象更加灵活和更具有适应能力。很多面向对象的语言都有相似的接口概念但Go语言中接口类型的独特之处在于它是满足隐式实现的鸭子类型。所谓鸭子类型说的是只要走起路来像鸭子、叫起来也像鸭子那么就可以把它当作鸭子。Go语言中的面向对象就是如此如果一个对象只要看起来像是某种接口类型那么它就可以作为该接口类型使用。这种设计可以让你创建一个新的接口类型满足已经存在的具体类型却不用去破坏这些类型原有的定义当我们使用的类型来自于不受我们控制的包时这种设计尤其灵活有用。Go语言的接口类型是延迟绑定可以实现类似虚函数的多态功能。
Go的接口类型是对其它类型行为的抽象和概括因为接口类型不会和特定的实现细节绑定在一起通过这种抽象的方式我们可以让对象更加灵活和更具有适应能力。很多面向对象的语言都有相似的接口概念但Go语言中接口类型的独特之处在于它是满足隐式实现的鸭子类型。所谓鸭子类型说的是只要走起路来像鸭子、叫起来也像鸭子那么就可以把它当作鸭子。Go语言中的面向对象就是如此如果一个对象只要看起来像是某种接口类型的实现那么它就可以作为该接口类型使用。这种设计可以让你创建一个新的接口类型满足已经存在的具体类型却不用去破坏这些类型原有的定义当我们使用的类型来自于不受我们控制的包时这种设计尤其灵活有用。Go语言的接口类型是延迟绑定可以实现类似虚函数的多态功能。
接口在Go语言中无处不在在“Hello world”的例子中`fmt.Printf`函数的设计就是完全基于接口的,它的真正功能由`fmt.Fprintf`函数完成。用于表示错误的`error`类型更是内置的接口类型。在C语言中`printf`只能将几种有限的基础数据类型打印到文件对象中。但是Go语言灵活接口特性`fmt.Fprintf`却可以向任何自定义的输出流对象打印,可以打印到文件或标准输出、也可以打印到网络、甚至可以打印到一个压缩文件;同时,打印的数据也不仅仅局限于语言内置的基础类型,任意隐式满足`fmt.Stringer`接口的对象都可以打印,不满足`fmt.Stringer`接口的依然可以通过反射的技术打印。`fmt.Fprintf`函数的签名如下:
@ -496,6 +496,6 @@ type Plugin interface {
}
```
`generate.Plugin`接口对应的`grpcPlugin`类型的`GenerateImports`方法中使用的`p.P(...)`函数却是通过`Init`函数注入的`generator.Generator`对象实现。这里的`generator.Generator`对应一个具体类型,但是如果`generator.Generator`是接口类型的话我们甚至可以传直接的实现。
`generate.Plugin`接口对应的`grpcPlugin`类型的`GenerateImports`方法中使用的`p.P(...)`函数却是通过`Init`函数注入的`generator.Generator`对象实现。这里的`generator.Generator`对应一个具体类型,但是如果`generator.Generator`是接口类型的话我们甚至可以传直接的实现。
Go语言通过几种简单特性的组合居然轻易就实现了鸭子面向对象和虚拟继承等高级特性,真的是不可思议。
Go语言通过几种简单特性的组合轻易就实现了鸭子面向对象和虚拟继承等高级特性,真的是不可思议。