1
0
mirror of https://github.com/chai2010/advanced-go-programming-book.git synced 2025-05-24 20:52:22 +00:00
2018-01-04 00:29:56 +08:00

228 lines
8.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 2.4. CGO内存模型
CGO是架接Go语言和C语言的桥梁它不仅仅在二进制接口层面实现互通同时要考虑两种语言的内存模型的差异。如果在CGO处理的跨语言函数调用时涉及指针的传递则可能会出现Go语言和C语言共享某一段内存的场景。我们知道C语言的内存在分配之后就是稳定的但是Go语言因为函数栈的动态伸缩可能导致栈中内存地址的移动。如果C语言持有的是移动之前的Go指针那么以旧指针访问Go对象时会导致程序崩溃。这是Go和C内存模型的最大差异。
## Go访问C内存
在Go语言访问C语言内存是最简单的情形我们在之前的例子中已经见过多次。因此C语言空间的内存是稳定的只要不是被人为提前释放那么在Go语言空间可以放心大胆地使用。
因为Go语言实现的现在我们无法在Go语言中创建大于2GB内存的切片具体请参考makeslice实现代码。不过借助cgo技术我们可以在C语言环境创建大于2GB的内存然后转为Go语言的切片使用
```go
package main
/*
#include <stdlib.h>
void* makeslice(size_t memsize) {
return malloc(memsize);
}
*/
import "C"
import "unsafe"
func makeByteSlize(n int) []byte {
p := C.makeslice(C.size_t(n))
return ((*[1 << 31]byte)(p))[0:n:n]
}
func freeByteSlice(p []byte) {
C.free(unsafe.Pointer(&p[0]))
}
func main() {
s := makeByteSlize(1<<32+1)
s[len[s]-1] = 1234
print(s[len[s]-1])
freeByteSlice(p)
}
```
例子中我们通过makeByteSlize来创建大于4G内存大小的切片从而绕过了Go语言实现的限制需要代码验证。而freeByteSlice辅助函数用于释放从C语言函数创建的切片。
因为C语言内存空间是稳定的基于C语言内存构造的切片也是绝对稳定的不会因为Go语言栈的变化而被移动。
## C临时访问传入的Go内存
cgo之所以存在的一大因素是要继承C/C++语言几十年的软件遗产。而C/C++很多库都是需要通过指针直接处理传入的内存数据的。因此cgo中也有很多需要将Go内存传入C语言函数的场景。
假设一个极端场景我们将一个Go语言内存传入了C语言函数后该Go语言内存位于于另一个goroutinue的栈上。在C语言函数执行期间另一个goroutinue因为栈不足的原因发生了栈的扩展也就是导致了原来的Go语言内存被移动到了新的位置。但是此时此刻C语言函数并不知道该Go语言内存已经移动了位置仍然用之前的地址来操作该内存——也就是将导致内存越界。以上是一个推论真实情况有些差异也就是说C访问传入的Go内存可能是不安全的
当然有RPC远程远程过程调用的经验的用户可能会考虑通过完全传值的方式处理借助C语言内存稳定的特性在C语言空间先开辟同样大小的内存然后将Go的内存填充到C的内存空间返回的内存也是如此处理。下面的例子是这种思路的具体实现
```go
package main
/*
void printString(const char* s) {
printf("%s", s);
}
*/
import "C"
func printString(s string) {
cs := C.CString(s)
defer C.free(unsafe.Pointer(cs))
C.printString(cs)
}
func main() {
s := "hello"
printString(s)
}
```
需要将Go的字符串传入C语言时先通过`C.CString`将Go语言字符串对应的内存数据复制到在C语言新创建的内存空间。上面例子的处理思路虽然时安全的但是效率极其低下因为要多次分配内存并逐个复制元素同时也极其繁琐。
为了简化并高效处理该场景向C语言传入Go语言内存cgo针对该场景定义了专门的规则在CGO调用的C语言函数返回前cgo保证传入的Go语言内存在此期间不会发生移动C语言函数可以大胆地使用Go语言的内存
根据新的规则我们可以直接传入Go字符串的内存
```go
package main
/*
void printString(const char* s) {
printf("%s", s);
}
*/
import "C"
func printString(s string) {
C.printString((*C.char)(unsafe.Pointer(&s[0])))
}
func main() {
s := "hello"
printString(s)
}
```
现在的处理方式更加直接,避免的分配额外的内存,完美的解决方案。
任何完美的技术都有被滥用的时候CGO的这种看似完美的规则也是存在隐患的。我们假设调用的C语言函数需要长时间运行那么将会导致被他引用的Go语言内存在C语言返回前不能被移动从而可能间接地导致这个Go内存栈对应的goroutine不能动态伸缩栈内存也就是可能导致这个goroutine被阻塞。因此在需要长时间运行的C语言函数特别是在纯CPU运算之外还可能因为需要等待其它的资源而需要不确定时间才能完成的函数需要谨慎处理传入的Go语言内存。
不过需要小心的是在取到Go内存时需要马上传入C语言函数期间不能保存到临时变量后再间接传入C语言函数。因为CGO只能保证在C函数调用之后被传入的Go语言内存不会发生移动它并不能保证在传入C函数之前内存发送变化。
以下代码是错误的:
```go
// 错误的代码
tmp := uintptr(unsafe.Pointer(&x))
pb := (*int16)(unsafe.Pointer(tmp))
*pb = 42
```
因为tmp并不是指针类型在它获取到Go对象地址之后x对象可能会被移动但是因为不是指针类型不会被Go语言运行时通过更新新内存的地址。在非制作类型的tmp保持Go对象的地址和在C语言环境保持Go对象的地址的效果是一样的如果原始的Go对象内存发生了移动Go语言运行时并不会同步更新它们。
## C长期持有Go指针对象
作为一个Go程序员在使用CGO时潜意识会认为总是Go调用C函数。其实CGO中C语言函数也可以回调Go语言实现的函数。特别是我们可以用Go语言写一个动态库导出C语言规范的接口给其它用户调用。当C语言函数调用Go语言函数的时候C语言函数就成了程序的调用方Go语言函数返回的Go对象内存的生命周期也就自然超出了Go语言运行时的管理。简言之我们不能在C语言函数中直接使用Go语言对象的内存。
虽然Go语言禁止在C语言函数中长期持有Go指针对象但是这种需求是切实存在的。如果需要在C语言中访问Go语言内存对象我们可以将Go语言内存对象在Go语言空间映射为一个int类型的id然后构建此id来间接访问和空着Go语言对象。
以下代码用于将Go对应映射为整数类型的ObjectId用完之后需要手工调用free方法释放该对象ID
```go
package main
import "sync"
type ObjectId int32
var refs struct {
sync.Mutex
objs map[ObjectId]interface{}
next ObjectId
}
func init() {
refs.Lock()
defer refs.Unlock()
refs.objs = make(map[ObjectId]interface{})
refs.next = 1000
}
func NewObjectId(obj interface{}) ObjectId {
refs.Lock()
defer refs.Unlock()
id := refs.next
refs.next++
refs.objs[id] = obj
return id
}
func (id ObjectId) IsNil() bool {
return id == 0
}
func (id ObjectId) Get() interface{} {
refs.Lock()
defer refs.Unlock()
return refs.objs[id]
}
func (id *ObjectId) Free() interface{} {
refs.Lock()
defer refs.Unlock()
obj := refs.objs[*id]
delete(refs.objs, *id)
*id = 0
return obj
}
```
我们通过一个map来管理Go语言对象和id对象的映射关系。其中NewObjectId用于创建一个和对象绑定的id而id对象的方法可用于解码出原始的Go对象也可以用于接触id和原始Go对象的绑定。
下面一组函以C接口规范导出可以被C语言函数调用
```go
package main
/*
export char* NewGoString(char* );
export void FreeGoString(char* );
export void PrintGoString(char* );
void printString(const char* s) {
char* gs = NewGoString(s);
PrintGoString(gs);
FreeGoString(gs);
}
*/
import "C"
//export NewGoString
func NewGoString(s *C.char) *C.char {
gs := C.GoString(s)
id := NewObjectId(gs)
return (*C.char)(unsafe.Pointer(uintptr(id)))
}
//export FreeGoString
func FreeGoString(p *C.char) {
id := ObjectId(uintptr(unsafe.Pointer(p)))
id.Free()
}
//export PrintGoString
func PrintGoString(s *C.char) {
id := ObjectId(uintptr(unsafe.Pointer(p)))
gs := id.Get().(string)
print(gs)
}
func main() {
C.printString("hello")
}
```
在printString函数中我们通过NewGoString创建一个对应的Go字符串对象返回的其实是一个ID不能直接使用。我们借助PrintGoString函数将id解析为Go语言字符串后打印。该字符串在C语言函数中完全跨越了Go语言的内存管理在PrintGoString调用前即时发生了栈伸缩导致的Go字符串地址发生变化也依然可以正常工作因为该字符串对应的id是稳定的在Go语言空间通过id解码得到的字符串也就是有效的。