Go 系列 channel

channel是Golang在语言层面提供的goroutine间的通信方式，比Unix管道更易用也更轻便。channel同是提供了一种同步的机制，确保在数据发送和接收之间的正确顺序和时机。通过使用channel，可以避免在多个goroutine之间共享数据时出现的竞争条件和其他并发问题。

Go语言的并发模型是CSP（Communicating Sequential Processes），提倡通过通信共享内存而不是通过共享内存而实现通信。channel主要用于进程内各goroutine间通信，如果需要跨进程通信，建议使用分布式系统的方法来解决。

func main() {
    ch := make(chan string)
    go func() {
        ch <- "test"
    }()
    
    msg := <-ch
    fmt.Println(msg)
}

常见用法

channel底层是一个“先进先出”的阻塞队列，队列满时“写”会阻塞，队列空时“读”会阻塞，同时对channel的“读”和“写”操作是线程安全的。

channel分缓冲型（buffered）和非缓冲型（unbuffered），非缓冲型的size是0，缓冲型的size是缓冲区的大小。
缓冲型通道读写经过buffer，非缓冲型通道的数据交互不经过通道，直接通过内存写传递。
channel分单向和双向，单向的意思是只能读（或写），双向是既能读也能写。
channel满时“写”会阻塞，channel空时“读”会阻塞。

单向 channel

顾名思义，单向channel指只能用于发送或接收数据，实际上也没有单向 channel。

我们知道 channel 可以通过参数传递，所谓单向 channel 只是对 channel 的一种使用限制。

func readChan(chanName <-chan int)：通过形参限定函数内部只能从channel中读取数据；
func writeChan(chanName chan<- int)：通过形参限定函数内部只能向channel中写入数据；

一个简单的示例程序如下：

func readChan(chanName <-chan int) { 
  <- chanName 
} 
func writeChan(chanName chan<- int) { 
  chanName <- 1
} 
func main() { 
  var mychan = make(chan int, 10) 
  writeChan(mychan) 
  readChan(mychan) 
} 

mychan是个正常的channel，而readChan()参数限制了传入的channel只能用来读，writeChan()参数限制了传入的channel只能用来写。

select

使用 select 可以监控多 channel，比如监控多个 channel，当其中某一个 channel 有数据时，就从其读出数据。

一个简单的示例程序如下：

package main 

import ( 
  "fmt" 
  "time" 
) 

func addNumberToChan(chanName chan int) { 
  for { 
    chanName <- 1
    time.Sleep(1 * time.Second)
  }
}

func main() { 
  var chan1 = make(chan int, 10) 
  var chan2 = make(chan int, 10) 
  go addNumberToChan(chan1) 
  go addNumberToChan(chan2) 
  for { 
    select { 
      case e := <- chan1 : 
        fmt.Printf("Get element from chan1: %d\n", e) 
      case e := <- chan2 : 
        fmt.Printf("Get element from chan2: %d\n", e) 
      default: 
        fmt.Printf("No element in chan1 and chan2.\n") 
        time.Sleep(1 * time.Second) 
    } 
  } 
}

程序中创建两个 channel： chan1 和 chan2。函数 addNumberToChan() 函数会向两个 channel 中周期性写入数据。通过 select 可以监控两个 channel，任意一个可读时就从其中读出数据。

程序输出如下：

D:\SourceCode\GoExpert\src>go run main.go 
Get element from chan1: 1 
Get element from chan2: 1 
No element in chan1 and chan2. 
Get element from chan2: 1 
Get element from chan1: 1 
No element in chan1 and chan2. 
Get element from chan2: 1 
Get element from chan1: 1 
No element in chan1 and chan2.

从输出可见，从channel中读出数据的顺序是随机的，事实上select语句的多个case执行顺序是随机的。

通过这个示例想说的是：select的case语句读channel不会阻塞，尽管channel中没有数据。这是由于case语句编译后调用读channel时会明确传入不阻塞的参数，此时读不到数据时不会将当前goroutine加入到等待队列，而是直接返回。

range

通过 range 可以持续从 channel 中读出数据，好像在遍历一个数组一样，当 channel 中没有数据时会阻塞当前 goroutine，与读channel时阻塞处理机制一样。

func chanRange(chanName chan int) { 
    for e := range chanName { 
      fmt.Printf("Get element from chan: %d\n", e) 
    } 
}

注意：如果向此 channel 写数据的 goroutine 退出时，系统检测到这种情况后会panic，否则range将会永久阻塞。

###

实现原理

channel数据结构如下图所示，主要是围绕着一个环形队列和两个双向链表展开。

channel

src/runtime/chan.go:hchan 定义了channel的数据结构：

type hchan struct { 
    qcount uint        // 当前队列中剩余元素个数 
    dataqsiz uint      // 环形队列长度，即可以存放的元素个数 
    buf unsafe.Pointer // 环形队列指针 
    elemsize uint16    // 每个元素的大小 
    closed uint32      // 标识关闭状态 
    elemtype *_type    // 元素类型 
    sendx uint         // 队列下标，指示元素写入时存放到队列中的位置 
    recvx uint         // 队列下标，指示元素从队列的该位置读出 
    recvq waitq        // 等待读消息的goroutine队列 
    sendq waitq        // 等待写消息的goroutine队列 
    lock mutex         // 互斥锁，chan不允许并发读写 
}

type waitq struct {
    first *sudog
    last  *sudog
}

从数据结构可以看出 channel 由队列、类型信息、goroutine 等待队列组成，下面分别说明其原理。

recvq和sendq都是双向链表，FIFO

buf使用ring buffer（环形缓存区）

sudog 是等待goroutine以及数据的封装，是核心数据结构之一

环形队列

chan 内部实现了一个环形队列作为其缓冲区，队列的长度是创建 chan 时指定的。下图展示了一个可缓存 6 个元素的 channel 示意图： channel

dataqsiz：指示了队列长度为6，即可缓存6个元素；
buf：指向队列的内存地址；
qcount：表示队列中还有两个元素；
sendx：指示后续写入的数据存储的位置，取值 [0, 6)；
recvx：指示从该位置读取数据, 取值 [0, 6)；

等待队列

从 channel 读数据，如果 channel 缓冲区为空或者没有缓冲区，当前 goroutine 会被阻塞。向 channel 写数据，如果 channel 缓冲区已满或者没有缓冲区，当前 goroutine 会被阻塞。被阻塞的 goroutine 将会挂在 channel 的等待队列中：

因读阻塞的 goroutine 会被向 channel 写入数据的 goroutine 唤醒；
因写阻塞的 goroutine 会被从 channel 读数据的 goroutine 唤醒；

下图展示了一个没有缓冲区的 channel，有几个 goroutine 阻塞等待读数据：

channel

注意，一般情况下 recvq 和 sendq 至少有一个为空。只有一个例外，那就是同一个 goroutine 使用 select 语句向 channel 一边写数据，一边读数据。

类型信息

一个 channel 只能传递一种类型的值，类型信息存储在 hchan 数据结构中。

elemtype 代表类型，用于数据传递过程中的赋值；
elemsize 代表类型大小，用于在 buf 中定位元素位置。

锁

一个 channel 同时仅允许被一个 goroutine 读写，为简单起见，本章后续部分说明读写过程时不再涉及加锁和解锁。

channel 读写

创建 channel

创建 channel 的过程实际上是初始化 hchan 结构。其中类型信息和缓冲区长度由 make 语句传入，buf 的大小则与元素大小和缓冲区长度共同决定。

创建 channel 的伪代码如下所示：

func makechan(t *chantype, size int) *hchan { 
    var c *hchan 
    c = new(hchan) 
    c.buf = malloc(元素类型大小*size) 
    c.elemsize = 元素类型大小 
    c.elemtype = 元素类型 
    c.dataqsiz = size 
    return c 
}

向 channel 写数据

向一个 channel 中写数据简单过程如下：

如果等待接收队列 recvq 不为空，说明缓冲区中没有数据或者没有缓冲区，此时直接从 recvq 取出 G, 并把数据写入，最后把该 G 唤醒，结束发送过程；
如果缓冲区中有空余位置，将数据写入缓冲区，结束发送过程；
如果缓冲区中没有空余位置，将待发送数据写入 G，将当前 G 加入 sendq，进入睡眠，等待被读 goroutine 唤醒；

简单流程图如下： channel

从 channel 读数据

从一个 channel 读数据简单过程如下：

如果等待发送队列 sendq 不为空，且没有缓冲区，直接从 sendq 中取出 G，把 G 中数据读出，最后把 G 唤醒，结束读取过程；
如果等待发送队列 sendq 不为空，此时说明缓冲区已满，从缓冲区中首部读出数据，把 G 中数据写入缓冲区尾部，把 G 唤醒，结束读取过程；
如果缓冲区中有数据，则从缓冲区取出数据，结束读取过程；
将当前 goroutine 加入 recvq，进入睡眠，等待被写 goroutine 唤醒；

简单流程图如下： channel消息接收

关闭 channel

关闭 channel 时会把 recvq 中的 G 全部唤醒，本该写入 G 的数据位置为 nil。把 sendq 中的 G 全部唤醒，但这些 G 会 panic。

除此之外，panic 出现的常见场景还有：

关闭值为 nil 的 channel
关闭已经被关闭的 channel
向已经关闭的 channel 写数据