Go素數篩選分析
1. 素數篩選介紹
學習Go語言的程序中,遇到素數篩選的問題,這是一個經典的并發編程問題,是某大佬的代碼,短短幾行代碼就實作了素數篩選,但是自己看完原理和代碼后一臉懵逼(僅此幾行能實作素數篩選),然后在網上查詢相關資料,依舊似懂非懂,經過1天的分析除錯,目前基本上掌握了的原理,在這里介紹一下學習理解的程序,
素數篩選基本原理如下圖:

就原理來說還是比較簡單的,首先生成從 2 開始的遞增自然數,然后依次對生成的第 1, 2, 3, ...個素數 整除,經過全部整除仍有余數的自然數,將會是素數,
大佬的代碼如下:
// 回傳生成自然數序列的管道: 2, 3, 4, ...
// GenerateNatural 函式內部啟動一個 Goroutine 生產序列,回傳對應的管道
func GenerateNatural() chan int {
ch := make(chan int)
go func() {
for i := 2; ; i++ {
ch <- i
}
}()
return ch
}
// 管道過濾器: 將輸入序列中是素數倍數的數淘汰,并回傳新的管道
// 函式內部啟動一個 Goroutine 生產序列,回傳過濾后序列對應的管道
func PrimeFilter(in <-chan int, prime int) chan int {
out := make(chan int)
go func() {
for {
if i := <-in; i%prime != 0 {
out <- i
}
}
}()
return out
}
func main() {
ch := GenerateNatural() // 自然數序列: 2, 3, 4, ...
for i := 0; i < 100; i++ {
prime := <-ch // 新出現的素數
fmt.Printf("%v: %v\n", i+1, prime)
ch = PrimeFilter(ch, prime) // 基于新素數構造的過濾器
}
}
main()函式先是呼叫 GenerateNatural() 生成最原始的從 2 開始的自然數序列,然后開始一個 100 次迭代的回圈,希望生成 100 個素數,在每次回圈迭代開始的時候,管道中的第一個數必定是素數,我們先讀取并列印這個素數,然后基于管道中剩余的數列,并以當前取出的素數為篩子過濾后面的素數,不同的素數篩子對應的管道是串聯在一起的,
運行代碼,程式正確輸出如下:
1: 2
2: 3
3: 5
......
......
98: 521
99: 523
100: 541
2. 代碼分析
之前在課本中學習到:chan底層結構 是一個指標,所以我們能在函式間直接傳遞 channel,而不用傳遞 channel 的指標,
上述代碼fun GenerateNatural()中創建了管道ch := make(chan int),并創建一個協程(為了便于描述,該協程稱為Gen)持續向ch中寫入漸增自然數,
當i=0時,main()中prime := <-ch讀取該ch(此時prime=2,輸出素數2),接著將ch傳入PrimeFilter(ch, prime)中,PrimeFilter(ch, prime)創建新協程(稱為PF(ch, 2))持續讀取傳入的ch(ch中2之前已被取出,從3依次往后讀取),同時回傳一個新的chan out(當通過過濾器的i向out寫入時,此時out僅有寫入而沒有讀取操作,PF(ch, 2)將阻塞在第1次寫chan out操作),與此同時main()中ch = PrimeFilter(ch, 2)將out賦值給ch,此操作給ch賦了新變數,到這里,重點來了:由于在隨后的時間里,協程Gen、PF(ch, 2)中仍需要不停寫入和讀取ch,這里將out賦值給ch的操作是否會更改Gen、PF(ch, 2)兩協程中ch的值了?
直接給出答案(后面會給出代碼測驗),此時ch賦新值不影響Gen、PF(ch, 2)兩協程,僅影響main() for回圈體隨后對chan的操作,(本人認為go中channel引數傳遞采用了channel指標的拷貝,后續給channel賦新值相當于將該channel重新指向了另外一個地址,該channel與之前協程中使用的channel分別指向不同地址,是完全不同的變數),為了便于后面分析,這里將ch = PrimeFilter(ch, 2)賦值后的ch稱為ch_2,
當i=1時,main() for回圈讀取前一次產生新的ch_2賦值給prime(此時prime=3,輸出素數3),接著將ch_2傳入PrimeFilter(ch, prime)并創建新協程(稱為PF(ch, 3)),而后ch = PrimeFilter(ch, 3)將新產生的out賦值給ch,稱為ch_3,與此同時協程Gen持續向ch中寫入直至阻塞,攜程PF(ch, 2)持續讀取ch值并寫入ch_2直至阻塞,新協程PF(ch, 3)持續讀取ch_2值并輸出至chan out(即ch_3)(此時ch_3僅有寫入而沒有讀取操作,PF(ch, 3)將阻塞在第1次寫ch_3操作),
當i繼續增加時,后面的結果以此類推,
總結一下:main()函式中,每回圈1次,會增加一個協程PF(ch, prime),且協程Gen與新增加的協程之間是串聯的關系(即前一個協程的輸出,作為下一個協程的輸入,二者通過channel互動),協程main每次回圈讀取最后一個channel的第1個值,獲取prime素數,基本原理如下圖所示,

3. 代碼驗證
(1) channel引數傳遞驗證
func main() {
ch1 := make(chan int)
go write(ch1)
go read(ch1)
time.Sleep(time.Second * 3)
fmt.Println("main() 1", ch1)
ch2 = make(chan int)
ch1 = ch2
fmt.Println("main() 2", ch1)
time.Sleep(time.Second * 3)
}
func read(ch1 chan int) {
for {
time.Sleep(time.Second)
fmt.Println("read", <-ch1, ch1)
}
}
func write(ch1 chan int) {
for {
time.Sleep(time.Second)
fmt.Println("write", ch1)
ch1 <- 5
}
}
測驗代碼比較簡單,在main()中創建chan ch1,后創建兩個協程write、read分別對ch1不間斷寫入與讀取,持續一段時間后,main()新創建ch2,并賦值給ch1,查看協程write、read是否受到影響,
...
write 0xc000048120
read 5 0xc000048120
main() 1 0xc000048120
main() 2 0xc000112000
write 0xc000048120
read 5 0xc000048120
...
程式輸出如上,可以看到ch1地址為0xc000048120,ch2地址為0xc000112000,main()中ch1的重新賦值不會影響到其他協程對ch1的讀寫,
(2) 素數篩選代碼驗證
在之前素數篩選原始碼的基礎上,添加一些除錯列印代碼,以便更容易分析代碼,如下所示,
package main
import (
"fmt"
"runtime"
"sync/atomic"
)
var total uint32
// 回傳生成自然數序列的管道: 2, 3, 4, ...
func GenerateNatural() chan int {
ch := make(chan int)
go func() {
goRoutineId := atomic.AddUint32(&total, 1)
for i := 2; ; i++ {
//fmt.Println("before generate", i)
ch <- i
fmt.Printf("[routineId: %.4v]----generate i=%v, ch=%v\n", goRoutineId, i, ch)
}
}()
return ch
}
// 管道過濾器: 洗掉能被素數整除的數
func PrimeFilter(in <-chan int, prime int) chan int {
out := make(chan int)
go func() {
goRoutineId := atomic.AddUint32(&total, 1)
for {
i := <-in
if i%prime != 0 {
fmt.Printf("[routineId: %.4v]----read i=%v, in=%v, out=%v\n", goRoutineId, i, in, out)
out <- i
}
}
}()
return out
}
func main() {
goRoutineId := atomic.AddUint32(&total, 1)
ch := GenerateNatural() // 自然數序列: 2, 3, 4, ...
for i := 0; i < 100; i++ {
//fmt.Println("--------before read prime")
prime := <-ch // 新出現的素數
fmt.Printf("[routineId: %.4v]----main i=%v; prime=%v, ch=%v, total=%v\n", goRoutineId, i+1, prime, ch, runtime.NumGoroutine())
ch = PrimeFilter(ch, prime) // 基于新素數構造的過濾器
}
}
1)列印協程id
由于Go語言沒有直接把獲取go程id的介面暴露出來,這里采用atomic.AddUint32原子操作,每次新建1個協程時,將atomic.AddUint32(&total, 1)的值保存下來,作為該協程的唯一id,
2)輸出結果分析
[routineId: 0002]----generate i=2, ch=0xc000018180
[routineId: 0001]----main i=1; prime=2, ch=0xc000018180, total=2
[routineId: 0003]----read i=3, in=0xc000018180, out=0xc000090000
[routineId: 0002]----generate i=3, ch=0xc000018180
[routineId: 0001]----main i=2; prime=3, ch=0xc000090000, total=3
[routineId: 0002]----generate i=4, ch=0xc000018180
[routineId: 0002]----generate i=5, ch=0xc000018180
[routineId: 0003]----read i=5, in=0xc000018180, out=0xc000090000
[routineId: 0002]----generate i=6, ch=0xc000018180
[routineId: 0002]----generate i=7, ch=0xc000018180
......
輸出結果如上,main協程id=1,GenerateNatural協程id=2,PrimeFilter(ch, prime)協程id從3開始遞增,這里還是不太容易看明白,下面分類闡述輸出結果,
首先,單獨查看GenerateNatural協程輸出,如下,可以看出,此協程就是在寫入阻塞交替間往ch=0xc000018180中寫入資料,
[routineId: 0002]----generate i=2, ch=0xc000018180
[routineId: 0002]----generate i=3, ch=0xc000018180
[routineId: 0002]----generate i=4, ch=0xc000018180
[routineId: 0002]----generate i=5, ch=0xc000018180
[routineId: 0002]----generate i=6, ch=0xc000018180
[routineId: 0002]----generate i=7, ch=0xc000018180
[routineId: 0002]----generate i=8, ch=0xc000018180
[routineId: 0002]----generate i=9, ch=0xc000018180
......
接著,查看PrimeFilter(ch, prime)協程,如下,每輸出1個素數,將增加1個PrimeFilter(ch, prime)協程,且協程id號從3開始遞增,
[routineId: 0003]----read i=3, in=0xc000018180, out=0xc000090000
......
[routineId: 0004]----read i=5, in=0xc000090000, out=0xc0000181e0
......
[routineId: 0005]----read i=7, in=0xc0000181e0, out=0xc00020a000
......
[routineId: 0006]----read i=11, in=0xc00020a000, out=0xc00020a060
......
可以看出,協程[routineId: 0003]讀取GenerateNatural協程ch=0xc000018180值作為輸入,并將out=0xc000090000輸出作為[routineId: 0004]協程輸入,以此類推,從id>=2開始的多個協程是通過channel管道串聯在一起的,且前一個協程的輸出作為后一個協程的輸入,與前述分析一致,
最后,查看main執行緒,其id=1,可見main每次回圈讀取最后一個channel的第1個值,且該值為素數,與前述分析一致,
[routineId: 0002]----generate i=2, ch=0xc000018180
[routineId: 0001]----main i=1; prime=2, ch=0xc000018180, total=2
[routineId: 0003]----read i=3, in=0xc000018180, out=0xc000090000
......
[routineId: 0001]----main i=2; prime=3, ch=0xc000090000, total=3
......
[routineId: 0004]----read i=5, in=0xc000090000, out=0xc0000181e0
......
[routineId: 0001]----main i=3; prime=5, ch=0xc0000181e0, total=4
[routineId: 0005]----read i=7, in=0xc0000181e0, out=0xc00020a000
[routineId: 0001]----main i=4; prime=7, ch=0xc00020a000, total=5
4. 總結
- 對
Go不同協程中chan的傳遞原理了解不深,且素數篩選代碼中多個協程統一使用了ch名稱,特別是對于main()中ch的重新賦值會不會影響其他協程不甚了解,導致理解混亂, - 經深入分析代碼后理解了素數篩選的內部原理,可謂知其所以然,然如果讓自己來設計,代碼肯定會臃腫非常多,對于大佬能用如此簡單的代碼實作功能,萬分欽佩!
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/517494.html
標籤:Go
下一篇:聊聊運營活動的設計與實作邏輯
