golang 各种排序大比拼实例
1、准备工作
准备数据:
生成随机数并写入文件,之后在把数据读取出来
//新生成整数随机数,并存储在txt文件中, func NewIntRandm(fileName string, number, maxrandm int) { filename := fileName file, err := os.Create(filename) if err != nil { return } r := rand.New(rand.NewSource(time.Now().UnixNano())) rans := make([]string, 0, number) for i := 0; i < number; i++ { rans = append(rans, strconv.Itoa(r.Intn(maxrandm))) } file.WriteString(strings.Join(rans, " ")) defer file.Close() } //把一串数组存入文件总 func SavaRandmInt(fileName string, data []int) { if fileName == " " || len(data) == 0 { return } var file *os.File var openerr error file, openerr = os.Open(fileName) if openerr != nil { var newerr error file, newerr = os.Create(fileName) if newerr != nil { return } } rans := make([]string, 0, len(data)) for _, v := range data { rans = append(rans, strconv.Itoa(v)) } file.WriteString(strings.Join(rans, " ")) defer file.Close() }
准备计时的程序:
package util import "time" type Stopwatch struct { start time.Time stop time.Time } func (s *Stopwatch) Start() { s.start = time.Now() } func (s *Stopwatch) Stop() { s.stop = time.Now() } //纳秒 func (s Stopwatch) RuntimeNs() int { return s.stop.Nanosecond() - s.start.Nanosecond() } //微妙 func (s Stopwatch) RuntimeUs() float64 { return (float64)(s.stop.Nanosecond()-s.start.Nanosecond()) / 1000.00 } //毫秒 func (s Stopwatch) RuntimeMs() float64 { return (float64)(s.stop.Nanosecond()-s.start.Nanosecond()) / 1000000.00 } //秒 func (s Stopwatch) RuntimeS() float64 { return (float64)(s.stop.Nanosecond()-s.start.Nanosecond()) / 10000000000.00 }
2、开始写排序
我模仿golang中的sort源码包中的写法,暴露了一个接口,把排序的实现都写在内部
package sort // package main type Interface interface { //获取数据的长度 Len() int //判读索引为i和索引为j的值的大小,在实现的时候如果判断i>j 返回true,则为升序,反之为降序 Less(i, j int) bool //交换索引i,j的值 Swap(i, j int) } //冒泡排序 func BubbleSort(data Interface) { n := data.Len() for index := 0; index < n; index++ { for j := index + 1; j < n; j++ { if data.Less(index, j) { data.Swap(index, j) } } } } //此方法比上面的冒泡算法快,因为我找最小元素是指记住下标,并没有每一次都做元素交换 func SelectSort(data Interface) { n := data.Len() var min int for index := 0; index < n; index++ { min = index for j := index + 1; j < n; j++ { if data.Less(min, j) { min = j } } data.Swap(index, min) } } //插入排序 func InsertSrot(data Interface) { count := data.Len() for index := 1; index < count; index++ { for j := index; j > 0 && data.Less(j, j-1); j-- { //j>0 做一个边界守护,不让下标小于0 data.Swap(j, j-1) } } } //希尔排序 func ShellSort(data Interface) { N := data.Len() h := 1 for h < N/3 { h = 3*h + 1 } for h > 0 { for index := h; index < N; index++ { for j := index; j >= h && data.Less(j, j-h); j -= h { //j>0 做一个边界守护,不让下标小于0 data.Swap(j, j-h) } } h = h / 3 } } //快速排序 func QuickSort(data Interface) { n := data.Len() low, row := 0, n-1 quickSort(data, low, row) } func quickSort(data Interface, low, row int) { if low < row { i, j, x, last := low, row, low, 0 //0就是使用第一个作为基准值,last这个变量时为了基准最后一次交换变量时出现在那次 for i < j { for i < j && data.Less(x, j) { //比x小的放在前面出现的坑中 j-- } if i < j { data.Swap(i, j) i++ x = j last = 1 } for i < j && data.Less(i, x) { //比x大的放在后面出现的坑中 i++ } if i < j { data.Swap(i, j) j-- x = i last = -1 } } if last == 1 { data.Swap(j, x) } else if last == -1 { data.Swap(i, x) } quickSort(data, low, i-1) quickSort(data, i+1, row) } } //通过控制Less方法来控制升序降序 func HeapSort(data Interface) { makeHeap(data) n := data.Len() for i := n - 1; i >= 1; i-- { data.Swap(0, i) heapFixdown(data, 0, i) } } func makeHeap(data Interface) { n := data.Len() for i := (n - 1) 1; i >= 0; i-- { heapFixdown(data, i, n) } } func heapFixdown(data Interface, r, n int) { root := r //跟结点 for { leftChildIndex := root<<1 + 1 if leftChildIndex >= n { break } if leftChildIndex+1 < n && data.Less(leftChildIndex+1, leftChildIndex) { leftChildIndex++ } if data.Less(root, leftChildIndex) { return } data.Swap(leftChildIndex, root) root = leftChildIndex } }
3、开始使用
//先实现这个排序接口 type InSort []int func (is InSort) Len() int { return len(is) }//降序 func (is InSort) Less(i, j int) bool { return is[i] > is[j] } func (is InSort) Swap(i, j int) { is[i], is[j] = is[j], is[i] } func main() { fileName := "randm.txt" // util.NewIntRandm(fileName, 1000000, 10000) //封装生成5000000个随机数字 fileUtil := util.FileUtil{} insort := InSort{} insort = fileUtil.ReaderAllInt(fileName) //读取生成的随机数 fmt.Println(insort.Len()) t := new(util.Stopwatch) //封装的计时间的方法 t.Start() // sort.HeapSort(insort) //开始排序,519.8732 ms sort.QuickSort(insort) //开始排序,7.0267 ms t.Stop() fmt.Println(t.RuntimeMs(), "ms") util.SavaRandmInt("result.txt", insort) }
快排:10000数组 7.0267 ms,1000000数组 37.7612 ms
堆排序:10000数组 10.0039 ms,1000000数组 358.6429 ms
下面是我测试的一些数据:
HeapSort(insort) //堆排序 10000个数 4.0013 ms,100000个数 54.0659 ms,很稳定,500000个数 208.1511 ms 很稳定 sort.QuickSort(insort, 0, len(insort)-1) //快速排序 10000个数 3.0017 ms,100000个数,33.0222 ms,很稳定,500000个数 150.1096 ms 很稳定,100000个数 94.0823 ms 很稳定 sort.SelectSort(insort) //选择排序 10000个数 130.8017 ms,100000个数 时间很长 sort.BubbleSort(insort) //冒泡排序 10000个数 203.5344ms ,100000个数 187.7438 ms sort.InsertSrot(insort) // 插入排序 10000个数 858.6085 ms,100000个数,时间很长 sort.ShellSort(insort) //希尔插入 10000个数 10.9876 ms,100000个数 46.0322 m ,就做这个范围,很稳定,500000个数 141.8833 ms,相对稳定 sort.Sort(insort) //golang源码的排序 10000个数 6.0062 ms ,100000个数 19.9988 ms~89.0574 ms 不稳定,500000个数 358.2536 ms 稳定
补充:golang 定时任务方面time.Sleep和time.Tick的优劣对比
golang 写循环执行的定时任务,常见的有以下三种实现方式:
1、time.Sleep方法:
for { time.Sleep(time.Second) fmt.Println("我在定时执行任务") }
2、time.Tick函数:
t1:=time.Tick(3*time.Second) for { select { case <-t1: fmt.Println("t1定时器") } }
3、其中Tick定时任务,也可以先使用time.Ticker函数获取Ticker结构体,然后进行阻塞监听信息,这种方式可以手动选择停止定时任务,在停止任务时,减少对内存的浪费。
t:=time.NewTicker(time.Second) for { select { case <-t.C: fmt.Println("t1定时器") t.Stop() } }
其中第二种和第三种可以归为同一类
这三种定时器的实现原理
一般来说,你在使用执行定时任务的时候,一般旁人会劝你不要使用time.Sleep完成定时任务,但是为什么不能使用Sleep函数完成定时任务呢,它和Tick函数比,有什么劣势呢?这就需要我们去探讨阅读一下源码,分析一下它们之间的优劣性。
首先,我们研究一下Tick函数,func Tick(d Duration) <-chan Time
调用Tick函数会返回一个时间类型的channel,如果对channel稍微有些了解的话,我们首先会想到,既然是返回一个channel,在调用Tick方法的过程中,必然创建了goroutine,该Goroutine负责发送数据,唤醒被阻塞的定时任务。我在阅读源码之后,确实发现函数中go出去了一个协程,处理定时任务。
按照当前的理解,使用一个tick,需要go出去一个协程,效率和对内存空间的占用肯定不能比sleep函数强。我们需要继续阅读源码才拿获取到真理。
简单的调用过程我就不陈述了,我在这介绍一下核心结构体和方法(删除了部分判断代码,解释我写在表格中):
func (tb *timersBucket) addtimerLocked(t *timer) { t.i = len(tb.t) //计算timersBucket中,当前定时任务的长度 tb.t = append(tb.t, t)// 将当前定时任务加入timersBucket siftupTimer(tb.t, t.i) //维护一个timer结构体的最小堆(四叉树),排序关键字为执行时间,即该定时任务下一次执行的时间 if !tb.created { tb.created = true go timerproc(tb)// 如果还没有创建过管理定时任务的协程,则创建一个,执行通知管理timer的协程,最核心代码 } }
timersBucket,顾名思义,时间任务桶,是外界不可见的全局变量。每当有新的timer定时器任务时,会将timer加入到timersBucket中的timer切片。
timerBucket结构体如下:
type timersBucket struct { lock mutex //添加新定时任务时需要加锁(冲突点在于维护堆) t []*timer //timer切片,构造方式为四叉树最小堆 }
func timerproc(tb *timersBucket) 详细介绍
可以称之为定时任务处理器,所有的定时任务都会加入timersBucket,然后在该函数中等待被处理。等待被处理的timer,根据when字段(任务执行的时间,int类型,纳秒级别)构成一个最小堆,每次处理完成堆顶的某个timer时,会给它的when字段加上定时任务循环间隔时间(即Tick(d Duration) 中的d参数),然后重新维护堆,保证when最小的timer在堆顶。当堆中没有可以处理的timer(有timer,但是还不到执行时间),需要计算当前时间和堆顶中timer的任务执行时间差值delta,定时任务处理器沉睡delta段时间,等待被调度器唤醒。核心代码如下(注释写在每行代码的后面,删除一些判断代码以及不利于阅读的非核心代码):
func timerproc(tb *timersBucket) { for { lock(&tb.lock) //加锁 now := nanotime() //当前时间的纳秒值 delta := int64(-1) //最近要执行的timer和当前时间的差值 for { if len(tb.t) == 0 { delta = -1 break }//当前无可执行timer,直接跳出该循环 t := tb.t[0] delta = t.when - now //取when组小的的timer,计算于当前时间的差值 if delta > 0 { break }// delta大于0,说明还未到发送channel时间,需要跳出循环去睡眠delta时间 if t.period > 0 { // leave in heap but adjust next time to fire t.when += t.period * (1 + -delta/t.period)// 计算该timer下次执行任务的时间 siftdownTimer(tb.t, 0) //调整堆 } else { // remove from heap,如果没有设定下次执行时间,则将该timer从堆中移除(time.after和time.sleep函数即是只执行一次定时任务) last := len(tb.t) - 1 if last > 0 { tb.t[0] = tb.t[last] tb.t[0].i = 0 } tb.t[last] = nil tb.t = tb.t[:last] if last > 0 { siftdownTimer(tb.t, 0) } t.i = -1 // mark as removed } f := t.f arg := t.arg seq := t.seq unlock(&tb.lock)//解锁 f(arg, seq) //在channel中发送time结构体,唤醒阻塞的协程 lock(&tb.lock) } if delta < 0 { // No timers left - put goroutine to sleep. goparkunlock(&tb.lock, "timer goroutine (idle)", traceEvGoBlock, 1) continue }// delta小于0说明当前无定时任务,直接进行阻塞进行睡眠 tb.sleeping = true tb.sleepUntil = now + delta unlock(&tb.lock) notetsleepg(&tb.waitnote, delta) //睡眠delta时间,唤醒之后就可以执行在堆顶的定时任务了 } }
至此,time.Tick函数涉及到的主要功能就讲解结束了,总结一下就是启动定时任务时,会创建一个唯一协程,处理timer,所有的timer都在该协程中处理。
然后,我们再阅读一下sleep的源码实现,核心源码如下:
//go:linkname timeSleep time.Sleep func timeSleep(ns int64) { *t = timer{} //创建一个定时任务 t.when = nanotime() + ns //计算定时任务的执行时间点 t.f = goroutineReady //执行方法 tb.addtimerLocked(t) //加入timer堆,并在timer定时任务执行协程中等待被执行 goparkunlock(&tb.lock, "sleep", traceEvGoSleep, 2) //睡眠,等待定时任务协程通知唤醒 }
读了sleep的核心代码之后,是不是突然发现和Tick函数的内容很类似,都创建了timer,并加入了定时任务处理协程。神奇之处就在于,实际上这两个函数产生的timer都放入了同一个timer堆,都在定时任务处理协程中等待被处理。
优劣性对比,使用建议
现在我们知道了,Tick,Sleep,包括time.After函数,都使用的timer结构体,都会被放在同一个协程中统一处理,这样看起来使用Tick,Sleep并没有什么区别。
实际上是有区别的,Sleep是使用睡眠完成定时任务,需要被调度唤醒。Tick函数是使用channel阻塞当前协程,完成定时任务的执行。当前并不清楚golang 阻塞和睡眠对资源的消耗会有什么区别,这方面不能给出建议。
但是使用channel阻塞协程完成定时任务比较灵活,可以结合select设置超时时间以及默认执行方法,而且可以设置timer的主动关闭,以及不需要每次都生成一个timer(这方面节省系统内存,垃圾收回也需要时间)。
所以,建议使用time.Tick完成定时任务。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
下一篇:利用golang的字符串解决leetcode翻转字符串里的单词