You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
golang-tutorial/docs/golang_tutorial_11.md

25 KiB

11 - 数组和切片

上一节:第十篇 if else 语句
下一节:第十二篇 变参函数

这是本Golang系列教程的第11篇。

数组

数组是类型相同的元素的集合。例如,整数 5, 8, 9, 79, 76 的集合就构成了一个数组。Go不允许在数组中混合使用不同类型的元素比如整数和字符串

声明

数组的类型为 [n]T,其中 n 表示数组中元素的个数,T 表示数组中元素的类型。元素的个数 n 也是数组类型的一部分(我们将在稍后详细讨论)。

有很多声明数组的方式,让我们一个一个地介绍。

package main

import (  
    "fmt"
)

func main() {  
    var a [3]int //int array with length 3
    fmt.Println(a)
}

var a [3]int 声明了一个长度为 3 的整型数组。数组中的所有元素都被自动赋值为元素类型的 0 值。比如这里 a 是一个整型数组,因此 a 中的所有元素都被赋值为 0即整型的 0 值)。运行上面的程序,输出为:[0 0 0]

数组的索引从 0 开始到 length - 1 结束。下面让我们给上面的数组赋一些值。

package main

import (  
    "fmt"
)

func main() {  
    var a [3]int //int array with length 3
    a[0] = 12 // array index starts at 0
    a[1] = 78
    a[2] = 50
    fmt.Println(a)
}

a[0] 表示数组中的第一个元素。程序的输出为:[12 78 50]

(译者注:可以用下标运算符([])来访问数组中的元素,下标从 0 开始,例如 a[0] 表示数组 a 的第一个元素,a[1] 表示数组 a 的第二个元素,以此类推。)

可以利用 速记声明shorthand declaration 的方式来创建同样的数组:

package main 

import (  
    "fmt"
)

func main() {  
    a := [3]int{12, 78, 50} // shorthand declaration to create array
    fmt.Println(a)
}

上面的程序输出为:[12 78 50]

(译者注:这个例子给出了速记声明的方式:在数组类型后面加一对大括号({}),在大括号里面写元素初始值列表,多个值用逗号分隔。)

在速记声明中,没有必要为数组中的每一个元素指定初始值。

package main

import (  
    "fmt"
)

func main() {  
    a := [3]int{12} 
    fmt.Println(a)
}

上面程序的第 8 行:a := [3]int{12} 声明了一个长度为 3 的数组,但是只提供了一个初值 12。剩下的两个元素被自动赋值为 0。程序 的输出为:[12 0 0]

在声明数组时你可以忽略数组的长度并用...代替,让编译器为你自动推导数组的长度。比如下面的程序:

package main

import (  
    "fmt"
)

func main() {  
    a := [...]int{12, 78, 50} // ... makes the compiler determine the length
    fmt.Println(a)
}

上面已经提到,数组的长度是数组类型的一部分。因此 [5]int[25]int 是两个不同类型的数组。正是因为如此,一个数组不能动态改变长度。不要担心这个限制,因为切片(slices)可以弥补这个不足。

package main

func main() {  
    a := [3]int{5, 78, 8}
    var b [5]int
    b = a //not possible since [3]int and [5]int are distinct types
}

在上面程序的第 6 行,我们试图将一个 [3]int 类型的数组赋值给一个 [5]int 类型的数组,这是不允许的。编译会报错:main.go:6: cannot use a (type [3]int) as type [5]int in assignment。

数组是值类型

在 Go 中数组是值类型而不是引用类型。这意味着当数组变量被赋值时,将会获得原数组(译者注:也就是等号右面的数组)的拷贝。新数组中元素的改变不会影响原数组中元素的值。

package main

import "fmt"

func main() {  
    a := [...]string{"USA", "China", "India", "Germany", "France"}
    b := a // a copy of a is assigned to b
    b[0] = "Singapore"
    fmt.Println("a is ", a)
    fmt.Println("b is ", b) 
}

上面程序的第 7 行,将数组 a 的拷贝赋值给数组 b。第 8 行b 的第一个元素被赋值为 Singapore。这将不会影响到原数组 a。程序的输出为

a is [USA China India Germany France]  
b is [Singapore China India Germany France]  

同样的,如果将数组作为参数传递给函数,仍然是值传递,在函数中对(作为参数传入的)数组的修改不会造成原数组的改变。

package main

import "fmt"

func changeLocal(num [5]int) {  
    num[0] = 55
    fmt.Println("inside function ", num)

}
func main() {  
    num := [...]int{5, 6, 7, 8, 8}
    fmt.Println("before passing to function ", num)
    changeLocal(num) //num is passed by value
    fmt.Println("after passing to function ", num)
}

上面程序的第 13 行,数组 num 是通过值传递的方式传递给函数 changeLocal 的,因此该函数执行过程中不会造成 num 的改变。程序输出如下:

before passing to function  [5 6 7 8 8]  
inside function  [55 6 7 8 8]  
after passing to function  [5 6 7 8 8]  

数组的长度

内置函数 len 用于获取数组的长度:

package main

import "fmt"

func main() {
	arr := [...]float64{23.2,34.12,45.22,55.6}
	fmt.Println("length of a is  ",len(arr)); // print 4
}

上面程序的输出为:length of a is 4

使用 range 遍历数组

for 循环可以用来遍历数组中的元素:

package main

import "fmt"

func main() {  
    a := [...]float64{67.7, 89.8, 21, 78}
    for i := 0; i < len(a); i++ { //looping from 0 to the length of the array
        fmt.Printf("%d th element of a is %.2f\n", i, a[i])
    }
}

上面的程序使用 for 循环遍历数组中的元素(索引从 0 到 len(a) - 1。上面的程序输出如下

0 th element of a is 67.70  
1 th element of a is 89.80  
2 th element of a is 21.00  
3 th element of a is 78.00  

Go 提供了一个更简单,更简洁的遍历数组的方法:使用 range 形式的 for 循环。range 返回数组的索引和索引对应的值。让我们用 range for 重写上面的程序(除此之外我们还计算了数组元素的总和)。

package main

import "fmt"

func main() {  
    a := [...]float64{67.7, 89.8, 21, 78}
    sum := float64(0)
    for i, v := range a {//range returns both the index and value
        fmt.Printf("%d the element of a is %.2f\n", i, v)
        sum += v
    }
    fmt.Println("\nsum of all elements of a",sum)
}  

上面的程序中,第 8 行 for i, v := range a 是 range 形式的 for 循环。range 将返回数组的索引和相对应的元素。我们打印这些值并计算数组 a 中所有元素的总和。程序的输出如下:

0 the element of a is 67.70  
1 the element of a is 89.80  
2 the element of a is 21.00  
3 the element of a is 78.00

sum of all elements of a 256.5 

如果你只想访问数组元素而不需要访问数组索引,则可以通过空标识符来代替索引变量:

for _, v := range a { //ignores index  
}

上面的代码忽略了索引。用类似的方法,也可以忽略值。

多维数组

目前为止我们创建的数组都是一维的。也可以创建多维数组。

package main

import (  
    "fmt"
)

func printarray(a [3][2]string) {  
    for _, v1 := range a {
        for _, v2 := range v1 {
            fmt.Printf("%s ", v2)
        }
        fmt.Printf("\n")
    }
}

func main() {  
    a := [3][2]string{
        {"lion", "tiger"},
        {"cat", "dog"},
        {"pigeon", "peacock"}, //this comma is necessary. The compiler will complain if you omit this comma
    }
    printarray(a)
    var b [3][2]string
    b[0][0] = "apple"
    b[0][1] = "samsung"
    b[1][0] = "microsoft"
    b[1][1] = "google"
    b[2][0] = "AT&T"
    b[2][1] = "T-Mobile"
    fmt.Printf("\n")
    printarray(b)
}

上面的程序中,第 17 行利用速记声明创建了一个二维数组 a。第 20 行的逗号是必须的,因为词法分析器会根据一些简单的规则自动插入分号。如果你想了解更多,请阅读:https://golang.org/doc/effective_go.html#semicolons

在第 23 行声明了另一个二维数组 b并通过索引的方式给数组 b 中的每一个元素赋值。这是初始化二维数组的另一种方式。

第 7 行声明的函数 printarray 通过两个嵌套的 range for 打印二维数组的内容。上面程序的输出为:

lion tiger  
cat dog  
pigeon peacock 

apple samsung  
microsoft google  
AT&T T-Mobile 

以上就是对数组的介绍。尽管数组看起来足够灵活,但是数组的长度是固定的,没办法动态增加数组的长度。而切片却没有这个限制,实际上在 Go 中,切片比数组更为常见。

切片

切片slice是建立在数组之上的更方便更灵活更强大的数据结构。切片并不存储任何元素而只是对现有数组的引用。

创建切片

元素类型为 T 的切片表示为: []T

package main

import (  
    "fmt"
)

func main() {  
    a := [5]int{76, 77, 78, 79, 80}
    var b []int = a[1:4] //creates a slice from a[1] to a[3]
    fmt.Println(b)
}

通过 a[start:end] 这样的语法创建了一个从 a[start]a[end -1] 的切片。在上面的程序中,第 9 行 a[1:4] 创建了一个从 a[1]a[3] 的切片。因此 b 的值为:[77 78 79]

下面是创建切片的另一种方式:

package main

import (  
    "fmt"
)

func main() {  
    c := []int{6, 7, 8} //creates and array and returns a slice reference
    fmt.Println(c)
}

在上面的程序中,第 9 行 c := []int{6, 7, 8} 创建了一个长度为 3 的 int 数组,并返回一个切片给 c。

修改切片

切片本身不包含任何数据。它仅仅是底层数组的一个上层表示。对切片进行的任何修改都将反映在底层数组中。

package main

import (  
    "fmt"
)

func main() {  
    darr := [...]int{57, 89, 90, 82, 100, 78, 67, 69, 59}
    dslice := darr[2:5]
    fmt.Println("array before",darr)
    for i := range dslice {
        dslice[i]++
    }
    fmt.Println("array after",darr) 
}

上面程序的第 9 行,我们创建了一个从 darr[2] 到 darr[5] 的切片 dslice。for 循环将这些元素值加 1。执行完 for 语句之后打印原数组的值,我们可以看到原数组的值被改变了。程序输出如下:

array before [57 89 90 82 100 78 67 69 59]  
array after [57 89 91 83 101 78 67 69 59]  

当若干个切片共享同一个底层数组时,对每一个切片的修改都会反映在底层数组中。

package main

import (  
    "fmt"
)

func main() {  
    numa := [3]int{78, 79 ,80}
    nums1 := numa[:] //creates a slice which contains all elements of the array
    nums2 := numa[:]
    fmt.Println("array before change 1",numa)
    nums1[0] = 100
    fmt.Println("array after modification to slice nums1", numa)
    nums2[1] = 101
    fmt.Println("array after modification to slice nums2", numa)
}

可以看到,在第 9 行,numa[:] 中缺少了开始和结束的索引值,这种情况下开始和结束的索引值默认为 0len(numa)。这里 nums1nums2 共享了同一个数组。程序的输出为:

array before change 1 [78 79 80]  
array after modification to slice nums1 [100 79 80]  
array after modification to slice nums2 [100 101 80] 

从输出结果可以看出,当多个切片共享同一个数组时,对每一个切片的修改都将会反映到这个数组中。

切片的长度和容量

切片的长度是指切片中元素的个数。切片的容量是指从切片的起始元素开始到其底层数组中的最后一个元素的个数。

(译者注:使用内置函数 cap 返回切片的容量。)

让我们写一些代码来更好地理解这一点。

package main

import (  
    "fmt"
)

func main() {  
    fruitarray := [...]string{"apple", "orange", "grape", "mango", "water melon", "pine apple", "chikoo"}
    fruitslice := fruitarray[1:3]
    fmt.Printf("length of slice %d capacity %d", len(fruitslice), cap(fruitslice)) //length of is 2 and capacity is 6
}

在上面的程序中,创建了一个以 fruitarray 为底层数组,索引从 1 到 2 的切片 fruitslice,因此 fruitslice 长度为 2。

fruitarray 的长度是 7。fruiteslice 是从 fruitarray 的索引 1 开始的。因此 fruiteslice 的容量是从 fruitarray 的第 1 个元素开始算起的数组中的元素个数,这个值是 6。因此 fruitslice 的容量是 6。程序的输出为length of slice 2 capacity 6

切片的长度可以动态地改变(最大长度为其容量)。任何超出切片容量的操作都会发生运行错误。

package main

import (  
    "fmt"
)

func main() {  
    fruitarray := [...]string{"apple", "orange", "grape", "mango", "water melon", "pine apple", "chikoo"}
    fruitslice := fruitarray[1:3]
    fmt.Printf("length of slice %d capacity %d\n", len(fruitslice), cap(fruitslice)) //length of is 2 and capacity is 6
    fruitslice = fruitslice[:cap(fruitslice)] //re-slicing furitslice till its capacity
    fmt.Println("After re-slicing length is",len(fruitslice), "and capacity is",cap(fruitslice))
}

在上面的程序中, 第 11 行修改 fruitslice 的长度为它的容量。上面的程序输出如下:

length of slice 2 capacity 6  
After re-slicing length is 6 and capacity is 6  

用 make 创建切片

内置函数 func make([]T, len, cap) []T 可以用来创建切片,该函数接受长度容量作为参数,返回切片。容量是可选的,默认与长度相同。使用 make 函数将会创建一个数组并返回它的切片。

package main

import (  
    "fmt"
)

func main() {  
    i := make([]int, 5, 5)
    fmt.Println(i)
}

用 make 创建的切片的元素值默认为 0 值。上面的程序输出为:[0 0 0 0 0]

追加元素到切片

我们已经知道数组是固定长度的,它们的长度不能动态增加。而切片是动态的,可以使用内置函数 append 添加元素到切片。append 的函数原型为:append(s []T, x ...T) []T

x …T 表示 append 函数可以接受的参数个数是可变的。这种函数叫做变参函数。

你可能会问一个问题:如果切片是建立在数组之上的,而数组本身不能改变长度,那么切片是如何动态改变长度的呢?实际发生的情况是,当新元素通过调用 append 函数追加到切片末尾时如果超出了容量append 内部会创建一个新的数组。并将原有数组的元素拷贝给这个新的数组最后返回建立在这个新数组上的切片。这个新切片的容量是旧切片的二倍译者注当超出切片的容量时append 将会在其内部创建新的数组,该数组的大小是原切片容量的 2 倍。最后 append 返回这个数组的全切片,即从 0 到 length - 1 的切片)。下面的程序会帮助你理解这一知识点:

package main

import (  
    "fmt"
)

func main() {  
    cars := []string{"Ferrari", "Honda", "Ford"}
    fmt.Println("cars:", cars, "has old length", len(cars), "and capacity", cap(cars)) //capacity of cars is 3
    cars = append(cars, "Toyota")
    fmt.Println("cars:", cars, "has new length", len(cars), "and capacity", cap(cars)) //capacity of cars is doubled to 6
}

在上面的程序中cars 的容量开始时为 3。在第 10 行我们追加了一个新的元素给 cars,并将 append(cars, "Toyota") 的返回值重新复制给 cars。现在 cars 的容量翻倍,变为 6。上面的程序输出为

cars: [Ferrari Honda Ford] has old length 3 and capacity 3  
cars: [Ferrari Honda Ford Toyota] has new length 4 and capacity 6  

切片的 0 值为 nil。一个 nil 切片的长度和容量都为 0。可以利用 append 函数给一个 nil 切片追加值。

package main

import (  
    "fmt"
)

func main() {  
    var names []string //zero value of a slice is nil
    if names == nil {
        fmt.Println("slice is nil going to append")
        names = append(names, "John", "Sebastian", "Vinay")
        fmt.Println("names contents:",names)
    }
}

在上面的程序中 namesnil,并且我们把 3 个字符串追加给 names。程序的输出为:

slice is nil going to append  
names contents: [John Sebastian Vinay]  

可以使用 ... 操作符将一个切片追加到另一个切片末尾:

package main

import (  
    "fmt"
)

func main() {  
    veggies := []string{"potatoes","tomatoes","brinjal"}
    fruits := []string{"oranges","apples"}
    food := append(veggies, fruits...)
    fmt.Println("food:",food)
}

上面的程序中在第10行将 fruits 追加到 veggies 并赋值给 food...操作符用来展开切片。程序的输出为:food: [potatoes tomatoes brinjal oranges apples]

切片作为函数参数

可以认为切片在内部表示为如下的结构体:

type slice struct {  
    Length        int
    Capacity      int
    ZerothElement *byte
}

可以看到切片包含长度、容量、以及一个指向首元素的指针。当将一个切片作为参数传递给一个函数时,虽然是值传递,但是指针始终指向同一个数组。因此将切片作为参数传给函数时,函数对该切片的修改在函数外部也可以看到。让我们写一个程序来验证这一点。

package main

import (  
    "fmt"
)

func subtactOne(numbers []int) {  
    for i := range numbers {
        numbers[i] -= 2
    }

}
func main() {

    nos := []int{8, 7, 6}
    fmt.Println("slice before function call", nos)
    subtactOne(nos)                               //function modifies the slice
    fmt.Println("slice after function call", nos) //modifications are visible outside

}

在上面的程序中,第 17 行将切片中的每个元素的值减 2。在函数调用之后打印切片的的内容发现切片内容发生了改变。你可以回想一下这不同于一个数组对函数内部的数组所做的更改在函数外不可见。上面的程序输出如下

array before function call [8 7 6]  
array after function call [6 5 4]  

多维切片

同数组一样,切片也可以有多个维度。

package main

import (  
    "fmt"
)


func main() {  
     pls := [][]string {
            {"C", "C++"},
            {"JavaScript"},
            {"Go", "Rust"},
            }
    for _, v1 := range pls {
        for _, v2 := range v1 {
            fmt.Printf("%s ", v2)
        }
        fmt.Printf("\n")
    }
}

上面程序的输出如下:

C C++  
JavaScript  
Go Rust  

内存优化

切片保留对底层数组的引用。只要切片存在于内存中,数组就不能被垃圾回收。这在内存管理方便可能是值得关注的。假设我们有一个非常大的数组,而我们只需要处理它的一小部分,为此我们创建这个数组的一个切片,并处理这个切片。这里要注意的事情是,数组仍然存在于内存中,因为切片正在引用它。

解决该问题的一个方法是使用 copy 函数 func copy(dst, src []T) int 来创建该切片的一个拷贝。这样我们就可以使用这个新的切片,原来的数组可以被垃圾回收。

package main

import (  
    "fmt"
)

func countries() []string {  
    countries := []string{"USA", "Singapore", "Germany", "India", "Australia"}
    neededCountries := countries[:len(countries)-2]
    countriesCpy := make([]string, len(neededCountries))
    copy(countriesCpy, neededCountries) //copies neededCountries to countriesCpy
    return countriesCpy
}
func main() {  
    countriesNeeded := countries()
    fmt.Println(countriesNeeded)
}

在上面程序中,第 9 行 neededCountries := countries[:len(countries)-2] 创建一个底层数组为 countries 并排除最后两个元素的切片。第 11 行将 neededCountries 拷贝到 countriesCpy 并在下一行返回 countriesCpy。现在数组 countries 可以被垃圾回收,因为 neededCountries 不再被引用。

我(原文作者)已经将我们讨论的所有概念汇总到一个程序中,你可以从 github 下载。

扩展

数组

深入解析 Go 中 Slice 底层实现

创建(定义)数组

数组在Go中是值类型而不是引用其他语言的数组则是引用类型

PS切片slice是一个引用类型。数组不是统一的类型大小不同的数组是不可以比较的不同数组类型是不可以比较的

var a[2]int
var b[3]string

// 提前知道数组中的值
var a[2]int{11,22}
var a[20]int{19:11} // 索引值为19的元素赋值为 11 ,其他的默认为 0

// 不指定数组的长度 ...
var c = [...]int{11,22,33,44}
var d = [...]int{19:90} // 尽可能的满足索引值得数组
指向数组的指针和指向指针的数组
//定义数组a
a := [...]int{19:100}

// 指向数组的指针
var p *[20]int = &a  //长度为20的int型数组这里的数组长度 `20` 必须和a数组长度相等
fmt.Println(p) //以上表示取这样一个数组的地址 
// 打印结果:&[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 100]

//指向指针的数组
x , y  := 1, 2
pp := [...]*int{&x,&y} // 指向int型的指针保存的元素是指向int型的指针。输出x,y的地址
fmt.Println("pp is ",pp)  // 打印结果pp is  [0xc420012128 0xc420012130]
new 创建一个数组
 ppp := new([10]int)
fmt.Println("----ppp-------",ppp); //输出结果:`----ppp------- &[0 0 0 0 0 0 0 0 0 0]` 
//以上为指向数组的指针
两种方式修改数组赋值
// 第一种方式
n := [10]int{}
n[1] = 10
fmt.Println("-----1------",n)  // 输出:`-----1------ [0 10 0 0 0 0 0 0 0 0]`

// 第二种方式
m := new([10]int)
m[1] = 20
fmt.Println("-----2------",m)  // 输出:`-----2------ &[0 20 0 0 0 0 0 0 0 0]`
多维数组
arr := [2][3]int{
                {1, 2, 3},
                {4, 5, 6}} //最外面的`}`不可以换行的,否则报错:`syntax error`
fmt.Println("-----",arr)

冒泡排序

第一种写法
func main(){
        a :=[...]int64{12,23,293,34,128,132}
        fmt.Println(a)
        num := len(a)
        for i := 0; i<num; i++ {
                for j := i+1; j<num; j++ {
                        if a[i]<a[j] {
                                tmp := a[i]
                                a[i] = a[j]
                                a[j] = tmp
                        }
                } 
        }
        fmt.Println(a)
}

从大到小排序

第二种写法
func main(){
        a :=[...]int64{12,23,293,34,128,132}
        fmt.Println(a)
        num := len(a)
        for i := 0; i<num; i++ {
                for j := i+1; j<num; j++ {
                        if a[i]<a[j] {
                                a[i],a[j] = a[j],a[i]
                        }
                } 
        }
        fmt.Println(a)
}

切片

package main

import "fmt"

func main() {
	a := [10]int{1,2,3,4,5,6,7,8,9}
	var s1  []int
	fmt.Println(s1) // 输出:[]

	// 只取一个元素
	s2 := a[5]
	fmt.Println(s2) // 输出6

	// 只取前5个元素
	s3 := a[:5]
	fmt.Println(s3) // 输出:[1 2 3 4 5]

	// 只取后5个元素
	s4 := a[5:]
	fmt.Println(s4) // 输出:[6 7 8 9 0]

	// 截取某一段元素,不包括最后一个
	s5 := a[5:8]
	fmt.Println(s5) // 输出:[6 7 8]

	// 使用make创建一个切片
	s6 := make([]int, 3, 10) //  func make([]T, len, cap) []T 可以用来创建切片
	fmt.Println(len(s6),cap(s6));

	s7 := []byte{'a','b','c','d','e','f','g','h','i','j','k'} // 切片底层对应的数组

	slice_a := s7[2:5]
	fmt.Println(slice_a) // 输出的ascii码 值 [99 100 101]
	fmt.Println(string(slice_a)) // 格式化为字符串输出
	fmt.Println(len(slice_a),cap(slice_a))

	slice_b := s7[3:5]
	fmt.Println(string(slice_b)) // 格式化为字符串输出

	// append 函数使用
	s8 := make([]int, 3, 6) // 3个元素容量为6的切片
	fmt.Printf("%p\n", s8)  // 打印内存地址0xc042074030
	s8 = append(s8, 12, 48)
	fmt.Printf("%v %p", s8, s8) // 格式化打印值和内存地址:[0 0 0 12 48] 0xc042074030

	// 追加的元素如果没有超过切片容量,则切片的地址是不变的,否则内存地址会变
	s8 = append(s8, 66, 88)
	fmt.Printf("%v %p\n", s8, s8) // [0 0 0 12 48 66 88] 0xc042048060

	// copy 使用
	s9 := []int{1,2,3,4,5,6,7}
	s10 := []int{33,44,55}
	copy(s9,s10) // copy(拷贝,被拷贝)
	fmt.Println(s9) //[33 44 55 4 5 6 7]

	copy(s10,s9) 
	fmt.Println(s10) // [1 2 3]

	copy(s9[2:4],s10[0:2]) 
	fmt.Println(s9) // [1 2 33 44 5 6 7]

	s11 := s7[:]
	fmt.Println(s11) // copy一个数组的所有
}

希望你喜欢阅读。请留下宝贵的意见和反馈:)