Go语言反射——性能和灵活性的双刃剑

现在的一些流行设计思想需要建立在反射基础上,如控制反转(Inversion Of Control,IOC)和依赖注入(Dependency Injection,DI)。Go语言中非常有名的 Web 框架 martini(https://github.com/go-martini/martini)就是通过依赖注入技术进行中间件的实现,例如使用 martini 框架搭建的 http 的服务器如下:
package main

import "github.com/go-martini/martini"

func main() {
    m := martini.Classic()
    m.Get("/", func() string {
        return "Hello world!"
    })
    m.Run()
}
第 7 行,响应路径/的代码使用一个闭包实现。如果希望获得 Go语言中提供的请求和响应接口,可以直接修改为:
m.Get("/", func(res http.ResponseWriter, req *http.Request) string {
    // 响应处理代码……
})
martini 的底层会自动通过识别 Get 获得的闭包参数情况,通过动态反射调用这个函数并传入需要的参数。martini 的设计广受好评,但同时也有人指出,其运行效率较低。其中最主要的因素是大量使用了反射。

虽然一般情况下,I/O 的延迟远远大于反射代码所造成的延迟。但是,更低的响应速度和更低的 CPU 占用依然是 Web 服务器追求的目标。因此,反射在带来灵活性的同时,也带上了性能低下的桎梏。

要用好反射这把双刃剑,就需要详细了解反射的性能。下面的一些基准测试从多方面对比了原生调用和反射调用的区别。

1) 结构体成员赋值对比

反射经常被使用在结构体上,因此结构体的成员访问性能就成为了关注的重点。下面例子中使用一个被实例化的结构体,访问它的成员,然后使用 Go语言的基准化测试可以迅速测试出结果。

反射性能测试的完整代码位于./src/chapter12/reflecttest/reflect_test.go,下面是对各个部分的详细说明。
本套教程所有源码下载地址:https://pan.baidu.com/s/1ORFVTOLEYYqDhRzeq0zIiQ    提取密码:hfyf
原生结构体的赋值过程:
// 声明一个结构体, 拥有一个字段
type data struct {
    Hp int
}

func BenchmarkNativeAssign(b *testing.B) {

    // 实例化结构体
    v := data{Hp: 2}

    // 停止基准测试的计时器
    b.StopTimer()
    // 重置基准测试计时器数据
    b.ResetTimer()

    // 重新启动基准测试计时器
    b.StartTimer()

    // 根据基准测试数据进行循环测试
    for i := 0; i < b.N; i++ {

        // 结构体成员赋值测试
        v.Hp = 3
    }

}
代码说明如下:
  • 第 2 行,声明一个普通结构体,拥有一个成员变量。
  • 第 6 行,使用基准化测试的入口。
  • 第 9 行,实例化 data 结构体,并给 Hp 成员赋值。
  • 第 12~17 行,由于测试的重点必须放在赋值上,因此需要极大程度地降低其他代码的干扰,于是在赋值完成后,将基准测试的计时器复位并重新开始。
  • 第 20 行,将基准测试提供的测试数量用于循环中。
  • 第 23 行,测试的核心代码:结构体赋值。

接下来的代码分析使用反射访问结构体成员并赋值的过程。
func BenchmarkReflectAssign(b *testing.B) {

    v := data{Hp: 2}

    // 取出结构体指针的反射值对象并取其元素
    vv := reflect.ValueOf(&v).Elem()

    // 根据名字取结构体成员
    f := vv.FieldByName("Hp")

    b.StopTimer()
    b.ResetTimer()
    b.StartTimer()

    for i := 0; i < b.N; i++ {

        // 反射测试设置成员值性能
        f.SetInt(3)
    }
}
代码说明如下:
  • 第 6 行,取v的地址并转为反射值对象。此时值对象里的类型为 *data,使用值的 Elem() 方法取元素,获得 data 的反射值对象。
  • 第 9 行,使用 FieldByName() 根据名字取出成员的反射值对象。
  • 第 11~13 行,重置基准测试计时器。
  • 第 18 行,使用反射值对象的 SetInt() 方法,给 data 结构的Hp字段设置数值 3。

这段代码中使用了反射值对象的 SetInt() 方法,这个方法的源码如下:
func (v Value) SetInt(x int64) {
    v.mustBeAssignable()
    switch k := v.kind(); k {
    default:
        panic(&ValueError{"reflect.Value.SetInt", v.kind()})
    case Int:
        *(*int)(v.ptr) = int(x)
    case Int8:
        *(*int8)(v.ptr) = int8(x)
    case Int16:
        *(*int16)(v.ptr) = int16(x)
    case Int32:
        *(*int32)(v.ptr) = int32(x)
    case Int64:
        *(*int64)(v.ptr) = x
    }
}
可以发现,整个设置过程都是指针转换及赋值,没有遍历及内存操作等相对耗时的算法。

2) 结构体成员搜索并赋值对比

func BenchmarkReflectFindFieldAndAssign(b *testing.B) {

    v := data{Hp: 2}

    vv := reflect.ValueOf(&v).Elem()

    b.StopTimer()
    b.ResetTimer()
    b.StartTimer()

    for i := 0; i < b.N; i++ {

        // 测试结构体成员的查找和设置成员的性能
        vv.FieldByName("Hp").SetInt(3)
    }

}
这段代码将反射值对象的 FieldByName() 方法与 SetInt() 方法放在循环里进行检测,主要对比测试 FieldByName() 方法对性能的影响。FieldByName() 方法源码如下:
func (v Value) FieldByName(name string) Value {
    v.mustBe(Struct)
    if f, ok := v.typ.FieldByName(name); ok {
        return v.FieldByIndex(f.Index)
    }
    return Value{}
}
底层代码说明如下:
  • 第 3 行,通过名字查询类型对象,这里有一次遍历过程。
  • 第 4 行,找到类型对象后,使用 FieldByIndex() 继续在值中查找,这里又是一次遍历。

经过底层代码分析得出,随着结构体字段数量和相对位置的变化,FieldByName() 方法比较严重的低效率问题。

3) 调用函数对比

反射的函数调用,也是使用反射中容易忽视的性能点,下面展示对普通函数的调用过程。
// 一个普通函数
func foo(v int) {

}

func BenchmarkNativeCall(b *testing.B) {

    for i := 0; i < b.N; i++ {
        // 原生函数调用
        foo(0)
    }
}

func BenchmarkReflectCall(b *testing.B) {

    // 取函数的反射值对象
    v := reflect.ValueOf(foo)

    b.StopTimer()
    b.ResetTimer()
    b.StartTimer()

    for i := 0; i < b.N; i++ {
        // 反射调用函数
        v.Call([]reflect.Value{reflect.ValueOf(2)})
    }
}
代码说明如下:
  • 第 2 行,一个普通的只有一个参数的函数。
  • 第 10 行,对原生函数调用的性能测试。
  • 第 17 行,根据函数名取出反射值对象。
  • 第 25 行,使用 reflect.ValueOf(2) 将 2 构造为反射值对象,因为反射函数调用的参数必须全是反射值对象,再使用 []reflect.Value 构造多个参数列表传给反射值对象的 Call() 方法进行调用。

反射函数调用的参数构造过程非常复杂,构建很多对象会造成很大的内存回收负担。Call() 方法内部就更为复杂,需要将参数列表的每个值从 reflect.Value 类型转换为内存。调用完毕后,还要将函数返回值重新转换为 reflect.Value 类型返回。因此,反射调用函数的性能堪忧。

4) 基准测试结果对比

测试结果如下:
$ go test -v -bench=.
goos: linux
goarch: amd64
BenchmarkNativeAssign-4                        2000000000               0.32 ns/op
BenchmarkReflectAssign-4                       300000000               4.42 ns/op
BenchmarkReflectFindFieldAndAssign-4           20000000               91.6 ns/op
BenchmarkNativeCall-4                          2000000000               0.33 ns/op
BenchmarkReflectCall-4                         10000000               163 ns/op
PASS
结果分析如下:
  • 第 4 行,原生的结构体成员赋值,每一步操作耗时 0.32 纳秒,这是参考基准。
  • 第 5 行,使用反射的结构体成员赋值,操作耗时 4.42 纳秒,比原生赋值多消耗 13 倍的性能。
  • 第 6 行,反射查找结构体成员且反射赋值,操作耗时 91.6 纳秒,扣除反射结构体成员赋值的 4.42 纳秒还富余,性能大概是原生的 272 倍。这个测试结果与代码分析结果很接近。SetInt 的性能可以接受,但 FieldByName() 的性能就非常低。
  • 第 7 行,原生函数调用,性能与原生访问结构体成员接近。
  • 第 8 行,反射函数调用,性能差到“爆棚”,花费了 163 纳秒,操作耗时比原生多消耗 494 倍。

经过基准测试结果的数值分析及对比,最终得出以下结论:
  • 能使用原生代码时,尽量避免反射操作。
  • 提前缓冲反射值对象,对性能有很大的帮助。
  • 避免反射函数调用,实在需要调用时,先提前缓冲函数参数列表,并且尽量少地使用返回值。

推荐文章
FTP内部命令大汇总

客户端成功登录FTP服务器后,就可以进入会话模式(ftp>)。在该模式下,不论是在Windows系统,还是UNIX操作系统,都会使用大量的FTP内部命令。 熟悉掌握每个内部命令的作用,有助于客户端与

setAttribute(Stringname,Objectobject) name:要设置的属性名称。 object:要设置的属性值,可以是任何对象。 示例 典型应用 applic

C++ return:使函数立即结束

return语句 #include usingnamespacestd; //Functionprototype voiddivide(doublearg1,doublearg2);

JS键盘事件(非常详细)

在JavaScript中,当用户操作键盘时,会触发键盘事件,键盘事件主要包括下面3种类型: keydown:在键盘上按下某个键时触发。如果按住某个键,会不断触发该事件,但是Opera浏览器不支持这

vb是一种面向对象的编程语言吗?

VB(VisualBasic)是一种面向对象的可视化程序设计语言,采取了事件驱动的编程机制;构成对象的三要素是:属性、事件和方法。VisualBasic(简称VB)是Microsoft公司开发的一种通

c++11新特性有哪些?

最近工作中,遇到一些问题,使用C++11实现起来会更加方便,而线上的生产环境还不支持C++11,于是决定新年开工后,在组内把C++11推广开来,整理以下文档,方便自己查阅,也方便同事快速上手。(对于异

C语言数据类型转换(自动类型转换+强制类型转换)

数据类型转换就是将数据(变量、数值、表达式的结果等)从一种类型转换为另一种类型。 自动类型转换 自动类型转换就是编译器默默地、隐式地、偷偷地进行的数据类型转换,这种转换不需要程序员干预,会自动发生。

C#面向对象概述

早期的程序实际上就是一连串对计算机下达的指令,例如求解第N大的质数,或联立计算若干个方程的解。 由于问题实际上都是数学问题,所以主要的矛盾在算法设计上,而变量通常都是简单的数据类型,例如整数和小数等

ctrl+p是什么快捷键?

“ctrl+p”是打印快捷键。当我们打开一个Word文档(或者excel表格)且需要打印时,就可以使用“ctrl+p”组合键,快速弹出打印窗口,然后就可以根据需求选择打印设备、页数、份数、正反面打印、

Shell数学计算(算术运算,加减乘除运算)

如果要执行算术运算(数学计算),就离不开各种运算符号,和其他编程语言类似,Shell也有很多算术运算符,下面就给大家介绍一下常见的Shell算术运算符,如下表所示。 Shell算术运算符一览表

java中synchronized和lock的区别是什么?

synchronized和lock的区别1.首先synchronized是java内置关键字,在jvm层面,Lock是个java类;2.synchronized无法判断是否获取锁的状态,Lock可以判

Java字节流和字符流的区别及如何区分输入流和输出流

本节主要讲解Java字节流和字符流的区别,以及如何区分Java输入流和输出流。 Java字节流和字符流的区别 首先我们先大概总结一下前面学习的内容,可分为以下几点: 以Stream结尾都是字节流

Qt MDI及其使用方法(详解版)

传统的应用程序设计中有多文档界面(Multi-documentInterface,MDI)应用程序,Qt为设计MDI应用程序提供了支持。 本节的实例samp6_4是一个MDI应用程序,程序运行效果如

Linux备份策略(完全备份、增量备份和差异备份)详解

常用的备份策略有完全备份和增量备份,而增量备份有可细分为累计增量备份和差异增量备份。下面来分别讲述不同备份策略以及之间的区别。 完全备份 完全备份是指把所有需要备份的数据全部备份。当然,完全备份可以

C++11完美转发及实现方法详解

C++11标准为C++引入右值引用语法的同时,还解决了一个C++98/03标准长期存在的短板,即使用简单的方式即可在函数模板中实现参数的完美转发。那么,什么是完美转发?它为什么是C++98/03标准存

C语言文件随机访问fseek()和ftell()函数

文件随机访问是指在某个文件内直接读写任何给定位置数据的能力。通过获取与设定文件位置指示符可以实现这一功能,文件位置指示符指定了文件中的当前访问位置,该文件与一个给定的流关联。 获取当前文件位置 下面

C语言rewind和fseek函数的用法详解(随机读写文件)

前面介绍的文件读写函数都是顺序读写,即读写文件只能从头开始,依次读写各个数据。但在实际开发中经常需要读写文件的中间部分,要解决这个问题,就得先移动文件内部的位置指针,再进行读写。这种读写方式称为随机读

getInitParameter(Stringname) name:获取的参数的名称。 示例

getAttribute(Stringname) name:要获取的属性名称。 示例 典型应用 session在网络术语中被称为会话。由于HTTP协议是一种无状态协议,也就是当一个客户向服

mysql中drop table是什么命令

droptable是mysql中一个用于删除数据表的命令。droptablel可以删除数据表及该表的所有数据、索引、触发器、约束和权限规范。droptable命令格式:droptable;例如,删除表