From e9987fe2c77ef97c6a48e06c78e2b3fff717181f Mon Sep 17 00:00:00 2001 From: Yang Libin Date: Mon, 31 Aug 2020 09:07:25 +0800 Subject: [PATCH] =?UTF-8?q?Update=20FastThreadLocal=E6=BA=90=E7=A0=81?= =?UTF-8?q?=E5=88=86=E6=9E=90.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../FastThreadLocal源码分析.md | 267 ++++++++++-------- 1 file changed, 150 insertions(+), 117 deletions(-) diff --git a/docs/Netty/Netty技术细节源码分析/FastThreadLocal源码分析.md b/docs/Netty/Netty技术细节源码分析/FastThreadLocal源码分析.md index f741d1b..e2ece3d 100644 --- a/docs/Netty/Netty技术细节源码分析/FastThreadLocal源码分析.md +++ b/docs/Netty/Netty技术细节源码分析/FastThreadLocal源码分析.md @@ -1,153 +1,186 @@ -# netty的FastThreadLocal源码解析 -该文中涉及到的netty源码版本为4.1.6。 -## netty的FastThreadLocal是什么 -> A special variant of ThreadLocal that yields higher access performance when accessed from a FastThreadLocalThread. -Internally, a FastThreadLocal uses a constant index in an array, instead of using hash code and hash table, to look for a variable. Although seemingly very subtle, it yields slight performance advantage over using a hash table, and it is useful when accessed frequently. -To take advantage of this thread-local variable, your thread must be a FastThreadLocalThread or its subtype. By default, all threads created by DefaultThreadFactory are FastThreadLocalThread due to this reason. -Note that the fast path is only possible on threads that extend FastThreadLocalThread, because it requires a special field to store the necessary state. An access by any other kind of thread falls back to a regular ThreadLocal. +# Netty 的 FastThreadLocal 源码解析 -以上是netty官方文档中关于FastThreadLocal的介绍。 +该文中涉及到的 Netty 源码版本为 4.1.6。 -简而言之,FastThreadLocal是在ThreadLocal实现上的一种变种,相比ThreadLocal内部通过将自身hash的方式在hashTable上定位需要的变量存储位置,FastThreadLocal选择在数组上的一个固定的常量位置来存放线程本地变量,这样的操作看起来并没有太大区别,但是相比ThreadLocal的确体现了性能上的优势,尤其是在读操作频繁的场景下。 +## Netty 的 FastThreadLocal 是什么 -## 如何使用FastThreadLocal -如果想要得到FastThreadLocal的速度优势,必须通过FastThreadLocalThread 或者其子类的线程,才可以使用,因为这个原因,netty的DefaultThreadFactory,其内部默认线程工厂的newThread()方法就是直接初始化一个FastThreadLocalThread ,以便期望在ThreadLocal的操作中,得到其性能上带来的优势。 -``` - protected Thread newThread(Runnable r, String name) { - return new FastThreadLocalThread(threadGroup, r, name); - } -``` +> A special variant of ThreadLocal that yields higher access performance when accessed from a FastThreadLocalThread. +> Internally, a FastThreadLocal uses a constant index in an array, instead of using hash code and hash table, to look for a variable. Although seemingly very subtle, it yields slight performance advantage over using a hash table, and it is useful when accessed frequently. +> To take advantage of this thread-local variable, your thread must be a FastThreadLocalThread or its subtype. By default, all threads created by DefaultThreadFactory are FastThreadLocalThread due to this reason. +> Note that the fast path is only possible on threads that extend FastThreadLocalThread, because it requires a special field to store the necessary state. An access by any other kind of thread falls back to a regular ThreadLocal. + +以上是 Netty 官方文档中关于 FastThreadLocal 的介绍。 + +简而言之,FastThreadLocal 是在 ThreadLocal 实现上的一种变种,相比 ThreadLocal 内部通过将自身 hash 的方式在 hashTable 上定位需要的变量存储位置,FastThreadLocal 选择在数组上的一个固定的常量位置来存放线程本地变量,这样的操作看起来并没有太大区别,但是相比 ThreadLocal 的确体现了性能上的优势,尤其是在读操作频繁的场景下。 + +## 如何使用 FastThreadLocal + +如果想要得到 FastThreadLocal 的速度优势,必须通过 FastThreadLocalThread 或者其子类的线程,才可以使用,因为这个原因,Netty 的 DefaultThreadFactory,其内部默认线程工厂的 newThread()方法就是直接初始化一个 FastThreadLocalThread ,以便期望在 ThreadLocal 的操作中,得到其性能上带来的优势。 -## FastThreadLocal的源码实现 -### FastThreadLocal被访问的入口 -当需要用到FastThreadLocal的时候,想必和jdk原生的ThreadLocal的api类似,都是通过初始化一个新的FastThreadLocal之后,通过其set()方法初始化并放入一个变量作为线程本地变量存储。 +```java +protected Thread newThread(Runnable r, String name) { + return new FastThreadLocalThread(threadGroup, r, name); +} ``` - public final void set(V value) { - if (value != InternalThreadLocalMap.UNSET) { - set(InternalThreadLocalMap.get(), value); - } else { - remove(); - } + +## FastThreadLocal 的源码实现 + +### FastThreadLocal 被访问的入口 + +当需要用到 FastThreadLocal 的时候,想必和 jdk 原生的 ThreadLocal 的 api 类似,都是通过初始化一个新的 FastThreadLocal 之后,通过其 set()方法初始化并放入一个变量作为线程本地变量存储。 + +```java +public final void set(V value) { + if (value != InternalThreadLocalMap.UNSET) { + set(InternalThreadLocalMap.get(), value); + } else { + remove(); } +} ``` -因此,在FastThreadLocal的set()方法中,可以看到,存储本地线程变量的数据结构是一个InternalThreadLocalMap。 -``` - private InternalThreadLocalMap threadLocalMap; -``` -在FastThreadLocalThread 中,因为本身threadLocalMap就是其中的一个成员,能够快速得到返回。而其他线程实现,就将面临没有这个成员的尴尬,netty也给出了相应的兼容。 + +因此,在 FastThreadLocal 的 set()方法中,可以看到,存储本地线程变量的数据结构是一个 InternalThreadLocalMap。 + +```java +private InternalThreadLocalMap threadLocalMap; ``` - public static InternalThreadLocalMap get() { - Thread thread = Thread.currentThread(); - if (thread instanceof FastThreadLocalThread) { - return fastGet((FastThreadLocalThread) thread); - } else { - return slowGet(); - } + +在 FastThreadLocalThread 中,因为本身 threadLocalMap 就是其中的一个成员,能够快速得到返回。而其他线程实现,就将面临没有这个成员的尴尬,Netty 也给出了相应的兼容。 + +```java +public static InternalThreadLocalMap get() { + Thread thread = Thread.currentThread(); + if (thread instanceof FastThreadLocalThread) { + return fastGet((FastThreadLocalThread) thread); + } else { + return slowGet(); } +} ``` -InternalThreadLocalMap的get()方法中,当前线程如果是FastThreadLocalThread 或是其子类的实现,变直接返回其InternalThreadLocalMap进行操作,但对于不属于上述条件的线程,netty通过slowGet()的方式,也将返回一个InternalThreadLocalMap。 -``` - private static InternalThreadLocalMap slowGet() { - ThreadLocal slowThreadLocalMap = UnpaddedInternalThreadLocalMap.slowThreadLocalMap; - InternalThreadLocalMap ret = slowThreadLocalMap.get(); - if (ret == null) { - ret = new InternalThreadLocalMap(); - slowThreadLocalMap.set(ret); - } - return ret; + +InternalThreadLocalMap 的 get()方法中,当前线程如果是 FastThreadLocalThread 或是其子类的实现,变直接返回其 InternalThreadLocalMap 进行操作,但对于不属于上述条件的线程,Netty 通过 slowGet()的方式,也将返回一个 InternalThreadLocalMap。 + +```java +private static InternalThreadLocalMap slowGet() { + ThreadLocal slowThreadLocalMap = UnpaddedInternalThreadLocalMap.slowThreadLocalMap; + InternalThreadLocalMap ret = slowThreadLocalMap.get(); + if (ret == null) { + ret = new InternalThreadLocalMap(); + slowThreadLocalMap.set(ret); } + return ret; +} ``` -在slowGet()方法中,当前线程对应的InternalThreadLocalMap会通过原生jdk下ThreadLocal的方式存储并通过ThreadLocal返回,因此,在这个场景下,使用的还是jdk原生的ThreadLocal,但是只占用了原生ThreadLocal下的Entry[]数组的一个位置,具体的变量还是存放在专门为FastThreadLocal服务的InternalThreadLocalMap中。 -在此,随着InternalThreadLocalMap的得到并返回,针对FastThreadLocal的get和set操作,也将变为操作InternalThreadLocalMap来达到目的,FastThreadLocal性能优越的原因,也在InternalThreadLocalMap当中。 -### InternalThreadLocalMap的内部构造 -``` - static final AtomicInteger nextIndex = new AtomicInteger(); +在 slowGet()方法中,当前线程对应的 InternalThreadLocalMap 会通过原生 jdk 下 ThreadLocal 的方式存储并通过 ThreadLocal 返回,因此,在这个场景下,使用的还是 jdk 原生的 ThreadLocal,但是只占用了原生 ThreadLocal 下的 Entry[]数组的一个位置,具体的变量还是存放在专门为 FastThreadLocal 服务的 InternalThreadLocalMap 中。 +在此,随着 InternalThreadLocalMap 的得到并返回,针对 FastThreadLocal 的 get 和 set 操作,也将变为操作 InternalThreadLocalMap 来达到目的,FastThreadLocal 性能优越的原因,也在 InternalThreadLocalMap 当中。 - Object[] indexedVariables; -``` -InternalThreadlocalMap主要由以上两个成员组成,其中indexedVariables作为一个Object[]数组,直接用来存放FastThreadLocal对应的value,每个FastThreadLocal对象都会在相应的线程的ThreadLocalMap中被分配到对应的index,而这里的具体下标,则由以上的nextIndex成员在每个FastThreadLocal初始化的时候分配。 -``` - private final int index; +### InternalThreadLocalMap 的内部构造 - public FastThreadLocal() { - index = InternalThreadLocalMap.nextVariableIndex(); - } -``` -每个FastThreadLocal在构造方法的过程中,都会通过InternalThreadlocalMap的nextVariableIndex()返回nextIndex 自加后的结果作为其在InternalThreadlocalMap上的下标。后续该FastThreadLocal在操作变量的时候可以直接通过该index定位到Object[]数组上的位置。 -``` - private static final int variablesToRemoveIndex = InternalThreadLocalMap.nextVariableIndex(); +```java +static final AtomicInteger nextIndex = new AtomicInteger(); + +Object[] indexedVariables; ``` -而数组上的下标有一个特殊位,一般在其首位也就是0的位置,这个位置在FastThreadLocal类被加载的时候作为静态变量被设置。在这个位置上,存放的是一个FastThreadLocal对象集合,每个存放到InternalThreadlocalMap中的FastThreadLocal都会被保存在首位的集合中。 + +InternalThreadlocalMap 主要由以上两个成员组成,其中 indexedVariables 作为一个 Object[]数组,直接用来存放 FastThreadLocal 对应的 value,每个 FastThreadLocal 对象都会在相应的线程的 ThreadLocalMap 中被分配到对应的 index,而这里的具体下标,则由以上的 nextIndex 成员在每个 FastThreadLocal 初始化的时候分配。 + +```java +private final int index; + +public FastThreadLocal() { + index = InternalThreadLocalMap.nextVariableIndex(); +} ``` - public static final Object UNSET = new Object(); + +每个 FastThreadLocal 在构造方法的过程中,都会通过 InternalThreadlocalMap 的 nextVariableIndex()返回 nextIndex 自加后的结果作为其在 InternalThreadlocalMap 上的下标。后续该 FastThreadLocal 在操作变量的时候可以直接通过该 index 定位到 Object[]数组上的位置。 + +```java +private static final int variablesToRemoveIndex = InternalThreadLocalMap.nextVariableIndex(); ``` -另外,为了具体区分保存的变量是null还是不存在当前变量,InternalThreadLocalMap中定义了一个为NULL的成员变量,以便区分上述情况,在一开始,InternalThreadLocalMap中的indexedVariables数组都是NULL。 -### FastThreadLocal的set()方法的源码分析 -相比FastThreadLocal的set操作,get方法的过程与逻辑都要简单的多,因此此处主要以其set方法为主。 +而数组上的下标有一个特殊位,一般在其首位也就是 0 的位置,这个位置在 FastThreadLocal 类被加载的时候作为静态变量被设置。在这个位置上,存放的是一个 FastThreadLocal 对象集合,每个存放到 InternalThreadlocalMap 中的 FastThreadLocal 都会被保存在首位的集合中。 + +```java +public static final Object UNSET = new Object(); ``` - public final void set(V value) { - if (value != InternalThreadLocalMap.UNSET) { - set(InternalThreadLocalMap.get(), value); - } else { - remove(); - } + +另外,为了具体区分保存的变量是 null 还是不存在当前变量,InternalThreadLocalMap 中定义了一个为 NULL 的成员变量,以便区分上述情况,在一开始,InternalThreadLocalMap 中的 indexedVariables 数组都是 NULL。 + +### FastThreadLocal 的 set()方法的源码分析 + +相比 FastThreadLocal 的 set 操作,get 方法的过程与逻辑都要简单的多,因此此处主要以其 set 方法为主。 + +```java +public final void set(V value) { + if (value != InternalThreadLocalMap.UNSET) { + set(InternalThreadLocalMap.get(), value); + } else { + remove(); } +} - public final void set(InternalThreadLocalMap threadLocalMap, V value) { - if (value != InternalThreadLocalMap.UNSET) { - if (threadLocalMap.setIndexedVariable(index, value)) { - addToVariablesToRemove(threadLocalMap, this); - } - } else { - remove(threadLocalMap); +public final void set(InternalThreadLocalMap threadLocalMap, V value) { + if (value != InternalThreadLocalMap.UNSET) { + if (threadLocalMap.setIndexedVariable(index, value)) { + addToVariablesToRemove(threadLocalMap, this); } + } else { + remove(threadLocalMap); } +} ``` -在其set()方法中,首先会判断set的值是否是InternalThreadLocalMap中的NULL对象来判断是set操作还是remove操作,如果不是,会通过InternalThreadLocalMap.get()方法获取当前线程对应的InternalThreadLocalMap,获取的过程在前文已经描述过。 + +在其 set()方法中,首先会判断 set 的值是否是 InternalThreadLocalMap 中的 NULL 对象来判断是 set 操作还是 remove 操作,如果不是,会通过 InternalThreadLocalMap.get()方法获取当前线程对应的 InternalThreadLocalMap,获取的过程在前文已经描述过。 之后的主要流程主要分为两步: -- 调用InternalThreadLocalMap的setIndexedVariable()方法,将该FastThreadLocal成员在构造方法中获得到的InternalThreadLocalMap上的下标作为入参传入。 -``` - public boolean setIndexedVariable(int index, Object value) { - Object[] lookup = indexedVariables; - if (index < lookup.length) { - Object oldValue = lookup[index]; - lookup[index] = value; - return oldValue == UNSET; - } else { - expandIndexedVariableTableAndSet(index, value); - return true; - } + +- 调用 InternalThreadLocalMap 的 setIndexedVariable()方法,将该 FastThreadLocal 成员在构造方法中获得到的 InternalThreadLocalMap 上的下标作为入参传入。 + +```java +public boolean setIndexedVariable(int index, Object value) { + Object[] lookup = indexedVariables; + if (index < lookup.length) { + Object oldValue = lookup[index]; + lookup[index] = value; + return oldValue == UNSET; + } else { + expandIndexedVariableTableAndSet(index, value); + return true; } +} ``` -在InternalThreadLocalMap的setIndexedVariable()方法过程中,set的过程并不复杂,找到对应的下标,并将对应的值放到InternalThreadLocalMap数组下标对应的位置上即宣告结束。但是,因为FastThreadLocal在构造过程中虽然预先获得了对应的下标,但是实际上的数组大小可能完全还没有达到相应的大小,就要在此处通过expandIndexedVariableTableAndSet()方法进行扩容,由于是数组的缘故,只需要扩容后将原来的值复制过去,并将剩余的值用NULL对象填满即可。 -- 如果上一步set成功,通过addToVariablesToRemove()方法将该FastThreadLocal对象放入到InternalThreadLocalMap的数组中的首位集合中。在这个集合中,对于FastThreadLocal是一个强引用。 -这样,对于FastThreadLocal的一次set操作即宣告结束。 +在 InternalThreadLocalMap 的 setIndexedVariable()方法过程中,set 的过程并不复杂,找到对应的下标,并将对应的值放到 InternalThreadLocalMap 数组下标对应的位置上即宣告结束。但是,因为 FastThreadLocal 在构造过程中虽然预先获得了对应的下标,但是实际上的数组大小可能完全还没有达到相应的大小,就要在此处通过 expandIndexedVariableTableAndSet()方法进行扩容,由于是数组的缘故,只需要扩容后将原来的值复制过去,并将剩余的值用 NULL 对象填满即可。 -## 相比ThreadLocal,FastThreadLocal到底快在哪里 -- FastThreadLocal在具体的定位的过程中,只需要根据在构造方法里获取得到的具体下标就可以定位到具体的数组位置进行变量的存取,而在jdk原生的ThreadLocal中,具体位置的下标获取不仅需要计算ThreadLocal的hash值,并需要在hashTable上根据key定位的结果,一旦定位之后的结果上已经存在其他ThreadLocal的变量,那么则是通过线性探测法,在hashTable上寻找下一个位置进行,相比FastThreadLocal定位的过程要复杂的多。 -- FastThreadLocal由于采取数组的方式,当面对扩容的时候,只需要将原数组中的内容复制过去,并用NULL对象填满剩余位置即可,而在ThreadLocal中,由于hashTable的缘故,在扩容后还需要进行一轮rehash,在这过程中,仍旧存在hash冲突的可能。 -- 在FastThreadLocal中,遍历当前线程的所有本地变量,只需要将数组首位的集合即可,不需要遍历数组上的每一个位置。 -- 在原生的ThreadLocal中,由于可能存在ThreadLocal被回收,但是当前线程仍旧存活的情况导致ThreadLocal对应的本地变量内存泄漏的问题,因此在ThreadLocal的每次操作后,都会进行启发式的内存泄漏检测,防止这样的问题产生,但也在每次操作后花费了额外的开销。而在FastThreadLocal的场景下,由于数组首位的FastThreadLocal集合中保持着所有FastThreadLocal对象的引用,因此当外部的FastThreadLocal的引用被置为null,该FastThreadLocal对象仍旧保持着这个集合的引用,不会被回收掉,只需要在线程当前业务操作后,手动调用FastThreadLocal的removeAll()方法,将会遍历数组首位集合,回收掉所有FastThreadLocal的变量,避免内存泄漏的产生,也减少了原生ThreadLocal的启发式检测开销。 -``` - private static final class DefaultRunnableDecorator implements Runnable { +- 如果上一步 set 成功,通过 addToVariablesToRemove()方法将该 FastThreadLocal 对象放入到 InternalThreadLocalMap 的数组中的首位集合中。在这个集合中,对于 FastThreadLocal 是一个强引用。 - private final Runnable r; +这样,对于 FastThreadLocal 的一次 set 操作即宣告结束。 - DefaultRunnableDecorator(Runnable r) { - this.r = r; - } +## 相比 ThreadLocal,FastThreadLocal 到底快在哪里 - @Override - public void run() { - try { - r.run(); - } finally { - FastThreadLocal.removeAll(); - } +- FastThreadLocal 在具体的定位的过程中,只需要根据在构造方法里获取得到的具体下标就可以定位到具体的数组位置进行变量的存取,而在 jdk 原生的 ThreadLocal 中,具体位置的下标获取不仅需要计算 ThreadLocal 的 hash 值,并需要在 hashTable 上根据 key 定位的结果,一旦定位之后的结果上已经存在其他 ThreadLocal 的变量,那么则是通过线性探测法,在 hashTable 上寻找下一个位置进行,相比 FastThreadLocal 定位的过程要复杂的多。 +- FastThreadLocal 由于采取数组的方式,当面对扩容的时候,只需要将原数组中的内容复制过去,并用 NULL 对象填满剩余位置即可,而在 ThreadLocal 中,由于 hashTable 的缘故,在扩容后还需要进行一轮 rehash,在这过程中,仍旧存在 hash 冲突的可能。 +- 在 FastThreadLocal 中,遍历当前线程的所有本地变量,只需要将数组首位的集合即可,不需要遍历数组上的每一个位置。 +- 在原生的 ThreadLocal 中,由于可能存在 ThreadLocal 被回收,但是当前线程仍旧存活的情况导致 ThreadLocal 对应的本地变量内存泄漏的问题,因此在 ThreadLocal 的每次操作后,都会进行启发式的内存泄漏检测,防止这样的问题产生,但也在每次操作后花费了额外的开销。而在 FastThreadLocal 的场景下,由于数组首位的 FastThreadLocal 集合中保持着所有 FastThreadLocal 对象的引用,因此当外部的 FastThreadLocal 的引用被置为 null,该 FastThreadLocal 对象仍旧保持着这个集合的引用,不会被回收掉,只需要在线程当前业务操作后,手动调用 FastThreadLocal 的 removeAll()方法,将会遍历数组首位集合,回收掉所有 FastThreadLocal 的变量,避免内存泄漏的产生,也减少了原生 ThreadLocal 的启发式检测开销。 + +```java +private static final class DefaultRunnableDecorator implements Runnable { + + private final Runnable r; + + DefaultRunnableDecorator(Runnable r) { + this.r = r; + } + + @Override + public void run() { + try { + r.run(); + } finally { + FastThreadLocal.removeAll(); } } +} ``` -在netty的DefaultThreadFactory中,每个线程在执行为任务后都会调用FastThreadLocal的removeAll()方法。 \ No newline at end of file + +在 Netty 的 DefaultThreadFactory 中,每个线程在执行为任务后都会调用 FastThreadLocal 的 removeAll()方法。