Merge pull request #63 from ysde/patch-1

Update 把被说烂的BIO、NIO、AIO再从头到尾扯一遍.md
pull/65/head
Yang Libin 4 years ago committed by GitHub
commit dcac454e17
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

@ -1,38 +1,46 @@
网上关于各种IO的博文已经多到飞起如果你是大神可以跳过我这个菜鸟的拙文本博文没有什么特别NB的东西只是集百家之长并且以自己感到简单舒适的方式输出自己的理解及学习过程中的经验。 网上关于各种 IO 的博文已经多到飞起,如果你是大神,可以跳过我这个菜鸟的拙文,本博文没有什么特别 NB 的东西,只是集百家之长,并且以自己感到简单舒适的方式输出自己的理解,及学习过程中的经验。
## IO及基本概念
## IO 及基本概念
#### 1、流的概念和作用 #### 1、流的概念和作用
**流**:代表任何有能力产出数据的数据源对象或者是有能力接受数据的接收端对象。<Thinking in Java> **流**:代表任何有能力产出数据的数据源对象或者是有能力接受数据的接收端对象。<Thinking in Java>
**流的本质**:数据传输,根据数据传输特性将流抽象为各种类,方便更直观的进行数据操作。 **流的本质**:数据传输,根据数据传输特性将流抽象为各种类,方便更直观的进行数据操作。
**流的作用**:为数据源和目的地建立一个输送通道。 **流的作用**:为数据源和目的地建立一个输送通道。
Java中将输入输出抽象称为流就好像水管将两个容器连接起来。流是一组有顺序的有起点和终点的字节集合是对数据传输的总称或抽象。即数据在两设备间的传输称为流。 Java 中将输入输出抽象称为流,就好像水管,将两个容器连接起来。流是一组有顺序的,有起点和终点的字节集合,是对数据传输的总称或抽象。即数据在两设备间的传输称为流。
每个流只能是输入流或输出流的一种,不能同时具备两个功能,输入流只能进行读操作,对输出流只能进行写操作。在一个数据传输通道中,如果既要写入数据,又要读取数据,则要分别提供两个流。 每个流只能是输入流或输出流的一种,不能同时具备两个功能,输入流只能进行读操作,对输出流只能进行写操作。在一个数据传输通道中,如果既要写入数据,又要读取数据,则要分别提供两个流。
#### 2、IO模型
五种IO模型包括阻塞IO、非阻塞IO、信号驱动IO、IO多路复用、异步IO。其中前四个被称为同步IO。在网络环境下可以将IO分为两步 #### 2、IO 模型
1.等待数据到来;
2.数据搬迁。 五种 IO 模型包括:阻塞 IO、非阻塞 IO、信号驱动 IO、IO 多路复用、异步 IO。其中前四个被称为同步 IO。在网络环境下可以将 IO 分为两步: 1.等待数据到来; 2.数据搬迁。
在互联网应用中IO线程大多被阻塞在等待数据的过程中所以如果要想提高IO效率需要降低等待的时间。 在互联网应用中IO 线程大多被阻塞在等待数据的过程中,所以,如果要想提高 IO 效率,需要降低等待的时间。
##### 2.1 阻塞IOBlocking I/O
##### 2.1 阻塞 IOBlocking I/O
在内核将数据准备好之前系统调用会一直等待所有的套接字Socket默认的是阻塞方式。 在内核将数据准备好之前系统调用会一直等待所有的套接字Socket默认的是阻塞方式。
![avatar](../../../images/Netty/阻塞IO模型.png) ![avatar](../../../images/Netty/阻塞IO模型.png)
Java中的socket.read()会调用native read()而Java中的native方法会调用操作系统底层的dll而dll是C/C++编写的图中的recvfrom其实是C语言socket编程中的一个方法。所以其实我们在Java中调用socket.read()最后也会调用到图中的recvfrom方法。 Java 中的 socket.read()会调用 native read(),而 Java 中的 native 方法会调用操作系统底层的 dll而 dll 是 C/C++编写的,图中的 recvfrom 其实是 C 语言 socket 编程中的一个方法。所以其实我们在 Java 中调用 socket.read()最后也会调用到图中的 recvfrom 方法。
应用程序(也就是我们的代码)想要读取数据就会调用 recvfrom而 recvfrom 会通知 OS 来执行OS 就会判断数据报是否准备好(比如判断是否收到了一个完整的 UDP 报文,如果收到 UDP 报文不完整,那么就继续等待)。当数据包准备好了之后OS 就会将数据从内核空间拷贝到用户空间(因为我们的用户程序只能获取用户空间的内存,无法直接获取内核空间的内存)。拷贝完成之后 socket.read()就会解除阻塞,并得到 read 的结果。
应用程序(也就是我们的代码)想要读取数据就会调用recvfrom而recvfrom会通知OS来执行OS就会判断数据报是否准备好(比如判断是否收到了一个完整的UDP报文如果收到UDP报文不完整那么就继续等待)。当数据包准备好了之后OS就会将数据从内核空间拷贝到用户空间(因为我们的用户程序只能获取用户空间的内存,无法直接获取内核空间的内存)。拷贝完成之后socket.read()就会解除阻塞并得到read的结果。 BIO 中的阻塞,就是阻塞在 2 个地方:
BIO中的阻塞就是阻塞在2个地方 1. OS 等待数据报(通过网络发送过来)准备好。
1. OS等待数据报(通过网络发送过来)准备好。
2. 将数据从内核空间拷贝到用户空间。 2. 将数据从内核空间拷贝到用户空间。
在这2个时候我们的BIO程序就是占着茅坑不拉屎啥事情都不干。 在这 2 个时候,我们的 BIO 程序就是占着茅坑不拉屎,啥事情都不干。
##### 2.2 非阻塞IONoblocking I/O
##### 2.2 非阻塞 IONoblocking I/O
![avatar](../../../images/Netty/非阻塞IO模型.png) ![avatar](../../../images/Netty/非阻塞IO模型.png)
每次应用进程询问内核是否有数据报准备好当有数据报准备好时就进行拷贝数据报的操作从内核拷贝到用户空间和拷贝完成返回的这段时间应用进程是阻塞的。但在没有数据报准备好时并不会阻塞程序内核直接返回未准备就绪的信号等待应用进程的下一个轮寻。但是轮寻对于CPU来说是较大的浪费一般只有在特定的场景下才使用。 每次应用进程询问内核是否有数据报准备好,当有数据报准备好时,就进行拷贝数据报的操作,从内核拷贝到用户空间,和拷贝完成返回的这段时间,应用进程是阻塞的。但在没有数据报准备好时,并不会阻塞程序,内核直接返回未准备就绪的信号,等待应用进程的下一个轮寻。但是,轮寻对于 CPU 来说是较大的浪费,一般只有在特定的场景下才使用。
Java 的 NIO 就是采用这种方式,当我们 new 了一个 socket 后我们可以设置它是非阻塞的。比如:
Java的NIO就是采用这种方式当我们new了一个socket后我们可以设置它是非阻塞的。比如
```java ```java
// 初始化一个 serverSocketChannel // 初始化一个 serverSocketChannel
serverSocketChannel = ServerSocketChannel.open(); serverSocketChannel = ServerSocketChannel.open();
@ -41,81 +49,97 @@ serverSocketChannel.bind(new InetSocketAddress(8000));
// 即 accept()会立即得到返回 // 即 accept()会立即得到返回
serverSocketChannel.configureBlocking(false); serverSocketChannel.configureBlocking(false);
``` ```
上面的代码是设置ServerSocketChannel为非阻塞SocketChannel也可以设置。
从图中可以看到当设置为非阻塞后我们的socket.read()方法就会立即得到一个返回结果(成功 or 失败)我们可以根据返回结果执行不同的逻辑比如在失败时我们可以做一些其他的事情。但事实上这种方式也是低效的因为我们不得不使用轮询方法区一直问OS“我的数据好了没啊”。 上面的代码是设置 ServerSocketChannel 为非阻塞SocketChannel 也可以设置。
从图中可以看到,当设置为非阻塞后,我们的 socket.read()方法就会立即得到一个返回结果(成功 or 失败),我们可以根据返回结果执行不同的逻辑,比如在失败时,我们可以做一些其他的事情。但事实上这种方式也是低效的,因为我们不得不使用轮询方法区一直问 OS“我的数据好了没啊”。
**NIO 不会在 recvfrom询问数据是否准备好时阻塞但还是会在将数据从内核空间拷贝到用户空间时阻塞。一定要注意这个地方Non-Blocking 还是会阻塞的。**
**BIO 不会在recvfrom询问数据是否准备好时阻塞但还是会在将数据从内核空间拷贝到用户空间时阻塞。一定要注意这个地方Non-Blocking还是会阻塞的。** ##### 2.3 IO 多路复用I/O Multiplexing
##### 2.3 IO多路复用I/O Multiplexing
![avatar](../../../images/Netty/IO复用模型.png) ![avatar](../../../images/Netty/IO复用模型.png)
传统情况下client与server通信需要一个3个socket(客户端的socket服务端的serversocket服务端中用来和客户端通信的socket)而在IO多路复用中客户端与服务端通信需要的不是socket而是3个channel通过channel可以完成与socket同样的操作channel的底层还是使用的socket进行通信但是多个channel只对应一个socket(可能不只是一个但是socket的数量一定少于channel数量)这样仅仅通过少量的socket就可以完成更多的连接提高了client容量。 传统情况下 client 与 server 通信需要 3 个 socket(客户端的 socket服务端的 serversocket服务端中用来和客户端通信的 socket),而在 IO 多路复用中,客户端与服务端通信需要的不是 socket而是 3 channel通过 channel 可以完成与 socket 同样的操作channel 的底层还是使用的 socket 进行通信,但是多个 channel 只对应一个 socket(可能不只是一个,但是 socket 的数量一定少于 channel 数量),这样仅仅通过少量的 socket 就可以完成更多的连接,提高了 client 容量。
其中,不同的操作系统,对此有不同的实现: 其中,不同的操作系统,对此有不同的实现:
Windowsselector
Linuxepoll - Windowsselector
Mackqueue - Linuxepoll
其中epollkqueue比selector更为高效这是因为他们监听方式的不同。selector的监听是通过轮询FD_SETSIZE来问每一个socket“你改变了吗假若监听到事件那么selector就会调用相应的事件处理器进行处理。但是epoll与kqueue不同他们把socket与事件绑定在一起当监听到socket变化时立即可以调用相应的处理。 - Mackqueue
**selectorepollkqueue都属于Reactor IO设计。**
其中 epollkqueue 比 selector 更为高效这是因为他们监听方式的不同。selector 的监听是通过轮询 FD_SETSIZE 来问每一个 socket“你改变了吗假若监听到事件那么 selector 就会调用相应的事件处理器进行处理。但是 epoll 与 kqueue 不同,他们把 socket 与事件绑定在一起,当监听到 socket 变化时,立即可以调用相应的处理。
**selectorepollkqueue 都属于 Reactor IO 设计。**
##### 2.4 信号驱动Signal driven IO ##### 2.4 信号驱动Signal driven IO
![avatar](../../../images/Netty/信号驱动IO模型.png) ![avatar](../../../images/Netty/信号驱动IO模型.png)
信号驱动IO模型应用进程告诉内核当数据报准备好的时候给我发送一个信号对SIGIO信号进行捕捉并且调用我的信号处理函数来获取数据报。 信号驱动 IO 模型,应用进程告诉内核:当数据报准备好的时候,给我发送一个信号,对 SIGIO 信号进行捕捉,并且调用我的信号处理函数来获取数据报。
##### 2.5 异步IOAsynchronous I/O
##### 2.5 异步 IOAsynchronous I/O
![avatar](../../../images/Netty/异步IO模型.png) ![avatar](../../../images/Netty/异步IO模型.png)
Asynchronous IO调用中是真正的无阻塞其他IO model中多少会有点阻塞。程序发起read操作之后立刻就可以开始去做其它的事。而在内核角度当它受到一个asynchronous read之后首先它会立刻返回所以不会对用户进程产生任何block。然后kernel会等待数据准备完成然后将数据拷贝到用户内存当这一切都完成之后kernel会给用户进程发送一个signal告诉它read操作完成了。 Asynchronous IO 调用中是真正的无阻塞,其他 IO model 中多少会有点阻塞。程序发起 read 操作之后,立刻就可以开始去做其它的事。而在内核角度,当它受到一个 asynchronous read 之后,首先它会立刻返回,所以不会对用户进程产生任何 block。然后kernel 会等待数据准备完成然后将数据拷贝到用户内存当这一切都完成之后kernel 会给用户进程发送一个 signal告诉它 read 操作完成了。
可以看出,阻塞程度:阻塞 IO>非阻塞 IO>多路转接 IO>信号驱动 IO>异步 IO效率是由低到高的。
##### 2.6 Blocking IO 与 Non-Blocking IO 区别?
可以看出阻塞程度阻塞IO>非阻塞IO>多路转接IO>信号驱动IO>异步IO效率是由低到高的。 阻塞或非阻塞只涉及程序和 OSBlocking IO 会一直 block 程序直到 OS 返回,而 Non-Block IO 在 OS 内核准备数据包的情况下会立即得到返回
##### 2.6 Blocking IO 与Non-Blocking IO 区别?
阻塞或非阻塞只涉及程序和OSBlocking IO 会一直block程序直到OS返回而Non-Block IO在OS内核准备数据包的情况下会立即得到返回。
##### 2.7 Asynchronous IO 与 Synchronous IO ##### 2.7 Asynchronous IO 与 Synchronous IO
只要有block就是同步IO完全没有block则是异步IO。所以我们之前所说的Blocking IO、Non-Blocking IO、IO Multiplex均为Synchronous IO只有Asynchronous IO为异步IO。
只要有 block 就是同步 IO完全没有 block 则是异步 IO。所以我们之前所说的 Blocking IO、Non-Blocking IO、IO Multiplex均为 Synchronous IO只有 Asynchronous IO 为异步 IO。
##### 2.8 Non-Blocking IO 不是会立即返回没有阻塞吗? ##### 2.8 Non-Blocking IO 不是会立即返回没有阻塞吗?
**Non-Blocking IO在数据包准备时是非阻塞的但是在将数据从内核空间拷贝到用户空间还是会阻塞**。而Asynchronous IO则不一样当进程发起IO 操作之后就直接返回再也不理睬了由内核完成读写完成读写操作后kernel发送一个信号告诉进程说IO完成。在这整个过程中进程完全没有被block。
#### 3、IO模式Reactor与Proactor **Non-Blocking IO 在数据包准备时是非阻塞的,但是在将数据从内核空间拷贝到用户空间还是会阻塞**。而 Asynchronous IO 则不一样,当进程发起 IO 操作之后,就直接返回再也不理睬了,由内核完成读写,完成读写操作后 kernel 发送一个信号,告诉进程说 IO 完成。在这整个过程中,进程完全没有被 block。
#### 3、IO 模式Reactor 与 Proactor
##### 3.1 Reactor ##### 3.1 Reactor
Reactor(反应器)的设计是一种事件驱动思想比如Java NIO中socket过来时有四种事件
Reactor(反应器)的设计是一种事件驱动思想,比如 Java NIO 中socket 过来时有四种事件:
connectable connectable
acceptable acceptable
readable readable
writable writable
我们为每一种事件都编写一个处理器然后设置每个socket要监听哪种情况随后就可以调用对应的处理器。 我们为每一种事件都编写一个处理器,然后设置每个 socket 要监听哪种情况,随后就可以调用对应的处理器。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191121200143647.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70) ![在这里插入图片描述](https://img-blog.csdnimg.cn/20191121200143647.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70)
图中的input就可以当作socket中间的Service Hanlder&event dispatch的作用就是监听每一个socket(需要实现把socket注册进来并指定要监听哪种情况)然后给socket派发不同的事件。 图中的 input 就可以当作 socket中间的 Service Hanlder&event dispatch 的作用就是监听每一个 socket(需要实现把 socket 注册进来,并指定要监听哪种情况),然后给 socket 派发不同的事件。
##### 3.2 Proactor ##### 3.2 Proactor
![在这里插入图片描述](https://img-blog.csdnimg.cn/2019112120035031.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70) ![在这里插入图片描述](https://img-blog.csdnimg.cn/2019112120035031.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70)
Proactor与Reactor较为类似以读取数据为例 Proactor Reactor 较为类似,以读取数据为例:
**Reactor模式** **Reactor 模式**
1. 应用程序注册读就绪事件和相关联的事件处理器 1. 应用程序注册读就绪事件和相关联的事件处理器
2. 事件分离器等待事件的发生 2. 事件分离器等待事件的发生
3. 当发生 读就绪事件 的时候,事件分离器调用第一步注册的事件处理器 3. 当发生 读就绪事件 的时候,事件分离器调用第一步注册的事件处理器
4. 事件处理器首先执行实际的读取操作,然后根据读取到的内容进行进一步的处理 4. 事件处理器首先执行实际的读取操作,然后根据读取到的内容进行进一步的处理
**Proactor模式** **Proactor 模式**
1. 应用程序调用一个异步读取操作然后注册相应的事件处理器此时事件处理器不关注读取就绪事件而是关注读取完成事件这是区别于Reactor的关键。 1. 应用程序调用一个异步读取操作,然后注册相应的事件处理器,此时事件处理器不关注读取就绪事件,而是关注读取完成事件,这是区别于 Reactor 的关键。
2. 事件分离器等待读取操作完成事件 2. 事件分离器等待读取操作完成事件
3. 在事件分离器等待读取操作完成的时候操作系统调用内核线程完成读取操作异步IO都是操作系统负责将数据读写到应用传递进来的缓冲区供应用程序操作操作系统扮演了重要角色并将读取的内容放入用户传递过来的缓存区中。这也是区别于Reactor的一点Proactor中应用程序需要传递缓存区。 3. 在事件分离器等待读取操作完成的时候,操作系统调用内核线程完成读取操作(异步 IO 都是操作系统负责将数据读写到应用传递进来的缓冲区供应用程序操作,操作系统扮演了重要角色),并将读取的内容放入用户传递过来的缓存区中。这也是区别于 Reactor 的一点Proactor 中,应用程序需要传递缓存区。
4. 事件分离器捕获到读取完成事件后,激活应用程序注册的事件处理器,事件处理器直接从缓存区读取数据,而不需要进行实际的读取操作。 4. 事件分离器捕获到读取完成事件后,激活应用程序注册的事件处理器,事件处理器直接从缓存区读取数据,而不需要进行实际的读取操作。
**区别** **区别**
Reactor中监听是否有可读或可写事件然后读/写操作是由程序进行的。而Proactor中直接监听读/写操作是否完成,也就是说读/写操作是否OS来完成并将读写数据放入一个缓冲区提供给程序。 Reactor 中,监听是否有可读或可写事件,然后读/写操作是由程序进行的。而 Proactor 中,直接监听读/写操作是否完成,也就是说读/写操作是否 OS 来完成,并将读写数据放入一个缓冲区提供给程序。
#### 4、同步与异步阻塞与非阻塞 #### 4、同步与异步阻塞与非阻塞
同步/异步(描述网络通信模式,适用于请求-响应模型) 同步/异步(描述网络通信模式,适用于请求-响应模型)
同步:发送方发送请求后,需要等待接收响应,否则将一直等待 同步:发送方发送请求后,需要等待接收响应,否则将一直等待
异步发送方发送请求后不需要等待响应可以继续发送下一个请求或者主动挂起线程并释放CPU 异步:发送方发送请求后,不需要等待响应,可以继续发送下一个请求,或者主动挂起线程并释放 CPU
阻塞/非阻塞(描述进程的函数调用方式) 阻塞/非阻塞(描述进程的函数调用方式)
阻塞IO 调用会一直阻塞,直至结果返回才能继续执行 阻塞IO 调用会一直阻塞,直至结果返回才能继续执行
@ -123,15 +147,17 @@ Reactor中监听是否有可读或可写事件然后读/写操作是由程
总结,同步异步和阻塞非阻塞是两个不同的概念,用简单的数据库查询来举一个例子: 总结,同步异步和阻塞非阻塞是两个不同的概念,用简单的数据库查询来举一个例子:
如果发送一个请求,需要等待数据库响应,否则将一直等待,这就是同步 如果发送一个请求,需要等待数据库响应,否则将一直等待,这就是同步
如果发送一个请求,不需要数据库响应,就可以继续发送下一个请求(NIO模式、回调通知模式)或者主动将任务插入队列中主动挂起线程并释放CPU(异步队列模式),这就是异步 如果发送一个请求,不需要数据库响应,就可以继续发送下一个请求(NIO 模式、回调通知模式),或者主动将任务插入队列中,主动挂起线程并释放 CPU(异步队列模式),这就是异步
一般来说,同步是最简单的编程方式,而异步编程虽然需要一定技术,但是却能提升系统性能。对于阻塞与非阻塞,阻塞的实时响应性更好,但在高并发情况下阻塞线程数会急剧增加,导致大量的上下文切换会引起挂起/唤醒线程的性能损耗,而非阻塞的性能吞吐量更高,但由于其是顺序执行每一个事件,一旦处理某一个事件过久,会影响后续事件的处理,因此实时响应性较差。 一般来说,同步是最简单的编程方式,而异步编程虽然需要一定技术,但是却能提升系统性能。对于阻塞与非阻塞,阻塞的实时响应性更好,但在高并发情况下阻塞线程数会急剧增加,导致大量的上下文切换会引起挂起/唤醒线程的性能损耗,而非阻塞的性能吞吐量更高,但由于其是顺序执行每一个事件,一旦处理某一个事件过久,会影响后续事件的处理,因此实时响应性较差。
## Java中的BIO ## Java 中的 BIO
#### 传统Socket阻塞案例代码
#### 传统 Socket 阻塞案例代码
```java ```java
public class TraditionalSocketDemo { public class TraditionalSocketDemo {
public static void main(String[] args) throws IOException { public static void main(String[] args) throws IOException {
ServerSocket serverSocket = new ServerSocket(7777); ServerSocket serverSocket = new ServerSocket(7777);
System.out.println("服务端启动..."); System.out.println("服务端启动...");
@ -158,11 +184,14 @@ public class TraditionalSocketDemo {
} }
} }
``` ```
在debugger代码的过程中会发现服务端启动只有当客户端就绪后才进行下一步操作如果客户端没有就绪线程阻塞客户端发送请求程序才继续往下执行如果客户端没有发出请求线程阻塞**上面的代码有两个阻塞点**
1. **等待客户端就绪** 在 debugger 代码的过程中会发现,服务端启动,只有当客户端就绪后才进行下一步操作(如果客户端没有就绪,线程阻塞),客户端发送请求,程序才继续往下执行,如果客户端没有发出请求,线程阻塞;**上面的代码有两个阻塞点**
2. **等待OS将数据从内核拷贝到用户空间应用程序可以操作的内存空间**
#### 传统bio多线程版本 1. **等待客户端就绪**
2. **等待 OS 将数据从内核拷贝到用户空间(应用程序可以操作的内存空间)**
#### 传统 bio 多线程版本
```java ```java
public class TraditionalSocketDemo2 { public class TraditionalSocketDemo2 {
@ -201,40 +230,51 @@ public class TraditionalSocketDemo2 {
} }
} }
``` ```
能够解决传统的BIO问题但是会出现多少个客户端多少个线程请求和线程的个数1:1关系操作系统资源耗尽服务端挂了。使用线程池虽然能控制服务线程的数量但应对高并发量的访问时依然会导致大量线程处于阻塞状态严重影响服务效率。
## Java中的NIO
NIO是一种基于通道和缓冲区的I/O方式它可以使用Native函数库直接分配堆外内存区别于JVM的运行时数据区然后通过一个存储在java堆里面的DirectByteBuffer对象作为这块内存的直接引用进行操作。这样能在一些场景显著提高性能因为避免了在Java堆和Native堆中来回复制数据。
#### 1、Java NIO组件 能够解决传统的 BIO 问题,但是会出现:多少个客户端多少个线程,请求和线程的个数 1:1 关系;操作系统资源耗尽,服务端挂了。使用线程池虽然能控制服务线程的数量,但应对高并发量的访问时,依然会导致大量线程处于阻塞状态,严重影响服务效率。
NIO主要有三大核心部分Channel(通道)Buffer(缓冲区), Selector选择器。传统IO是基于字节流和字符流进行操作基于流而NIO基于Channel和Buffer(缓冲区)进行操作数据总是从通道读取到缓冲区中或者从缓冲区写入到通道中。Selector(选择区)用于监听多个通道的事件(比如:连接打开,数据到达)。因此,单个线程可以监听多个数据通道。
## Java 中的 NIO
NIO 是一种基于通道和缓冲区的 I/O 方式,它可以使用 Native 函数库直接分配堆外内存(区别于 JVM 的运行时数据区),然后通过一个存储在 java 堆里面的 DirectByteBuffer 对象作为这块内存的直接引用进行操作。这样能在一些场景显著提高性能,因为避免了在 Java 堆和 Native 堆中来回复制数据。
#### 1、Java NIO 组件
NIO 主要有三大核心部分Channel(通道)Buffer(缓冲区), Selector选择器。传统 IO 是基于字节流和字符流进行操作(基于流),而 NIO 基于 Channel 和 Buffer(缓冲区)进行操作数据总是从通道读取到缓冲区中或者从缓冲区写入到通道中。Selector(选择区)用于监听多个通道的事件(比如:连接打开,数据到达)。因此,单个线程可以监听多个数据通道。
##### 1.1 Buffer ##### 1.1 Buffer
Buffer缓冲区是一个用于存储特定基本类型数据的容器。除了boolean外其余每种基本类型都有一个对应的buffer类。Buffer类的子类有ByteBuffer, CharBuffer, DoubleBuffer, FloatBuffer, IntBuffer, LongBuffer, ShortBuffer 。
Buffer缓冲区是一个用于存储特定基本类型数据的容器。除了 boolean 外,其余每种基本类型都有一个对应的 buffer 类。Buffer 类的子类有 ByteBuffer, CharBuffer, DoubleBuffer, FloatBuffer, IntBuffer, LongBuffer, ShortBuffer 。
##### 1.2 Channel ##### 1.2 Channel
Channel通道表示到实体如硬件设备、文件、**网络套接字**或可以执行一个或多个不同 I/O 操作如读取或写入的程序组件的开放的连接。Channel接口的常用实现类有FileChannel对应文件IO、DatagramChannel对应UDP、SocketChannel和ServerSocketChannel对应TCP的客户端和服务器端。**Channel和IO中的Stream(流)是差不多一个等级的。只不过Stream是单向的譬如InputStream, OutputStream.而Channel是双向的既可以用来进行读操作又可以用来进行写操作**。
Channel通道表示到实体如硬件设备、文件、**网络套接字**或可以执行一个或多个不同 I/O 操作如读取或写入的程序组件的开放的连接。Channel 接口的常用实现类有 FileChannel对应文件 IO、DatagramChannel对应 UDP、SocketChannel 和 ServerSocketChannel对应 TCP 的客户端和服务器端)。**Channel 和 IO 中的 Stream(流)是差不多一个等级的。只不过 Stream 是单向的譬如InputStream, OutputStream.而 Channel 是双向的,既可以用来进行读操作,又可以用来进行写操作**。
##### 1.3 Selector ##### 1.3 Selector
Selector选择器用于监听多个通道的事件比如连接打开数据到达。因此单个的线程可以监听多个数据通道。即用选择器借助单一线程就可对数量庞大的活动I/O通道实施监控和维护。
写就绪相对有一点特殊一般来说你不应该注册写事件。写操作的就绪条件为底层缓冲区有空闲空间而写缓冲区绝大部分时间都是有空闲空间的所以当你注册写事件后写操作一直是就绪的选择处理线程全占用整个CPU资源。所以只有当你确实有数据要写时再注册写操作并在写完以后马上取消注册。 Selector选择器用于监听多个通道的事件比如连接打开数据到达。因此单个的线程可以监听多个数据通道。即用选择器借助单一线程就可对数量庞大的活动 I/O 通道实施监控和维护。
写就绪相对有一点特殊,一般来说,你不应该注册写事件。写操作的就绪条件为底层缓冲区有空闲空间,而写缓冲区绝大部分时间都是有空闲空间的,所以当你注册写事件后,写操作一直是就绪的,选择处理线程全占用整个 CPU 资源。所以,只有当你确实有数据要写时再注册写操作,并在写完以后马上取消注册。
基于阻塞式I/O的多线程模型中Server为每个Client连接创建一个处理线程每个处理线程阻塞式等待可能达到的数据一旦数据到达则立即处理请求、返回处理结果并再次进入等待状态。由于每个Client连接有一个单独的处理线程为其服务因此可保证良好的响应时间。但当系统负载增大并发请求增多Server端需要的线程数会增加对于操作系统来说线程之间上下文切换的开销很大而且每个线程都要占用系统的一些资源如内存。因此使用的线程越少越好。 基于阻塞式 I/O 的多线程模型中Server 为每个 Client 连接创建一个处理线程,每个处理线程阻塞式等待可能达到的数据,一旦数据到达,则立即处理请求、返回处理结果并再次进入等待状态。由于每个 Client 连接有一个单独的处理线程为其服务因此可保证良好的响应时间。但当系统负载增大并发请求增多Server 端需要的线程数会增加,对于操作系统来说,线程之间上下文切换的开销很大,而且每个线程都要占用系统的一些资源(如内存)。因此,使用的线程越少越好。
但是现代的操作系统和CPU在多任务方面表现的越来越好所以多线程的开销随着时间的推移变得越来越小了。实际上如果一个CPU有多个内核不使用多任务可能是在浪费CPU能力。 但是,现代的操作系统和 CPU 在多任务方面表现的越来越好,所以多线程的开销随着时间的推移,变得越来越小了。实际上,如果一个 CPU 有多个内核,不使用多任务可能是在浪费 CPU 能力。
传统的IO处理方式一个线程处理一个网络连接 传统的 IO 处理方式,一个线程处理一个网络连接
![在这里插入图片描述](https://img-blog.csdnimg.cn/2019112120352588.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70) ![在这里插入图片描述](https://img-blog.csdnimg.cn/2019112120352588.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70)
NIO处理方式一个线程可以管理过个网络连接 NIO 处理方式,一个线程可以管理过个网络连接
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191121203602279.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70) ![在这里插入图片描述](https://img-blog.csdnimg.cn/20191121203602279.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MDM4Mzk2,size_16,color_FFFFFF,t_70)
#### 2、NIO服务器端如何实现非阻塞 #### 2、NIO 服务器端如何实现非阻塞?
服务器上所有Channel需要向Selector注册而Selector则负责监视这些Socket的IO状态(观察者)当其中任意一个或者多个Channel具有可用的IO操作时该Selector的select()方法将会返回大于0的整数该整数值就表示该Selector上有多少个Channel具有可用的IO操作并提供了selectedKeys方法来返回这些Channel对应的SelectionKey集合(一个SelectionKey对应一个就绪的通道)。正是通过Selector使得服务器端只需要不断地调用Selector实例的select()方法即可知道当前所有Channel是否有需要处理的IO操作。注java NIO就是多路复用IOjdk7之后底层是epoll模型。
#### 3、Java NIO的简单实现 服务器上所有 Channel 需要向 Selector 注册,而 Selector 则负责监视这些 Socket 的 IO 状态(观察者),当其中任意一个或者多个 Channel 具有可用的 IO 操作时,该 Selector 的 select()方法将会返回大于 0 的整数,该整数值就表示该 Selector 上有多少个 Channel 具有可用的 IO 操作,并提供了 selectedKeys方法来返回这些 Channel 对应的 SelectionKey 集合(一个 SelectionKey 对应一个就绪的通道)。正是通过 Selector使得服务器端只需要不断地调用 Selector 实例的 select()方法即可知道当前所有 Channel 是否有需要处理的 IO 操作。注java NIO 就是多路复用 IOjdk7 之后底层是 epoll 模型。
#### 3、Java NIO 的简单实现
##### 3.1 服务端 ##### 3.1 服务端
```java ```java
public class NioServer { public class NioServer {
@ -329,7 +369,9 @@ public class NioServer {
} }
} }
``` ```
##### 3.2 客户端 ##### 3.2 客户端
```java ```java
public class NioClient { public class NioClient {
private static final String host = "127.0.0.1"; private static final String host = "127.0.0.1";
@ -397,16 +439,14 @@ public class NioClient {
} }
``` ```
## Java中的AIO
JDK1.7升级了NIO类库升级后的NIO类库被称为NIO 2.0。Java正式提供了异步文件I/O操作同时提供了与UNIX网络编程事件驱动I/O对应的AIO。NIO 2.0引入了新的异步通道的概念,并提供了异步文件通道和异步套接字通道的实现。
异步通道获取获取操作结果方式:
1. 使用java.util.concurrent.Future类表示异步操作的结果
2. 在执行异步操作的时候传入一个java.nio.channels操作完成后胡回调CompletionHandler接口的实现类。
NIO 2.0的异步套接字通道是真正的异步非阻塞I/O对应于UNIX网络编程中的事件驱动I/OAIO
## Java 中的 AIO
JDK1.7 升级了 NIO 类库,升级后的 NIO 类库被称为 NIO 2.0。Java 正式提供了异步文件 I/O 操作,同时提供了与 UNIX 网络编程事件驱动 I/O 对应的 AIO。NIO 2.0 引入了新的异步通道的概念,并提供了异步文件通道和异步套接字通道的实现。
异步通道获取获取操作结果方式:
1. 使用 java.util.concurrent.Future 类表示异步操作的结果;
2. 在执行异步操作的时候传入一个 java.nio.channels操作完成后胡回调 CompletionHandler 接口的实现类。
NIO 2.0 的异步套接字通道是真正的异步非阻塞 I/O对应于 UNIX 网络编程中的事件驱动 I/OAIO

Loading…
Cancel
Save