当前位置：

首页
/
IT
/
程序
/
Java
/
ByteBuf(图解)

ByteBuf(图解)

源码工程

写在前面

Netty ByteBuf 优势

手动获取与释放 ByteBuf

自动获取和释放 ByteBuf

方式一: TailHandler 自动释放

方式二: SimpleChannelInboundHandler 自动释放

方式三: HeadHandler 自动释放

如何避免内存泄露

自动释放的注意事项

手动释放的注意事项

缓冲区 Allocator 分配器

分配器 Allocator 的类型

默认的分配器

设置通道 Channel 的分配器

缓冲区内存的类型

Unpooled 非池化缓冲区的使用方法

写在最后

疯狂创客圈 Java 死磕系列

Netty ByteBuf(图解 )之一

疯狂创客圈 Java 分布式聊天室[ 亿级流量] 实战系列之 15 [博客园总入口 ]

源码工程

源码 IDEA 工程获取链接: Java 聊天室实战源码

写在前面

大家好, 我是作者尼恩.

今天是百万级流量 Netty 聊天器打造的系列文章的第 15 篇, 这是一个基础篇.

由于关于 ByteBuf 的内容比较多, 分两篇文章:

第一篇: 图解 ByteBuf 的分配, 释放和如何避免内存泄露

第二篇: 图解 ByteBuf 的具体使用

本篇为第一篇.

Netty ByteBuf 优势

Netty 提供了 ByteBuf, 来替代 Java NIO 的 ByteBuffer 缓, 来操纵内存缓冲区.

与 Java NIO 的 ByteBuffer 相比, ByteBuf 的优势如下:

Pooling (池化, 这点减少了内存复制和 GC, 提升效率)

可以自定义缓冲类型

通过一个内置的复合缓冲类型实现零拷贝

扩展性好, 比如 StringBuffer

不需要调用 flip()来切换读 / 写模式

读取和写入索引分开

方法链

引用计数

手动获取与释放 ByteBuf

Netty 环境下, 业务处理的代码, 基本上都在 Handler 处理器中的各个入站和出站方法中.

一般情况下, 采用如下方法获取一个 Java 堆中的缓冲区:

ByteBuf heapBuffer = ctx.alloc().heapBuffer();

使用完成后, 通过如下的方法, 释放缓冲区:

ReferenceCountUtil.release(heapBuffer );

上面的代码很简单, 通过 release 方法减去 heapBuffer 的使用计数, Netty 会自动回收 heapBuffer .

缓冲区内存的回收, 二次分配等管理工作, 是 Netty 自动完成的.

自动获取和释放 ByteBuf

方式一: TailHandler 自动释放

Netty 默认会在 ChannelPipline 的最后添加的那个 TailHandler 帮你完成 ByteBuf 的 release.

先看看, 自动创建的 ByteBuf 实例是如何登场的?

Netty 自动创建 ByteBuf 实例

Netty 的 Reactor 线程会在 AbstractNioByteChannel.NioByteUnsafe.read() 处调用 ByteBufAllocator 创建 ByteBuf 实例, 将 TCP 缓冲区的数据读取到 Bytebuf 实例中, 并调用 pipeline.fireChannelRead(byteBuf) 进入 pipeline 入站处理流水线.

默认情况下, TailHandler 自动释放掉 ByteBuf 实例

Netty 的 ChannelPipleline 的流水线的末端是 TailHandler, 默认情况下如果每个入站处理器 Handler 都把消息往下传, TailHandler 会释放掉 ReferenceCounted 类型的消息.

说明:

上图中, TailHandler 写成了 TailContext, 这个是没有错的.

对于流水线的头部和尾部 Hander 来说, Context 和 Hander , 是同一个类.

HeadContext 与 HeadHandler , 也是同一个类.

关于 Context 与 Handler 的关系, 请看疯狂创客圈的系列文章.

如果没有到达末端呢?

一种没有到达入站处理流水线 pipeline 末端的情况, 如下图所示:

这种场景下, 也有一种自动释放的解决办法, 它就是:

可以继承 SimpleChannelInboundHandler, 实现业务 Handler. SimpleChannelInboundHandler 会完成 ByteBuf 的自动释放, 释放的处理工作, 在其入站处理方法 channelRead 中.

方式二: SimpleChannelInboundHandler 自动释放

如果业务 Handler 需要将 ChannelPipleline 的流水线的默认处理流程截断, 不进行后边的 inbound 入站处理操作, 这时候末端 TailHandler 自动释放缓冲区的工作, 自然就失效了.

这种场景下, 业务 Handler 有两种选择:

手动释放 ByteBuf 实例

继承 SimpleChannelInboundHandler, 利用它的自动释放功能.

本小节, 我们聚焦的是第二种选择: 看看 SimpleChannelInboundHandler 是如何自动释放的.

利用这种方法, 业务处理 Handler 必须继承 SimpleChannelInboundHandler 基类. 并且, 业务处理的代码, 必须移动到重写的 channelRead0(ctx, msg)方法中.

如果好奇, 想看看 SimpleChannelInboundHandler 是如何释放 ByteBuf 的, 那就一起来看看 Netty 源码.

截取的代码如下所示:

public abstract class SimpleChannelInboundHandler<I> extends ChannelInboundHandlerAdapter
{
//...
@Override
public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {
    boolean release = true;
    try {
        if (acceptInboundMessage(msg)) {
            @SuppressWarnings("unchecked")
            I imsg = (I) msg;
            channelRead0(ctx, imsg);
        } else {
            release = false;
            ctx.fireChannelRead(msg);
        }
    } finally {
        if (autoRelease && release) {
            ReferenceCountUtil.release(msg);
        }
    }
}

源码中, 执行完重写的 channelRead0()后, 在 finally 语句块中, ByteBuf 的生命被结束掉了.

上面两种, 都是入站处理 (inbound) 过程中的自动释放.

出站处理 (outbound) 流程, 又是如何自动释放呢?

方式三: HeadHandler 自动释放

出站处理流程中, 申请分配到的 ByteBuf, 通过 HeadHandler 完成自动释放.

出站处理用到的 Bytebuf 缓冲区, 一般是要发送的消息, 通常由应用所申请. 在出站流程开始的时候, 通过调用 ctx.writeAndFlush(msg),Bytebuf 缓冲区开始进入出站处理的 pipeline 流水线 . 在每一个出站 Handler 中的处理完成后, 最后消息会来到出站的最后一棒 HeadHandler, 再经过一轮复杂的调用, 在 flush 完成后终将被 release 掉.

强调一下, HeadContext (HeadHandler)是出站处理流程的最后一棒.

出站处理的全过程, 请查看疯狂创客圈的专门文章.

如何避免内存泄露

基本上, 在 Netty 的开发中, 通过 ChannelHandlerContext 或 Channel 获取的缓冲区 ByteBuf 默认都是 Pooled, 所以需要再合适的时机对其进行释放, 避免造成内存泄漏.

自动释放的注意事项

我们已经知道了三种自动释放方法:

通过 TailHandler 自动释放入站 ByteBuf

继承 SimpleChannelInboundHandler 的完成入站 ByteBuf 自动释放

通过 HeadHandler 自动释放出站 ByteBuf

自动释放, 注意事项如下:

入站处理流程中, 如果对原消息不做处理, 默认会调用 ctx.fireChannelRead(msg) 把原消息往下传, 由流水线最后一棒 TailHandler 完成自动释放.

如果截断了入站处理流水线, 则可以继承 SimpleChannelInboundHandler , 完成入站 ByteBuf 自动释放.

出站处理过程中, 申请分配到的 ByteBuf, 通过 HeadHandler 完成自动释放.

手动释放的注意事项

手动释放是自动释放的重要补充和辅助.

手动释放操作, 大致有如下注意事项:

入站处理中, 如果将原消息转化为新的消息并调用 ctx.fireChannelRead(newMsg)往下传, 那必须把原消息 release 掉;

入站处理中, 如果已经不再调用 ctx.fireChannelRead(msg) 传递任何消息, 也没有继承 SimpleChannelInboundHandler 完成自动释放, 那更要把原消息 release 掉;

多层的异常处理机制, 有些异常处理的地方不一定准确知道 ByteBuf 之前释放了没有, 可以在释放前加上引用计数大于 0 的判断避免异常; 有时候不清楚 ByteBuf 被引用了多少次, 但又必须在此进行彻底的释放, 可以循环调用 reelase()直到返回 true.

特别需要强调的, 是上边的第一种情况.

如果在入站处理的 handlers 传递过程中, 传递了新的 ByteBuf 值, 老 ByteBuf 值需要自己手动释放. 老的 ByteBuf 值, 就是从 pipeline 流水线入口传递过来的 ByteBuf 实例.

总之, 只要是在传递过程中, 没有传递下去的 ByteBuf 就需要手动释放, 避免不必要的内存泄露.

缓冲区 Allocator 分配器

Netty 通过 ByteBufAllocator 分配缓冲区.

Netty 提供了 ByteBufAllocator 的两种实现: PoolByteBufAllocator 和 UnpooledByteBufAllocator. 前者将 ByteBuf 实例放入池中, 提高了性能, 将内存碎片减少到最小. 这个实现采用了一种内存分配的高效策略, 称为 jemalloc. 它已经被好几种现代操作系统所采用. 后者则没有把 ByteBuf 放入池中, 每次被调用时, 返回一个新的 ByteBuf 实例.

分配器 Allocator 的类型

PooledByteBufAllocator: 可以重复利用之前分配的内存空间.

为了减少内存的分配回收以及产生的内存碎片, Netty 提供了 PooledByteBufAllocator 用来分配可回收的 ByteBuf, 可以把 PooledByteBufAllocator 看做一个池子, 需要的时候从里面获取 ByteBuf, 用完了放回去, 以此提高性能.

UnpooledByteBufAllocator: 不可重复利用, 由 JVM GC 负责回收.

顾名思义 Unpooled 就是不会放到池子里, 所以根据该分配器分配的 ByteBuf, 不需要放回池子, 由 JVM 自己 GC 回收.

这两个类, 都是 AbstractByteBufAllocator 的子类, AbstractByteBufAllocator 实现了一个接口, 叫做 ByteBufAllocator.

可以做一个对比试验:

使用 UnpooledByteBufAllocator 的方式创建 ByteBuf 的时候, 单台 24 核 CPU 的服务器, 16G 内存, 刚启动时候, 10000 个长连接, 每秒所有的连接发一条消息, 短时间内, 可以看到内存占到 10G 多点, 但随着系统的运行, 内存不断增长, 直到整个系统内存溢出挂掉.

把 UnpooledByteBufAllocator 换成 PooledByteBufAllocator, 通过试验, 内存使用量机器能维持在一个连接占用 1M 左右, 内存在 10G 左右, 经常长期的运行测试, 发现都能维持在这个数量, 系统内存不会崩溃.

默认的分配器

默认的分配器 ByteBufAllocator.DEFAULT , 可以通过 Java 系统参数 (SystemProperty ) 选项 io.netty.allocator.type 去配置, 使用字符串值:"unpooled","pooled".

关于这一段, Netty 的源代码截取如下:

String allocType = SystemPropertyUtil.get("io.netty.allocator.type", "unpooled").toLowerCase(Locale.US).trim();
        Object alloc;
        if("unpooled".equals(allocType)) {
            alloc = UnpooledByteBufAllocator.DEFAULT;
            logger.debug("-Dio.netty.allocator.type: {}", allocType);
        } else if("pooled".equals(allocType)) {
            alloc = PooledByteBufAllocator.DEFAULT;
            logger.debug("-Dio.netty.allocator.type: {}", allocType);
        } else {
            alloc = UnpooledByteBufAllocator.DEFAULT;
            logger.debug("-Dio.netty.allocator.type: unpooled (unknown: {})", allocType);
        }

不同的 Netty 版本, 源码不一样.

上面的代码, 是 4.0 版本的源码, 默认为 UnpooledByteBufAllocator.

而 4.1 版本, 默认为 PooledByteBufAllocator. 因此, 4.1 版本的代码, 是和上面的代码稍微有些不同的.

设置通道 Channel 的分配器

在 4.x 版本中, UnpooledByteBufAllocator 是默认的 allocator, 尽管其存在某些限制.

现在 PooledByteBufAllocator 已经广泛使用一段时间, 并且我们有了增强的缓冲区泄漏追踪机制, 所以是时候让 PooledByteBufAllocator 成为默认了.

ServerBootstrap b = new ServerBootstrap()
        .group(bossGroup, workerGroup)
        .channel(NioServerSocketChannel.class)
        .localAddress(port)
        .childOption(ChannelOption.ALLOCATOR, PooledByteBufAllocator.DEFAULT)
        .childHandler(new ChannelInitializer<SocketChannel>() {
            @Override
            public void initChannel(SocketChannel ch) throws Exception {
                ch.pipeline().addLast(...);
            }
        });

使用 Netty 带来的又一个好处就是内存管理. 只需一行简单的配置, 就能获得到内存池带来的好处. 在底层, Netty 实现了一个 Java 版的 Jemalloc 内存管理库, 为我们做完了所有 "脏活累活"!

缓冲区内存的类型

说完了分配器的类型, 再来说下缓冲区的类型.

依据内存的管理方不同, 分为堆缓存和直接缓存. 也就是 Heap ByteBuf 和 Direct ByteBuf. 另外, 为了方便缓冲区进行组合, 提供了一种组合缓存区.

三种缓冲区的介绍如下:

使用模式	描述	优点	劣势
堆缓冲区	数据存存储在 JVM 的堆空间中，又称为支撑数组，通过 hasArray 来判断是不是在堆缓冲区中	没使用池化情况下能提供快速的分配和释放	发送之前都会拷贝到直接缓冲区
直接缓冲区	存储在物理内存中	能获取超过 jvm 堆限制大小的空间；写入 channel 比堆缓冲区更快	释放和分配空间昂贵 (使用系统的方法) ；操作时需要复制一次到堆上
复合缓冲	单个缓冲区合并多个缓冲区表示	操作多个更方便	-

上面三种缓冲区的类型, 无论哪一种, 都可以通过池化, 非池化的方式, 去获取.

Unpooled 非池化缓冲区的使用方法

Unpooled 也是用来创建缓冲区的工具类, Unpooled 的使用也很容易.

看下面代码:

// 创建复合缓冲区
CompositeByteBuf compBuf = Unpooled.compositeBuffer();
// 创建堆缓冲区
ByteBuf heapBuf = Unpooled.buffer(8);
// 创建直接缓冲区
ByteBuf directBuf = Unpooled.directBuffer(16);

Unpooled 提供了很多方法, 详细方法大致如下:

方法名称	描述
buffer() buffer(int initialCapacity) buffer(int initialCapacity, int maxCapacity)	返回 heap ByteBuf
directBuffer() directBuffer(int initialCapacity) directBuffer(int initialCapacity, intmaxCapacity)	返回 direct ByteBuf
compositeBuffer()	返回 CompositeByteBuf
copiedBuffer()	返回 copied ByteBuf

Unpooled 类的应用场景

Unpooled 类让 ByteBuf 也同样适用于不需要其他的 Netty 组件的, 无网络操作的项目, 这些项目可以从这个高性能的, 可扩展的 buffer API 中获益.

写在最后

至此为止, 终于完成 ByteBuf 的分配, 释放和如何避免内存泄露介绍.

接下来是:

第二篇: 图解 ByteBuf 的具体使用

疯狂创客圈 Java 死磕系列

Java (Netty) 聊天程序[ 亿级流量] 实战开源项目实战

Netty 源码, 原理, JAVA NIO 原理

Java 面试题一网打尽

疯狂创客圈 [ 博客园总入口 ]

来源: https://www.cnblogs.com/crazymakercircle/p/9977872.html

与本文相关文章

暂无,快来抢沙发吧！