托管对象本质 - 第一部分 - 布局

IsMarked 标记

相关文献

译文作者: 杰哥很忙

托管对象本质 1 - 布局

托管对象本质 2 - 对象头布局和锁成本

托管对象本质 3 - 托管数组结构

托管对象本质 4 - 字段布局

托管对象的布局非常简单: 托管对象包含实例数据, 指向元数据的指针 (也称为方法表指针) 和内部信息包(也称为对象头).

译者补充: 方法表指针在某些文章也被称之为类型句柄, 英文是 TypeHandle.

当我第一次看到对象的布局时, 我产生了一些疑问:

为什么对象的布局如此怪异?

为什么托管引用指向对象的中间, 而对象头的偏移量为负?

对象头中存储了哪些信息?

译者补充: 作者对于布局怪异实际指的就是对象头的偏移量为负数. 由于托管对象以引用地址的偏移量记为 0, 对象头大小为 4 或 8 字节(取决于是 32 位还是 64 位, 实际 64 位对象头也仅使用 4 字节, 前面 4 个字节填充 0). 因此由于对象头在对象指针之前, 因此它的偏移量位 - 4 或 - 8.

当我开始思考布局并做了一个快速研究时, 我只有几个选择:

JVM 从一开始就对托管对象使用了类似的布局.

今天听起来有点疯狂, 但请记住, 由于 Java 早就有了一个特性(又名数组协方差 http://www.voidcn.com/article/p-yjocauww-buv.html ),C# 在借鉴 Java 语言时也引用了这一有史以来最糟糕的特性. 与这个决定相比, 重用一些关于对象结构的想法听起来并不合理.

译者补充: 数组协方差可能存在无法保证类型安全, 从而产生一个运行时异常. 详情可以看与 C# 数组的协方差和逆差 http://www.voidcn.com/article/p-yjocauww-buv.html

对象头的大小可以增大, 而在 CLR 中没有横切更改.

对象头包含 CLR 使用的一些辅助信息, CLR 可能需要比指针大小字段更多的信息. 事实上, 移动电话中使用的 .Net Compact Framework 对于大小对象具有不同的头(有关详细信息, 请参阅 WP7:CLR 托管对象开销). 桌面 CLR 从未使用过此功能, 但这并不意味着将来不可能实现此功能.

译者补充: 这里说的 CLR 没有根据切面大小改变对象头, 指的是桌面 CLR, 因为移动设备的 CLR 会根据对象大小改变对象头的布局.

缓存行和其他性能相关特征.

Chris Brumme https://devblogs.microsoft.com/cbrumme/ - CLR 架构师之一, 在他的发表的 Value Types 的评论中提到, 缓存友好性正是托管对象布局的原因. 从理论上讲, 由于缓存行大小(64 字节), 访问彼此较近的字段的效率可能更高. 这意味着根据字段在对象中的位置不同, 访问间接引用字段会有不同的性能差异. 我花了一些时间试图证明对于现代处理器该理论依据仍然是成立的, 但无法获得任何能够显示存在的差异基准测试数据.

花了一些时间试图验证我的理论后, 我联系了 Vance Morrison https://blogs.msdn.microsoft.com/vancem/ 问这个问题, 并得到了以下的答案: 目前的设计没有特别考虑.

因此, 对于 "为什么托管对象的布局如此怪异?" 的一个简单回答是由于历史原因造成的. 老实说, 我可以看到在负索引移动对象头的逻辑, 以强调此数据块是 CLR 的实现细节, 它的大小可以随时间而变化, 并且不应由用户检查.

译者补充: 原作者说的是由于历史原因造成的也没有毛病, 因为非托管代码就包含了对象头和对象引用地址, 因此托管代码延续了这一风格.

现在是时候审视布局的更多细节了. 再次之前, 我们思考一下, CLR 可以与托管对象实例关联哪些额外信息? 以下是一些想法:

GC 可以用来标记可从应用程序根访问对象的特殊标志.

一种特殊的标志用于通知 GC 某个对象已固定, 在垃圾收集期间不应移动.

托管对象的哈希代码(当未重写 GetHashCode 方法时).

锁语句使用的关键节和其他信息: 获取锁的线程等.

除了实例状态之外, CLR 还存储了许多与类型相关的信息, 如方法表, 接口映射, 实例大小等等, 但这与我们当前的讨论无关.

IsMarked 标记

托管对象头可用于多种不同的用途. 你可能认为垃圾收集器 (GC) 使用对象头中的一个位来标记该对象是由根引用的, 并且应该保持活动状态. 这是一种常见的误解, 只有少量的名著提及.

比如 Jeffrey Richter 写的《CLR via C#》, 《Pro .NET Performance》作者是 Sasha Goldstein, 当然还有一些其他人.

CLR 作者决定不使用对象头, 而是使用一个巧妙的技巧: 方法表指针的最低位用于存储在垃圾回收期间存储对象可访问且不应被回收的标志.

下面是来自 Coreclr 的一个 mark 标记的实现, 在文件的 8974 行:

#define marked(i) header(i) -> IsMmarked();
#define set_marked(i) header(i)->SetMarked()
#define clear_marked(i) header(i)->ClearMarked()
// class CObjectHeader
BOOL IsMarked() const
{
    return !!(((size_t)RawGetMethodTable()) & GC_MARKED);
}
void ClearMarked()
{
    RawSetMethodTable(GetMethodTable());
}
void SetMarked()
{
    RawSetMethodTable((MethodTable*)(((size_t)RawGetMethodTable()) | GC_MARKED));
}
MethodTable* GetMethodTable() const
{
    return((MethodTable*)(((size_t)RawGetMethodTable()) & (~(GC_MARKED))));
}

由于 gc.cpp 文件太大导致 GitHub 不分析它. 这意味着我不能将超链接添加到特定代码行.

CLR 堆中的托管指针以 4 个或 8 个字节地址长度进行对齐, 取决于 32 位还是 64 位平台. 这意味着每个指针的 2 或 3 位始终为 0, 可用于其他目的. JVM 也使用同样的技巧, 称为 "压缩 Oops", 该功能允许 JVM 具有 32 GB 堆大小, 并且仍使用 4 个字节作为托管指针.

译者补充: 当我们在对象上标注 StructLayout 以控制对象的分布甚至偏移值. 若对象没有填满 4 字节或 8 字节时, CLR 会进行自动填充.

"这意味着每个指针的 2 或 3 位始终为 0, 可用于其他目的." 对于这句话的解释, 个人理解如下: 由于 64 位指针最多支持 2^64^ 内存, 即 16TiB 的内存大小, 而对于 Windows 系统则有软件上的内存大小限制, windows7 旗舰版支持 192GB 的内存, 而 Windows server 2008 R2 支持 2TiB 内存大小, Windows Server 2012 提高到 4TiB 的最大内存限制. 因此可以如作者所说, Windows 64 位操作系统预留了 2 到 3 位指针用于其他目的, 因此最大内存支持 4TiB.

从技术上讲, 即使在 32 位平台上, 也有 2 位可用于标志. 基于 object.h 文件的注释, 我们可以认为确实如此, 并且方法表指针的第二个最低位用于固定 (以标记在垃圾回收的压缩阶段不应移动对象). 不幸的是, 并不能判断该说法是否正确, 因为来自 gc.cpp(行 3850-3859) 的 SetPinned/IsPinned 方法基于对象头中的保留位实现, 并且我无法在 coreclr 代码版本库中找到实际设置方法表指针位的任何代码.

下次我们会讨论所得实现以及锁的性能消耗大小.

与本文相关文章

暂无,快来抢沙发吧！