作者:Taposh Dutta-Roy
今年 3 月,英伟达的 GTC 2017 大会上展示了很多深度学习技术在医疗领域中的卓越工作。Ian GoodFellow、Jeremy Howard 以及其他的深度学习专家都分享了他们对深度学习的见解。顶尖的医科学校(例如西奈山医院、纽约大学、麻省综合医院等)以及肺癌 BOWL 的获奖者 Kaggle 一起解释了他们的建模策略。回顾我们的系列文章,在上一篇文章中,我们讨论了在文本和图像数据上的基础深度学习。在本文中,我们会聚焦于分析医疗图像和它们的格式。
这篇文章由三部分组成–医疗图像和组成、医疗图像格式,以及医疗图像格式的转换。本文的目标就是组织知识来帮助我们实现最终目标–用深度学习进行医疗图形的分析。
与这个主题相关的一个很好的资源来自意大利生物组织和生物图像研究所(IBB)的 Michele Larobina 和 Loredana Murino 发表的论文。这个研究所是意大利国家研究委员会(NCR)的一部分。它是意大利最大的公共研究机构。另一个可供参考的资源是这篇论文:「Working with the DICOM and NIfTI Data Standards in R」
那么,医疗图像是什么呢?医疗图像是对解剖区域的内部结构和功能的一种表征。它以二维像素或者三维体素的形式呈现出来。映射到空间位置的数值是对采样过程和重建过程的离散表征。用来描述一个确定采样模态视野的像素数量是对解剖结构和功能的细节的表达。像素表达的数值取决于成像模式、采样协议、重建以及后续处理过程。
医疗数据的组成
如图所示:医疗数据有四个关键的组成部分–像素深度、光度解释、元数据以及像素数据。这几部分决定了图像的大小和分辨率。
像素深度(Pixel Depth)或者位深度(Bit Depth)或者色深度(Color Depth)就是用来编码每一像素的信息所用的位数。例如,一个 8 位的栅格会拥有从 0 到 255 这 256 种各不相同的数值。
参考:http://desktop.arcgis.com/en/arcmap/10.3/manage-data/raster-and-images/bit-depth-capacity-for-raster-dataset-cells.htm
光度解释具体化了像素数据被解释成正确的图片展示的方式,如单色图像或者彩色图像。为了确定像素值中是否存储了彩色信息,我们引入了每个像素的样本的概念,也就是大家都知道的通道数量。单色图像每个像素只有一个样本,图片中并没有存储彩色信息。我们使用从黑色到白色的灰度级别来展示这种图片。灰度的数量明显取决于用来存储这个样本的位数,在这种情况下,与像素深度是一致的。像 X 光片、CT 和磁共振这样的放射医疗影像都有一个灰度光度解释。核医学图像都以彩色的形式展现,例如 PET 和 SPECT。
元数据就是图片中所描述的信息。它看上去可能是很奇怪的,但是无论在什么格式的文件中,都存在一些超越像素数据并且和图像相关的信息。这类被称作元数据的信息通常都以头部的形式储在文件的起始部分,它至少会包含以下信息:图像矩阵的维度、空间精度、像素深度以及光度解释。
像素数据–这里存储的是像素数值的大小。根据不同的数据类型,像素数据可能以整型或者浮点型的类型存储,使用表达数据所需的最少的数据位。
所以,图像的大小=头部大小(包含元数据)+行×列×像素深度×帧的数量
放射生物图像中主要有六种格式–DICOM(医疗中的数字图像和通信),NIFTI(神经影像学信息技术计划),PAR/REC(飞利浦 MRI 扫描格式),ANALYZE(Mayo 医疗成像)以及 NRRD(近乎原始光栅数据)和 MNIC 格式。
截止 2017 年 5 月的医疗图像格式
其中 DICOM 和 NIFTI 是最常用的格式。
DICOM 代表的是医疗数字成像和通信。DICOM 是由美国国家电气制造商协会(NEMA)制定的标准。它定义了医疗成像领域中关于信息处理、存储、打印以及传输的标准。这些都是你在扫描仪或者某家医院的图片归档和通信系统(PACS)能够立即得到的文件格式。
它包括了文件格式和能够接收图像和 DICOM 格式的病人数据的实体之间使用 TCP/IP 进行通信的协议。
一个 DICOM 文件包含文件头部和同文件名的*.dcm 图像数据。文件头部的大小取决于它所提供的信息的多少。文件头包含以下信息:病人的 ID,病人的姓名,图像的模态以及其他信息。它定义了帧的数量以及图像的精度。这些信息会被图像浏览器在显示图像时用到。对于一个单词采样,会有很多个 DICOM 文件。
来源: http://www.36dsj.com/archives/90490