随着信息时代的到来, 图片压缩技术对于信息传输影响越来越大, 500W 像素的彩色图片需要 15M 空间存储, 如果不经过压缩, 对于所有的网站和移动应用都是一个非常大的负担.
自 80 年代起国内开始引入 JPEG 等图片压缩标准; 但是随着互联网的发展, 今天网络每天传输, 存储的图片已达到亿万级别; 传统压缩算法已经满足不了企业需求. 为了减少带宽资源消耗, 降低存储压力, 减轻服务器压力, 企业开始寻求更高效的图像压缩算法.
也应如此, CVPR 作为一直关注计算机视觉领域发展的世界顶级学术会议, 在今年, 联合 Google,ETH,Twitter,Amazon,Disney Research,Netflix 举办了 CVPR 2018 的图像压缩挑战赛(CLIC). 目前该比赛已经落下帷幕, 图鸭科技的 Tucodec TNGcnn4p 在该项挑战赛上取得 MS-SSIM 与 MOS 两项第一.
这次的挑战赛主要从 PSNR,MOS,MS-SSIM 和解码速度 (评分较高的队伍里解码速度最快) 这四个方面进行评比. PSNR,MOS,MS-SSIM 这些都是业界通用的图像质量评估 (Image Quality Assessment,IQA) 标准.
(大赛链接 http://www.compression.cc/results/)
图鸭科技图片压缩团队的 Tucodec TNGcnn4p 压缩在 MOS 与 MS-SSIM 值上占据领先优势, 取得第一. 在 PSNR 指标上, Tucodec TNG 压缩也取得了第二名的好成绩.
MOS 与 MIS-SSIM 值是指用户对于图片的主观感受, 比分越高, 代表图片还原度越高, 丢失的信息越少.
Tucodec TNGcnn4p 在 MOS 和 MS-SSIM 值上有显著的优势, 下图为其与目前业界通用的图像压缩算法 BPG,webP 和 JPEG2000 的对比图:
(TNG 压缩与 BPG,webp,jpeg2000 对比图)
在 MS-SSIM/dB 为 17 时, Tucodec TNGcnn4p 比 BPG 节省 40% 的码率, 比 WebP 节省 50% 的码率, 比 JPEG 2000 节省 75% 的码率.
在 0.15bpp-0.8bpp 这一常用码率范围下, Tucodec TNGcnn4p 平均比 BPG 节省 19.75 码字, 比 WebP 节省 27.08 码字, 比 JPEG2000 节省 33.28 码字.
(Tucodec TNGcnn4p 在验证集和测试集上的实验结果)
据图鸭科技图片压缩团队介绍: Tucodec TNGcnn4p 算法是基于端到端深度学习的算法, 在该算法中使用了层次特征融合的网络结构, 并结合新的量化方法, 码字估计等技术对整体网络进行设计. 在训练中为了获得更好的主观质量, 我们使用了一种加权主观和客观指标的损失函数, 并在我们的数据平台上使用大规模数据训练, 最终可以在大赛中斩获了 MOS 和 MS-SSIM 的第一名.
TucodecTNGcnn4p 算法完整的框架包括 CNN 编码, 量化, 反量化, CNN 解码器, 熵编码, 码字估计, 码率 - 失真优化等几个模块.
图鸭科技图片压缩研发团队, 由国内多名从事计算机视觉, 图像视频编解码和深度学习的博士们组成. 团队从 16 年开始专注于图像视频算法研究, 在 17 年开始专攻深度学习学习方向的压缩算法. 打破传统压缩算法, 采用基于端到端的深度学习算法架构新的图片编解码框架. 致力于成为下一个图像视频压缩标准.
来源: https://juejin.im/post/5b2a18f1e51d4558817dfebf