数字图像处理调研报告(含近五年CV顶会论文整理)

Posted by Cheng-Long Wang on April 20, 2017

数字图像处理调研报告(含近五年CV顶会论文整理)

  数字图像处理是使利用计算机算法对数字图像进行图像处理的一种技术,可分为低级、中级、高级处理。低级处理涉及初级操作,如降噪的图像预处理、对比度增强和图像锐化。低级处理以输入、输出都是图像为特征。中级处理涉及诸多人物,比如图像分割,减少目标物的描述,使其更适合计算机处理及对不同目标的分类(识别)。中间图像处理以输入为图像,但输出是从这些图像中提取的特征(如边缘、轮廓及各问题的标识等)的。最后,高级处理涉及“理解”已识别目标的总体,就像在图像分析中那样,以及在连续统一体的远端执行与视觉相关的认知过程。

1.观察你生活和学习中与数字图像处理有关的事物,把他们罗列出来.试选其中一种对其用到的图像处理技术做较详细的描述

移动电子设备图像、视频等的采集和处理,打印机等扫描设备的输入和打印,监控等视频的采集和保存,面部识别门禁系统等图像上人脸识别和检测等。

  • 电子设备相机
    数字图像的采集输入和保存,涉及图像传感器敏感度,信噪比,动态范围,色彩表示,白平衡等,以及相机模块中锐度,分辨率,定焦,EDof等
  • 相机自拍美颜
    图像增强,面部检测等,具体如:磨皮->双边滤波,美白->通道的处理,瘦脸->自动人脸检测定位人脸轮廓点,再由这些轮廓坐标点应用局部平移算法得到瘦脸效果。
  • 美颜自拍分享到朋友圈
    数字图像的压缩算法等

2.尽可能设想一种数字图像处理的新应用

  图像上物体大面积遮挡情况下,由局部物体复原出原始物体的可能情况,涉及到数据输入阶段的目标部件级或像素级的语义理解,分解和标注,复原阶段对目标部件的语义分割提取,以及推理能力。

  该技术若实现,能在达到遮挡率极高的情况下实现一定估计准确率,可极大地帮助公安系统,刑侦人员案件侦查工作的进行,或文物部门文物修补工作的进行,极大的节约人力资源。

3.尝试去顶级会议的网址看看历年的会议内容及研讨方向分类,总结

分类

类别主要包含

  • 3D vision,Computational photography;
  • sensing and display;
  • face and gesture;
  • low-level and image processing;
  • motion and tracking ;
  • optimization methods;
  • physics-based vision;
  • pthotometry and shape-from-X;
  • recognition:detection/ategorization/indexing/matching;
  • segmentation,grouping and shape representation;
  • statistical methods and learning;
  • video:events,activities and surveillance;
  • applications。

总结:

  从近几年计算机视觉顶级会议选出的最佳论文上,可以看出前沿关注的热点.包括深度学习中涉及到的结构、非凸、优化等问题;与3D Vision 有关的场景重建,SLAM,目标位姿估计等;与视频时空序列处理有关的目标跟踪,运动估计,事件监测,行为预测等问题为热门方向,以及在这三方面都有涉及的目标分类检测,目标分割,场景理解,面部识别等问题。这三大热门方向中以深度学习尤为突出。

  以评奖方向看,最近一两年的最佳论文没有放弃对传统计算机视觉研究问题的关注,一方面是因为深度学习相关研究目前难度日益增大,想做成有突破性进展的工作不易;一方面是领域大牛有意扶持传统研究问题,维护计算机视觉研究领域生态平衡,不致深度学习一家独大。

附近5年最佳论文列表:

##### CVPR(每年一次)

  • 2016

    • Deep Residual Learning for Image Recognition, Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun(图像识别的深度残差学习,深度学习)论文 github
    • Sublabel-Accurate Relaxation of Nonconvex Energies., Thomas Möllenhoff, Emanuel Laude, Michael Moeller, Jan Lellmann, Daniel Cremers(非凸能量函数的亚标签精确松弛框架,传统优化理论,能量优化问题)
    • Structural-RNN: Deep Learning on Spatio-Temporal Graphs, Ashesh Jain, Amir R. Zamir, Silvio Savarese, Ashutosh Saxena(时空图的深度学习:结构化RNN)论文
  • 2015

    • DynamicFusion: Reconstruction and Tracking of Non-rigid Scenes in Real-Time, Richard A. Newcombe, Dieter Fox, Steven M. Seitz(非刚性场景的实时重建和跟踪,动态环境下的SLAM技术)pdf
    • Efficient Globally Optimal Consensus Maximisation with Tree Search, Tat-Jun Chin, Pulak Purkait, Anders Eriksson, David Suter(基于树搜索的全局最优的一致性最大化)pdf
    • Fully Convolutional Networks for Semantic Segmentation, Jonathan Long, Evan Shelhamer, Trevor Darrell(全卷积网络的语义分割)pdf
    • Picture: A Probabilistic Programming Language for Scene Perception, Tejas D Kulkarni, Pushmeet Kohli, Joshua B Tenenbaum, Vikash Mansinghka(图片:用于场景感知的一种概率性编程语言)pdf
    • Category-Specific Object Reconstruction from a Single Image, Abhishek Kar, Shubham Tulsiani, João Carreira, Jitendra Malik(从一幅图像中重建图像中物体的三维结构的方法)pdf
  • 2014

    • What Camera Motion Reveals About Shape with Unknown BRDF, M.K. Chandraker(关于未知双向反射分布函数,摄像机运动揭示了什么)pdf
    • 3D Shape and Indirect Appearance by Structured Light Transport, Matthew O’Toole, John Mather, Kyros Kutulakos(结构光传输的3D形状和间接外观)pdf
    • Partial Optimality by Pruning for MAP-inference with General Graphical Models, Paul Swoboda, Bogdan Savchynskyy, Joerg Kappes, Christoph Schnörr用于一般图模型的修剪MAP推理的部分最优化论文
  • 2013

    • Fast, Accurate Detection of 100,000 Object Classes on a Single Machine, Thomas Dean, Jay Yagnik, Mark Ruzon, Mark Segal, Jonathon Shlens, and Sudheendra Vijayanarasimhan(在单个机器中实现对 100,000 个对象类别的快速准确的探测)pdf
    • Lost! Leveraging the Crowd for Probabilistic Visual Self-Localization, Marcus Brubaker, Andreas Geiger, and Raquel Urtasun(丢失,利用人群进行概率视觉自我定位)pdf
    • Discriminative Non-blind Deblurring, Uwe Schmidt, Carsten Rother, Sebastian Nowozin, Jeremy Jancsary, and Stefan Roth(判别性非盲解卷积)pdf
  • 2012

    • A Simple Prior-free Method for Non-Rigid Structure-from-Motion Factorization, Yuchao Dai, Hongdong Li, Mingyi He(对于动作生成结构的非刚性因式分解的简单且无需先验的方法)pdf
    • Max-Margin Early Event Detectors, Minh Hoai, Fernando De la Torre(基于最大间隔技术的早期事件检测)pdf
ECCV(偶数年)
  • 2016

    • Real-Time 3D Reconstruction and 6-DoF Tracking with an Event Camera. Hanme Kim, Stefan Leutenegger, and Andrew J. Davison(单个事件摄像机实现实时3D重建和6位姿跟踪)pdf
    • The Fast Bilateral Solver.Jonathan Barron and Ben Poole(快速双边求解器)pdf
    • Focal Flow: Measuring Distance and Velocity with Defocus and Differential Motion. Emma Alexander, Qi Guo, Sanjeev Koppal, Steven Gortler, and Todd Zickler(使用散焦和差分运动测量距离和速度)pdf
  • 2014

    • Kevin Matzen and Noah Snavely for “Scene Chronology”(场景时间变化推理)pdf

    • Jia Deng, Nan Ding, Yangqing Jia, Andrea Frome, Kevin Murphy, Samy Bengio, Yuan Li, Hartmut Neven, Hartwig Adam, for “Large-Scale Object Classification using Label Relation Graphs”(使用标签关系图的大规模目标分类)pdf

    • Honorable mention: Matt Zeiler and Rob Fergus for “Visualizing and Understanding Convolutional Neural Networks”(视觉和理解卷积神经网络)pdf

  • 2012

    • Segmentation Propagation in ImageNet Authors: Daniel Kuettel, Matthieu Guillaumin and Vittorio Ferrari(ImageNet中的分割传播)论文
    • Paper title: Activity Forecasting Authors: Kris Kitani, Brian D. Ziebart, James Bagnell and Martial Hebert(行为预测)论文
    • Paper title: Reconstructing the World’s Museums Authors: Jianxiong Xiao and Yasutaka Furukawa(世界博物馆重构)pdf
ICCV(奇数年)
  • 2015

    • Peter Kontschieder, Madalina Fiterau, Antonio Criminisi, and Samuel Rota Bulò. “Deep Neural Decision Forests”(深度神经决策森林)pdf
    • Saining Xie and Zhuowen Tu. “Holistically-Nested Edge Detection”(整体-嵌套边缘检测)论文
  • 2013
    • Vicente Ordonez, Jia Deng, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. “From Large Scale Image Categorization to Entry-Level Categories”(从大规模图像分类到入门级分类)pdf
    • Yuandong Tian and Srinivasa Narasimhan. “Hierarchical Data-driven Descent for Efficient Optimal Deformation Estimation”(有效最优变形估计下的分层数据驱动下降)pdf
    • Christoph Vogel, Konrad Schindler, Stefan Roth. “Piecewise Rigid Scene Flow”(分段刚性场景流)pdf github
  • 2011
    • Marr Prize Paper: Devi Parikh, Kristen Grauman: “Relative Attributes”(相对属性)论文

Reference

  • 数字图像处理(第三版,中文)_冈萨雷斯_p2

  • CVPR Best Paper Award • IEEE Computer Society (https://www.computer.org/web/tcpami/cvpr-best-paper-award)

  • Best Paper Awards in Computer Science (since 1996) (http://jeffhuang.com/best_paper_awards.html)

  • 机器之心专栏 2016年欧洲计算机视觉大会纪要(ECCV’16 Recap)(https://zhuanlan.zhihu.com/p/23281846)