ECCV 2020附代码论文合集(CNN,图像分割)

学术头条

    
    ECCV 2020 共接受 1361 篇论文,涵盖了包括目标检测,语义分割,图像分类,点云,图像重建,神经网络模型等热门主题。对计算机视觉感兴趣的小伙伴们也许你们已经阅读完论文并对论文的内容跃跃欲试了吧!毕竟纸上得来终觉浅!这里 AMnier 整理了计算机视觉相关热门主题下的附带代码的精选论文,快来寻找自己感兴趣的论文并亲自在自己的机器上实现吧!
    CNN
    1 WeightNet: Revisiting the Design Space of Weight Networks
    作者:Ningning Ma,Xiangyu Zhang,Jiawei Huang,Jian Sun
    机构:香港科技大学,MEGVI研究
    简介:本文提出了一个概念上简单、灵活和有效的权值生成网络框架。文中的方法是通用的,它将当前两个不同且非常有效的SENet和CondConv统一到一个权重空间的框架中。这个称为WeightNet的方法通过简单地在注意力激活层上添加一个分组的完全连接层来推广这两个方法。作者使用完全由(分组)完全连接层组成的WeightNet直接输出卷积权重。WeightNet在内核空间而不是特征空间上训练起来很容易,而且节省内存。由于灵活性,他们的方法在ImageNet和COCO检测任务上都优于现有的方法,实现了更好的精度浮点和精度参数权衡。该框架在柔性权重空间上具有进一步提高性能的潜力。
    
    2 Feature Pyramid Transformer
    作者:Dong Zhang,Hanwang Zhang,Jinhui Tang,Meng Wang,Xiansheng Hua,Qianru Sun
    机构:南京科技大学,南洋理工大学
    简介:跨空间和尺度的特征交互是现代视觉识别系统的基础,因为它们引入了有益的视觉环境。传统上,空间上下文被被动地隐藏在CNN不断增加的接受域中,或者被非局部卷积主动编码。然而,非局部空间相互作用并不是跨尺度的,因此它们无法捕捉到不同尺度上物体(或部件)的非局部上下文。为此,作者提出了一种跨空间和尺度的全主动特征交互,称为特征金字塔变换器(FPT)。它通过使用三个特殊设计的自层、自上而下和自下而上的交互方式,将任何一个特征金字塔转换成另一个大小相同但上下文更丰富的特征金字塔。FPT作为一种通用的可视化主干,具有合理的计算开销。在实例级(即对象检测和实例分割)和像素级分割任务中进行了大量的实验,使用各种主干网和头部网络,观察到在所有基线和最新方法上的一致性改进。
    
    3 Dynamic Group Convolution for Accelerating Convolutional Neural Networks
    作者:Zhuo Su,Linpu Fang,Wenxiong Kang,Dewen Hu,Matti Pietik inen,Li Liu
    机构:奥卢大学,华南理工大学
    简介:用群卷积代替常规卷积可以显著提高现代深卷积网络的计算效率,在紧凑型网络结构设计中得到了广泛的应用。然而,现有的群卷积会永久性地切断某些连接,从而破坏原有的网络结构,导致显著的精度下降。在这篇论文中,作者提出动态群组卷积(DGC),它可以在每个群组内,针对个别样本,自适应地选取输入通道的哪一部分连接。具体来说,为每组配备一个小的特征选择器,以根据输入图像自动选择最重要的输入通道。多个组可以自适应地为每个输入图像捕获丰富且互补的视觉/语义特征。DGC保留了原有的网络结构,同时具有与传统群卷积相似的计算效率。在CIFAR-10、CIFAR-100和ImageNet等多个图像分类基准上进行了大量的实验,结果表明该算法优于现有的群卷积技术和动态执行方法。
    
    4 Learning to Learn Parameterized Classification Networks for Scalable Input Images
    作者:Duo Li,Anbang Yao,Qifeng Chen
    机构:香港科技大学,Intel实验室
    简介:卷积神经网络对输入分辨率的变化不具有可预测的识别行为。这就阻止了在特定模型的不同输入图像分辨率上进行部署的可行性。为了在运行时实现高效、灵活的图像分类,作者使用元学习器为不同的输入尺度生成主网络的卷积权值,并在每个尺度上维护私有化的批量规范化层。为了提高训练性能,他们进一步利用基于不同输入分辨率的飞越模型预测的知识蒸馏。与单独训练的模型相比,学习后的元网络能够动态地参数化主网络以作用于任意大小的输入图像,具有一致的更好的精度。在ImageNet上的大量实验表明,在自适应推理过程中,本文的方法实现了更高的精度和效率的折衷。通过切换可执行输入分辨率,该方法可以满足不同资源受限环境下的快速自适应要求。
    
    
    
    1  2  下一页>