README.md

    classification

    物体识别分类

    项目介绍

    该项目对物体进行识别分类。

    项目配置

    • 作者开发环境:
    • Python 3.7
    • PyTorch >= 1.5.1

    数据集

    1、Stanford Dogs 数据集

    image_dogs

    2、静态手势识别数据集(handpose_x_gesture_v1)

    video_gesture

    • 数据集来源3部分,且网上数据占绝大多数,具体:
    • 1)来源于网上数据并自制。
    • 2)来源于自己相机采集并自制。
    • 3)来源于 kinect_leap_dataset 数据集并自制,其官网地址为:https://lttm.dei.unipd.it/downloads/gesture/
    • 注:数据集如有侵权,请联系删除。
    kinect_leap_dataset 数据集来源于以下paper项目组的贡献。  
    [1] G. Marin, F. Dominio, P. Zanuttigh, "Hand gesture recognition with Leap Motion and Kinect devices", IEEE International Conference on Image Processing (ICIP), Paris, France, 2014  
    
    [2] G. Marin, F. Dominio, P. Zanuttigh, "Hand Gesture Recognition with Jointly Calibrated Leap Motion and Depth Sensor", Multimedia Tools and Applications, 2015  

    one :000-one five :001-five fist :002-fist ok :003-ok
    heartSingle :004-heartSingle yearh :005-yearh three :006-three four :007-four
    six :008-six Iloveyou :009-Iloveyou gun :010-gun thumbUp :011-thumbUp
    nine :012-nine pink :013-pink

    • 注意事项
      如果使用了该项目的14类静态手势数据集请指出引用来源,具体如下所示 :
    
    [1] G. Marin, F. Dominio, P. Zanuttigh, "Hand gesture recognition with Leap Motion and Kinect devices", IEEE International Conference on Image Processing (ICIP), Paris, France, 2014  
    
    [2] G. Marin, F. Dominio, P. Zanuttigh, "Hand Gesture Recognition with Jointly Calibrated Leap Motion and Depth Sensor", Multimedia Tools and Applications, 2015  
    
    [3] Eric.Lee , https://codechina.csdn.net/EricLee/classification  
    

    构建自己的数据集

    • 构建一个总的数据集目录,在目录内建立每一个具体类别的子目录,每一个子目录有且只有单独的一个类别。并且文件夹的命名为“数字-名称”,比如上图的“one静态手势”的文件夹命名为“000-one”。
    • 注意名称为英文命名,可以由自己定义,类别编号数字从0开始。
    • 另外在具体训练时,需要在训练脚本 train.py 中进行训练集文件夹路径和类别数的对应修改。

    预训练模型

    1、Stanford Dogs 预训练模型

    2、静态手势识别预训练模型(handpose_x_gesture_v1)

    项目使用方法

    模型训练

    注意: train.py 中的 3个参数与具体分类任务数据集,息息相关,如下所示:

        #---------------------------------------------------------------------------------
        parser.add_argument('--train_path', type=str, default = './handpose_x_gesture_v1/',
            help = 'train_path') # 训练集路径
        parser.add_argument('--num_classes', type=int , default = 14,
            help = 'num_classes') #  分类类别个数,gesture 配置为 14 , Stanford Dogs 配置为 120
        parser.add_argument('--have_label_file', type=bool, default = False,
            help = 'have_label_file') # 是否有配套的标注文件解析才能生成分类训练样本,gesture 配置为 False , Stanford Dogs 配置为 True
    • 根目录下运行命令: python train.py (注意脚本内相关参数配置 )

    模型推理

    • 根目录下运行命令: python inference.py (注意脚本内相关参数配置 )

    注意事项

    • 因为数据集的整张图会有大量背景、多只狗等干扰因素。本文采用的图像输入是"Stanford Dogs Dataset"数据集的目标边界框范围图像,这样也觉定了在模型推断预测环境下也是以目标物的边界框为范围的图像作为输入。

    联系方式 (Contact)

    项目简介

    物体识别分类,pytorch 目前数据集包括 1)Stanford Dogs 数据集 ,2)14类静态手势自建数据集

    发行版本

    当前项目没有发行版本

    贡献者 1

    开发语言

    • Python 100.0 %