首页 > 其他分享> 文章详细

【深度学习】基于Keras的Data Augmentation方法

2022-03-01 19:03:12 阅读：246 来源： 互联网

标签：img Keras 0.2 像素 range Augmentation 图像 array Data

首先为什么我们需要对数据集进行Data Augmentation

对于现有的数据集来说，有些时候往往是不够的。举个例子，汽车识别，如果训练集当中只有汽车的正方位的图片，那么如果我们需要识别的图片是汽车的侧方位，这就导致了识别率的不高
进行了数据加强，那么就能够让机器有足够的训练集去训练，这样一来就可以显著的提高识别率

本文主要参考的博客

那么数据加强都有哪些功能

旋转|反射变换：随机图像一定角度，改变图像内容的朝向
翻转变换：沿着水平或垂直方向翻转图像
缩放变换：按照一定比例放大或者缩小图像
平移变换：在图像平面上对图像以一定的方式进行平移；可以采用随机或人为定义的方式指定平移范围和平移步长, 沿水平或竖直方向进行平移. 改变图像内容的位置;
尺度变换：对图像按照指定的尺度因子, 进行放大或缩小; 或者参照SIFT特征提取思想, 利用指定的尺度因子对图像滤波构造尺度空间. 改变图像内容的大小或模糊程度;
对比度变换：在图像的HSV颜色空间，改变饱和度S和V亮度分量，保持色调H不变. 对每个像素的S和V分量进行指数运算(指数因子在0.25到4之间), 增加光照变化;
噪声扰动：对图像的每个像素RGB进行随机扰动, 常用的噪声模式是椒盐噪声和高斯噪声;
颜色变换：在训练集像素值的RGB颜色空间进行PCA, 得到RGB空间的3个主方向向量,3个特征值, p1, p2, p3, λ1, λ2, λ3. 对每幅图像的每个像素Ixy=[IRxy,IGxy,IBxy]T进行加上如下的变化:
[p1,p2,p3][α1λ1,α2λ2,α3λ3]T

其中:αi是满足均值为0,方差为0.1的随机变量.

实现代码：

# -*- coding: utf-8 -*-
__author__ = 'Administrator'

import numpy as np
import tensorflow

# import packages
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img

datagen = ImageDataGenerator(
    rotation_range=0.2,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest')

# img = load_img('C:\Users\Administrator\Desktop\dataA\lena.jpg')  # this is a PIL image, please replace to your own file path
img = load_img(
    'D:/picture1/xz.jpg')  # this is a PIL image, please replace to your own file path

x = img_to_array(img)  # this is a Numpy array with shape (3, 150, 150)
x = x.reshape((1,) + x.shape)  # this is a Numpy array with shape (1, 3, 150, 150)

# the .flow() command below generates batches of randomly transformed images
# and saves the results to the `preview/` directory

i = 0
for batch in datagen.flow(x,
                          batch_size=1,
                          save_to_dir='D:/picture',  # 生成后的图像保存路径
                          save_prefix='lena',
                          save_format='jpg'):
    i += 1
    if i > 20:  # 这个20指出要扩增多少个数据
        break  # otherwise the generator would loop indefinitely

实现效果如下：

1.首先我们需要自己去找到一张需要加强数据集的图片
在这里插入图片描述
2.然后就是数据加强之后的图片

3.虽然结果出来了，但是还是有点问题，虽然说数据加强代码实现了旋转，平移，放大缩小，填充像素，但是还是有一些不足的地方
比如下图，图片的周围都是不清晰的像马赛克一样的东西
在这里插入图片描述

每一岁的成长，都仍要奔走在自己的热爱里

标签：img,Keras,0.2,像素,range,Augmentation,图像,array,Data
来源： https://blog.csdn.net/qq_44833724/article/details/123212629

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

【深度学习】基于Keras的Data Augmentation方法

首先为什么我们需要对数据集进行Data Augmentation

本文主要参考的博客

实现效果如下：