我想扩充MNIST手写数字数据集 为了做到这一点,我想分别为每个图像创建一个弹性变形图像。
我在this论文上阅读了第2节“通过弹性扩展数据集” 扭曲'他们实现了弹性扭曲
在:
后:
我试过了:
http://www.mathworks.com/help/images/ref/imwarp.html http://www.mathworks.com/help/images/examples/creating-a-gallery-of-transformed-images.html
没有任何成功。
我怎么能在MATLAB中做到这一点?
如何在 MATLAB 中的图像上创建弹性失真转换?
答案 0 :(得分:9)
我不确定我是否完全遵循"规范化"位移场的方法,但我认为这可以让你非常接近
img = imread('http://deeplearning.net/tutorial/_images/mnist_2.png'); %// get a digit
计算随机置换字段dx~U(-1,1)
,dy~U(-1,1)
:
dx = -1+2*rand(size(img));
dy = -1+2*rand(size(img));
平滑和标准化字段:
sig=4;
alpha=60;
H=fspecial('gauss',[7 7], sig);
fdx=imfilter(dx,H);
fdy=imfilter(dy,H);
n=sum((fdx(:).^2+fdy(:).^2)); %// norm (?) not quite sure about this "norm"
fdx=alpha*fdx./n;
fdy=alpha*fdy./n;
产生的位移
[y x]=ndgrid(1:size(img,1),1:size(img,2));
figure;
imagesc(img); colormap gray; axis image; axis tight;
hold on;
quiver(x,y,fdx,fdy,0,'r');
最后阶段 - 使用griddata
插值将位移应用于实际像素:
new = griddata(x-fdx,y-fdy,double(img),x,y);
new(isnan(new))=0;
结果数字:
figure;
subplot(121); imagesc(img); axis image;
subplot(122); imagesc(new); axis image;
colormap gray
顺便说一句,我不确定所提议的方法(rand
+ imfilter
)是产生随机平滑变形的最直接方法,您可以考虑采样系数为2- nd或3阶多项式变形,
dx = a*x.^2 + b*x.*y + c*y.^2 + d*x + e*y + f;
dy = g*x.^2 + h*x.*y + k*y.^2 + l*x + m*y + n;