一 方式1: skimage
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
from skimage import data, io, transform, color import matplotlib.pyplot as plt # io.imread 讀出的圖片格式是uint8,value是numpy array 類型。 image = data.coffee() image = io.imread( dir ) plt.imshow(image) plt.show() io.save( '1.jpg' ,image) #保存圖像 image_gray = color.rgb2gray(image) #轉(zhuǎn)換為灰度圖像 io.save( '2.jpg' ,image_gray) # 通過(guò)transform.resize()裁剪后的圖片是以 float64的格式存儲(chǔ)的,數(shù)值的取值范圍是(0~1) image_ = transform.resize(image,( 200 , 200 )) img = image_ * 255 #將圖片的取值范圍改成(0~255) img = img.astype(np.uint8) img = image_ * 255 #將圖片的取值范圍改成(0~255) img = img.astype(np.uint8) |
二、方式2:cv2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
import cv2 import matplotlib.pyplot as plt # cv2.imread讀出的圖片格式是uint8,value也是numpy array 類型。 # 圖像數(shù)據(jù)格式是以BGR的格式進(jìn)行存儲(chǔ)的。需要將存儲(chǔ)類型改成RGB 的形式才能正常顯示原圖的顏色。 image = cv2.imread( dir ) b,g,r = cv2.split(image) #將圖像通道分離開(kāi) rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新組合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用這個(gè)函數(shù)直接轉(zhuǎn)換成RGB 形式 plt.imshow(rgb_image) # 通過(guò)cv2.resize()裁剪后的圖片還是以 numpy array 的方式保存的, 數(shù)值的取值范圍是(0~255) image_cv2 = cv2.resize(rgb_image) image = cv2.imread( dir ) b,g,r = cv2.split(image) #將圖像通道分離開(kāi) rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新組合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用這個(gè)函數(shù)直接轉(zhuǎn)換成RGB 形式 plt.imshow(rgb_image) # 通過(guò)cv2.resize()裁剪后的圖片還是以 numpy array 的方式保存的, 數(shù)值的取值范圍是(0~255) image_cv2 = cv2.resize(rgb_image) |
補(bǔ)充知識(shí):tensorflow中兩種讀圖及裁剪圖片的區(qū)別(io.imread和cv2.imread)以及(transform.resize和cv2.resize)
Tensorflow中,在訓(xùn)練圖片數(shù)據(jù)之前,需要先對(duì)圖片進(jìn)行預(yù)處理,讀圖和裁剪是最基本的兩步。常見(jiàn)的的讀圖何裁剪分別有兩種方式,這里小編將和大家分享下這幾種方式的實(shí)現(xiàn)以及他們之間的區(qū)別。
一、常見(jiàn)的兩種讀圖方式 io.imread() 和 cv2.imread()
1.io.imread 讀出的圖片格式是uint8,value是numpy array 類型。對(duì)于RGB 圖片,圖像數(shù)據(jù)是以RGB 的格式進(jìn)行存儲(chǔ)的。
2.cv2.imread讀出的圖片格式是uint8 ,value也是numpy array 類型。唯一的區(qū)別是,圖像數(shù)據(jù)格式是以BGR的格式進(jìn)行存儲(chǔ)的。需要將存儲(chǔ)類型改成RGB 的形式才能正常顯示原圖的顏色。特別是制作tfrecord 時(shí),需要將圖片通道改成RGB,具體代碼如下。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
import cv2 import matplotlib.pyplot as plt from skimage import transform import numpy as np import skimage.io as io train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg' '''以cv2方式讀取圖片''' image = cv2.imread(train_dir) b,g,r = cv2.split(image) #將圖像通道分離開(kāi) rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新組合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用這個(gè)函數(shù)直接轉(zhuǎn)換成RGB 形式 plt.imshow(rgb_image) '''以io.imread方式讀取圖片''' #image = io.imread(train_dir) #讀圖并顯示 #plt.imshow(image) |
二、常見(jiàn)的兩種圖片裁剪方式 cv2.resize() 和 transform.resize()
1.通過(guò)cv2.resize()裁剪后的圖片還是以 numpy array 的方式保存的, 數(shù)值的取值范圍是(0~255)
2.通過(guò)transform.resize()裁剪后的圖片是以 float64的格式存儲(chǔ)的,數(shù)值的取值范圍是(0~1)。通常在制作tfrecord 數(shù)據(jù)集的過(guò)程中,我們需要將其轉(zhuǎn)換成numpy array的形式,具體代碼如下
1
2
3
4
5
6
7
8
|
'''以io.imread方式讀取圖片并使用transform形式裁剪圖片''' image = io.imread(train_dir) #讀圖并顯示 plt.imshow(image) image = transform.resize(image, ( 208 , 208 )) img = image * 255 #將圖片的取值范圍改成(0~255) img = img.astype(np.uint8) plt.imshow(img) |
讀圖和裁剪圖片在制作tfrecord數(shù)據(jù)集時(shí),是很基礎(chǔ)的步驟,在接下來(lái),我還將進(jìn)一步更新如何制作自己的tfrecord數(shù)據(jù)集,以及tfrecord的讀取。如有謬誤,還請(qǐng)大家斧正。
以上這篇淺談tensorflow 中的圖片讀取和裁剪方式就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持服務(wù)器之家。
原文鏈接:https://blog.csdn.net/dkuhn/article/details/80719452