Pythonで特定のピクセルのRGB値を読み取る方法は?
質問
open(" image.jpg")
で画像を開く場合、ピクセルの座標があると仮定してピクセルのRGB値を取得するにはどうすればよいですか?
では、これをどのように逆にすることができますか?空白のグラフィックから始めて、特定のRGB値でピクセルを「書き込み」ますか?
追加のライブラリをダウンロードする必要がなければ好むでしょう。
解決
恐らくこれを行うには、 Pythonイメージライブラリを使用するのがおそらく最善です。個別のダウンロードです。
希望することを行う最も簡単な方法は、 Imageオブジェクトのload()メソッドを使用することです配列のように操作できるピクセルアクセスオブジェクトを返します。
from PIL import Image
im = Image.open('dead_parrot.jpg') # Can be many different formats.
pix = im.load()
print im.size # Get the width and hight of the image for iterating over
print pix[x,y] # Get the RGBA Value of the a pixel of an image
pix[x,y] = value # Set the RGBA Value of the image (tuple)
im.save('alive_parrot.png') # Save the modified pixels as .png
または、 ImageDraw をご覧ください。これにより、画像を作成するためのより豊富なAPIが提供されます。
他のヒント
PyPNG-軽量PNGデコーダー/エンコーダー
質問はJPGを暗示していますが、私の回答が一部の人々にとって役立つことを願っています。
PyPNGモジュールを使用して、PNGピクセルを読み書きする方法は次のとおりです。
import png, array
point = (2, 10) # coordinates of pixel to be painted red
reader = png.Reader(filename='image.png')
w, h, pixels, metadata = reader.read_flat()
pixel_byte_width = 4 if metadata['alpha'] else 3
pixel_position = point[0] + point[1] * w
new_pixel_value = (255, 0, 0, 0) if metadata['alpha'] else (255, 0, 0)
pixels[
pixel_position * pixel_byte_width :
(pixel_position + 1) * pixel_byte_width] = array.array('B', new_pixel_value)
output = open('image-with-red-dot.png', 'wb')
writer = png.Writer(w, h, **metadata)
writer.write_array(output, pixels)
output.close()
PyPNGは、テストとコメントを含む4000行未満の単一の純粋なPythonモジュールです。
PIL はより包括的なイメージングライブラリですが、かなり重いです。
枕(Python 3.XおよびPython 2.7+で動作します)を使用すると、次のことができます。
from PIL import Image
im = Image.open('image.jpg', 'r')
width, height = im.size
pixel_values = list(im.getdata())
これですべてのピクセル値が得られました。 RGBまたは別のモードが im.mode
で読み取れる場合。次に、次の方法でピクセル(x、y)
を取得できます。
pixel_values[width*y+x]
別の方法として、Numpyを使用して配列の形状を変更することもできます:
>>> pixel_values = numpy.array(pixel_values).reshape((width, height, 3))
>>> x, y = 0, 1
>>> pixel_values[x][y]
[ 18 18 12]
完全で使いやすいソリューションは
def get_image(image_path):
"""Get a numpy array of an image so that one can access values[x][y]."""
image = Image.open(image_path, 'r')
width, height = image.size
pixel_values = list(image.getdata())
if image.mode == 'RGB':
channels = 3
elif image.mode == 'L':
channels = 1
else:
print("Unknown mode: %s" % image.mode)
return None
pixel_values = numpy.array(pixel_values).reshape((width, height, channels))
return pixel_values
デイブウェッブが言ったように:
これは、以下からのピクセル色を印刷する私の作業コードスニペットです 画像:
import os, sys import Image im = Image.open("image.jpg") x = 3 y = 4 pix = im.load() print pix[x,y]
photo = Image.open('IN.jpg') #your image
photo = photo.convert('RGB')
width = photo.size[0] #define W and H
height = photo.size[1]
for y in range(0, height): #each pixel has coordinates
row = ""
for x in range(0, width):
RGB = photo.getpixel((x,y))
R,G,B = RGB #now you can use the RGB value
wiki.wxpython.orgには画像の操作という非常に優れた記事があります。 。この記事では、wxWidgets(wxImage)、PIL、またはPythonMagickを使用する可能性について言及しています。個人的には、PILとwxWidgetsを使用しており、どちらも画像操作をかなり簡単にします。
pygame のsurfarrayモジュールを使用できます。このモジュールには、pixels3d(surface)と呼ばれる3Dピクセル配列を返すメソッドがあります。以下に使用方法を示しました。
from pygame import surfarray, image, display
import pygame
import numpy #important to import
pygame.init()
image = image.load("myimagefile.jpg") #surface to render
resolution = (image.get_width(),image.get_height())
screen = display.set_mode(resolution) #create space for display
screen.blit(image, (0,0)) #superpose image on screen
display.flip()
surfarray.use_arraytype("numpy") #important!
screenpix = surfarray.pixels3d(image) #pixels in 3d array:
#[x][y][rgb]
for y in range(resolution[1]):
for x in range(resolution[0]):
for color in range(3):
screenpix[x][y][color] += 128
#reverting colors
screen.blit(surfarray.make_surface(screenpix), (0,0)) #superpose on screen
display.flip() #update display
while 1:
print finished
お役に立てば幸いです。最後の言葉:screenpixの有効期間中、画面はロックされます。
画像操作は複雑なトピックであり、ライブラリを使用する行う場合に最適です。 Python内からさまざまな画像形式に簡単にアクセスできる gdmodule をお勧めします。
" sudo apt-get install python-imaging"コマンドを使用してPILをインストールします。そして、次のプログラムを実行します。画像のRGB値を印刷します。画像が大きい場合、「>」を使用して出力をファイルにリダイレクトします後でファイルを開いてRGB値を表示します
import PIL
import Image
FILENAME='fn.gif' #image can be in gif jpeg or png format
im=Image.open(FILENAME).convert('RGB')
pix=im.load()
w=im.size[0]
h=im.size[1]
for i in range(w):
for j in range(h):
print pix[i,j]
Tk GUIツールキットへの標準PythonインターフェイスであるTkinterモジュールを使用できます。追加のダウンロードは不要です。 https://docs.python.org/2/library/tkinter.html。
(Python 3の場合、Tkinterはtkinterに名前が変更されます)
RGB値の設定方法は次のとおりです。
#from http://tkinter.unpythonic.net/wiki/PhotoImage
from Tkinter import *
root = Tk()
def pixel(image, pos, color):
"""Place pixel at pos=(x,y) on image, with color=(r,g,b)."""
r,g,b = color
x,y = pos
image.put("#%02x%02x%02x" % (r,g,b), (y, x))
photo = PhotoImage(width=32, height=32)
pixel(photo, (16,16), (255,0,0)) # One lone pixel in the middle...
label = Label(root, image=photo)
label.grid()
root.mainloop()
そしてRGBを取得:
#from http://www.kosbie.net/cmu/spring-14/15-112/handouts/steganographyEncoder.py
def getRGB(image, x, y):
value = image.get(x, y)
return tuple(map(int, value.split(" ")))
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
img=mpimg.imread('Cricket_ACT_official_logo.png')
imgplot = plt.imshow(img)
from PIL import Image
def rgb_of_pixel(img_path, x, y):
im = Image.open(img_path).convert('RGB')
r, g, b = im.getpixel((x, y))
a = (r, g, b)
return a
RGBカラーコードの形式で3桁の数字を探している場合、次のコードでそれを行う必要があります。
i = Image.open(path)
pixels = i.load() # this is not a list, nor is it list()'able
width, height = i.size
all_pixels = []
for x in range(width):
for y in range(height):
cpixel = pixels[x, y]
all_pixels.append(cpixel)
これはあなたのために働くかもしれません。