Как нормализовать массив NumPy в пределах определенного диапазона?
-
20-09-2019 - |
Вопрос
После выполнения некоторой обработки массива аудио или изображений его необходимо нормализовать в пределах определенного диапазона, прежде чем можно будет записать обратно в файл.Это можно сделать следующим образом:
# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()
# Normalize image to between 0 and 255
image = image/(image.max()/255.0)
Есть ли менее подробный, удобный функциональный способ сделать это? matplotlib.colors.Normalize()
похоже, это никак не связано.
Решение
audio /= np.max(np.abs(audio),axis=0)
image *= (255.0/image.max())
С использованием /=
и *=
позволяет исключить промежуточный временный массив, тем самым сэкономив немного памяти.Умножение обходится дешевле, чем деление, поэтому
image *= 255.0/image.max() # Uses 1 division and image.size multiplications
немного быстрее, чем
image /= image.max()/255.0 # Uses 1+image.size divisions
Поскольку здесь мы используем базовые методы numpy, я думаю, что это максимально эффективное решение в numpy.
Операции на месте не меняют dtype массива контейнеров.Поскольку желаемые нормализованные значения являются числами с плавающей запятой, audio
и image
перед выполнением операций на месте массивы должны иметь тип dtype с плавающей запятой.Если они еще не имеют тип d с плавающей запятой, вам необходимо преобразовать их с помощью astype
.Например,
image = image.astype('float64')
Другие советы
Если массив содержит как положительные, так и отрицательные данные, я бы выбрал:
import numpy as np
a = np.random.rand(3,2)
# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)
# Normalised [0,255] as integer
c = 255*(a - np.min(a))/np.ptp(a).astype(int)
# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1
также стоит упомянуть, даже если это не вопрос ОП, стандартизация:
e = (a - np.mean(a)) / np.std(a)
Вы также можете изменить масштаб, используя sklearn
.Преимущества заключаются в том, что вы можете настроить нормализацию стандартного отклонения в дополнение к центрированию данных по среднему значению и что вы можете сделать это по любой оси, по объектам или по записям.
from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )
Аргументы ключевого слова axis
, with_mean
, with_std
говорят сами за себя и отображаются в состоянии по умолчанию.Аргумент copy
выполняет операцию на месте, если для нее установлено значение False
.Документация здесь.
Вы можете использовать версию «i» (как в idiv, imul..), и она выглядит неплохо:
image /= (image.max()/255.0)
В другом случае вы можете написать функцию для нормализации n-мерного массива по столбцам:
def normalize_columns(arr):
rows, cols = arr.shape
for col in xrange(cols):
arr[:,col] /= abs(arr[:,col]).max()
Простое решение — использовать масштабаторы, предлагаемые библиотекой sklearn.preprocessing.
scaler = sk.MinMaxScaler(feature_range=(0, 250))
scaler = scaler.fit(X)
X_scaled = scaler.transform(X)
# Checking reconstruction
X_rec = scaler.inverse_transform(X_scaled)
Ошибка X_rec-X будет равна нулю.Вы можете настроить Feature_range под свои нужды или даже использовать стандартный масштабатор sk.StandardScaler().
Вы пытаетесь масштабировать значения min-max audio
между -1 и +1 и image
от 0 до 255.
С использованием sklearn.preprocessing.minmax_scale
, должно легко решить вашу проблему.
например.:
audio_scaled = minmax_scale(audio, feature_range=(-1,1))
и
shape = image.shape
image_scaled = minmax_scale(image.ravel(), feature_range=(0,255)).reshape(shape)
примечание:Не путать с операцией масштабирования норма (длину) вектора до определенного значения (обычно 1), которое также обычно называют нормализацией.
Я попробовал следовать это, и получил сообщение об ошибке
TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'l') according to the casting rule ''same_kind''
Тот Самый numpy
массив, который я пытался нормализовать, был integer
массив.Похоже, они устарели от приведения типов в версиях> 1.10
, и вы должны использовать numpy.true_divide()
чтобы решить эту проблему.
arr = np.array(img)
arr = np.true_divide(arr,[255.0],out=None)
img
был PIL.Image
объект.