質問

その処理のオーディオや映像配列が必要で正規化した範囲におけ前に書くことができ戻しファイルです。このように:

# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()

# Normalize image to between 0 and 255
image = image/(image.max()/255.0)

が少ないデフォルト値が設定され、より便利機能がないという。 matplotlib.colors.Normalize() ないようにします。

役に立ちましたか?

解決

audio /= np.max(np.abs(audio),axis=0)
image *= (255.0/image.max())

/=*=を使用して、あなたは、このようにいくつかのメモリを節約、中間一時的な配列を排除することができます。乗算は除算よりも安価であるので、

image *= 255.0/image.max()    # Uses 1 division and image.size multiplications

タグよりもわずかに速いです
image /= image.max()/255.0    # Uses 1+image.size divisions
ここでは、基本的なnumpyの方法を使用しているので、

、私はこれが可能とnumpyの中程度の効率的なソリューションだと思います。

<時間>

インプレース操作は、コンテナ配列のDTYPEを変更しないでください。所望の正規化された値は、浮動小数点数であるので、audioimageアレイは、インプレース動作が実行される前に、浮動小数点点DTYPEを有する必要があります。 彼らはすでに浮動小数点DTYPEのない場合は、astypeを使用して、それらを変換する必要があります。たとえば、

image = image.astype('float64')

他のヒント

の配列は、正と負のデータの両方が含まれている場合は、私が一緒に行くと思います:

import numpy as np

a = np.random.rand(3,2)

# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)

# Normalised [0,255] as integer
c = 255*(a - np.min(a))/np.ptp(a).astype(int)

# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1

また、言及する価値が、それはOPの質問ではない場合でも、標準化するます:

e = (a - np.mean(a)) / np.std(a)

またsklearnを使用して再スケールすることができます。利点は、あなたがデータをセンタリング意味するだけでなく、標準偏差を正規化調整できていること、そしてあなたが機能することにより、またはレコードにより、いずれかの軸でこれを行うことができます。

from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )

キーワード引数のaxiswith_meanwith_stdは自明であり、そのデフォルト状態で示されています。引数copyは、Falseに設定されている場合には、場所の動作を行います。ここのドキュメントのます。

あなたは「I」(IDIVのように、IMUL ...)バージョンを使用することができ、それは半分悪くは見えません。

image /= (image.max()/255.0)

は、他のケースでは、あなたがcolumsによってn次元アレイを正規化する関数を書くことができます:

def normalize_columns(arr):
    rows, cols = arr.shape
    for col in xrange(cols):
        arr[:,col] /= abs(arr[:,col]).max()

簡単な解決策はsklearn.preprocessingライブラリが提供するスケーラーを使用しています。

scaler = sk.MinMaxScaler(feature_range=(0, 250))
scaler = scaler.fit(X)
X_scaled = scaler.transform(X)
# Checking reconstruction
X_rec = scaler.inverse_transform(X_scaled)

エラーX_rec-Xはゼロとなります。あなたは、あなたのニーズに合わせてfeature_rangeを調整し、あるいはスタンダールスケーラsk.StandardScalerを()を使用することができます。

しようとしている大規模な価値を audio 間-1+1 image 0-255です。

を使用 sklearn.preprocessing.minmax_scale, う簡単に解決問題です。

例えば:

audio_scaled = minmax_scale(audio, feature_range=(-1,1))

shape = image.shape
image_scaled = minmax_scale(image.ravel(), feature_range=(0,255)).reshape(shape)

注意:はじめての操作のスケールの 規範 (長さ)のベクトル一定の値(通常1)であるものになっていて、一般的にノーマライゼーション

私はにhref="https://stackoverflow.com/a/1735122/8507120">以下試みたが、エラーが発生しました。

TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'l') according to the casting rule ''same_kind''

私は正常化しようとしていたnumpy配列はinteger配列でした。それは、彼らがバージョン> 1.10に型キャストを非推奨と思われる、とあなたはそれを解決するためにnumpy.true_divide()を使用する必要があります。

arr = np.array(img)
arr = np.true_divide(arr,[255.0],out=None)

imgPIL.Imageの目的であった。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top