Extraploation avec la méthode « la plus proche » en Python
-
20-12-2019 - |
Question
Je cherche l'équivalent Python de l'instruction Matlab suivante :
vq interp1(x,y, xq,'nearest','extrap')
C'est comme si interp(xq, x, y)
fonctionne parfaitement pour l'interpolation/extrapolation linéaire.
j'ai aussi regardé
F = scipy.interpolate.interp1d(x, y, kind='nearest')
ce qui fonctionne parfaitement pour la méthode la plus proche, mais n'effectuera pas d'extrapolation.
Y a-t-il autre chose que j'ai oublié ?Merci.
La solution
Pour une interpolation linéaire qui extrapolera en utilisant l'interpolation la plus proche, utilisez numpy.interp
.Il le fait par défaut.
Par exemple:
yi = np.interp(xi, x, y)
Sinon, si vous souhaitez simplement l'interpolation la plus proche partout, comme vous le décrivez, vous pouvez le faire de manière courte mais inefficace :(vous pouvez en faire une one-liner, si vous le souhaitez)
def nearest_interp(xi, x, y):
idx = np.abs(x - xi[:,None])
return y[idx.argmin(axis=1)]
Ou de manière plus efficace en utilisant searchsorted
:
def fast_nearest_interp(xi, x, y):
"""Assumes that x is monotonically increasing!!."""
# Shift x points to centers
spacing = np.diff(x) / 2
x = x + np.hstack([spacing, spacing[-1]])
# Append the last point in y twice for ease of use
y = np.hstack([y, y[-1]])
return y[np.searchsorted(x, xi)]
Pour illustrer la différence entre numpy.interp
et les exemples d'interpolation les plus proches ci-dessus :
import numpy as np
import matplotlib.pyplot as plt
def main():
x = np.array([0.1, 0.3, 1.9])
y = np.array([4, -9, 1])
xi = np.linspace(-1, 3, 200)
fig, axes = plt.subplots(nrows=2, sharex=True, sharey=True)
for ax in axes:
ax.margins(0.05)
ax.plot(x, y, 'ro')
axes[0].plot(xi, np.interp(xi, x, y), color='blue')
axes[1].plot(xi, nearest_interp(xi, x, y), color='green')
kwargs = dict(x=0.95, y=0.9, ha='right', va='top')
axes[0].set_title("Numpy's $interp$ function", **kwargs)
axes[1].set_title('Nearest Interpolation', **kwargs)
plt.show()
def nearest_interp(xi, x, y):
idx = np.abs(x - xi[:,None])
return y[idx.argmin(axis=1)]
main()
Autres conseils
Dans les versions ultérieures de SciPy (au moins v0.19.1+), scipy.interpolate.interp1d
a la possibilité fill_value = “extrapolate”
.
Par exemple:
import pandas as pd
>>> s = pd.Series([1, 2, 3])
Out[1]:
0 1
1 2
2 3
dtype: int64
>>> t = pd.concat([s, pd.Series(index=s.index + 0.1)]).sort_index()
Out[2]:
0.0 1.0
0.1 NaN
1.0 2.0
1.1 NaN
2.0 3.0
2.1 NaN
dtype: float64
>>> t.interpolate(method='nearest')
Out[3]:
0.0 1.0
0.1 1.0
1.0 2.0
1.1 2.0
2.0 3.0
2.1 NaN
dtype: float64
>>> t.interpolate(method='nearest', fill_value='extrapolate')
Out[4]:
0.0 1.0
0.1 1.0
1.0 2.0
1.1 2.0
2.0 3.0
2.1 3.0
dtype: float64