Extraploação com método 'mais próximo' em Python
-
20-12-2019 - |
Pergunta
Estou procurando o equivalente em Python da seguinte instrução Matlab:
vq interp1(x,y, xq,'nearest','extrap')
Parece que interp(xq, x, y)
funciona perfeitamente para interpolação/extrapolação linear.
Eu também olhei
F = scipy.interpolate.interp1d(x, y, kind='nearest')
que funciona perfeitamente para o método mais próximo, mas não realizará extrapolação.
Há mais alguma coisa que eu esqueci?Obrigado.
Solução
Para interpolação linear que irá extrapolar usando a interpolação mais próxima, use numpy.interp
.Ele faz isso por padrão.
Por exemplo:
yi = np.interp(xi, x, y)
Caso contrário, se você quiser apenas a interpolação mais próxima em todos os lugares, como descreve, poderá fazê-lo de maneira curta, mas ineficiente:(você pode fazer disso uma linha única, se quiser)
def nearest_interp(xi, x, y):
idx = np.abs(x - xi[:,None])
return y[idx.argmin(axis=1)]
Ou de uma forma mais eficiente usando searchsorted
:
def fast_nearest_interp(xi, x, y):
"""Assumes that x is monotonically increasing!!."""
# Shift x points to centers
spacing = np.diff(x) / 2
x = x + np.hstack([spacing, spacing[-1]])
# Append the last point in y twice for ease of use
y = np.hstack([y, y[-1]])
return y[np.searchsorted(x, xi)]
Para ilustrar a diferença entre numpy.interp
e os exemplos de interpolação mais próximos acima:
import numpy as np
import matplotlib.pyplot as plt
def main():
x = np.array([0.1, 0.3, 1.9])
y = np.array([4, -9, 1])
xi = np.linspace(-1, 3, 200)
fig, axes = plt.subplots(nrows=2, sharex=True, sharey=True)
for ax in axes:
ax.margins(0.05)
ax.plot(x, y, 'ro')
axes[0].plot(xi, np.interp(xi, x, y), color='blue')
axes[1].plot(xi, nearest_interp(xi, x, y), color='green')
kwargs = dict(x=0.95, y=0.9, ha='right', va='top')
axes[0].set_title("Numpy's $interp$ function", **kwargs)
axes[1].set_title('Nearest Interpolation', **kwargs)
plt.show()
def nearest_interp(xi, x, y):
idx = np.abs(x - xi[:,None])
return y[idx.argmin(axis=1)]
main()
Outras dicas
Em versões posteriores do SciPy (pelo menos v0.19.1+), scipy.interpolate.interp1d
tem a opção fill_value = “extrapolate”
.
Por exemplo:
import pandas as pd
>>> s = pd.Series([1, 2, 3])
Out[1]:
0 1
1 2
2 3
dtype: int64
>>> t = pd.concat([s, pd.Series(index=s.index + 0.1)]).sort_index()
Out[2]:
0.0 1.0
0.1 NaN
1.0 2.0
1.1 NaN
2.0 3.0
2.1 NaN
dtype: float64
>>> t.interpolate(method='nearest')
Out[3]:
0.0 1.0
0.1 1.0
1.0 2.0
1.1 2.0
2.0 3.0
2.1 NaN
dtype: float64
>>> t.interpolate(method='nearest', fill_value='extrapolate')
Out[4]:
0.0 1.0
0.1 1.0
1.0 2.0
1.1 2.0
2.0 3.0
2.1 3.0
dtype: float64