質問

文字列変数があります。すべての非桁の文字をスペース( "")に変換する必要があります。 Unicode文字に問題があります。 Unicode文字(基本チャーセット以外の文字)は、いくつかの無効な文字に変換されます。たとえば、コードを参照してください。

特別なユニコード文字を窒息させない手順で同じ結果を達成する方法はありますか?

new file.

set unicode = yes.
show unicode.

data list free
 /T (a10).
begin data
1234
5678
absd
12as
12(a
12(vi
12(vī
12āčž
end data.

string Z (a10).
comp Z = T.

loop #k = 1 to char.len(Z).
if ~range(char.sub(Z, #k, 1), "0", "9") sub(Z, #k, 1) = " ".
end loop.

comp Z = normalize(Z).

comp len = char.len(Z).

list var = all.

exe.

結果:

T          Z               len

1234       1234              4
5678       5678              4
absd                         0
12as       12                2
12(a       12                2
12(vi      12                2
12(vī     12   �          6

>Warning # 649
>The first argument to the CHAR.SUBSTR function contains invalid characters.
>Command line: 1939  Current case: 8  Current splitfile group: 1

12āčž   12   �ž        7


Number of cases read:  8    Number of cases listed:  8
役に立ちましたか?

解決 2

非数字の文字を交換する代わりに、あなたは数値文字を撤回して再構築するのはどうですか Z? (ここに私のバージョンに注意してください CHAR. 文字列関数。)

data list free
 /T (a10).
begin data
1234
5678
absd
12as
12(a
12(vi
12(vī
12āčž
12as23
end data.

STRING Z (a10).
STRING #temp (A1).
COMPUTE #len = LENGTH(RTRIM(T)).
LOOP #i = 1 to #len.
  COMPUTE #temp = SUBSTR(T,#i,1).
  DO IF INDEX('0123456789',#temp) > 0.
    COMPUTE Z = CONCAT(SUBSTR(Z,1,#i-1),#temp).
  ELSE.
    COMPUTE Z = CONCAT(SUBSTR(Z,1,#i-1)," ").
  END IF. 
END LOOP.
EXECUTE.

他のヒント

substr関数は、交換された文字が交換されるのと同じバイト数ではない可能性があるため、ユニコードモードの式の式の左側に使用しないでください。代わりに、右側の交換関数を使用します。

あなたが見ている腐敗したキャラクターは、このサイズの不一致によるものです。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top