我有一个字符串变量。我需要将所有非数字字符转换为空格(“”)。我对Unicode字符有问题。 Unicode字符(基本字符集之外的字符)被转换为某些无效的字符。例如,请参见代码。

还有其他方法如何通过不扼杀特殊Unicode字符的过程实现相同的结果?

new file.

set unicode = yes.
show unicode.

data list free
 /T (a10).
begin data
1234
5678
absd
12as
12(a
12(vi
12(vī
12āčž
end data.

string Z (a10).
comp Z = T.

loop #k = 1 to char.len(Z).
if ~range(char.sub(Z, #k, 1), "0", "9") sub(Z, #k, 1) = " ".
end loop.

comp Z = normalize(Z).

comp len = char.len(Z).

list var = all.

exe.

结果:

T          Z               len

1234       1234              4
5678       5678              4
absd                         0
12as       12                2
12(a       12                2
12(vi      12                2
12(vī     12   �          6

>Warning # 649
>The first argument to the CHAR.SUBSTR function contains invalid characters.
>Command line: 1939  Current case: 8  Current splitfile group: 1

12āčž   12   �ž        7


Number of cases read:  8    Number of cases listed:  8
有帮助吗?

解决方案 2

如何虽然骑自行车并拔出数字字符并重建,而不是替换非数字字符 Z? (请注意我的版本在这里是pre CHAR. 字符串功能。)

data list free
 /T (a10).
begin data
1234
5678
absd
12as
12(a
12(vi
12(vī
12āčž
12as23
end data.

STRING Z (a10).
STRING #temp (A1).
COMPUTE #len = LENGTH(RTRIM(T)).
LOOP #i = 1 to #len.
  COMPUTE #temp = SUBSTR(T,#i,1).
  DO IF INDEX('0123456789',#temp) > 0.
    COMPUTE Z = CONCAT(SUBSTR(Z,1,#i-1),#temp).
  ELSE.
    COMPUTE Z = CONCAT(SUBSTR(Z,1,#i-1)," ").
  END IF. 
END LOOP.
EXECUTE.

其他提示

在Unicode模式下,不应在表达式的左侧使用subtr函数,因为替换字符可能与替换字符的字节数不同。而是在右侧使用替换功能。

您看到的损坏角色是由于这种大小不匹配所致。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top