我一直在寻找如何将BSWAP用于64位寄存器的低32位子寄存器的答案。例如, 0x0123456789abcdef 在RAX寄存器中,我想用一条指令将其更改为 0x01234567efcdab89 (因为性能)。

所以我尝试了内联函数:

#define BSWAP(T) {  \
    __asm__ __volatile__ (  \
            "bswap %k0" \
            : "=q" (T)  \
            : "q" (T)); \
}

结果是 0x00000000efcdab89 。我不明白为什么编译器就像这样。有人知道有效的解决方案吗?

有帮助吗?

解决方案

啊,是的,我现在明白了这个问题:

x86-64处理器 隐式零延伸 32位寄存器在执行32位操作时为64位(在%eax,%ebx等上)。这是为了保持与遗留代码的兼容性,遗留代码需要这些寄存器的32位语义,据我所知。

所以我担心无法在64位寄存器的低32位上执行 ror 。你必须使用一系列的几个指令...

其他提示

检查gcc生成的汇编输出!使用 gcc -s 标志编译代码并生成asm输出。

IIRC,x86-64在没有明确指示的情况下默认使用32位整数,因此这可能是(部分)问题。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top