문제

GLIBC에 대한 정보와 SSE 기능을 사용하는 정도까지 정보를 찾으려고 노력하고 있습니다.

최적화 된 경우 상자 밖으로 사용할 수 있습니까?

더 큰 Linux 배포판 중 하나를 사용하고 있다고 말하면서 GliBC가 가능한 한 일반적인 상태로 편집되어 최대한 휴대 할 수 있으므로 최적화되지 않습니까?

특히 Memcpy 및 Memcmp 기능과 이러한 기능을 최대한 빨리 얻는 방법에 관심이 있습니다.

도움이 되었습니까?

해결책

GLIBC 2.8은 MEMCPY 또는 MEMCMP 용 SSE를 전혀 사용하지 않습니다 (x86 또는 x86_64) - 가족의 모든 CPU에서 지원되지 않는 것을 피하는 손으로 쓴 조립품을 사용합니다. 새로운 유형의 재배치 인 GLIBC 2.10에서 stt_gnu_ifunc CPU 지원을 기반으로 더 나은 최적화를 할 수있는 지원이 지원됩니다.

다른 팁

가장 높은 최적화 설정으로 컴파일하면 Memcpy 및 Memcmp가 컴파일러에 의한 내재로 대체 될 수 있으며 Glibc를 전혀 호출하지 않을 수 있습니다. 그럼 MCPU 그리고 3월 컴파일러 옵션은 가장 빠른 코드를 선택합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top