我正在尝试查找有关glibc的信息以及它使用SSE功能的程度。

如果它已经过优化,我可以开箱即用吗?

假设我正在使用一个较大的Linux发行版,我假设它的glibc被编译为尽可能通用并且尽可能便携,因此没有优化?

我对memcpy和memcmp函数以及如何尽快获得这些函数特别感兴趣。

有帮助吗?

解决方案

glibc 2.8根本不使用SSE用于memcpy或memcmp(在x86或x86_64中) - 它使用一些手写的程序集,避免了该系列的所有CPU都不支持的任何内容。在glibc 2.10中,将支持一种新型的重定位, STT_GNU_IFUNC ,这将使基于更好的优化在CPU支持方面可能。

其他提示

如果使用最高优化设置进行编译,编译器可能会用内在函数替换memcpy和memcmp,而根本不会调用glibc。然后 mcpu march 编译器选项将选择最快的代码。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top