Как проверить, поддерживает ли процессор набор инструкций SSE3?


является ли следующий код допустимым, чтобы проверить, поддерживает ли процессор набор инструкций SSE3?

С помощью

5 55

5 ответов:

Я создал GitHub repro, который будет обнаруживать поддержку процессора и ОС для всех основных расширений x86 ISA:https://github.com/Mysticial/FeatureDetector

вот более короткая версия:


сначала вам нужно получить доступ к инструкции CPUID:

#ifdef _WIN32

//  Windows
#define cpuid(info, x)    __cpuidex(info, x, 0)

#else

//  GCC Intrinsics
#include <cpuid.h>
void cpuid(int info[4], int InfoType){
    __cpuid_count(InfoType, 0, info[0], info[1], info[2], info[3]);
}

#endif

затем вы можете запустить следующий код:

//  Misc.
bool HW_MMX;
bool HW_x64;
bool HW_ABM;      // Advanced Bit Manipulation
bool HW_RDRAND;
bool HW_BMI1;
bool HW_BMI2;
bool HW_ADX;
bool HW_PREFETCHWT1;

//  SIMD: 128-bit
bool HW_SSE;
bool HW_SSE2;
bool HW_SSE3;
bool HW_SSSE3;
bool HW_SSE41;
bool HW_SSE42;
bool HW_SSE4a;
bool HW_AES;
bool HW_SHA;

//  SIMD: 256-bit
bool HW_AVX;
bool HW_XOP;
bool HW_FMA3;
bool HW_FMA4;
bool HW_AVX2;

//  SIMD: 512-bit
bool HW_AVX512F;    //  AVX512 Foundation
bool HW_AVX512CD;   //  AVX512 Conflict Detection
bool HW_AVX512PF;   //  AVX512 Prefetch
bool HW_AVX512ER;   //  AVX512 Exponential + Reciprocal
bool HW_AVX512VL;   //  AVX512 Vector Length Extensions
bool HW_AVX512BW;   //  AVX512 Byte + Word
bool HW_AVX512DQ;   //  AVX512 Doubleword + Quadword
bool HW_AVX512IFMA; //  AVX512 Integer 52-bit Fused Multiply-Add
bool HW_AVX512VBMI; //  AVX512 Vector Byte Manipulation Instructions

int info[4];
cpuid(info, 0);
int nIds = info[0];

cpuid(info, 0x80000000);
unsigned nExIds = info[0];

//  Detect Features
if (nIds >= 0x00000001){
    cpuid(info,0x00000001);
    HW_MMX    = (info[3] & ((int)1 << 23)) != 0;
    HW_SSE    = (info[3] & ((int)1 << 25)) != 0;
    HW_SSE2   = (info[3] & ((int)1 << 26)) != 0;
    HW_SSE3   = (info[2] & ((int)1 <<  0)) != 0;

    HW_SSSE3  = (info[2] & ((int)1 <<  9)) != 0;
    HW_SSE41  = (info[2] & ((int)1 << 19)) != 0;
    HW_SSE42  = (info[2] & ((int)1 << 20)) != 0;
    HW_AES    = (info[2] & ((int)1 << 25)) != 0;

    HW_AVX    = (info[2] & ((int)1 << 28)) != 0;
    HW_FMA3   = (info[2] & ((int)1 << 12)) != 0;

    HW_RDRAND = (info[2] & ((int)1 << 30)) != 0;
}
if (nIds >= 0x00000007){
    cpuid(info,0x00000007);
    HW_AVX2   = (info[1] & ((int)1 <<  5)) != 0;

    HW_BMI1        = (info[1] & ((int)1 <<  3)) != 0;
    HW_BMI2        = (info[1] & ((int)1 <<  8)) != 0;
    HW_ADX         = (info[1] & ((int)1 << 19)) != 0;
    HW_SHA         = (info[1] & ((int)1 << 29)) != 0;
    HW_PREFETCHWT1 = (info[2] & ((int)1 <<  0)) != 0;

    HW_AVX512F     = (info[1] & ((int)1 << 16)) != 0;
    HW_AVX512CD    = (info[1] & ((int)1 << 28)) != 0;
    HW_AVX512PF    = (info[1] & ((int)1 << 26)) != 0;
    HW_AVX512ER    = (info[1] & ((int)1 << 27)) != 0;
    HW_AVX512VL    = (info[1] & ((int)1 << 31)) != 0;
    HW_AVX512BW    = (info[1] & ((int)1 << 30)) != 0;
    HW_AVX512DQ    = (info[1] & ((int)1 << 17)) != 0;
    HW_AVX512IFMA  = (info[1] & ((int)1 << 21)) != 0;
    HW_AVX512VBMI  = (info[2] & ((int)1 <<  1)) != 0;
}
if (nExIds >= 0x80000001){
    cpuid(info,0x80000001);
    HW_x64   = (info[3] & ((int)1 << 29)) != 0;
    HW_ABM   = (info[2] & ((int)1 <<  5)) != 0;
    HW_SSE4a = (info[2] & ((int)1 <<  6)) != 0;
    HW_FMA4  = (info[2] & ((int)1 << 16)) != 0;
    HW_XOP   = (info[2] & ((int)1 << 11)) != 0;
}

обратите внимание, что это только определяет, поддерживает ли процессор инструкции. Чтобы на самом деле запустить их, вам также нужно поддержка операционной системы.

в частности, поддержка операционной системы требуется:

  • x64 инструкции. (Вам нужна 64-разрядная ОС.)
  • инструкции, которые используют (AVX) 256-бит ymm регистры. Смотрите ответ Энди Лутомирского как это обнаружить.
  • инструкции, которые используют (AVX512) 512-бит zmm и регистров маски. Определение поддержки операционной системы для AVX512 совпадает с Аух, но используя флаг 0xe6 вместо 0x6.

ответ Mysticial немного опасен - он объясняет, как обнаружить поддержку процессора, но не поддержку ОС. Вы должны использовать _xgetbv, чтобы проверить, включила ли ОС необходимое расширенное состояние ЦП. Смотрите здесь для другой источник. даже gcc сделал ту же ошибку. мясо кода:

bool avxSupported = false;

int cpuInfo[4];
__cpuid(cpuInfo, 1);

bool osUsesXSAVE_XRSTORE = cpuInfo[2] & (1 << 27) || false;
bool cpuAVXSuport = cpuInfo[2] & (1 << 28) || false;

if (osUsesXSAVE_XRSTORE && cpuAVXSuport)
{
    unsigned long long xcrFeatureMask = _xgetbv(_XCR_XFEATURE_ENABLED_MASK);
    avxSupported = (xcrFeatureMask & 0x6) == 0x6;
}

после совсем немного гуглить, я также нашел решения от Intel:

Ссылка: https://software.intel.com/en-us/articles/how-to-detect-new-instruction-support-in-the-4th-generation-intel-core-processor-family

    void cpuid(uint32_t eax, uint32_t ecx, uint32_t* abcd) {
#if defined(_MSC_VER)
            __cpuidex((int*)abcd, eax, ecx);
#else
            uint32_t ebx, edx;
# if defined( __i386__ ) && defined ( __PIC__ )
            /* in case of PIC under 32-bit EBX cannot be clobbered */
            __asm__("movl %%ebx, %%edi \n\t cpuid \n\t xchgl %%ebx, %%edi" : "=D" (ebx),
# else
            __asm__("cpuid" : "+b" (ebx),
# endif
            "+a" (eax), "+c" (ecx), "=d" (edx));
            abcd[0] = eax; abcd[1] = ebx; abcd[2] = ecx; abcd[3] = edx;
#endif
    }

    int check_xcr0_ymm()
    {
        uint32_t xcr0;
#if defined(_MSC_VER)
        xcr0 = (uint32_t)_xgetbv(0);  /* min VS2010 SP1 compiler is required */
#else
        __asm__("xgetbv" : "=a" (xcr0) : "c" (0) : "%edx");
#endif
        return ((xcr0 & 6) == 6); /* checking if xmm and ymm state are enabled in XCR0 */
    }

также обратите внимание, что GCC имеет некоторые специальные встроенные функции, которые вы можете использовать (см.:https://gcc.gnu.org/onlinedocs/gcc-4.9.2/gcc/X86-Built-in-Functions.html ):

    if (__builtin_cpu_supports("avx2"))
    // ...

Если вы положите это вместе с информация выше, все будет хорошо работать.

на Mac OS это работает:

sysctl -a | grep machdep.cpu.features

в моей машине он выводит это:

machdep.ЦП.характеристики: ФПУ вме де ЧОП ВСК ПМа Пае МРЗ CX8 АПИК сентября MTRR ЭПГ СМА CMOV ПЭТ PSE36 CLFSH ДС с ACPI ММХ FXSR SSE за поддержкой SSE2 СС ГТО ТМ ПБЭ SSE3 PCLMULQDQ DTES64 MON DSCPL VMX EST TM2 SSSE3 FMA CX16 TPR PDCM SSE4.1SSE4.2 x2APIC MOVBE POPCNT AES PCID XSAVE OSXSAVE SEGLIM64 TSCTMR AVX1.0 RDRAND F16C

Как вы можете видеть с инструкциями, написанными жирным шрифтом, SSE3 и куча других инструкций SIMD поддерживаются.

чтобы добавить к ответу Абхирупа: В linux вы можете запустить эту команду оболочки, чтобы узнать функции, поддерживаемые вашим процессором

cat /proc/cpuinfo | grep flags | uniq

на моей машине это выводит

флаги : ППУ вме де ЧОП ВСК ПМа Пае МРЗ cx8 апик сентября mtrr ЭПГ СМА cmov ПЭТ pse36 clflush ММХ fxsr SSE за поддержкой SSE2 ХТ операции в NX pdpe1gb rdtscp лм constant_tsc rep_good НОПЛ xtopology nonstop_tsc aperfmperf eagerfpu пни pclmulqdq ssse3 фма cx16 псмд sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer ня команду xsave Аух f16c rdrand гипервизора lahf_lm про 3dnowprefetch invpcid_single retpoline Кайзер fsgsbase bmi1 хле поддержкой AVX2 СМЭП bmi2 асэд invpcid РТМ rdseed индикатор ADX xsaveopt