preguntar acerca de avx

2
réponses

Utilisation des instructions du processeur AVX: mauvaise performance sans » / arch: AVX»

mon code C++ utilise SSE et maintenant je veux l'améliorer pour supporter AVX quand il est disponible. Donc je détecte quand AVX est disponible et j'appelle une fonction qui utilise des commandes AVX. J'utilise Win7 SP1 + VS2010 SP1 et un CPU avec AV …
demandé sur 1970-01-01 00:33:31
3
réponses

Intel AVX: version à 256 bits du produit dot pour les variables à virgule flottante de double précision

les Extensions vectorielles avancées Intel (AVX) n'offrent pas de produit dot dans la version de 256 bits (YMM register) pour les variables à virgule flottante de double précision . Le " Pourquoi?"question ont été traités très brièvement dans un au …
demandé sur 1970-01-01 00:33:32
1
réponses

Performance étonnamment bonne avec openmp parallèle pour boucle

j'ai édité ma question après des commentaires précédents (en particulier @Zboson) pour une meilleure lisibilité j'ai toujours agi sur, et observé, la sagesse conventionnelle que le nombre de threads openmp devrait grosso modo correspondre …
demandé sur 1970-01-01 00:33:34
2
réponses

Comment additionner M256 horizontalement?

j'aimerais faire la somme horizontale des composantes d'un vecteur __m256 en utilisant les instructions AVX. En SSE je pourrais utiliser _mm_hadd_ps(xmm,xmm); _mm_hadd_ps(xmm,xmm); pour obtenir le résultat au premier composant du vecte …
demandé sur 1970-01-01 00:33:32