ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

C SSE2或AVX2内在函数,用于灰度到ARGB转换

2019-08-24 00:07:04  阅读:306  来源: 互联网

标签:c intrinsics avx2 rgba


我想知道是否有一个SSE2 / AVX2整数指令或指令序列(或内在函数)要执行以实现以下结果:

给定一行8字节像素的形式:

A = {a, b, c, d, e, f, g, h}

有没有办法在包含8个32位ARGB像素的YMM寄存器中加载这些像素,以便将初始灰度值广播到每个相应32位像素的其他2个字节?结果应该是这样的:( 0是alpha值)

B = {0aaa, 0bbb, 0ccc, 0ddd, 0eee, 0fff, 0ggg, 0hhh}

我是矢量扩展的完全初学者,所以我甚至不确定如何处理它,或者它是否可能.

任何帮助,将不胜感激.谢谢!

UPDATE1

谢谢你的回答.我仍然有一个问题:

我把这个小例子放在一起,并在x64上用VS2015编译.

int main()
{
    unsigned char* pixels = (unsigned char*)_aligned_malloc(64, 32);
    memset(pixels, 0, 64);

    for (unsigned char i = 0; i < 8; i++)
        pixels[i] = 0xaa + i;

    __m128i grayscalePix = _mm_load_si128((const __m128i*)pixels);
    __m256i rgba = _mm256_cvtepu8_epi32(grayscalePix);
    __m256i mulOperand = _mm256_set1_epi32(0x00010101);

    __m256i result = _mm256_mullo_epi32(rgba, mulOperand);

   _aligned_free(pixels);
    return 0;
}

问题是做完之后

__m256i rgba = mm256_cvtepu8_epi32(grayscalePix)

rgba只有前四个双字组.最后四个都是0.

英特尔开发人员手册说:

VPMOVZXBD ymm1, xmm2/m64
Zero extend 8 packed 8-bit integers in the low 8
bytes of xmm2/m64 to 8 packed 32-bit integers in
ymm1.

我不确定这是否是预期的行为,或者我仍然遗漏了一些东西.

谢谢.

解决方法:

从Mark建议的PMOVZX开始.

但在此之后,PSHUFB(_mm256_shuffle_epi8)将比PMULLD快得多,除了它与PMOVZX竞争shuffle端口. (并且它在通道内运行,因此您仍然需要PMOVZX).

因此,如果您只关心吞吐量而不是延迟,那么_mm256_mullo_epi32就是好的.但是如果延迟很重要,或者如果你的吞吐量瓶颈不是每个矢量2个shuffle-port指令,那么PSHUFB复制每个像素中的字节应该是最好的.

实际上,即使对于吞吐量,_mm256_mullo_epi32在HSW和BDW上都是坏的:对于p0来说它是2 uops(10c延迟),所以对于一个端口它是2 uop.

在SKL上,p01为2 uop(10c延迟),因此它可以维持与VPMOVZXBD相同的每时钟吞吐量.但这是一个额外的1 uop,使其更容易出现瓶颈.

(对于支持AVX2的所有Intel CPU,VPSHUFB为1 uop,端口5为1c延迟.)

标签:c,intrinsics,avx2,rgba
来源: https://codeday.me/bug/20190823/1702492.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有