主頁 >  其他 > 【演算法隨記七】巧用SIMD指令實作急速的位元組流按位反轉演算法。

【演算法隨記七】巧用SIMD指令實作急速的位元組流按位反轉演算法。

2020-09-23 16:34:15 其他

  位元組按位反轉演算法,在有些演算法加密或者一些特殊的場合有著較為重要的應用,其速度也是一個非常關鍵的應用,比如一個byte變數a = 3,其二進制表示為00000011,進行按位反轉后的結果即為11000000,即十進制的192,還有一種常用的應用是int型變數按位反轉,其基本的原理和位元組反轉類似,本文僅以位元組反轉為例來比較這個演算法的實作,

  一種最為傳統和直接的演算法實作如下:

unsigned char Reverse8U(unsigned char x)
{
    x = (x & 0xaa) >> 1 | (x & 0x55) << 1;
    x = (x & 0xcc) >> 2 | (x & 0x33) << 2;
    x = (x & 0xf0) >> 4 | (x & 0x0f) << 4;
    return x;
}

  我們對大資料進行測驗,測驗的代碼如下:

void Byte_Reverse_01(unsigned char *Src, unsigned char *Dest, int Length)
{
    for (int Y = 0; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  當Length=100000000(一億)時,上面的代碼大概用時470毫秒,我們稍微更改下函式的樣式,更改如下:

unsigned char Reverse8U(unsigned int x)
{
    x = (x & 0xaa) >> 1 | (x & 0x55) << 1;
    x = (x & 0xcc) >> 2 | (x & 0x33) << 2;
    x = (x & 0xf0) >> 4 | (x & 0x0f) << 4;
    return x;
}

  還是使用Byte_Reverse_01的代碼,神奇的結果顯示速度一下子就跳到220ms,快了一倍多,其實這個看下反匯編的代碼就可以看到問題所在了,主要是前面的代碼使用了暫存器的低位,在32位的環境下不是很有效,

  注意C語言中默認是傳值,所以在函式體內改變了x變數的值,并不會產生其他的什么問題,直接回傳這個x不會影響Src中的資料,

  第二步改動,我們試著4路并行看看,即如下代碼:

void Byte_Reverse_02(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 4, Block = Length / BlockSize;
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        Dest[Y + 0] = Reverse8U(Src[Y + 0]);
        Dest[Y + 1] = Reverse8U(Src[Y + 1]);
        Dest[Y + 2] = Reverse8U(Src[Y + 2]);
        Dest[Y + 3] = Reverse8U(Src[Y + 3]);
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  四路并行,一個是可以讓編譯器編譯出能更充分利用指令級并行的指令(即在同一個指令周期內完成2個或多個指令),二是在一定程度上減少了回圈變數計數的耗時,雖然這個對大回圈不明顯,但是在本例這種輕計算量的代碼里還是有一定作用的,

  演算法的速度變為大概195ms,提速不是很明顯,

  下一步改進,我們知道,現代編譯器對位元組變數的處理其實速度可能還不如處理int型別,因此,我們考慮把這個四個位元組的反轉用一個int型別的變數也一次性實作,這可以用下面的代碼實作:

unsigned int Reverse32I(unsigned int x)
{
    x = (((x & 0xaaaaaaaa) >> 1) | ((x & 0x55555555) << 1));
    x = (((x & 0xcccccccc) >> 2) | ((x & 0x33333333) << 2));
    x = (((x & 0xf0f0f0f0) >> 4) | ((x & 0x0f0f0f0f) << 4));
    return x;
}

  注意這里起名叫Reverse32I其實不是很適合,畢竟他不是反轉32位數,但你知道就可以了,

  測驗代碼如下:

void Byte_Reverse_03(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 4, Block = Length / BlockSize;
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        *((unsigned int *)(Dest + Y)) = Reverse32I(*((unsigned int *)(Src + Y)));
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  測驗結果顯示執行耗時為65ms,靠,速度提高了三四倍,

  接下來,我們考慮另外的實作方法,因為byte只有256個不同的數,因此,我們也可以直接用查表的方式來實作,這個表可以實時計算(耗時可以忽視),也可以靜態給出,前人已經給給出了,這里我直接貼出來:

static const unsigned char BitReverseTable256[] =
{
    0x00, 0x80, 0x40, 0xC0, 0x20, 0xA0, 0x60, 0xE0, 0x10, 0x90, 0x50, 0xD0, 0x30, 0xB0, 0x70, 0xF0,
    0x08, 0x88, 0x48, 0xC8, 0x28, 0xA8, 0x68, 0xE8, 0x18, 0x98, 0x58, 0xD8, 0x38, 0xB8, 0x78, 0xF8,
    0x04, 0x84, 0x44, 0xC4, 0x24, 0xA4, 0x64, 0xE4, 0x14, 0x94, 0x54, 0xD4, 0x34, 0xB4, 0x74, 0xF4,
    0x0C, 0x8C, 0x4C, 0xCC, 0x2C, 0xAC, 0x6C, 0xEC, 0x1C, 0x9C, 0x5C, 0xDC, 0x3C, 0xBC, 0x7C, 0xFC,
    0x02, 0x82, 0x42, 0xC2, 0x22, 0xA2, 0x62, 0xE2, 0x12, 0x92, 0x52, 0xD2, 0x32, 0xB2, 0x72, 0xF2,
    0x0A, 0x8A, 0x4A, 0xCA, 0x2A, 0xAA, 0x6A, 0xEA, 0x1A, 0x9A, 0x5A, 0xDA, 0x3A, 0xBA, 0x7A, 0xFA,
    0x06, 0x86, 0x46, 0xC6, 0x26, 0xA6, 0x66, 0xE6, 0x16, 0x96, 0x56, 0xD6, 0x36, 0xB6, 0x76, 0xF6,
    0x0E, 0x8E, 0x4E, 0xCE, 0x2E, 0xAE, 0x6E, 0xEE, 0x1E, 0x9E, 0x5E, 0xDE, 0x3E, 0xBE, 0x7E, 0xFE,
    0x01, 0x81, 0x41, 0xC1, 0x21, 0xA1, 0x61, 0xE1, 0x11, 0x91, 0x51, 0xD1, 0x31, 0xB1, 0x71, 0xF1,
    0x09, 0x89, 0x49, 0xC9, 0x29, 0xA9, 0x69, 0xE9, 0x19, 0x99, 0x59, 0xD9, 0x39, 0xB9, 0x79, 0xF9,
    0x05, 0x85, 0x45, 0xC5, 0x25, 0xA5, 0x65, 0xE5, 0x15, 0x95, 0x55, 0xD5, 0x35, 0xB5, 0x75, 0xF5,
    0x0D, 0x8D, 0x4D, 0xCD, 0x2D, 0xAD, 0x6D, 0xED, 0x1D, 0x9D, 0x5D, 0xDD, 0x3D, 0xBD, 0x7D, 0xFD,
    0x03, 0x83, 0x43, 0xC3, 0x23, 0xA3, 0x63, 0xE3, 0x13, 0x93, 0x53, 0xD3, 0x33, 0xB3, 0x73, 0xF3,
    0x0B, 0x8B, 0x4B, 0xCB, 0x2B, 0xAB, 0x6B, 0xEB, 0x1B, 0x9B, 0x5B, 0xDB, 0x3B, 0xBB, 0x7B, 0xFB,
    0x07, 0x87, 0x47, 0xC7, 0x27, 0xA7, 0x67, 0xE7, 0x17, 0x97, 0x57, 0xD7, 0x37, 0xB7, 0x77, 0xF7,
    0x0F, 0x8F, 0x4F, 0xCF, 0x2F, 0xAF, 0x6F, 0xEF, 0x1F, 0x9F, 0x5F, 0xDF, 0x3F, 0xBF, 0x7F, 0xFF
};

  最直接的查找代碼如下:

void Byte_Reverse_04(unsigned char *Src, unsigned char *Dest, int Length)
{
    for (int Y = 0; Y < Length; Y++)
    {
        Dest[Y] = BitReverseTable256[Src[Y]];
    }
}

  測驗耗時:70ms,速度也是不錯的,

  如果分四路并行測驗,代碼如下:

void Byte_Reverse_05(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 4, Block = Length / BlockSize;
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        Dest[Y + 0] = BitReverseTable256[Src[Y + 0]];
        Dest[Y + 1] = BitReverseTable256[Src[Y + 1]];
        Dest[Y + 2] = BitReverseTable256[Src[Y + 2]];
        Dest[Y + 3] = BitReverseTable256[Src[Y + 3]];
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = BitReverseTable256[Src[Y]];
    }
}

  測驗耗時:40ms,速度又有了大幅度的提高了,同時和前面的Byte_Reverse_02相比,明天提速比例完全不在一個檔次,這是因此這里代碼非常簡單,就是一個查找表,他很容易實作指令級的并行,

  還有一種方式,其實也類似于四路并行,如下所示:

void Byte_Reverse_06(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 4, Block = Length / BlockSize;
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        unsigned int Value = https://www.cnblogs.com/Imageshop/p/*((unsigned int *)(Src + Y));
        *((unsigned int *)(Dest + Y)) = (BitReverseTable256[Value & 0xff]) |
            (BitReverseTable256[(Value >> 8) & 0xff] << 8) |
            (BitReverseTable256[(Value >> 16) & 0xff] << 16) |
            (BitReverseTable256[(Value >> 24) & 0xff] << 24);
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = BitReverseTable256[Src[Y]];
    }
}

  本來想利用int比byte處理起來快的特性,但是這樣處理有計算量增大了,結果耗時50ms,比四路并行反而慢了一點,

   在 c語言實作bit反轉的最佳演算法-從msb-lsb到lsb-msb一文的回復一欄中,我無意看到ytfhwfnh的回復如下:

   我覺得查表法不錯,但是表太大了,建議改為半位元組為單元的查表,這樣,只需要16個uchar的表就夠了,查表,再翻轉高低半位元組,再翻轉一個int32的4個位元組,就能搞定了,

  他這個話的后續的再翻轉一個int32的4個位元組在本例中正好不要,他提供的示例代碼如下:

LOCAL u_long ucharBitsListR2Ulong(u_char* ucBits)
{
    const static u_char BitReverseTable16[] = 
    {
        0x0, 0x8, 0x4, 0xC, 0x2, 0xA, 0x6, 0xE,
        0x1, 0x9, 0x5, 0xD, 0x3, 0xB, 0x7, 0xF
    };
    u_long ret = 0;
    int i = 0;
 
    for (; i < 4; i++)
    {
        /* 獲取當前位元組,高4位 */
        u_char ucTmp = (ucBits[i] >> 4) & 0x0F;
        /* 查表得反轉的半位元組,并轉為u_long */
        u_long ulTmp = BitReverseTable16[ucTmp];
        /* 存入ret對應位置的低4位 */
        ret [表情]= ulTmp << (i * 8);
        
        /* 獲取當前位元組,低4位 */
        ucTmp = ucBits[i] & 0x0F;
        /* 查表得反轉的半位元組,并轉為u_long */
        ulTmp = BitReverseTable16[ucTmp];
        /* 存入ret對應位置的高4位 */
        ret [表情]= ulTmp << (i * 8 + 4);
    }
 
    return ret;
}

  這個[表情]是 CSDN的特色,實際上他應該是| 運算子,

  我們把他這個函式直接展開嵌入到回圈中,形成了如下的利用16位進行查表的演算法:

void Byte_Reverse_08(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 4, Block = Length / BlockSize;
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        unsigned int Value = https://www.cnblogs.com/Imageshop/p/*((unsigned int *)(Src + Y));
        *((unsigned int *)(Dest + Y)) =
            (BitReverseTable16[(Src[Y + 0] >> 4) & 0x0F]) | (BitReverseTable16[Src[Y + 0] & 0x0F] << 4) |
            (BitReverseTable16[(Src[Y + 1] >> 4) & 0x0F] << 8) | (BitReverseTable16[Src[Y + 1] & 0x0F] << 12) |
            (BitReverseTable16[(Src[Y + 2] >> 4) & 0x0F] << 16) | (BitReverseTable16[Src[Y + 2] & 0x0F] << 20) |
            (BitReverseTable16[(Src[Y + 3] >> 4) & 0x0F] << 24) | (BitReverseTable16[Src[Y + 3] & 0x0F] << 28);
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  很可惜,我沒有得到我想要的效果,這段代碼結果耗時110ms,比256個元素的查找表慢,

  那同樣,我們用四路并行實作他們試下,即如下代碼:

void Byte_Reverse_08(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 4, Block = Length / BlockSize;
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        Dest[Y + 0] = (BitReverseTable16[(Src[Y + 0] >> 4) & 0x0F]) | (BitReverseTable16[Src[Y + 0] & 0x0F] << 4);
        Dest[Y + 1] = (BitReverseTable16[(Src[Y + 1] >> 4) & 0x0F]) | (BitReverseTable16[Src[Y + 1] & 0x0F] << 4);
        Dest[Y + 2] = (BitReverseTable16[(Src[Y + 2] >> 4) & 0x0F]) | (BitReverseTable16[Src[Y + 2] & 0x0F] << 4);
        Dest[Y + 3] = (BitReverseTable16[(Src[Y + 3] >> 4) & 0x0F]) | (BitReverseTable16[Src[Y + 3] & 0x0F] << 4);
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  同樣道理,這樣又要快一點了,能做到75ms,但比256個查找表的多路并行還是要慢的,

  這是可以理解的,一般來說,查找表越少,同樣的查找次數耗時則越小,這主要得益于小的查找表有著較小的cache miss,但是我們注意到,上述16個元素的查找表的查找次數多了一倍,而且也多了很多移位和或運算,因此,總的耗時并沒有減少,

  但是,到這里,就出現了一個令我非常感興趣的話題了,我一直在思考如何利用SIMD指令實作快速的查表問題,后來得到的結論是,這個基本上不可行,對應SSE,除非幾個特殊的表,一個情況就是,這個查找表只有16個元素,而且表的型別是byte型別,這個時候,我們就可以利用_mm_shuffle_epi8指令進行快速的shuffle,此時的效果就比直接查表要快了很多了,

  那么仔細的觀察上面的代碼,除了查表之外,其他的計算太容易用SSE相應的指令實作了,或計算,并計算,注意移位計算SSE指令的_mm_srli_si128 、_mm_slli_si128并不是按位移位的,他是按照位元組進行的移位,這個時候我們可借用_mm_srli_epi16或者_mm_srli_epi32來實作相同的功能,

  此時,可編制如下的SSE代碼實作相同的功能:

void Byte_Reverse_09(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 16, Block = Length / BlockSize;
    __m128i Table = _mm_loadu_si128((__m128i *)BitReverseTable16);
    __m128i Mask = _mm_set1_epi8(0x0F);
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        __m128i SrcV = _mm_loadu_si128((__m128i *)(Src + Y));
        __m128i High = _mm_and_si128(_mm_srli_epi16(SrcV, 4), Mask);        //    高四位
        __m128i Low = _mm_and_si128(SrcV, Mask);                            //    低四位
        High = _mm_shuffle_epi8(Table, High);                                //    查找表
        Low = _mm_shuffle_epi8(Table, Low);
        _mm_storeu_si128((__m128i *)(Dest + Y), _mm_or_si128(High, _mm_slli_epi16(Low, 4)));    //    合并保存
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  此時函式的執行速度提高到了25ms左右,并且我們看到,這里其實是實質上就沒有任何的查表作業了,也不存在所謂的cache miss的,

  在此基礎上,我們可以將這個函式擴展到使用AVX優化,AVX支持一次性處理32個位元組的資料,比SSE還要擴展一倍,并且現在大部分CPU已經支持AVX2了,嘗試一下:

void Byte_Reverse_10(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 32, Block = Length / BlockSize;
    __m256i Table = _mm256_loadu_si256((__m256i *)BitReverseTable32);
    __m256i Mask = _mm256_set1_epi8(0x0F);
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        __m256i SrcV = _mm256_loadu_si256((__m256i *)(Src + Y));
        __m256i High = _mm256_and_si256(_mm256_srli_epi16(SrcV, 4), Mask);        //    高四位
        __m256i Low = _mm256_and_si256(SrcV, Mask);                            //    低四位
        High = _mm256_shuffle_epi8(Table, High);                                //    查找表
        Low = _mm256_shuffle_epi8(Table, Low);
        _mm256_storeu_si256((__m256i *)(Dest + Y), _mm256_or_si256(High, _mm256_slli_epi16(Low, 4)));    //    合并保存
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  速度也基本在25ms左右波動,區別和SSE不是很多大,

  最后,我們在回傳到最開始的unsigned char Reverse8U(unsigned char x)函式,我們發現,這個函式內部的演算法天然的就支持SSE并行化處理,我們可以稍微修改下語法就可以得到對應的SSE版本函式,如下所示:

void Byte_Reverse_11(unsigned char *Src, unsigned char *Dest, int Length)
{
    int BlockSize = 16, Block = Length / BlockSize;
    for (int Y = 0; Y < Block * BlockSize; Y += BlockSize)
    {
        __m128i V = _mm_loadu_si128((__m128i *)(Src + Y));
        V = _mm_or_si128(_mm_srli_epi16(_mm_and_si128(V, _mm_set1_epi8(0xaa)), 1), _mm_slli_epi16(_mm_and_si128(V, _mm_set1_epi8(0x55)), 1));
        V = _mm_or_si128(_mm_srli_epi16(_mm_and_si128(V, _mm_set1_epi8(0xcc)), 2), _mm_slli_epi16(_mm_and_si128(V, _mm_set1_epi8(0x33)), 2));
        V = _mm_or_si128(_mm_srli_epi16(_mm_and_si128(V, _mm_set1_epi8(0xf0)), 4), _mm_slli_epi16(_mm_and_si128(V, _mm_set1_epi8(0x0f)), 4));
        _mm_storeu_si128((__m128i *)(Dest + Y), V);
    }
    for (int Y = Block * BlockSize; Y < Length; Y++)
    {
        Dest[Y] = Reverse8U(Src[Y]);
    }
}

  這個版本也是相當的快的,大約用時28ms左右,而且不占用任何其他記憶體,

  當然,以上的時間比較只基于本人的一臺電腦,在不同的CPU系列當中,各演算法之間的耗時比例是不太相同的,有些甚至出現了相反的現象,總的來說,用多路并行256個元素的查找表方式是最為穩妥和夸平臺的,如果在PC段,則可以考慮時候用SIMD優化的版本,

  各版本的總和速度比較如下:

      

 

  附本文完整測驗代碼供有興趣的朋友研究:https://files.cnblogs.com/files/Imageshop/Byte_Reverse.rar

  既然是針對位元組的資料處理,自然而然我們想到可以直接把他應用在影像上,比如對lena影像,應用這個演算法得到如下效果:

 

   后面一幅圖你還能看出他是lena嗎,但是確實可以對后面的圖再次利用本演算法,恢復出完整的lena圖,這也可以算是最簡答的影像加密演算法之一吧,

        寫博不易,歡迎土豪打賞贊助,

 

 

 

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/112996.html

標籤:其他

上一篇:已知空間兩點組成的直線求線上某點的Z值

下一篇:PAT乙級1001

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more