文章目錄
- 題目設計
- 解題步驟(Writeup)
題目附件請自取:
鏈接:https://pan.baidu.com/s/1u8jiXfpD7HvoQTCe4fW80w
提取碼:4whw
題目設計
- 考察知識點:
資料處理、wav檔案頭、高低振幅轉換、LSB隱寫 - 題目思路:
逆序位元組流資料->wav檔案->高低振幅轉換->LSB隱寫->異或測驗
以下是設計題目時所用到的腳本
檔案轉換二進制01資料
from binascii import *
with open('1.png', 'rb') as f:#需要轉換的檔案
with open('bin.txt', 'w') as f1:
hex_data = hexlify(f.read()).decode()
for i in range(0, len(hex_data), 2):
data = '{:08b}'.format(int(hex_data[i:i+2], 16))
f1.write(data)
二進制資料轉換wav高低振幅
import wave,struct,random
sampleRate = 44100.0
obj = wave.open('sound.wav','w')
obj.setnchannels(1)
obj.setsampwidth(2)
obj.setframerate(sampleRate)
with open('bin.txt', 'r') as f:
bin_data = f.read()
for i in bin_data:
if i == '1':
if random.randint(0,1) == 1:
obj.writeframesraw(struct.pack('<h', random.randint(30000, 32000)))
else:
obj.writeframesraw(struct.pack('<h', random.randint(-32000, -30000)))
elif i == '0':
if random.randint(0,1) == 1:
obj.writeframesraw(struct.pack('<h', random.randint(18000, 20000)))
else:
obj.writeframesraw(struct.pack('<h', random.randint(-20000, -18000)))
else:
break
obj.close()
逆序檔案位元組流
from binascii import *
with open('sound.wav', 'rb') as f:
hex_data = hexlify(f.read()).decode()[::-1]
with open('sound', 'wb') as f1:
for i in range(0, len(hex_data), 2):
data = hex_data[i:i+2][::-1]
f1.write(unhexlify(data))
對檔案整體進行異或
from binascii import *
with open('qrcode.png', 'rb') as f:
all_data = f.read()
with open('data', 'wb') as f1:
for i in range(len(all_data)):
f.seek(i)
data = int(hexlify(f.read(1)), 16)
xor_data = '{:02x}'.format(data ^ 0x7f)
f1.write(unhexlify(xor_data))
解題步驟(Writeup)
what檔案開頭并不是什么型別的檔案頭

檔案尾發現端倪,RIFF、 WAVE、fmt等字樣,很明顯這是wav檔案的檔案頭

使用Python簡單處理、反轉位元組流資料等到正確的wav檔案
from binascii import *
with open('what', 'rb') as f:
hex_data = hexlify(f.read()).decode()[::-1]
with open('data.wav', 'wb') as f1:
for i in range(0, len(hex_data), 2):
data = hex_data[i:i+2][::-1]
f1.write(unhexlify(data))
得到的wav檔案使用Audacity分析


通過分析不難發現,每一幀高低頻區別明顯,高頻在一定的范圍內,低頻也在一定的范圍內
- Python wav模塊檔案: https://docs.python.org/zh-cn/3/library/wave.html#module-wave
首先來簡單分析下振幅的規律
import wave
obj = wave.open('data.wav', 'r')
frames = obj.getnframes()
print("All Frames: {}".format(frames))
frames_data = obj.readframes(20).hex()#提取出前20幀的資料
for i in range(0, len(frames_data), 4):
data = frames_data[i:i+4]
real_data = int(data[2:] + data[:2], 16)
data1 = data[2:] + data[:2]
print("第{:<2}幀: {} => {} 真實資料值: {}".format(int((i+4)/4), data,data1 , real_data))
提取出來的每一幀的資料大小為兩位元組,且存盤方式為小端存盤,所以需要高位元組位和低位元組位換一下,然后轉換成數值

先分析正振幅的資料值,通過多次嘗試分析,基本就可以確認高振幅范圍為:30000-32000,低振幅范圍為:18000-20000
PS:分析高低振幅取值范圍可以提升提取出來的幀數來進行更精確的判斷
而負振幅資料無論高振幅還是低振幅,為什么都看起來都不在這個范圍之內呢,明明從Audacity中觀察到的波形的高低范圍和正振幅范圍都應該是一樣的,而得到的數值確大相徑庭呢?
我們知道如果是帶符號的2位元組整型的取值范圍是:[-2^(15)] ~ [2^(15)-1]也就是-32768至32767之間
那么就能解釋負振幅資料的問題了,很明顯發生了溢位;需要對數值進行一個轉換處理即可得到在范圍內的正常的資料
>>> import math
>>> math.pow(2,15)-(45650-math.pow(2,15))
19886.0#第二幀
>>> math.pow(2,15)-(47417-math.pow(2,15))
18119.0#第三幀
>>> math.pow(2,15)-(33915-math.pow(2,15))
31621.0#第五幀
>>> math.pow(2,15)-(35258-math.pow(2,15))
30278.0#第十二幀
OK,這樣就解決了負振幅資料轉換的問題
接下來就直接使用Python簡單處理,將高低振幅轉換成二進制資料即可;然后將得到的二進制資料寫成位元組流轉成檔案
import wave, math, struct
from binascii import *
obj = wave.open('data.wav', 'r')
frames = obj.getnframes()
frames_data = obj.readframes(frames).hex()
bin_data = ''
for idx in range(0, len(frames_data), 4):
data = frames_data[idx:idx+4]
data = data[2:] + data[:2]
if int(data, 16) <= 20000:
bin_data += '0'
elif int(data, 16) > 20000 and int(data, 16) <= 32000:
bin_data += '1'
elif int(data, 16) > math.pow(2, 15):
overflow_data = math.pow(2, 15) - (int(data, 16) - math.pow(2, 15))
if overflow_data > 20000 and overflow_data <= 32000:
bin_data += '1'
elif overflow_data <= 20000:
bin_data += '0'
hex_data = ''
for idx in range(0, len(bin_data), 8):
hex_data += '{:02x}'.format(int(bin_data[idx:idx+8], 2))
with open('data', 'wb') as f1:
f1.write(unhexlify(hex_data))

得到一張PNG圖片,從binwalk分析來看,檔案尾附加了內容


附加內容直接看不出來什么,嘗試對圖片分析,發現存在無密碼的LSB隱寫

hint: xor [00-ff] which one?
提示異或一個范圍內的一個值,即可猜測附加的資料是經過異或的;可以嘗試提取開頭的幾個位元組進行異或看看結果是否為常見檔案型別的檔案頭;Python簡單處理即可
head_bytes = 'F6 2F 31 38'
for n in range(0xff):
hex_data = head_bytes.split(" ")
xor_data = ''
for data in hex_data:
data = int(data, 16) ^ n
xor_data += ' {:02x}'.format(data)
print("XOR {:02x}: {}".format(n, xor_data))
從結果中可以發現出現了PNG檔案頭

將附加資料提取出來,使用010 Editor打開工具->十六進制運算->二進制異或


得到一張二維碼,掃描即可得到flag

BMZCTF{755f3d5c-4817-4610-a377-68743f09e60a}
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/401648.html
標籤:python
