《自拍教程69》Python 批量重命名音頻檔案，AV專家必備！-有解無憂

本篇主要學習如何Python自定義模塊并呼叫該模塊，并重點介紹Python正則運算式的強大的文本處理能力，

案例故事: 任何一款終端產品只要涉及音頻輸出，就肯定涉及音頻的解碼,
作為一名專業的AV (Audio & Video）測驗人員，我們需要一堆的規范化標準的的音頻測驗檔案，
但是發現音瞥澩名字命名的很隨意比如：青藏高原.wma,
以上命名不能看出音頻檔案的具體編碼規格，
測驗經理要求我進行批量重命名作業，模板如下,
音頻編碼格式_音頻采樣率_聲道數_位元率_容器.容器, 例如：
WMA_44.1KHz_stereo_192Kbps_wma.wma

音頻編解碼基本知識

將聲音存盤為音頻檔案的時候，需要經過以下幾個步驟：

需要錄制（采樣）成音頻原始資料;
通過一定的編碼壓縮技術將音頻原始資料盡可能地壓縮成最小;
通過音頻容器以獨立檔案的形式存盤音頻;

主要涉及以下技術引數:

音頻引數	引數釋義	舉例
音頻編碼格式（壓縮技術）	即將音頻資料壓縮的一類技術, 不同的編碼格式，其壓縮率與壓縮效果不一樣，主要分成2類：有損壓縮（會導致失真，壓縮率高）無損壓縮（盡量保真，壓縮率低）	有損壓縮： Mpeg1 Level3(即我們常說的Mp3)； WMA；LCACC； LTPAAC； HE-AAC, HE-AACV2； AMR-WB, AMN-NB； Vorbis；MiDi；無損壓縮： Flac；PCM;APE
音頻采樣率 (單位：Khz)	將聲音記錄成資料檔案的時候，需要對聲音進行采樣，每秒鐘對聲音信號的采樣次數即采樣率，采樣率越高，越能還原現場音質，	比如44.1Khz代表每秒采樣44100次 8Khz, 11.025Khz, 22.5Khz, 32Khz, 44.1Khz, 48Khz,96Khz
音頻位深度 (單位：bit)	每次采樣，采集資料量的大小	8bit, 16bit
音頻聲道數 (單位：channel)	一般有雙聲道即2個聲道，錄音的時候肯定是需要2個麥克風同時錄制的，即同時采集了2個音頻流， 5聲道，則需要有5個麥克風同時錄制	單聲道：1 channel, Mono 雙聲道：2 channels, Stereo 5聲道：5 channels
音頻位元率 (單位：Kbps)	每秒鐘的音頻流的資料量，其大小是直接取決于：音頻編碼格式（壓縮率），采樣率，位深度，聲道數乘積	48Kbps, 96Kbps, 128Kbps，256Kbps
音頻容器	檔案后綴，將音頻流封裝的一種檔案格式	.mp3; .wma; .aac; .3gp; .mp4; .flac ; .ape;.pcm; .raw; .mid; .ogg; .wav; .mkv; .m4a

我們碰到的任何音頻檔案，都是資料的集合，
一般資料越大，其音頻播放質量越好，

準備階段

確保mediainfo.exe 命令列工具已經加入環境變數，查看其具體功能方法，
以下是某個音頻檔案的mediainfo資訊, 都是文本，Python處理起來肯定很簡單的，
如果要進行批量重命名音頻，我們還是用輸入輸出檔案架構，如下：


	+---Input_Audio   #批量放入待命名的音頻
	|       1.mp3
	|       青藏高原.wma
	|       
	+---Output_Video   #批量輸出已命名的音頻
	|       Mpeg3L1_44.1KHz_stereo_128Kbps_mp3.mp3
	|		WMA_44.1Khz_stereo_96Kbps_wma.wma
	|
    \audio_info.py   # 獲取音頻檔案info資訊的模塊，
	\rename_audio.py  #呼叫audio_info.py并實作重名，可雙擊運行

定義audio_info.py模塊

由于涉及較復雜的代碼，建議直接用面向物件類的編程方式實作：

# coding=utf-8

import os
import re
import subprocess


class AudioInfoGetter():
    '''獲取音頻檔案的codec, sample_rate, channels, bitrate'''

    def __init__(self, audio_file):
        '''判斷檔案是否存在，如果存在獲取其mediainfo資訊'''
        if os.path.exists(audio_file):
            self.audio_file = audio_file
            p_obj = subprocess.Popen('mediainfo "%s"' % self.audio_file, shell=True, stdout=subprocess.PIPE,
                                     stderr=subprocess.PIPE)
            self.info = p_obj.stdout.read().decode("utf-8")  # 解決非英文字符的編碼問題
        else:
            raise FileNotFoundError("Not this File!")  # 如果多媒體檔案路徑不存在，必須中斷

    def get_audio_codec(self):
        '''獲取音頻的編碼格式，比如Mepg3L1就是我們常說的Mp3， 還有AAC系列，AMR系列，Flac等等'''
        try:
            audio_codec = re.findall(r"Format\s+:\s(.*)", self.info)[-1]  # 取第最后一個Format欄位
            audio_codec = audio_codec.strip()  # 去除前后的空格
            if (audio_codec == "MPEG Audio"):
                audio_codec = self.__format_mpeg_audio()
            elif (audio_codec == "AMR"):
                audio_codec = self.__format_amr_audio()
            elif (audio_codec == "AAC"):
                audio_codec = self.__format_aac_audio()
            elif ("PCM" in audio_codec):
                audio_codec = "PCM"
            else:
                pass
        except:
            audio_codec = "undef"  # 防止程式因為例外而中斷
        return audio_codec

    def get_audio_channel(self):
        '''獲取聲道數，如果是雙聲道是stereo, 如果是單聲道是mono,還存在5聲道的情況'''
        try:
            audio_channel = re.findall(r"Channel\(s\)\s+:\s(.*)\schannel.*", self.info)[-1]
            audio_channel = audio_channel.strip()  # 過濾掉前后空格
            if audio_channel == "2":
                audio_channel = "stereo"
            elif audio_channel == "1":
                audio_channel = "mono"
            elif audio_channel == "5":
                audio_channel = "5-channels"
            else:
                audio_channel = "undef"  # 設定為undef，表示特殊例外規格，建議人工驗證并考慮手動重命名
        except:
            audio_channel = "undef"  # 防止程式因為例外而中斷
        return audio_channel

    def get_audio_sample_rate(self):
        '''獲取音頻采樣率，比如常見的48Khz, 44.1Khz等'''
        try:
            audio_sample_rate = re.findall(r"Sampling rate\s+:\s(.*)", self.info)[-1].strip()
            audio_sample_rate = audio_sample_rate.replace(" ", "")  # 去1 536 這個數字里的空格
            if "K" not in audio_sample_rate:
                audio_sample_rate = audio_sample_rate.replace("Hz", "")  # 先去掉“Hz"
                audio_sample_rate = str(int(int(audio_sample_rate) / 1000))
                audio_sample_rate = audio_sample_rate + "Khz"  # 再添上KHz的單位
            elif audio_sample_rate.endswith(".0Khz"):
                audio_sample_rate = audio_sample_rate.replace(".0", "")
            elif "/" in audio_sample_rate:  # 偶爾會有多個采樣率的情況 48.0 Khz / 44.1 KHz 這種
                audio_sample_rate = "undef"  # # 設定為undef，表示特殊例外規格，建議人工驗證并考慮手動重命名
            else:
                pass
        except:
            audio_sample_rate = "undef"  # 防止程式因為例外而中斷
        return audio_sample_rate

    def get_audio_bitrate(self):
        '''獲取音頻位元率，比如96Kbps, 128Kbps'''
        try:
            audio_bitrate = re.findall(r"Bit rate\s+:\s(.*)", self.info)[-1].strip()
            audio_bitrate = audio_bitrate.replace(" ", "")  # 去掉1 536 這個數字里的空格
            if "K" not in audio_bitrate:
                audio_bitrate = audio_bitrate.replace("bps", "")  # 先去掉“bps"
                audio_bitrate = str(int(audio_bitrate) / 1000)
                audio_bitrate = audio_bitrate + "Kbps"  # 再添上KHz的單位
        except:
            audio_bitrate = "undef"  # 防止程式因為例外而中斷
        return audio_bitrate

    def get_audio_container(self):
        '''獲取音頻容器，即檔案后綴名'''
        _, audio_container = os.path.splitext(self.audio_file)
        if not audio_container:
            raise NameError("This file no extension")
        audio_container = audio_container.replace(".", "")
        return audio_container

    def __format_mpeg_audio(self):
        '''如果是Mpeg Auido的音頻格式（常見的比如Mp3(Mpeg1 Level3))，進行格式化'''
        try:
            mpeg_audio_version = re.findall(r"Format version\s+:\sVersion\s(.*)", self.info)[-1].strip()
            mpeg_audio_profile = re.findall(r"Format profile\s+:\sLayer\s(.*)", self.info)[-1].strip()
            mpeg_audio_profile = "Mpeg%sL%s" % (mpeg_audio_version, mpeg_audio_profile)
        except:
            mpeg_audio_profile = "undef"
        return mpeg_audio_profile

    def __format_amr_audio(self):
        '''如果是amr的音頻格式（常見的比如amr-nb amr-wb)，進行格式化'''
        try:
            amr_profile = re.findall(r"Format profile\s+:\s(.*)", self.info)[-1].strip()
            if amr_profile == "Wide band":
                amr_profile = "AMR-WB"
            elif amr_profile == "Narrow band":
                amr_profile = "AMR-NB"
            else:
                amr_profile = "undef"  # 設定為undef，表示特殊例外規格，建議人工驗證并考慮手動重命名
        except:
            amr_profile = "undef"
        return amr_profile

    def __format_aac_audio(self):
        '''如果是acc的音頻格式（常見的比如AAC-LC, AAC-LTP, HE-AAC, HE-AACV2)，進行格式化'''
        try:
            amr_profile = re.findall(r"Format profile\s+:\s(.*)", self.info)[-1].strip()
            if amr_profile == "LC":
                aac_profile = "AAC-LC"
            elif amr_profile == "LTP":
                aac_profile = "AAC-LTP"
            elif amr_profile.startswith("HE-AACv2"):
                aac_profile = "HE-AACV2"
            elif amr_profile.startswith("HE-AAC"):
                aac_profile = "HE-AAC"
            else:
                aac_profile = "undef"  # 設定為undef，表示特殊例外規格，建議人工驗證并考慮手動重命名
        except:
            aac_profile = "undef"
        return aac_profile


if __name__ == '__main__':
    # 以下代碼塊，只是用來測驗本模塊的，一般不建議直接在這里大面積呼叫本模塊'''
    a_obj = AudioInfoGetter("C:\\好聽的歌曲.wma")
    audio_codec = a_obj.get_audio_codec()
    print(audio_codec)

呼叫audio_info.py模塊并實作批量重命名

# coding=utf-8

import os
import audio_info
from shutil import copyfile

curdir = os.getcwd()

# 輸入檔案夾，放入待重命名的音頻
input_audio_path = os.path.join(curdir, "Input_Audio")
filelist = os.listdir(input_audio_path) #獲取檔案串列

# 輸出檔案夾，已命名的視頻存放在這里
output_audio_path = os.path.join(curdir, "Output_Audio")

# 如果沒有Output_Audio這個檔案夾，則創建這個檔案夾
if not os.path.exists(output_audio_path):
    os.mkdir(output_audio_path)


if filelist:  # 如果檔案串列不為空
    for i in filelist:  # 變數檔案串列
        audio_file = os.path.join(input_audio_path, i)
        a_obj = audio_info.AudioInfoGetter(audio_file)
        audio_codec = a_obj.get_audio_codec()
        audio_sample_rate = a_obj.get_audio_sample_rate()
        audio_channel = a_obj.get_audio_channel()
        audio_bitrate = a_obj.get_audio_bitrate()
        audio_container = a_obj.get_audio_container()
        new_audio_name = audio_codec + "_" + audio_sample_rate + "_" + audio_channel + "_" \
                         + audio_bitrate + "_" + audio_container + "." + audio_container
        print(new_audio_name)
        new_audio_file = os.path.join(output_audio_path, new_audio_name)
        copyfile(audio_file, new_audio_file)  # 復制檔案
else:
    print("It's a Empty folder, please input the audio files which need to be renamed firstly!!!")
os.system("pause")

本案例練手素材下載

包含：mediainfo.exe(更建議丟到某個環境變數里去），
各種編碼格式的音頻檔案，audio_info.py模塊，rename_audio.py批處理腳本
調轉自拍教程官網下載
運行效果如下：

以上可以看出，輸入輸出檔案架構的好處，
我只需要將不同名字不同字符的，待重命名的音頻檔案整理好，
丟到Input_Audio檔案夾下，運行程式腳本后查看Output_Audio輸出檔案，
就可以測驗腳本的運行是否正常，健壯性（容錯）是否符合要求，
從而對這個程式腳本實作了“灰盒測驗”，

小提示: 比如Android手機，Google推出了CDD(Compatibiltiy Definition Document兼容性定義檔案)，
其第5部分，涉及了很多音頻編解碼格式的規定：

這就是Android最主要的音頻多媒體編解碼測驗需求，

更多更好的原創文章，請訪問官方網站：www.zipython.com
自拍教程（自動化測驗Python教程，武散人編著）
原文鏈接：https://www.zipython.com/#/detail?id=2c26d313cea54e8ab9ab3ecb612b986c
也可關注“武散人”微信訂閱號，隨時接受文章推送，

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/138094.html

標籤：Python

上一篇：60%的人不懂Python中的多執行緒，本文教你

下一篇：Python基礎-21反射