1. 背景介紹
15年移動端直播應用火起來的時候,主要的直播協議是RTMP,多媒體服務以Adobe的AMS、wowza、Red5、crtmpserver、nginx rtmp module等,后面過長RTMP服務SRS開始流行,Android端播放器主要以開始以EXOPlayer播放HLS,但是HLS有延遲高的確定,隨后大家主要使用開源的ijkplyer,ijkplayer通過ffmpeg進行拉流及解碼,支持多種音視頻編碼,還有跨平臺,API與系統播放器保持一致等特征,后續各大廠提供的直播SDK均有ijkplayer身影,
當時在做一款游戲SDK,SDK主要提供了游戲畫面聲音采集、音視頻編解碼、直播推流、直播拉流播放等,SDK為游戲提供直播功能,播放也是采用了現成的ijkplayer播放器,但是SDK推廣的時候遇到了問題,游戲廠家嫌棄SDK體積大(其實總共也就3Mb左右),我們需要一款體積小,性能高的播放器,由于開發成本的原因一直沒有時間做,后面換作業期間,花了一個月時間把這款播放器開發出來,并開源了出來,oarplayer 是基于MediaCodec與srs-librtmp,完全不依賴ffmpeg,純C語言實作的播放器,本文主要介紹這款播放器的實作思路,
2. 整體架構設計
播放器整體播放流程如下:

通過srs-librtmp拉取直播流,通過package type分離音視頻流,將package資料快取到package佇列,解碼執行緒不斷從package佇列讀取package交由解碼器解碼,解碼器將解碼后的frame存盤到frame佇列,opensles播放執行緒與opengles渲染執行緒從frame佇列讀取frame播放與渲染,這里還涉及到音視頻同步,
播放器主要涉及了以下執行緒:
- rtmp拉流執行緒;
- 音頻解碼執行緒;
- 視頻解碼執行緒;
- 音頻播放執行緒;
- 視頻渲染執行緒;
- JNI回呼執行緒,
3. API介面設計
通過以下幾步即可完成rtmp播放:
- 實體化OARPlayer:
OARPlayer player = new OARPlayer(); - 設定視頻源:
player.setDataSource(rtmp_url); - 設定surface:
player.setSurface(surfaceView.getHolder()); - 開始播放:
player.start(); - 停止播放:
player.stop(); - 釋放資源:
player.release();
Java層方法封裝了JNI層方法,JNI層封裝呼叫了對應的具體功能,
4. rtmp拉流執行緒
oarplayer使用的是srs-librtmp,srs-librtmp是從SRS服務器匯出的一個客戶端庫,作者提供srs-librtmp初衷是:
- 覺得rtmpdump/librtmp的代碼太難讀了,而SRS的代碼可讀性很好;
- 壓測工具srs-bench是個客戶端,需要一個客戶端庫;
- 覺得服務器能搞好,客戶端也不在話下
目前srs-librtmp作者已經停止維護,主要原因如作者所說:
決定開源專案正義的絕對不是技術多好,而是能跑多久,技術很牛,性能很強,代碼風格很好,固然是個好事,但是這些都頂不上一個“不維護”的大罪過,代碼放出來不維護,怎么跟進業內技術的不斷發展呢,而決定能跑多久的,首先是技術熱情,然后是維護者的領域背景,SRS的維護者都是服務器背景,大家的作業都是在服務器,客戶端經驗太少了,無法長久維護客戶端的庫,因此,SRS決定果斷放棄srs-librtmp,不再維護客戶端庫,聚焦于服務器的快速迭代,客戶端并非不重要,而是要交給專業的客戶端的開源專案和朋友維護,比如FFmpeg也自己實作了librtmp,
oarplayer當初使用srs-librtmp是基于srs-librtmp代碼的可讀性考慮,oarplayer有相當高的模塊化特性,可以很方便的替換各個rtmp lib實作,這里介紹srs-librtmp介面:
- 創建srs_rtmp_t物件:
srs_rtmp_create(url); - 設定讀寫超時時間:
srs_rtmp_set_timeout; - 開始握手:
srs_rtmp_handshake; - 開始連接:
srs_rtmp_connect_app; - 設定播放模式:
srs_rtmp_play_stream; - 回圈讀取音視頻包:
srs_rtmp_read_packet(rtmp, &type, ×tamp, &data, &size); - 決議音頻包:
- 獲取編碼型別:
srs_utils_flv_audio_sound_format; - 獲取音頻采樣率:
srs_utils_flv_audio_sound_rate; - 獲取采樣位深:
srs_utils_flv_audio_sound_size; - 獲取聲道數:
srs_utils_flv_audio_sound_type; - 獲取音頻包型別:
srs_utils_flv_audio_aac_packet_type;
- 獲取編碼型別:
- 決議視頻包:
- 獲取編碼型別:
srs_utils_flv_video_codec_id; - 是否關鍵幀:
srs_utils_flv_video_frame_type; - 獲取視頻包型別:
srs_utils_flv_video_avc_packet_type;
- 獲取編碼型別:
- 決議metadata型別;
- 銷毀srs_rtmp_t物件:
srs_rtmp_destroy;
這里有個小技巧,我們在拉流執行緒中,回圈呼叫srs_rtmp_read_packet方法,可以通過srs_rtmp_set_timeout設定超時時間,但是如果超時時間設定的太短,會導致頻繁的喚起執行緒,如果設定超時時間太長,我們在停止時,必須等待超時結束才會能真正結束,這里我們可以使用poll模型,將rtmp的tcp socket放入poll中,再放入一個管道fd,在需要停止時向管道寫入一個指令,喚醒poll,直接停止rtmp拉流執行緒,
5. 主要資料結構
5.1 package結構:
typedef struct OARPacket {
int size;//包大小
PktType_e type;//包型別
int64_t dts;//解碼時間戳
int64_t pts;//顯示時間戳
int isKeyframe;//是否關鍵幀
struct OARPacket *next;//下一個包地址
uint8_t data[0];//包資料內容
}OARPacket;
5.2 package佇列:
typedef struct oar_packet_queue {
PktType_e media_type;//型別
pthread_mutex_t *mutex;//執行緒鎖
pthread_cond_t *cond;//條件變數
OARPacket *cachedPackets;//佇列首地址
OARPacket *lastPacket;//佇列最后一個元素
int count;//數量
int total_bytes;//總位元組數
uint64_t max_duration;//最大時長
void (*full_cb)(void *);//佇列滿回呼
void (*empty_cb)(void *);//佇列為慷訓呼
void *cb_data;
} oar_packet_queue;
5.3 Frame型別
typedef struct OARFrame {
int size;//幀大小
PktType_e type;//幀型別
int64_t dts;//解碼時間戳
int64_t pts;//顯示時間戳
int format;//格式(用于視頻)
int width;//寬(用于視頻)
int height;//高(用于視頻)
int64_t pkt_pos;
int sample_rate;//采樣率(用于音頻)
struct OARFrame *next;
uint8_t data[0];
}OARFrame;
5.4 Frame佇列
typedef struct oar_frame_queue {
pthread_mutex_t *mutex;
pthread_cond_t *cond;
OARFrame *cachedFrames;
OARFrame *lastFrame;
int count;//幀數量
unsigned int size;
} oar_frame_queue;
6. 解碼執行緒
我們的rtmp流拉取、解碼、渲染、音頻輸出都在C層實作,在C層,Android 21之后系統提供了AMediaCodec介面,我們直接find_library(media-ndk mediandk),并引入<media/NdkMediaCodec.h>頭檔案即可,對于Android 21之前版本,可以在C層呼叫Java層的MediaCodec,下面分別介紹兩種實作:
6.1 Java層代理解碼
Java層MediaCodec解碼使用步驟:
- 創建解碼器:
codec = MediaCodec.createDecoderByType(codecName); - 配置解碼器格式:
codec.configure(format, null, null, 0); - 啟動解碼器:
codec.start() - 獲取解碼輸入快取ID:
dequeueInputBuffer - 獲取解碼輸入快取:
getInputBuffer - 獲取解碼輸出快取:
dequeueOutputBufferIndex - 釋放輸出快取:
releaseOutPutBuffer - 停止解碼器:
codec.stop();
Jni層封裝對應的呼叫介面即可,
6.2 C層解碼器使用
C層介面介紹:
- 創建Format:
AMediaFormat_new; - 創建解碼器:
AMediaCodec_createDecoderByType; - 配置解碼引數:
AMediaCodec_configure; - 啟動解碼器:
AMediaCodec_start; - 輸入音視頻包:
- 獲取輸入buffer序列:
AMediaCodec_dequeueInputBuffer - 獲取輸入buffer:
AMediaCodec_getInputBuffer - 拷貝資料:
memcpy - 輸入buffer放入解碼器:
AMediaCodec_queueInputBuffer
- 獲取輸入buffer序列:
- 獲取解碼后幀:
- 獲取輸出buffer序列:
AMediaCodec_dequeueOutputBuffer - 獲取輸出buffer:
AMediaCodec_getOutputBuffer
- 獲取輸出buffer序列:
我們發現不管是Java層還是C層的介面都是提供了類似的思路,其實他們最終呼叫的還是系統的解碼框架,
這里我們可以根據系統版本來覺得使用Java層介面和C層介面,我們的oarplayer,主要的代碼都是在C層實作,所以我們也有限使用C層介面,
7. 音頻輸出執行緒
音頻輸出我們使用opensl實作,之前文章介紹過Android音頻架構,其實也可以使用AAudio或者Oboe,這里再簡單介紹下opensl es的使用,
- 創建引擎:
slCreateEngine(&engineObject, 0, NULL, 0, NULL, NULL); - 實作引擎:
(*engineObject)->Realize(engineObject, SL_BOOLEAN_FALSE); - 獲取介面:
(*engineObject)->GetInterface(engineObject, SL_IID_ENGINE, &engineEngine); - 創建輸出混流器:
(*engineEngine)->CreateOutputMix(engineEngine, &outputMixObject, 0, NULL, NULL);; - 實作混流器:
(*outputMixObject)->Realize(outputMixObject, SL_BOOLEAN_FALSE); - 配置音頻源:
SLDataLocator_AndroidSimpleBufferQueue loc_bufq = {SL_DATALOCATOR_ANDROIDSIMPLEBUFFERQUEUE, 2}; - 配置Format:
SLDataFormat_PCM format_pcm = {SL_DATAFORMAT_PCM, channel, SL_SAMPLINGRATE_44_1,SL_PCMSAMPLEFORMAT_FIXED_16, SL_PCMSAMPLEFORMAT_FIXED_16,SL_SPEAKER_FRONT_LEFT | SL_SPEAKER_FRONT_RIGHT, SL_BYTEORDER_LITTLEENDIAN}; - 創建播放器:
(*engineEngine)->CreateAudioPlayer(engineEngine,&bqPlayerObject, &audioSrc, &audioSnk,2, ids, req); - 實作播放器:
(*bqPlayerObject)->Realize(bqPlayerObject, SL_BOOLEAN_FALSE); - 獲取播放介面:
(*bqPlayerObject)->GetInterface(bqPlayerObject, SL_IID_PLAY, &bqPlayerPlay); - 獲取緩沖區介面:
(*bqPlayerObject)->GetInterface(bqPlayerObject, SL_IID_ANDROIDSIMPLEBUFFERQUEUE,&bqPlayerBufferQueue); - 注冊快取回呼:
(*bqPlayerBufferQueue)->RegisterCallback(bqPlayerBufferQueue, bqPlayerCallback, oar); - 獲取音量調節器:
(*bqPlayerObject)->GetInterface(bqPlayerObject, SL_IID_VOLUME, &bqPlayerVolume); - 快取回呼中不斷的從音頻幀佇列讀取資料,并寫入快取佇列:
(*bqPlayerBufferQueue)->Enqueue(bqPlayerBufferQueue, ctx->buffer,(SLuint32)ctx->frame_size);
上面就是音頻播放的opensl es介面使用介紹,
8. 渲染執行緒
相比較于音頻播放,視頻渲染可能更復雜一些,除了opengl引擎創建,opengl執行緒創建,oarplayer使用的是基于音頻的同步方式,所以在視頻渲染時還需要考慮音視頻同步問題,
8.1 OpenGL引擎創建
- 生成buffer:
glGenBuffers - 系結buffer:
glBindBuffer(GL_ARRAY_BUFFER, model->vbos[0]) - 設定清屏色:
glClearColor - 創建紋理物件:
texture2D - 創建著色器物件:
glCreateShader - 設定著色器原始碼:
glShaderSource - 編譯著色器原始碼:
glCompileShader - 附著著色器:
glAttachShader - 連接著色器:
glLinkProgram
opengl與硬體互動還需要EGL環境,下面展示EGL初始化流程代碼:
static void init_egl(oarplayer * oar){
oar_video_render_context *ctx = oar->video_render_ctx;
const EGLint attribs[] = {EGL_SURFACE_TYPE, EGL_WINDOW_BIT, EGL_RENDERABLE_TYPE,
EGL_OPENGL_ES2_BIT, EGL_BLUE_SIZE, 8, EGL_GREEN_SIZE, 8, EGL_RED_SIZE,
8, EGL_ALPHA_SIZE, 8, EGL_DEPTH_SIZE, 0, EGL_STENCIL_SIZE, 0,
EGL_NONE};
EGLint numConfigs;
ctx->display = eglGetDisplay(EGL_DEFAULT_DISPLAY);
EGLint majorVersion, minorVersion;
eglInitialize(ctx->display, &majorVersion, &minorVersion);
eglChooseConfig(ctx->display, attribs, &ctx->config, 1, &numConfigs);
ctx->surface = eglCreateWindowSurface(ctx->display, ctx->config, ctx->window, NULL);
EGLint attrs[] = {EGL_CONTEXT_CLIENT_VERSION, 2, EGL_NONE};
ctx->context = eglCreateContext(ctx->display, ctx->config, NULL, attrs);
EGLint err = eglGetError();
if (err != EGL_SUCCESS) {
LOGE("egl error");
}
if (eglMakeCurrent(ctx->display, ctx->surface, ctx->surface, ctx->context) == EGL_FALSE) {
LOGE("------EGL-FALSE");
}
eglQuerySurface(ctx->display, ctx->surface, EGL_WIDTH, &ctx->width);
eglQuerySurface(ctx->display, ctx->surface, EGL_HEIGHT, &ctx->height);
initTexture(oar);
oar_java_class * jc = oar->jc;
JNIEnv * jniEnv = oar->video_render_ctx->jniEnv;
jobject surface_texture = (*jniEnv)->CallStaticObjectMethod(jniEnv, jc->SurfaceTextureBridge, jc->texture_getSurface, ctx->texture[3]);
ctx->texture_window = ANativeWindow_fromSurface(jniEnv, surface_texture);
}
8.2 音視頻同步
常見的音視頻同步有三種:
- 基于視頻同步;
- 基于音頻同步;
- 基于第三方時間戳同步,
這里我們使用基于音頻幀同步的方法,渲染畫面時,判斷音頻時間戳diff與視頻畫面渲染周期,如果大于周期,則等待,如果大于0小于周期,如果小于0則立馬繪制,
下面展示渲染代碼:
/**
*
* @param oar
* @param frame
* @return 0 draw
* -1 sleep 33ms continue
* -2 break
*/
static inline int draw_video_frame(oarplayer *oar) {
// 上一次可能沒有畫, 這種情況就不需要取新的了
if (oar->video_frame == NULL) {
oar->video_frame = oar_frame_queue_get(oar->video_frame_queue);
}
// buffer empty ==> sleep 10ms , return 0
// eos ==> return -2
if (oar->video_frame == NULL) {
_LOGD("video_frame is null...");
usleep(BUFFER_EMPTY_SLEEP_US);
return 0;
}
int64_t time_stamp = oar->video_frame->pts;
int64_t diff = 0;
if(oar->metadata->has_audio){
diff = time_stamp - (oar->audio_clock->pts + oar->audio_player_ctx->get_delta_time(oar->audio_player_ctx));
}else{
diff = time_stamp - oar_clock_get(oar->video_clock);
}
_LOGD("time_stamp:%lld, clock:%lld, diff:%lld",time_stamp , oar_clock_get(oar->video_clock), diff);
oar_model *model = oar->video_render_ctx->model;
// diff >= 33ms if draw_mode == wait_frame return -1
// if draw_mode == fixed_frequency draw previous frame ,return 0
// diff > 0 && diff < 33ms sleep(diff) draw return 0
// diff <= 0 draw return 0
if (diff >= WAIT_FRAME_SLEEP_US) {
if (oar->video_render_ctx->draw_mode == wait_frame) {
return -1;
} else {
draw_now(oar->video_render_ctx);
return 0;
}
} else {
// if diff > WAIT_FRAME_SLEEP_US then use previous frame
// else use current frame and release frame
// LOGI("start draw...");
pthread_mutex_lock(oar->video_render_ctx->lock);
model->update_frame(model, oar->video_frame);
pthread_mutex_unlock(oar->video_render_ctx->lock);
oar_player_release_video_frame(oar, oar->video_frame);
JNIEnv * jniEnv = oar->video_render_ctx->jniEnv;
(*jniEnv)->CallStaticVoidMethod(jniEnv, oar->jc->SurfaceTextureBridge, oar->jc->texture_updateTexImage);
jfloatArray texture_matrix_array = (*jniEnv)->CallStaticObjectMethod(jniEnv, oar->jc->SurfaceTextureBridge, oar->jc->texture_getTransformMatrix);
(*jniEnv)->GetFloatArrayRegion(jniEnv, texture_matrix_array, 0, 16, model->texture_matrix);
(*jniEnv)->DeleteLocalRef(jniEnv, texture_matrix_array);
if (diff > 0) usleep((useconds_t) diff);
draw_now(oar->video_render_ctx);
oar_clock_set(oar->video_clock, time_stamp);
return 0;
}
}
9. 總結
本文基于Android端的RTMP播放器實作程序,介紹了RTMP推拉流庫、Android MediaCodec Java層與C層介面、OpenSL ES介面、OpenGL ES介面、EGL介面、以及音視頻相關知識
推薦閱讀:
Android 音視頻開發核心知識點筆記整合
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/310606.html
標籤:其他
