本文介紹一種Cortex-M內核中的精確延時方法
前言
為什么要學習這種延時的方法?
- 很多時候我們跑作業系統,就一般會占用一個硬體定時器——SysTick,而我們一般作業系統的時鐘節拍一般是設定100-1000HZ,也就是1ms——10ms產生一次中斷,很多裸機教程使用延時函式又是基于SysTick的,這樣一來又難免產生沖突,
- 很多人會說,不是還有定時器嗎,定時器的計時是超級精確的,這點我不否認,但是假設,如果一個系統,總是進入定時器中斷(10us一次/1us一次/0.5us一次),那整個系統就會經常被打斷,執行緒的進行就沒辦法很好運行啊,此外還消耗一個硬體定時器資源,一個硬體定時器可能做其他事情呢!
- 對應ST HAL庫的修改,其實杰杰個人覺得吧,ST的東西什么都好,就是出的HAL庫太惡心了,沒辦法,而HAL庫中有一個HAL_Delay(),他也是采用SysTick延時的,在移植作業系統的時候,會有諸多不便,不過好在,HAL_Delay()是一個弱定義的,我們可以重寫這個函式的實作,那么,采用內核延時當然是最好的辦法啦(個人是這么覺得的)當然你有能力完全用for回圈寫個簡單的延時還是可以的,
- 可能我說的話沒啥權威,那我就參考Cortex-M3權威指南中的一句話——“DWT 中有剩余的計數器,它們典型地用于程式代碼的“性能速寫”(profiling),通過編程它們,就可以讓它們在計數器溢位時發出事件(以跟蹤資料包的形式),最典型地,就是使用 CYCCNT暫存器來測量執行某個任務所花的周期數,這也可以用作時間基準相關的目的(作業系統中統計 CPU使用率可以用到它),”
Cortex-M中的DWT
在Cortex-M里面有一個外設叫DWT(Data Watchpoint and Trace),是用于系統除錯及跟蹤,
它有一個32位的暫存器叫CYCCNT,它是一個向上的計數器,記錄的是內核時鐘運行的個數,內核時鐘跳動一次,該計數器就加1,精度非常高,決定內核的頻率是多少,如果是F103系列,內核時鐘是72M,那精度就是1/72M = 14ns,而程式的運行時間都是微秒級別的,所以14ns的精度是遠遠夠的,最長能記錄的時間為:60s=2的32次方/72000000(假設內核頻率為72M,內核跳一次的時間大概為1/72M=14ns),而如果是H7這種400M主頻的芯片,那它的計時精度高達2.5ns(1/400000000 = 2.5),而如果是 i.MX RT1052這種比較牛逼的處理器,最長能記錄的時間為: 8.13s=2的32次方/528000000 (假設內核頻率為528M,內核跳一次的時間大概為1/528M=1.9ns) ,當CYCCNT溢位之后,會清0重新開始向上計數,

m3、m4、m7杰杰實測可用(m0不可用),
精度:1/內核頻率(s),
要實作延時的功能,總共涉及到三個暫存器:DEMCR 、DWT_CTRL、DWT_CYCCNT,分別用于開啟DWT功能、開啟CYCCNT及獲得系統時鐘計數值,
DEMCR
想要使能DWT外設,需要由另外的內核除錯暫存器DEMCR的位24控制,寫1使能(劃重點啦,要考試!!),
DEMCR的地址是0xE000 EDFC


關于DWT_CYCCNT
使能DWT_CYCCNT暫存器之前,先清0,
讓我們看看DWT_CYCCNT的基地址,從ARM-Cortex-M手冊中可以看到其基地址是0xE000 1004,復位默認值是0,而且它的型別是可讀可寫的,我們往0xE000 1004這個地址寫0就將DWT_CYCCNT清0了,

關于CYCCNTENA
CYCCNTENA Enable the CYCCNT counter. If not enabled, the counter does not count and no event is
generated for PS sampling or CYCCNTENA. In normal use, the debugger must initialize
the CYCCNT counter to 0.
它是DWT控制暫存器的第一位,寫1使能,則啟用CYCCNT計數器,否則CYCCNT計數器將不會作業,

綜上所述
想要使用DWT的CYCCNT步驟:
- 先使能DWT外設,這個由另外內核除錯暫存器DEMCR的位24控制,寫1使能
- 使能CYCCNT暫存器之前,先清0,
- 使能CYCCNT暫存器,這個由DWT的CYCCNTENA 控制,也就是DWT控制暫存器的位0控制,寫1使能
代碼實作
/**
******************************************************************
* @file core_delay.c
* @author fire
* @version V1.0
* @date 2018-xx-xx
* @brief 使用內核暫存器精確延時
******************************************************************
* @attention
*
* 實驗平臺:野火 STM32開發板
* 論壇 :http://www.firebbs.cn
* 淘寶 :https://fire-stm32.taobao.com
*
******************************************************************
*/
#include "./delay/core_delay.h"
/*
**********************************************************************
* 時間戳相關暫存器定義
**********************************************************************
*/
/*
在Cortex-M里面有一個外設叫DWT(Data Watchpoint and Trace),
該外設有一個32位的暫存器叫CYCCNT,它是一個向上的計數器,
記錄的是內核時鐘運行的個數,最長能記錄的時間為:
10.74s=2的32次方/400000000
(假設內核頻率為400M,內核跳一次的時間大概為1/400M=2.5ns)
當CYCCNT溢位之后,會清0重新開始向上計數,
使能CYCCNT計數的操作步驟:
1、先使能DWT外設,這個由另外內核除錯暫存器DEMCR的位24控制,寫1使能
2、使能CYCCNT暫存器之前,先清0
3、使能CYCCNT暫存器,這個由DWT_CTRL(代碼上宏定義為DWT_CR)的位0控制,寫1使能
*/
#define DWT_CR *(__IO uint32_t *)0xE0001000
#define DWT_CYCCNT *(__IO uint32_t *)0xE0001004
#define DEM_CR *(__IO uint32_t *)0xE000EDFC
#define DEM_CR_TRCENA (1 << 24)
#define DWT_CR_CYCCNTENA (1 << 0)
/**
* @brief 初始化時間戳
* @param 無
* @retval 無
* @note 使用延時函式前,必須呼叫本函式
*/
HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority)
{
/* 使能DWT外設 */
DEM_CR |= (uint32_t)DEM_CR_TRCENA;
/* DWT CYCCNT暫存器計數清0 */
DWT_CYCCNT = (uint32_t)0u;
/* 使能Cortex-M DWT CYCCNT暫存器 */
DWT_CR |= (uint32_t)DWT_CR_CYCCNTENA;
return HAL_OK;
}
/**
* @brief 讀取當前時間戳
* @param 無
* @retval 當前時間戳,即DWT_CYCCNT暫存器的值
*/
uint32_t CPU_TS_TmrRd(void)
{
return ((uint32_t)DWT_CYCCNT);
}
/**
* @brief 讀取當前時間戳
* @param 無
* @retval 當前時間戳,即DWT_CYCCNT暫存器的值
*/
uint32_t HAL_GetTick(void)
{
return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);
}
/**
* @brief 采用CPU的內部計數實作精確延時,32位計數器
* @param us : 延遲長度,單位1 us
* @retval 無
* @note 使用本函式前必須先呼叫CPU_TS_TmrInit函式使能計數器,
或使能宏CPU_TS_INIT_IN_DELAY_FUNCTION
最大延時值為8秒,即8*1000*1000
*/
void CPU_TS_Tmr_Delay_US(uint32_t us)
{
uint32_t ticks;
uint32_t told,tnow,tcnt=0;
/* 在函式內部初始化時間戳暫存器, */
#if (CPU_TS_INIT_IN_DELAY_FUNCTION)
/* 初始化時間戳并清零 */
HAL_InitTick(5);
#endif
ticks = us * (GET_CPU_ClkFreq() / 1000000); /* 需要的節拍數 */
tcnt = 0;
told = (uint32_t)CPU_TS_TmrRd(); /* 剛進入時的計數器值 */
while(1)
{
tnow = (uint32_t)CPU_TS_TmrRd();
if(tnow != told)
{
/* 32位計數器是遞增計數器 */
if(tnow > told)
{
tcnt += tnow - told;
}
/* 重新裝載 */
else
{
tcnt += UINT32_MAX - told + tnow;
}
told = tnow;
/*時間超過/等于要延遲的時間,則退出 */
if(tcnt >= ticks)break;
}
}
}
/*********************************************END OF FILE**********************/
#ifndef __CORE_DELAY_H
#define __CORE_DELAY_H
#include "stm32h7xx.h"
/* 獲取內核時鐘頻率 */
#define GET_CPU_ClkFreq() HAL_RCC_GetSysClockFreq()
#define SysClockFreq (218000000)
/* 為方便使用,在延時函式內部呼叫CPU_TS_TmrInit函式初始化時間戳暫存器,
這樣每次呼叫函式都會初始化一遍,
把本宏值設定為0,然后在main函式剛運行時呼叫CPU_TS_TmrInit可避免每次都初始化 */
#define CPU_TS_INIT_IN_DELAY_FUNCTION 0
/*******************************************************************************
* 函式宣告
******************************************************************************/
uint32_t CPU_TS_TmrRd(void);
HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority);
//使用以下函式前必須先呼叫CPU_TS_TmrInit函式使能計數器,或使能宏CPU_TS_INIT_IN_DELAY_FUNCTION
//最大延時值為8秒
void CPU_TS_Tmr_Delay_US(uint32_t us);
#define HAL_Delay(ms) CPU_TS_Tmr_Delay_US(ms*1000)
#define CPU_TS_Tmr_Delay_S(s) CPU_TS_Tmr_Delay_MS(s*1000)
#endif /* __CORE_DELAY_H */
注意事項:
使用者如果不是在HAL庫中使用,注釋掉:
uint32_t HAL_GetTick(void)
{
return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);
}
同時建議重新命名HAL_InitTick()函式,
按照自己的平臺重寫以下宏定義:
/* 獲取內核時鐘頻率 */
#define GET_CPU_ClkFreq() HAL_RCC_GetSysClockFreq()
#define SysClockFreq (218000000)
后記
其實在ucos-iii 原始碼中,有一個功能是測量關中斷時間的功能,就是使用STM32的時間戳,即記錄程式運行的某個時刻,如果記錄下程式前后的兩個時刻點,即可以算出這段程式的運行時間,
但是有關內核暫存器的描述的資料非常少,還好找到一個(arm手冊),里面有這些內核暫存器的詳細描述,其中時間戳相關的暫存器在第10章和11章有詳細的描述,關于資料想看的可以后臺找我拿,
喜歡就關注我吧!

相關代碼可以在公眾號后臺回復 “ DWT ”獲取,
更多資料歡迎關注“物聯網IoT開發”公眾號!
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/33423.html
標籤:嵌入式
