前言
忘了在哪看到一位編程大牛調侃,他說程式員每天就做兩件事,其中之一就是處理字串,相信不少同學會有同感,
在Python中,我們經常會遇到字串的拼接問題,幾乎任何一種編程語言,都把字串列為最基礎和不可或缺的資料型別,而拼接字串是必備的一種技能,今天,我跟大家一起來學習Python拼接字串的七種方式,
下面話不多說了,來一起看看詳細的介紹吧
1、來自C語言的%方式
print('%s %s' % ('Hello', 'world'))
>>> Hello world
%號格式化字串的方式繼承自古老的C語言,這在很多編程語言都有類似的實作,上例的%s是一個占位符,它僅代表一段字串,并不是拼接的實際內容,實際的拼接內容在一個單獨的%號后面,放在一個元組里,
類似的占位符還有:%d(代表一個整數)、%f(代表一個浮點數)、%x(代表一個16進制數),等等,%占位符既是這種拼接方式的特點,同時也是其限制,因為每種占位符都有特定意義,實際使用起來太麻煩了,
2、format()拼接方式
# 簡潔版
s1 = 'Hello {}! My name is {}.'.format('World', 'Python貓')
print(s1)
>>>Hello World! My name is Python貓.
# 對號入座版
s2 = 'Hello {0}! My name is {1}.'.format('World', 'Python貓')
s3 = 'Hello {name1}! My name is {name2}.'.format(name1='World', name2='Python貓')
print(s2)
>>>Hello World! My name is Python貓.
print(s3)
>>>Hello World! My name is Python貓.
這種方式使用花括號{}做占位符,在format方法中再轉入實際的拼接值,容易看出,它實際上是對%號拼接方式的改進,這種方式在Python2.6中開始引入,
上例中,簡潔版的花括號中無內容,缺點是容易弄錯次序,對號入座版主要有兩種,一種傳入序列號,一種則使用key-value的方式,實戰中,我們更推薦后一種,既不會數錯次序,又更直觀可讀,
3、() 類似元組方式
s_tuple = ('Hello', ' ', 'world')
s_like_tuple = ('Hello' ' ' 'world')
print(s_tuple)
>>>('Hello', ' ', 'world')
print(s_like_tuple)
>>>Hello world
type(s_like_tuple)
>>>str
注意,上例中s_like_tuple并不是一個元組,因為元素間沒有逗號分隔符,這些元素間可以用空格間隔,也可以不要空格,使用type()查看,發現它就是一個str型別,我沒查到這是啥原因,猜測或許()括號中的內容是被Python優化處理了,
這種方式看起來很快捷,但是,括號()內要求元素是真實字串,不能混用變數,所以不夠靈活,
# 多元素時,不支持有變數
str_1 = 'Hello'
str_2 = (str_1 'world')
>>> SyntaxError: invalid syntax
str_3 = (str_1 str_1)
>>> SyntaxError: invalid syntax
# 但是下面寫法不會報錯
str_4 = (str_1)
4、面向物件模板拼接
from string import Template
s = Template('${s1} ${s2}!')
print(s.safe_substitute(s1='Hello',s2='world'))
>>> Hello world!
說實話,我不喜歡這種實作方式,濃濃的一股被面向物件思想毒害的臭味,
就不多說了,
5、常用的+號方式
str_1 = 'Hello world! '
str_2 = 'My name is Python貓.'
print(str_1 + str_2)
>>>Hello world! My name is Python貓.
print(str_1)
>>>Hello world!
這種方式最常用、直觀、易懂,是入門級的實作方式,但是,它也存在兩處讓人容易犯錯的地方,
首先,新入門編程的同學容易犯錯,他們不知道字串是不可變型別,新的字串會獨占一塊新的記憶體,而原來的字串保持不變,上例中,拼接前有兩段字串,拼接后實際有三段字串,
其次,一些有經驗的老程式員也容易犯錯,他們以為當拼接次數不超過3時,使用+號連接符就會比其它方式快(ps:不少Python教程都是如此建議),但這沒有任何合理根據,
事實上,在拼接短的字面值時,由于CPython中的 常數折疊 (constant folding)功能,這些字面值會被轉換成更短的形式,例如'a'+'b'+'c' 被轉換成'abc','hello'+'world'也會被轉換成'hello world',這種轉換是在編譯期完成的,而到了運行期時就不會再發生任何拼接操作,因此會加快整體計算的速度,
常數折疊優化有一個限度,它要求拼接結果的長度不超過20,所以,當拼接的最終字串長度不超過20時,+號運算子的方式,會比后面提到的join等方式快得多,這與+號的使用次數無關,
題外話:你是否覺得20這個數字很熟悉呢?沒錯,我們之前在《Python中的“特權種族”是什么?》中提到過,字串類的特權種族也是以20為限,當時也有一個例子,展示了編譯期和運行期的區別,建議你去回看,
6、join()拼接方式
str_list = ['Hello', 'world']
str_join1 = ' '.join(str_list)
str_join2 = '-'.join(str_list)
print(str_join1) >>>Hello world
print(str_join2) >>>Hello-world
str物件自帶的join()方法,接受一個序列引數,可以實作拼接,拼接時,元素若不是字串,需要先轉換一下,可以看出,這種方法比較適用于連接序列物件中(例如串列)的元素,并設定統一的間隔符,
當拼接長度超過20時,這種方式基本上是首選,不過,它的缺點就是,不適合進行零散片段的、不處于序列集合的元素拼接,
7、f-string方式
name = 'world'
myname = 'python_cat'
words = f'Hello {name}. My name is {myname}.'
print(words)
>>> Hello world. My name is python_cat.
f-string方式出自PEP 498(Literal String Interpolation,字面字串插值),從Python3.6版本引入,其特點是在字串前加 f 標識,字串中間則用花括號{}包裹其它字串變數,
這種方式在可讀性上秒殺format()方式,處理長字串的拼接時,速度與join()方法相當,
盡管如此,這種方式與其它某些編程語言相比,還是欠優雅,因為它引入了一個 f 標識,而其它某些程式語言可以更簡練,比如shell:
name="world"
myname="python_cat"
words="Hello ${name}. My name is ${myname}."
echo $words
>>>Hello world. My name is python_cat.
總結一下,我們前面說的“字串拼接”,其實是從結果上理解,若從實作原理上劃分的話,我們可以將這些方法劃分出三種型別:
-
格式化類:%、format()、template
-
拼接類:+、()、join()
-
插值類:f-string
當要處理字串串列等序列結構時,采用join()方式;拼接長度不超過20時,選用+號運算子方式;長度超過20的情況,高版本選用f-string,低版本時看情況使用format()或join()方式,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/162699.html
標籤:Python
