好了,咱們接著上一節的內容,繼續學習機器學習中的Python語法部分,這一節算是Python語法的最后一節了,也就是說如果真的看懂了這兩節的內容,理論上說就機器學習的領域或者方向,語言已經不是問題了,同時也意味著馬上真正的進入機器學習的核心部分了,好了,那咱們接下來正式開始咱們的學習啦,
- Tuples
Tuples是Python中的一種新的形式的資料collection(至少相對于C++, objective-C,Java是新的,其他的我就不敢肯定了,免得被打臉,哈哈),其實她和List幾乎是一樣的,除了2個方面的不同,她和list的區別主要是下面2個方面的不同:1)Tuples 的創建的展現是講元素element用括號包起來,而List是用的中括號,2)Tuples一旦創建 元素是不可改變的,即它是immutable的,而List的元素是可以改變的,即Mutable的,好了,下面看一下tuples的創建代碼展示一下,否則光說不練假把式,哈哈哈
t = (1,2,3)
上面的代碼就是創建了一個tuple,他的元素有三個,分別是1,2,3. 那么既然有了list為什么還要Tuples呢? 這主要是因為Tuple的應用場景主要是用于那些有多個回傳值的函式中,想象一下,如果一個函式有多個回傳值,你要怎么弄呢?對了,你肯定想到了List對吧?可是List里面的資料可能因為多人協同開發的時候被其他同事修改了,是會有一定Risk的,那么自然而然我們就想到了要用Tuples這個資料結構,因為他是Immutable的,如果有人試圖修改她的值,他會報錯的,總結起來就是List是可讀可寫的,而Tuples是只讀的,看看下面這個回傳多個值的例子吧,
a = 0.125.as_integer_ratio()
上面的函式回傳了2個值,分別是分子和分母,都是整型資料,回傳的資料是(1,8),
關于Tuples還有一個點是Individual assignments(翻譯過來應該是叫單獨賦值,不知道翻譯的對不對,容我裝個B,哈哈哈),這里的意思是講Tuple中的值可以分別賦值給不同的變數,如下所示:
numerator,demonstrater = a
上面代碼的運行結果就是:numerator = 1, demonstrater = 8.
- Dictionary
好了,現在接受最后一種形式的collection,就是字典,這和其他語言都很像,就是key-value鍵值對,好了,下面先來瞧一瞧咱們dictionary的創建
numbers = {"one":1,"two":2,"three":3}
這和其他很多種的語言的都一樣,再來看看如何通過Key值來retrieve value,
numbers["one"]
下面介紹一下dictionary中的比較高級但是在實際中會經常用到的的功能,這些語法特性看起來挺牛逼,其實都是紙老虎,哈哈,心態上我們要藐視他媽,操作上要重視他們哈,
1) in operator
in的關鍵字是Python中最常見的一個關鍵字,沒有之一!!!!在list中用,在dictionary中用,在條件判斷時會用,在回圈中還是會用的,既然這一節講的是dictionary,我們就看看她在dictionary中的應用吧,
#create a dictionary planets = ['Mercury', 'Venus', 'Earth', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptune'] plants_to_initial = {planet:planet[0] for planet in planets} "Mercury" in plants_to_initial # the in operator will tell us whether something is a key in the dictionary
上面的創建字典代碼現在看不懂沒關系,她就是創建了一個字典,這個字典的key值是這些星星的名字,value值就是這些星星的首字母,這里重要的是最后一行代碼,判斷“Mercury”這個字串是不是這個字典的key值,如果是key,回傳True, 否則回傳False,
2)遍歷key值
#the for loop will loop over its keys for key in plants_to_initial: print(key,end = " ")
如上代碼所示,直接對dictionary遍歷,回傳的是每一個key-value鍵值對的key值,上面代碼就是列印這個字典的所有的key值,
3) 同事遍歷key-value 鍵值對
在字典中,如果想要同時遍歷鍵值對,我們必須通過dictionary的一個method,叫做:items(). 這個方法回傳一個list,里面的元素是tuples,這些tuples里面的元素就是key,values. 話不多說,直接上代碼看
for planet, initial in plants_to_initial.items():#items()will return its key-value pairs print(planet,initial)
- String
好了,終于進入到最最常用的一種基本資料型別了-string,幾乎在所用的應用中,產生和消費的資料,幾乎字串占了絕大部分,當然啦,在機器學習中最常用到的資料型別是int和float,但是string型別的也是經常會出現的,其實String可以將它看成一串字符,這一串字符就好比一個list,用英文來說就是 A string is a sequences of characters. (是不是瞬間高大上了,從大蒜變成了咖啡,哈哈哈哈), 所以在Python中,幾乎你在list中看到的方法,都同樣適用于String.
1) String 的創建和index
planet = "Pluto" planet[0]#return P planet[-3:]#return uto len(planet)#return 5
2)常用的String方法
#string methods planet.upper()#return PLUTO planet.lower()#return pluto planet.index("uto")#return 2 planet.startswith("Plu")#return True planet.endswith("asds")#return False
3) List 和 String之間的相互轉換
#going between strings and lists #string -> list split method planets = "Pluto is a planet" list_planets = planets.split()#return a list of ["Pluto","is","a","planet"] dates = '2019-10-08' list_dates = dates.split('-')#returns ["2019","10","08"], the element are also all string types #list->string join method year,month,day = list_dates #individual assignment '/'.join([year,month,day]) #returns "2019/10/08"
注意無論是String->List還是List->String, 他們的基本元素都是String,而不會是Int或者Float或者其他什么稀奇古怪的資料型別,也就是說,無論是Split還是Join, 他們操作的物件都是String,例如:'/'.join([1,2,3]),這句代碼就會報錯,因為1,2,3都是整型資料而不是string,這里比較抽象哈,自己慢慢體會,
4)formatting a string
String是一個非常靈活的資料型別,例如int也可以轉換成string,等等,因此我們常常需要將不同資料型別的資料拼接在一起,然后轉換成一個string,這種情況下,我們經常需要用到format方法,當然也存在其他方法可以完成這個任務,但是format的牛逼之處不僅僅在于這,她還可以格式化資料的表現格式,例如保留幾位小數點,大數字的表現形式等等,具體的可以參考下面的代碼,
position = 9 "{}, you will be the {}th planet to me".format(planet,position) #returns 'Pluto, you will be the 9th planet to me' "{:.2}".format(0.123345) #returns "0.12", the result is converted to string type "{:,}".format(1234578) #returns '1,234,578' the result is also converted to string type "{0},{1},{1},{0},{0}".format(12,55)#indexing of format the result is '12,55,55,12,12', the result is also string type
- Loop comprehension
Loop comprehension 是Python中非常受歡迎的一個特性,她能夠快速創建List和dictionary,并且使用起來非常靈活,在將來機器學習的實踐中你們會發現非常好用,說了這么多,那么接下來我們來看看到底什么是Loop Comprehension.
1) 利用Loop Comprehension 來快速創建dictionary,
其實這已經在前面的代碼中有所體現了,如下面的代碼所示,快速創建字典,
plants_to_initial = {planet:planet[0] for planet in planets}
其實就是用for in 的回圈,然后通過key:value的形式,批量的產生鍵值對,最后生成一個字典,
2)利用Loop Comprehension 來創建List
List的創建也是很靈活的,也可以操作回圈的元素,來達到一些個性化或者特殊需求的一些目的,甚至她還可以通過組合條件判斷的陳述句達到更加精細化的控制,創建List的一些常用方式如下所示
numbers = [1,2,3,4] squares = [n**2 for n in numbers] #returns [1,4,9,16] print(squares) short_squares = [n for n in squares if n<9] #returns [1,4] count_number_of_squares = len([n for n in squares if n < 100]) #returns 4
總結: 前面一節內容還有這一節內容大體上已經介紹了常用Python的絕大部分特性,如果已經掌握,我覺得僅僅對于機器學習這個領域的學習的話,已經夠用了,這兩節的內容是給已經有其他語言經驗的人準備的(如果一點計算機語言經驗都沒有,我建議還是從Hello World開始)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/55450.html
標籤:其他
上一篇:自然語言處理學習筆記之一:概要
下一篇:Pandas 性能優化 學習筆記
