機器學習 - Python 02-有解無憂

好了，咱們接著上一節的內容，繼續學習機器學習中的Python語法部分，這一節算是Python語法的最后一節了，也就是說如果真的看懂了這兩節的內容，理論上說就機器學習的領域或者方向，語言已經不是問題了，同時也意味著馬上真正的進入機器學習的核心部分了，好了，那咱們接下來正式開始咱們的學習啦，

Tuples

Tuples是Python中的一種新的形式的資料collection（至少相對于C++， objective-C，Java是新的，其他的我就不敢肯定了，免得被打臉，哈哈），其實她和List幾乎是一樣的，除了2個方面的不同，她和list的區別主要是下面2個方面的不同：1）Tuples 的創建的展現是講元素element用括號包起來，而List是用的中括號，2）Tuples一旦創建元素是不可改變的，即它是immutable的，而List的元素是可以改變的，即Mutable的，好了，下面看一下tuples的創建代碼展示一下，否則光說不練假把式，哈哈哈

t = (1,2,3)

上面的代碼就是創建了一個tuple，他的元素有三個，分別是1,2,3. 那么既然有了list為什么還要Tuples呢？這主要是因為Tuple的應用場景主要是用于那些有多個回傳值的函式中，想象一下，如果一個函式有多個回傳值，你要怎么弄呢？對了，你肯定想到了List對吧？可是List里面的資料可能因為多人協同開發的時候被其他同事修改了，是會有一定Risk的，那么自然而然我們就想到了要用Tuples這個資料結構，因為他是Immutable的，如果有人試圖修改她的值，他會報錯的，總結起來就是List是可讀可寫的，而Tuples是只讀的，看看下面這個回傳多個值的例子吧，

a = 0.125.as_integer_ratio()

上面的函式回傳了2個值，分別是分子和分母，都是整型資料，回傳的資料是（1,8），

關于Tuples還有一個點是Individual assignments(翻譯過來應該是叫單獨賦值，不知道翻譯的對不對，容我裝個B，哈哈哈)，這里的意思是講Tuple中的值可以分別賦值給不同的變數，如下所示：

numerator,demonstrater = a

上面代碼的運行結果就是：numerator = 1, demonstrater = 8.

Dictionary

好了，現在接受最后一種形式的collection，就是字典，這和其他語言都很像，就是key-value鍵值對，好了，下面先來瞧一瞧咱們dictionary的創建

numbers = {"one":1,"two":2,"three":3}

這和其他很多種的語言的都一樣，再來看看如何通過Key值來retrieve value，

numbers["one"]

下面介紹一下dictionary中的比較高級但是在實際中會經常用到的的功能，這些語法特性看起來挺牛逼，其實都是紙老虎，哈哈，心態上我們要藐視他媽，操作上要重視他們哈，

1） in operator

in的關鍵字是Python中最常見的一個關鍵字，沒有之一！！！！在list中用，在dictionary中用，在條件判斷時會用，在回圈中還是會用的，既然這一節講的是dictionary，我們就看看她在dictionary中的應用吧，

#create a dictionary
planets = ['Mercury', 'Venus', 'Earth', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptune']
plants_to_initial = {planet:planet[0] for planet in planets}
"Mercury" in plants_to_initial  # the in operator will tell us whether something is a key in the dictionary

上面的創建字典代碼現在看不懂沒關系，她就是創建了一個字典，這個字典的key值是這些星星的名字，value值就是這些星星的首字母，這里重要的是最后一行代碼，判斷“Mercury”這個字串是不是這個字典的key值，如果是key,回傳True, 否則回傳False，

2）遍歷key值

#the for loop will loop over its keys
for key in plants_to_initial:
    print(key,end = " ")

如上代碼所示，直接對dictionary遍歷，回傳的是每一個key-value鍵值對的key值，上面代碼就是列印這個字典的所有的key值，

3）同事遍歷key-value 鍵值對

在字典中，如果想要同時遍歷鍵值對，我們必須通過dictionary的一個method，叫做：items(). 這個方法回傳一個list，里面的元素是tuples,這些tuples里面的元素就是key,values. 話不多說，直接上代碼看

for planet, initial in plants_to_initial.items():#items()will return its key-value pairs
    print(planet,initial)

String

好了，終于進入到最最常用的一種基本資料型別了-string，幾乎在所用的應用中，產生和消費的資料，幾乎字串占了絕大部分，當然啦，在機器學習中最常用到的資料型別是int和float，但是string型別的也是經常會出現的，其實String可以將它看成一串字符，這一串字符就好比一個list，用英文來說就是 A string is a sequences of characters. (是不是瞬間高大上了，從大蒜變成了咖啡，哈哈哈哈)，所以在Python中，幾乎你在list中看到的方法，都同樣適用于String.

1) String 的創建和index

planet = "Pluto"
planet[0]#return P
planet[-3:]#return uto
len(planet)#return 5

2)常用的String方法

#string methods
planet.upper()#return PLUTO
planet.lower()#return pluto
planet.index("uto")#return 2
planet.startswith("Plu")#return True
planet.endswith("asds")#return False

3) List 和 String之間的相互轉換

#going between strings and lists
#string -> list   split method
planets = "Pluto is a planet"
list_planets = planets.split()#return a list of ["Pluto","is","a","planet"]
dates = '2019-10-08'
list_dates = dates.split('-')#returns ["2019","10","08"], the element are also all string types
#list->string  join method
year,month,day = list_dates #individual assignment
'/'.join([year,month,day]) #returns "2019/10/08"

注意無論是String->List還是List->String, 他們的基本元素都是String，而不會是Int或者Float或者其他什么稀奇古怪的資料型別，也就是說，無論是Split還是Join, 他們操作的物件都是String，例如：'/'.join([1,2,3]),這句代碼就會報錯，因為1，2,3都是整型資料而不是string，這里比較抽象哈，自己慢慢體會，

4）formatting a string

String是一個非常靈活的資料型別，例如int也可以轉換成string，等等，因此我們常常需要將不同資料型別的資料拼接在一起，然后轉換成一個string，這種情況下，我們經常需要用到format方法，當然也存在其他方法可以完成這個任務，但是format的牛逼之處不僅僅在于這，她還可以格式化資料的表現格式，例如保留幾位小數點，大數字的表現形式等等，具體的可以參考下面的代碼，

position = 9
"{}, you will be the {}th planet to me".format(planet,position) #returns 'Pluto, you will be the 9th planet to me'
"{:.2}".format(0.123345) #returns "0.12", the result is converted to string type
"{:,}".format(1234578) #returns '1,234,578' the result is also converted to string type
"{0},{1},{1},{0},{0}".format(12,55)#indexing of format the result is '12,55,55,12,12', the result is also string type

Loop comprehension

Loop comprehension 是Python中非常受歡迎的一個特性，她能夠快速創建List和dictionary，并且使用起來非常靈活，在將來機器學習的實踐中你們會發現非常好用，說了這么多，那么接下來我們來看看到底什么是Loop Comprehension.

1) 利用Loop Comprehension 來快速創建dictionary，

其實這已經在前面的代碼中有所體現了，如下面的代碼所示，快速創建字典，

plants_to_initial = {planet:planet[0] for planet in planets}

其實就是用for in 的回圈，然后通過key:value的形式，批量的產生鍵值對，最后生成一個字典，

2）利用Loop Comprehension 來創建List

List的創建也是很靈活的，也可以操作回圈的元素，來達到一些個性化或者特殊需求的一些目的，甚至她還可以通過組合條件判斷的陳述句達到更加精細化的控制，創建List的一些常用方式如下所示

numbers = [1,2,3,4]
squares = [n**2 for n in numbers] #returns [1,4,9,16]
print(squares)    
short_squares = [n for n in squares if n<9] #returns [1,4]
count_number_of_squares = len([n for n in squares if n < 100]) #returns 4

總結：前面一節內容還有這一節內容大體上已經介紹了常用Python的絕大部分特性，如果已經掌握，我覺得僅僅對于機器學習這個領域的學習的話，已經夠用了，這兩節的內容是給已經有其他語言經驗的人準備的（如果一點計算機語言經驗都沒有，我建議還是從Hello World開始）

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/55450.html

標籤：其他

上一篇：自然語言處理學習筆記之一：概要

下一篇：Pandas 性能優化學習筆記