我有一個熊貓資料框:
Term. DocFreq. TermFreq. Ngram. Filenames
witness says 1 1 2 '/Users/KieraKatsalapov/Desktop//LuceneIndexing/Docs/cnnValBartCnnDocs/doc657.txt'
witness says of 2 2 3 '/Users/KieraKatsalapov/Desktop/LuceneIndexing/Docs/cnnValBartCnnDocs/doc192.txt,/Users/KieraKatsalapov/Desktop/LuceneIndexing/Docs/cnnValBartCnnDocs/doc153.txt'
.
.
.
我需要將檔案名轉換為基本名稱。我知道我可以使用
df['Filenames'] = df['Filenames'].apply(os.path.basenames)
但這只會轉換最后一個檔案名。例如,它會將第二個條目中的檔案名直接轉換為“doc153.txt”。
而我需要它是 - “doc192.txt, doc153.txt”
我假設我需要使用 lambda 函式,該函式將接收整個檔案名值并回傳包含多個檔案名的輸出。但我不知道如何繼續。
請幫忙。
uj5u.com熱心網友回復:
您可以,為每個值呼叫拆分值os.path.basename,最后加入,:
df['Filenames'] = df['Filenames'].apply(lambda x:','.join(os.path.basename(y) for y in x.split(',')))
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/369008.html
上一篇:使用AndroidStudio除錯AndroidNDK
下一篇:熊貓減去與下一行值相同的行值
