我有兩個相同長度的資料框,有一個名為 的共享列post_id,如下所示:
df1:
| post_id | 文本 |
|---|---|
| 001 | 一些文字 1 |
| 002 | 一些文字 2 |
| 003 | 一些文字 3 |
| ... | ... |
| 999 | 一些文字 999 |
df2:
| post_id | 文本 |
|---|---|
| 001 | 不同的文字 1 |
| 002 | 不同的文字 2 |
| 003 | 不同的文字 3 |
| ... | ... |
| 999 | 不同的文字 999 |
我想要的是一個新的資料框,其中一半的行從 中隨機選擇df1,另一半從 中隨機選擇df2,所有行都post_id在那里并且沒有重復。有沒有辦法在手動iloc行的情況下做到這一點?
uj5u.com熱心網友回復:
如果有相同的列數和相同的指數使用的DataFrame.update有DataFrame.sample:
df1.update(df2.sample(frac=0.5, replace=False))
print (df1)
post_id text
0 1.0 different text 1
1 2.0 some text 2
2 3.0 some text 3
3 999.0 different text 999
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/397686.html
