有點標題黨,不過都說都真實的,英語技能對開發員人員至關重要,所有人都不喜歡背單詞,但更慘的是背住的單詞發現沒怎么用,又慢慢地忘記了,本來計劃給自己做個開發人員常用單詞表,感覺可能對其它人也有用,所以就發布開源出來,
單詞串列托管在Github上,一共將近3000個,
https://github.com/kkyon/Simple-IT-English?
單詞主要來自:StackOverflow 和HackerNew、
Word Source:
| Source | Newest Post | Oldest Post | Row Count | Size |
|---|---|---|---|---|
| HackerNews comments | 2015-10-13 08:44:02 UTC | 2006-10-09 19:51:01 UTC | 8399417 | 3.41 GB |
| HackerNews stories | 2015-10-13 08:44:34 UTC | 2006-10-09 18:21:51 UTC | 1959809 | 402.71 MB |
| StackOverflow answers | 2019-09-01 05:22:21.463 UTC | 2008-08-01 13:16:49.127 UTC | 27665009 | 22.27 GB |
| StackOverflow questions | 2019-09-01 05:23:41.743 UTC | 2008-08-03 21:38:52.623 UTC | 18154493 | 28.13 GB |
48.8 GB processed
1 . 大資料部分使用了Bigquery, 使用非常簡單,
技術堆疊是:
2. NLP部分使用NLTK.
3. 最后使用python腳本來生成Markdown檔案, 具體代碼在github上都有, 后面加個v2ex地址: https://www.v2ex.com/t/627750
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/45236.html
標籤:其他
上一篇:我的微服務之路
下一篇:如何在寒冬中找到好作業?
