pyc檔案(位元組碼)
如何生成pyc檔案
https://www.cnblogs.com/zhangqunshi/p/6657208.html
https://blog.csdn.net/weixin_30614587/article/details/97230135
方1 命令列
python -m example.py
方2
import py_compile
py_compile.compile('example.py')
方3 將目錄下的py檔案都轉為pyc檔案
import compileall
compileall.compile_dir(r'/path')
方4 命令列 將目錄下的py檔案都轉為pyc檔案
python -m compileall <dir>
但發現直接運行代碼后有一個__pycache__檔案夾中會pyc檔案,這和這幾種方法的結果是一樣的.
pyo檔案 是 pyc檔案的簡化版
python -o -m example.py
python -oo -m example.py
-O引數表明要生成更加緊湊的優化后的位元組碼, 這樣生成的位元組碼檔案后綴名為.pyo檔案,
-OO會進一步移除-O選項生成的優化后的位元組碼檔案中的檔案字串,生成的檔案后綴名仍然為.pyo檔案,
如何運行pyc檔案
https://www.pynote.net/archives/2342
方法
python example.cpython-39.pyc
如何再轉為py檔案
https://blog.csdn.net/duohuanxi/article/details/114799153
https://pypi.org/project/uncompyle6/
uncompyle6 -o example.py example.pyc
Error: uncompyle6 requires Python 2.6-3.8
我的是python3.9就無法演示了
位元組碼與機器碼
https://blog.csdn.net/qq_35810838/article/details/99294636
位元組碼與機器碼都是二進制檔案即01組成的,但用notepad打開會發現是字母,這是notepad的問題.
python運行原理
源代碼py檔案
→
\rightarrow
→位元組碼pyc檔案
→
\rightarrow
→結果, pyc檔案通過解釋器得到結果
python并不是每次都需要轉換位元組碼,解釋器在轉換之前會判斷代碼檔案的修改時間是否與上一次轉換后的位元組碼pyc檔案的修改時間一致,若不一致才會重新轉換,即運行一遍后生成pyc檔案,以后每次運行,進行的只是將pyc輸入解釋器得出結果
python將源代碼翻譯為位元組碼,位元組碼通過解釋器獲得結果,并不會生成機器碼,但c語言會生成機器碼即exe檔案
從exe獲取原始碼
https://reverseengineering.stackexchange.com/questions/160/how-do-you-reverse-engineer-an-exe-compiled-with-pyinstaller
PE檔案的全稱是Portable Executable,意為可移植的可執行的檔案,常見的EXE、DLL、OCX、SYS、COM都是PE檔案,PE檔案是微軟Windows作業系統上的程式檔案(可能是間接被執行,如DLL)
非托管代碼反編譯后是匯編語言, 托管代碼反編譯是高級語言
非托管代碼就是根據不同的系統,不同的cpu進行編程,用來適配cup和作業系統
托管代碼,比如C# 通過編譯器生成中間語言,但是中建語言仍然需要編譯成本地cup能執行的機器代碼,這部分功能由一個運行在特定軟體系統來完成,這個軟體系統被稱之為虛擬機,只需要為每種作業系統和cpu架構提供一個虛擬機,就可以讓一個應用程式不加修改的跑在不同作業系統上,擁有不同cpu架構的計算機上,運行在這種虛擬機上的代碼成為托管代碼
https://blog.csdn.net/m0_37552052/article/details/88093427
https://blog.csdn.net/tymatlab/article/details/80511709
https://blog.csdn.net/ZH013/article/details/105116715
https://pypi.org/project/pydecipher/
方1
通過 pydecipher 將 exe 轉為 pyc
通過 uncompyle6 將 pyc 轉為 py
方2
通過pyinstxtractor 將 exe 轉為 pyc
通過 uncompyle6 將 pyc 轉為 py
pip install pydecipher報錯 error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio\\2019\\BuildTools\\VC\\Tools\\MSVC\\14.28.29910\\bin\\HostX86\\x64\\cl.exe' failed with exit status 2
pydecipher有一句話:可以在mac與linux的python3.8上運行,但windows不清楚,理論應該可以,
后面我嘗試可以用方2,所以就放棄這種方法了,
實體(方2)
寫一個test.py檔案

下載pyinstxtractor.py
https://codechina.csdn.net/mirrors/extremecoders-re/pyinstxtractor?utm_source=csdn_github_accelerator
打包py轉為exe pyinstaller test.py 在生成的dist檔案下的test檔案夾下會有test.exe
exe轉為pyc, 將生成的exe拿出來與pyinstxtractor.py放在同一級檔案下 python pyinstxtractor.py test.exe, 在生成的test.exe_extracted檔案夾下會有test.pyc
pyc轉為py,跳轉到test.exe_extracted檔案夾中 uncompyle6 -o test.py test.pyc


如何避免被反編譯
http://dt.digitser.cn/zh-CN/applet/cython_file/index.html
https://www.jianshu.com/p/4a0be62ee3e2
https://blog.csdn.net/qq_39498924/article/details/101292339
https://www.zhihu.com/question/347425323/answer/834691490
http://yshblog.com/blog/117
混淆代碼、加密代碼(安裝cython將py檔案轉為pyd檔案)
但貌似pyd也就是一種dll,也可以被反編譯,
pyd檔案是dll檔案嗎?
https://docs.python.org/3/faq/windows.html#id6
Yes, .pyd files are dll’s, but there are a few differences. If you have a DLL named foo.pyd, then it must have a function PyInit_foo(). You can then write Python “import foo”, and Python will search for foo.pyd (as well as foo.py, foo.pyc) and if it finds it, will attempt to call PyInit_foo() to initialize it. You do not link your .exe with foo.lib, as that would cause Windows to require the DLL to be present.
Note that the search path for foo.pyd is PYTHONPATH, not the same as the path that Windows uses to search for foo.dll. Also, foo.pyd need not be present to run your program, whereas if you linked your program with a dll, the dll is required. Of course, foo.pyd is required if you want to say import foo. In a DLL, linkage is declared in the source code with __declspec(dllexport). In a .pyd, linkage is defined in a list of available functions.
是的,但還是有些區別,
foo.pyd必須有函式PyInit_foo(),import foo 將foo.pyd匯入時,python會尋找foo.pyd(也會尋找foo.pyc或foo.py,假設只有foo.pyd檔案),找到后匯入就要呼叫PyInit_foo()對其進行初始化,
不要將exe與foo.lib鏈接,否則windows會要求foo.dll存在,
foo.pyd的搜尋路徑與foo.dll是不同的,
dll的鏈接在源代碼中的__declspec(dllexport),pyd的鏈接在函式中,
cpython與cython
https://zhuanlan.zhihu.com/p/65512422
https://www.tutorialspoint.com/what-is-the-difference-between-cython-and-cpython
https://cython.org/
cpython是用c實作的python,jython是java實作的python,IronPython是.NET實作的python,這些都是解釋器,
cython是一個靜態編譯器,是cpython的一個擴展,可以編譯cpython解釋器下的代碼,而不能用于編譯其他解釋器下如jython的代碼,
LLVM
https://www.infoworld.com/article/3247799/what-is-llvm-the-power-behind-swift-rust-clang-and-more.html
Mozilla Rust
Apple Swift
Jetbrains Kotlin
LLVM是Swift language creator Chris Lattner創建的一個開源專案,LLVM使得創建一門新語言以及提升現有語言很容易,
Swift使用LLVM作為其編譯器框架;Rust使用LLVM作為其工具鏈的核心組件;Clang編譯器及C/C++編譯器都有LLVM版本;Mono是.Net的一個開源實作,可以選擇用LLVM編譯;Kotlin是一種JVM語言,現在正在開發一種Kotlin Native使用LLVM編譯,
編譯原理
東北大學 編譯原理
高級語言、匯編語言、機器語言之間的轉換:
高級語言1
→
\rightarrow
→高級語言2
高級語言
→
\rightarrow
→機器語言
高級語言
→
\rightarrow
→匯編語言
匯編語言
→
\rightarrow
→高級語言
匯編語言
→
\rightarrow
→機器語言
機器語言
→
\rightarrow
→匯編語言
編譯程式:高級語言翻譯成等價低級語言
源語言——編譯程式——目標語言——運行程式——結果,編譯一次后,每次只需要運行目標語言即可,如c語言編譯為exe
編譯程式:高級語言直接運行得到結果
源語言——解釋程式——結果(python有逐行解釋與整體解釋之分)
源語言——詞法分析——語法分析——語意分析——優化處理——目標代碼生成——目標語言,中間的五個程式會不斷的與錯誤處理程式和符號表管理程式互動,
源語言——詞法分析——單詞串TOKEN——語法分析——語法樹——語意分析——語意樹——優化處理——優化語意樹——目標代碼生成——目標語言,目標語言可以用匯編語言或機器語言,
以語意樹為界,將整個程序分為兩部分,源語言——前端——中間代碼——后端——目標語言
int a,b;
b = a+2*5;
詞法分析:識別原程式中的單詞并分類
關鍵字:int
識別符號:a,b
常數:2,5
界符:, ;= + *
語法分析:組詞成句及語法錯誤檢查

語意分析:分析語法成分的語意特征
符號表
名字 型別 種類 地址
a int 變數 pointer1
b int 變數 pointer2
地址:指向符號在資料區存盤的位置
四元式或語意樹來描述語意資訊


優化:提高目標程式的質量,降低存盤空間,常數合并


目標代碼:

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/294218.html
標籤:python
