Wolfram語言中的靜態(tài)分析工具

發(fā)布時間：2021/05/06 瀏覽量：3973

編寫好的測試需要大量的知識和大量的時間

捕捉常見的問題

尋找錯誤并修復它們不僅僅是我的一種激情，更是一種強迫癥。幾年前，作為一名QA開發(fā)人員，我為Wolfram語言創(chuàng)建了MUnit單元測試框架，這是一個用于編寫和運行語言單元測試的框架。從那時起，我創(chuàng)造了更多的工具來幫助開發(fā)人員編寫更好的Wolfram語言代碼，同時在這個過程中無縫地檢查出錯誤。

編寫好的測試需要大量的知識和大量的時間。由于我們需要能夠盡快測試和解決問題，以便按期發(fā)布新功能，我們轉(zhuǎn)向靜態(tài)分析，以便能夠做到這一點。

什么是靜態(tài)分析？

靜態(tài)分析是在運行源代碼之前對其進行檢查的過程，以試圖預測其行為并發(fā)現(xiàn)問題。作為一種測試方法，它是非常有用的。在代碼運行時發(fā)現(xiàn)問題并不總是可行的。運行代碼的成本也很高--如果代碼失敗了，那就更是如此。

考慮到構成Wolfram語言的大量代碼（有120萬行的內(nèi)核啟動Wolfram語言代碼，橫跨1900個文件，還有85萬行的paclet Wolfram語言代碼，橫跨3700個文件），必須要有一個策略來測試所有這些代碼的錯誤。Wolfram對Wolfram語言的每一個角落都有專門的測試--其中有些是我寫的!

CodeInspector paclet 是那些重要的靜態(tài)分析工具之一，它使開發(fā)人員能夠完成更好的工作。CodeInspector包含在最近發(fā)布的Mathematica 12.2中，它可以掃描Wolfram語言代碼并報告問題，而不需要用戶手動運行paclet。CodeInspector 與 CodeParser 和 CodeFormatter 一起構成 CodeTools 套件，供內(nèi)部和外部用戶使用，以提高其 Wolfram Language 代碼的質(zhì)量。

一般來說，靜態(tài)分析不能發(fā)現(xiàn)程序中所有可能的bug(這是通過Rice定理對停止問題的不可控性所產(chǎn)生的結果)。但是，靜態(tài)分析仍然可以提供大量的重要信息

例如，很容易看出這里的測試中不需要&&True。

這可能是遺留的調(diào)試代碼，或者僅僅是邏輯上的一個錯誤。靜態(tài)分析工具可能會警告說，&& True不需要，可以去掉或改成別的東西。雖然靜態(tài)分析工具不能辨別作者的意圖，但它們可以找到值得調(diào)查的 "可能的問題 "的類別。

創(chuàng)建一個靜態(tài)分析工具來測試Wolfram語言中的錯誤，有一系列非常具體的挑戰(zhàn)。作為一種編碼語言，Wolfram語言具有難以置信的動態(tài)和靈活性。雖然這通常被認為是對開發(fā)人員的一種獎勵，但它確實使抽象建模非常困難。函數(shù)可以在運行時被重新定義，而且在Wolfram語言中精確定義一個值的概念也很復雜。

鑒于語言本身的局限性，CodeInspector基于語法樹的模式匹配進行輕量級靜態(tài)分析。這類似于其他語言的 "提示工具"。事實上，CodeInspector paclet的原名是Lint! 但很快就發(fā)現(xiàn)，它所做的工作不僅僅是檢查，所以它被改名為CodeInspector）。)

CodeInspector目前有大約兩百條內(nèi)置規(guī)則，可以應用于被檢查的代碼。這些規(guī)則從常見的語法問題（如缺少逗號）到更隱蔽的問題（如在符號求解器中使用Q函數(shù)）。許多規(guī)則包括修復代碼的建議。

使用 CodeInspector

CodeInspector 包含在 Mathematica 12.2 中。如果您使用的是舊版本的Mathematica，您可以通過評估以下內(nèi)容獲得CodeInspector：

為了以編程方式獲得以下代碼片斷中所有問題的列表：

...您可以運行這個測試：

要獲得測試中發(fā)現(xiàn)的所有問題的可視化摘要，請使用CodeInspectSummarize（包含在CodeInspector paclet中）：

您甚至可以在命令行上使用CodeInspectSummarize：

有多種方法可以控制CodeInspectSummarize的輸出。為了做到這一點，我們需要對問題進行分類，這本身就是一個有趣的問題！這是因為我們需要在以可查詢的方式公開問題的許多屬性與建立一個易于人類使用的系統(tǒng)之間取得適當?shù)钠胶?。這是因為我們需要在以可查詢的方式暴露問題的許多屬性與擁有一個易于人類消費和理解的系統(tǒng)之間取得適當?shù)钠胶狻?/p>

我使用兩個維度，至少現(xiàn)在是這樣：嚴重程度和信心等級。如果輸出顯示有問題，嚴重性表示每個問題有多嚴重。這個問題會不會影響到用戶？它是否會意外地發(fā)射核彈頭？知識就是力量，特別是當您需要了解手頭問題的影響時。

ConfidenceLevel表示該問題實際上是一個問題而不是一個假陽性的信心水平。ConfidenceLevel是一個介于0.0和1.0之間的真實值。ConfidenceLevel→0.0意味著對所報告的問題完全沒有信心，而ConfidenceLevel→1.0意味著眼前肯定有問題，比如函數(shù)中不匹配的括號。ConfidenceLevel為0.5意味著大約有一半的時間出現(xiàn)這種問題，是一個假陽性。在括號不匹配的情況下，ConfidenceLevel是1.0。CodeInspector中更多的實驗性規(guī)則會有更低的ConfidenceLevel，當我添加啟發(fā)式方法來消除假陽性時，我會增加問題的ConfidenceLevel。為我的目的重新使用 ConfidenceLevel 符號可能是對符號的濫用，但它很方便。

因為Wolfram語言是如此的動態(tài)，很難判斷一個所謂的bug實際上是一個錯誤。即使在前面的示例中,If語句也可能是故意編寫的。僅語法錯誤,例如：