[討論] 如何網路上在搜尋擁有特定pattern的code

作者: ericerix (Ponwar)   2022-05-04 16:26:17
請原諒我標題有點晶晶體,因為字數的關係才打成那樣的QQ
如標題,因為研究需要,想搜尋大量符合我要的 pattern 的程式碼以供研究,
例如:我要找有運用到 `a = b/c++;` 這種的程式碼,其中 a, b, c不限,
最好是屬於 library,也就是大家都會使用的函式庫。
目前鎖定 github,但 github 的搜尋能力好像沒辦法達到。
作者: EricTCartman (阿ㄆㄧㄚˇ)   2022-05-04 16:33:00
下載大量的程式碼 透過既有的AST Parser分析特定的tree pattern
作者: CRPKT (crpkt)   2022-05-04 17:23:00
sourcegraph 研究看看github 有新的搜尋功能在封測,要申請才有
作者: alihue (wanda wanda)   2022-05-04 17:45:00
找可以用 regex 的搜尋引擎
作者: TSW (翹班帝國)   2022-05-04 17:47:00
先縮小範圍,像是Apache基金會,可以整個都抓下來再分析
作者: johnny94 (32767)   2022-05-04 17:53:00
問copilot
作者: EricTCartman (阿ㄆㄧㄚˇ)   2022-05-04 18:20:00
regex能處理的有限 複雜一點的expression夾在另一個expression裡 你reg會寫到崩潰 除非這種case你要直接放棄
作者: qqaatw (qq)   2022-05-04 20:05:00
sourcegraph
作者: ss8651twtw (linsc04)   2022-05-04 20:58:00
grep.app
作者: Hsins (翔)   2022-05-04 21:30:00
https://cs.github.com/about封測中, 但現在申請應該一個禮拜會收到
作者: mohai (墨海)   2022-05-05 10:56:00
一樓是正解,之前幫忙開發 SonarQube 程式庫找 code smell也是抽象語法樹下去分析
作者: splitline (台ㄎ廢文王)   2022-05-05 16:28:00
grep.app
作者: seebass (Far Far Away Kingdom)   2022-05-07 21:57:00
code2vector and dataset

Links booklink

Contact Us: admin [ a t ] ucptt.com