[請益] 如何加快軟體工作程式搜尋效率

作者: FacetheFaith (Yes Man)   2017-09-20 16:12:23
借助軟體版的高人氣,請教一下前輩們,小弟有一支搜尋Google Drive的程式
因為使用者通常不知道folder id,所以預設的搜尋位置是從根目錄(root)開始搜尋檔案
我採用的是深度優先搜尋法(DFS),也就是搜尋到的檔案如果是資料夾
那麼接著就開始搜尋該資料夾下的檔案,以此類推
如果要搜尋的檔案在很前面 (不清楚一開始搜尋的資料夾是依據什麼),
那麼該檔案就很有可能被找到
反之,就有可能回傳 HTTP 500 Internal Server Error(應該是Time out)
程式碼如下,是使用遞迴搜尋:
... 省略 ...
service = new Drive.Builder(httpTransport, JSON_FACTORY, credential)
.setApplicationName(APPLICATION_NAME).build();
System.out.println("=== Start to search ===");
long startTime = System.currentTimeMillis();
File searchResult = recursiveSearch(folderID, searchFileName);
if (searchResult != null) {
result = searchResult.getName();
// 結束時間
long endTime = System.currentTimeMillis();
long totTime = (endTime - startTime) / 1000;
// 印出花費時間
System.out.println("花費時間:" + totTime + "秒");
}
public File recursiveSearch(String folderID, String searchFileName) throws
IOException {
File searchResult = null;
FileList fileList = service.files().list()
.setQ("'" + folderID + "' in parents and trashed = false")
// .setSpaces("drive")
.setCorpora("user")
.setFields("nextPageToken, files(id, name, mimeType)").execute();
List<File> items = fileList.getFiles();
System.out.println("files size is " + items.size());
for (File file : items) {
if (file.getName().equals(searchFileName)) {
searchResult = file;
System.out.println(file.getName() + " is found!");
return searchResult;
} else if (file.getMimeType().equals("application/vnd.google-apps
.folder"))
{
System.out.println("recursive search");
System.out.println("file.getId() is " + file.getId());
searchResult = recursiveSearch(file.getId(), searchFileName);
} else {
System.out.println("file name is " + file.getName());
}
if (searchResult != null) {
System.out.println("Finish");
break;
}
}
return searchResult;
}
public static void main(String[] args) throws IOException {
DriveSearch driveSearch = new DriveSearch();
String result = driveSearch.fetchData("hfjBV5Z3V2c", "test.txt");
System.out.println(result);
}
在Google Drive上面的根目錄搜尋同樣檔案一下子就找到了,
所以是演算法的問題嗎?
程式該怎麼改寫才能增進搜尋效率?
謝謝!
作者: StarRoad (知道越多了解越少)   2017-09-20 16:15:00
這裡是"軟體工作"版,不是軟體版
作者: JameC (智取其乳)   2017-09-20 16:22:00
你可以去Prob_Solve 問問看那裡雖然冷清,但通常都會有人回答你
作者: sing10407 (阿U)   2017-09-20 16:34:00
stackoverflow上應該比較容易有解答
作者: drajan (EasoN)   2017-09-20 16:37:00
建index 每一小時更新一次那個index table就好
作者: alog (A肉哥)   2017-09-20 16:51:00
1. 需要建立跟維護檔案的索引表,搜尋時可以優先找索引裡的資料2. 索引表裡面可以根據一些特徵,幫他標上一些 Meta 例如:屬於圖片類、文件類,再根據搜尋的關鍵字特徵優先尋找特定類的資料概念大概就是這樣 剩下的你得自己去想 畢竟是維護你自己app
作者: FacetheFaith (Yes Man)   2017-09-20 18:17:00
用elasticsearch建立index效果好嗎
作者: pttuser (pttuser)   2017-09-20 18:29:00
你可以重寫
作者: PUTOUCHANG (自己的廢文自己發)   2017-09-20 18:42:00
你會自刪嗎?
作者: chuegou (chuegou)   2017-09-20 18:53:00
樓上好問題
作者: ChungLi5566 (中壢56哥)   2017-09-20 19:03:00
我猜25號前就刪了
作者: blackcan (太平李榮浩)   2017-09-20 19:20:00
有種手機拍電腦畫面的感覺…請用gist
作者: zerof (貓橘毛發呆雕像)   2017-09-20 19:33:00
作者: alog (A肉哥)   2017-09-20 19:33:00
1. 如果你的服務下需要用到這樣,用 elasticsearch 可啊,不過要說,這東西是索引系統如果真的掛了你就當作不能恢復,直接重新建立 2. 你可以先用 docker 把軟體拉下來運作進行評估 3. 記得搜尋條件記得下好,不要讓其他 user 可以存取到他人的索引 這台也只能掛在後端不能對外存取
作者: pttworld (批踢踢世界)   2017-09-20 20:18:00
我在解題版回你了
作者: bakedgrass (蒙古烤小草)   2017-09-21 02:52:00
因為高人氣所以當作問題板不是好風氣
作者: iamshiao (CircleHsiao)   2017-09-21 10:29:00
貼 SO 問
作者: THEWORLDS (天下)   2017-09-22 15:11:00
GOOGLE的我寫過 他會動態改變每一次地址真的很難抓

Links booklink

Contact Us: admin [ a t ] ucptt.com