Re: [新聞] 中國盜印四庫全書 故宮竟幫忙脫罪

作者: Lumstasia (四十年來落花夢)   2014-09-25 00:23:05
JeremyJoung你好,小弟剛好也曾經是執行數位典藏的助理,有些網路資料,
大家或許可以一起來參考看看。
台北故宮的文淵閣四庫全書,1985年台灣商務印書館黑白影印出版,裝訂1500冊。
這是第一次公開的全文影像,之後所有標榜文淵閣四庫全文的出版品,
都是從這1500冊轉製作的。
http://www.cptw.com.tw/event/events_1007/siku.html (台灣商務四庫全書網頁)
後來香港迪志公司,把商務這套掃描全文,製作電子版。
這才有了全文數位檔(當然還是黑白的)
http://www.itventuresltd.com/big5/dhp.htm
迪志全文甚至發行過硬碟版
http://ttsgroup.com.tw/Prod_d/skqs.html
商務本30年來,不知被大陸轉印過幾次,有印零種書者,有印全文者,已經不是
罕見的資料。只要有人有錢,拿這些書再轉製作,就如此次新聞一般。
至於台北故宮,只有部份文淵閣四庫零冊與書影彩色影像檔,沒有全文影像檔,
這是因為經費不足,故宮無法製作。
故宮從2003年開始古籍數位化,這十來年每年約製作數萬頁,
可參考政府採購網公開招標文件,例如99年度平床掃描2萬5千頁
http://goo.gl/3tbgV2
以這經費比例,故宮花100年就可以把四庫完全數位化。
如果是2003年初期國科會經費較多時,只要30年就可以掃描完。
因為故宮根本沒有全文數位檔,所以無從外流。
又、從您文章看來,似乎您不太熟悉古籍數位化所需時間與作業要求,
以致對故宮數位檔內容有些幻想。小弟沒啥學問,但曾經任職10年
國科會數位典藏計畫助理,業務恰巧是執行故宮善本古籍數位化,
也剛好是摸過四庫全書原件的工作人員,對古籍數位影像檔稍有心得,
您要是有興趣,歡迎來討論。
http://content.teldap.tw/index/database/database.php?no=119
(↑因為小弟隨著計畫結束而離職了,上述電話、email已無效,
有意見請站內信,謝謝)
※ 引述《JeremyJoung (J.J.)》之銘言:
: 其實關於這份的爭議
: 魯蛇小弟我剛好有在負責天龍國內某國立博物館的數位典藏維護業務
: 基本上要先聲明的是 人家故宮是一級的院級單位 和江華華平起平坐沒在鳥它的
: 而我們只是個卑微的三級單位 上級單為隨便一個鳥官來的餿主意 都會整死我們
: 而且會有三級還是因為文化布升格 才正好有資格搭上升格順風車而已
: ok 進入正題
: 關於故宮的洩漏情資的事情真相 老實說我完全沒概念
: 但我只能根據我們館在內執行數位典藏時的一些基本規格讓板上眾魯參考一下
: 數位典藏說穿了其實也沒什麼 不過就是拿個手機來拍一下
: 然後每年就可以藉此跟國科會詐騙 喔不 是申請一筆計畫執行經費
: (當然沒可能這麼輕鬆 至少都是k牌xxD系列 而且拍完還要寫METADATA報告)
: 我們館內大約動用了3名不等(依大環境景氣決定) 國立碩士級約聘工讀生來執行典藏業務
: 每個計畫每年的產能基本上不超過1000張 但這也是沒辦法的事情
: 因為 這不是那種素人自拍 隨便拍拍就能交差
: 除了最基本的'全局圖'另外還有'特寫圖'
: 該怎麼拍才能表現出藏品的重點都是要討論與請示的
: 而且 敝館的蒐藏項目非藝術或文史纇蒐藏 是以實物藏品為主
: 所以取鏡角度的問題更明顯
: (館內研究員都說 我們的藏品都是無價之寶喔)
: 然後重點來了 即便是這樣卑微的無價之寶
: 我們的業務執行標準都是單眼畫素全開 以raw格式紀錄
: 在數位典藏的執行規範中 圖片由高到低分為四種層級: 原圖 大圖 中圖 縮圖
: 縮圖理所當然就是大家上網站檢索時看到的預覽圖
: 而點進藏品明細時 讓你看到的也只是中圖而已
: 如果 有人跟博物館申請照片時 我們會勉為其難的審核後把大圖傳給你 而且還只是jpg
: 那好 問題來了 原圖是幹嘛用的??
: 原圖除了是館內最核心的財產之外 是當有高階的重製或研究計畫時才會動用到的資料
: 在我們家 就算只是用個相機拍攝 每張原圖都是50MB+
: 而我們目前已製作了幾萬張的原圖(可見跟國科會騙了多少年[煙
: 多年前 我們動用了兩座磁櫃 一座20TB+ 來存放這些研究數據
: 要知道 這還只是我們這種雜魚館在執行業務時的操作規模
: 就故宮這種負責國寶文物的一級博物院 使用的都是大型全平面掃描器
: 如果一張原圖大小沒有沒超過1GB 我不相信他們能這樣交差
: 而且小於這個水準的品質也不可能能用於文物重製
: 而根據WIKI紀錄
: 「共收書3503種,79337卷(據文溯閣本79897卷),36304冊,近230萬頁,約8億字」
: 230萬頁
: 假設他們很偷懶 每個藏品都只需要拍一張全局圖 (我們是都要連續複數張以上的)
: 它的必須容量都至少是1G*2.3M = 2.3PB
: 怕非資訊的鄉民不熟悉PB這個單位 它是TB的1000倍 而當前市面上的主流硬碟是2-4TB
: 也就是 如果想要帶走四庫全書的完整影像檔 至少都要將近1000顆硬碟才有辦法乘載
: 而每顆裸機硬碟的重量是700G 體積自己想像
: 如果 真的有所謂"數位典藏資訊外流"的這一事實
: 納麼肯定不是區區一個打工約聘的研究員能做到的事情
: 也不可能是網路駭客入侵什麼的 那個流量根本無法忍受 而且也都是使用私人網路
: 若要實現這個可能性
: 必然是有上層的某XX會XX長 帶著大批人拿著金鑰加上一整櫃的全新硬碟進機房
: 不眠不休的花上數個月的時間來拷貝磁櫃(就是要這麼久)
: 在物理上才有可能拿走這些數據
: 所以對於這則新聞我持有幾個存疑點
: 1. 是否真的有故宮資訊財產外流這一事實??
: 但就故宮的回應來看 似乎並非完全子虛烏有之事實
: 2. 外流的圖檔真的是"原圖"嗎?
: 不過 若只是區區"大圖"以下的劣化品 我很難相信強國人敢這樣號稱正版 還開價6000萬
: 但我希望他們就是這樣無恥 能讓問題在此得到破解 因為麼最恐怖的問題才來了
: 3. 到底是誰有這樣通天的權限與本領 能用這麼久的時間 去取出這些最高級的大資料???
: 別忘了 故宮是一級單位 完全不用甩江華華的
: 現階段除了館長以外 就只有在江華華頭上的那兩隻 才有資格勒令故宮
: 我沒有什麼預設立場
: 但我只是根據物理面與制度規範面上的邏輯性來描素
: 若要實現上述行為 必需要有哪些不可避免的物理前提
: 剩下的就已經不是我的責任範圍了 我只是乙名卑微已失業的約聘打工前MIS
: (滾到角落去
:
※ 編輯: Lumstasia (175.180.98.31), 09/25/2014 00:25:05
作者: LIONDODO (LION)   2014-09-25 00:27:00
喔喔喔!
作者: spanda0730 (熊貓小奴)   2014-09-25 00:32:00
有專業又有內涵,推! 不象某些人半瓶水…
作者: waloloo (ARIAxヨシノヤ )   2014-09-25 00:33:00
有神快拜!以這經費比例,故宮花100年就可以把四庫完全數位化。(!
作者: ruo01332000 (EDGE)   2014-09-25 00:35:00
打臉文
作者: ko007x (有情有義退隱江湖)   2014-09-25 00:37:00
看推文數就知道 罵政府才有人看 誰管你對還是錯
作者: blackponpon (XDDD)   2014-09-25 00:38:00
專業給推
作者: linfon00 (笨蛋)   2014-09-25 00:42:00
那為什麼要跟故宮簽約?
作者: qooisgood (不告訴你)   2014-09-25 00:42:00
高調?!
作者: shrincault   2014-09-25 01:08:00
專業!!
作者: JeremyJoung (J.J.)   2014-09-25 02:49:00
基本上 計畫執行所需的時間成本我也有思考過但是由於故宮的獨立編制太大 單一個故宮就等於整個文化部的預算還有剩 研究員的數量也不是同一個水平所以要不是內部人員 我也只能假設他們的執行能力足夠所以 我才會開頭第一個疑問就是 到底有沒有外流這事

Links booklink

Contact Us: admin [ a t ] ucptt.com