google code prettify

2016年12月28日 星期三

[Trouble-Shooting][CheckFileFormat] 打不開的PDF檔與分析未知的檔案格式

以下內容來自黑暗大大,此篇純屬筆記,方便日後查詢使用
如果知道檔案原本是哪一種格式,就好解決,
但如果是未知的檔案,玩猜猜樂的話,可能猜到天荒地老XD。

黑暗大大分享了一篇檔案格式鑑定,實驗檢驗真理,當然要實作一下。

我承認我是懶懶豬(舉手答右),以下文字轉自黑暗大大
爬文找到一個神奇的小工具 - Marco Pontello TrID,
它搜羅整理了 7886 種檔案格式特徵,能掃瞄檔案內容推測檔案類型。
到網站下載工具包含主程式 trid.exe 以及 檔案特徵資料庫 triddefs.trd,下個指令一秒就知結果。




實驗結果:
  1. 原本是Word的檔案對調成Excel  =>解析成功,原始檔案高機率是Word
  2. 原本是Excel對調成Word,          =>解析成功,原始檔案高機率是Excel
  3. 原本是SQL Server 的北風DB,對調成Word  =>解析成功,原始檔案是SQL Server(100%)
  4. 原本副檔名為為SDF,不變        =>解析失敗,Unknown
結論:被分析的檔案最少要有一些資料,如果原始有問題的檔案無法被分析。

Tools from here:Marco Pontello's TrID
此工具免安裝,使用CMD 執行 trid.exe,
需搭配triddefs.trd(檔案特徵資料庫 triddefs.trd,在同一個資料夾就可以)
//分析最有可能的檔案格式
trid 檔案名稱.副檔名 => trid isExcel.doc 



回原始主題=>打不開的PDF檔

案情可定調為「原本產生 PDF 的套表程式,不知何故產出檔案格式變成 WPS」,這… 未免也太懸疑?

同事深入探訪後找出原因:套表程式原本搭 Word 2007 執行,
前些時候配合另一套古老系統需求在同台主機安裝了 Word 2003。
由於舊版軟體不知道新版軟體的存在,先裝新版再裝舊版可能造成共用元件被不當覆寫。
而問題發生時點跟安裝 Word 2003 時間大致吻合,
推測是元件覆寫導致檔案格式參數錯亂,才讓 PDF 變成 WPS。

問題在重新安裝 Word 2007 後排除,Case Closed,收工。

Reference
【茶包射手日記】打不開的PDF檔與檔案格式鑑定
Tools Check File Format - Marco Pontello's TrID

沒有留言:

張貼留言