如果知道檔案原本是哪一種格式,就好解決,
但如果是未知的檔案,玩猜猜樂的話,可能猜到天荒地老XD。
黑暗大大分享了一篇檔案格式鑑定,實驗檢驗真理,當然要實作一下。
我承認我是懶懶豬(舉手答右),以下文字轉自黑暗大大
爬文找到一個神奇的小工具 - Marco Pontello TrID, 它搜羅整理了 7886 種檔案格式特徵,能掃瞄檔案內容推測檔案類型。 到網站下載工具包含主程式 trid.exe 以及 檔案特徵資料庫 triddefs.trd,下個指令一秒就知結果。
實驗結果:
- 原本是Word的檔案對調成Excel =>解析成功,原始檔案高機率是Word
- 原本是Excel對調成Word, =>解析成功,原始檔案高機率是Excel
- 原本是SQL Server 的北風DB,對調成Word =>解析成功,原始檔案是SQL Server(100%)
- 原本副檔名為為SDF,不變 =>解析失敗,Unknown
結論:被分析的檔案最少要有一些資料,如果原始有問題的檔案無法被分析。
Tools from here:Marco Pontello's TrID
此工具免安裝,使用CMD 執行 trid.exe,
需搭配triddefs.trd(檔案特徵資料庫 triddefs.trd,在同一個資料夾就可以)
Tools from here:Marco Pontello's TrID
此工具免安裝,使用CMD 執行 trid.exe,
需搭配triddefs.trd(檔案特徵資料庫 triddefs.trd,在同一個資料夾就可以)
//分析最有可能的檔案格式 trid 檔案名稱.副檔名 => trid isExcel.doc
回原始主題=>打不開的PDF檔
案情可定調為「原本產生 PDF 的套表程式,不知何故產出檔案格式變成 WPS」,這… 未免也太懸疑? 同事深入探訪後找出原因:套表程式原本搭 Word 2007 執行, 前些時候配合另一套古老系統需求在同台主機安裝了 Word 2003。 由於舊版軟體不知道新版軟體的存在,先裝新版再裝舊版可能造成共用元件被不當覆寫。 而問題發生時點跟安裝 Word 2003 時間大致吻合, 推測是元件覆寫導致檔案格式參數錯亂,才讓 PDF 變成 WPS。 問題在重新安裝 Word 2007 後排除,Case Closed,收工。
Reference
【茶包射手日記】打不開的PDF檔與檔案格式鑑定
Tools Check File Format - Marco Pontello's TrID
沒有留言:
張貼留言