PDF 是許多活動的有益格式。它是一種基本的、易於分享的格式,最重要的是,它是一種美學格式。它是手冊、短篇文章、概況介紹、書籍、演示文稿等點的最佳樣式。所有 PDF 記錄都有自己的格式,包括不同類型的圖像、表格和圖表。我們大多數人都認識到,以 PDF 格式查看記錄是多麼的創新和簡單,而不管 Web 內容本身有多複雜。
因此,在 PDF 佈局中有很多現成的信息。自動翻譯是理解和分享信息的絕佳選擇。不幸的是,與自動翻譯相關的 PDF 佈局並不是很好。從技術的角度來看,PDF 是一個巨大的困難。這就是為什麼在自動對等 PDF 文件時會出現一些問題的原因。以下是 PDF 翻譯不成功的四個最典型原因:
因素 #1:PDF 文檔中的文本實際上是圖像
如果您嘗試翻譯您的 PDF 文件,但似乎沒有發生任何事情,則問題可能是由照片引起的。PDF數據可以有大量的照片,也可以有圖片裡面的信息。同樣,從網站檢查的任何類型的 PDF 記錄 硬拷貝可以被認為是一張大照片。然而,自動翻譯無法檢查任何美學元素中的文本,如圖像或圖表。如果您不確定是否是這種情況,您可以通過選擇文本中的某些項目來方便地測試您的記錄。掃描所有手工創建的 PDF 文檔。這種情況下的經驗法則是,如果您可以復制一段文本並將其粘貼到 word 中,那麼 PDF 翻譯器也應該能夠對其進行轉換。如果你不能選擇之後的文字,那就是圖片。
因素 #2:PDF 數據中的文本由“具有挑戰性”的字體樣式類型組成
如果您使用複制/粘貼方法檢查文檔並且粘貼的消息看起來很奇怪,則問題很可能與字體樣式類型有關。這意味著,即使您的 PDF 文件是包含“實際”信息的一流文件,該文件也無法正確翻譯。某些字體類型在 PDF 文件中以具有挑戰性的方法進行編碼,因此 PDF 翻譯人員也無法理解該消息。與個人一樣,PDF 翻譯器無法將其無法識別的文本等同起來。因此,如果您嘗試複製並粘貼該消息,並且它最終成為一些奇怪的人物或文字框,您很可能會責怪字體。
因素 #3:您的 PDF 數據是安全的
有機會保護 PDF 記錄。自然,版權所有者應該保護他的發展,而保護是避免任何形式的細節濫用的一種手段。如果文件受到保護,您不能在文件中選擇任何類型的消息,也不能自動轉換。
因素 #4:您的 PDF 翻譯器實際上功能有限
如果問題不是您的文件尚未等同於您在純消息文檔中獲得翻譯,則問題與您的 PDF 翻譯器有關。一些 PDF 翻譯器只能翻譯文本以及生成沒有額外屬性的普通文本翻譯,如圖片、表格或圖表。同樣還有更先進的 PDF 翻譯器,它們能夠生成與原始文檔完全相同的設計(帶有照片、圖表和表格在最佳位置)的翻譯文件。如果佈局對於理解文件很重要,則此問題特別相關。例如,所有類型的指南和科學帖子通常在文本、圖像和表格之間都有參考資料。
這些是大多數自動 PDF 翻譯背後的原因。當然,可能還有很多其他因素和問題,但這四個涵蓋了最常見的情況。
如果您正試圖找到一個複雜的 PDF tra