PDF là một dạng hình ảnh, thường được dùng lưu trữ văn bản tài liệu với chất lượng cao và nhiều thành phần công thức, biểu đồ. Hiện tại, trên thị trường có rất nhiều các công cụ giúp chuyển đổi từ PDF sang văn bản tuy nhiên hầu hết cho kết quả không cao n