PdfMasher For Mac là phiên bản dành cho hệ điều hành Mac, giúp bạn chuyển đổi file PDF sang định dạng file HTML. Hầu hết các ứng dụng đọc ebook đều hỗ trợ file PDF, nhưng việc đọc file PDf trên các ứng dụng này cũng rất khó khăn bởi chúng không có đúng kích cỡ phông chữ so với những dữ liệu ebook.
Trong nhiều trường hợp, chúng ta thường phải sử dụng tính năng phóng to hoặc thu nhỏ và đó chỉ là việc làm bất đắc dĩ mà thôi. Thêm vào đó, một trong những khó khăn khác khi đọc PDF trên ứng dụng đọc ebook là nó không hỗ trợ cho các chú giải.
Cũng có những công cụ được dùng để chuyển định dạng file PDF sang ebook ví dụ như Calibre, tuy nhiên những gì công cụ này có thể làm là cố gắng suy đoán vai trò của từng đoạn văn bản trong định dạng PDF (và tất nhiên nếu bạn là người may mắn). Tôi cho rằng đó là tất cả nhưng trong những trường hợp đơn giản nhất, đó là một sai lầm khi nghĩ rằng AI có khả năng suy đoán như thế.
Khởi động PdfMasher. Công cụ này sẽ hỏi người sử dụng về vai trò của mỗi đoạn văn bản và định dạng chúng một cách hiệu quả. File PDF của bạn chứa một tiêu đề trên mỗi trang và bạn không hề muốn chúng làm xáo trộn văn bản của mình? Hãy sắp xếp lại các đoạn văn bản theo dạng chữ Y (đó là nhóm chúng lại với nhau), giữ phím shift rồi lựa chọn các đoạn văn bản và đánh dấu là sẽ lược bỏ.
Và thế là chúng sẽ không còn xuất hiện trên file HTML cuối cùng của bạn nữa. File PDF của bạn chứa nhiều chú thích trên nhiều trang. Hãy sắp xếp lại các đoạn văn bản theo nội dung (đó là nhóm tất cả các đoạn với văn bản bắt đầu bằng 1 con số) và đánh dấu chúng là các chú thích. Lúc này chúng sẽ được chuyển tới cuối văn bản, và PdfMasher sẽ tiến hành tạo ra các đường dẫn tới phần tham khảo các chú thích.
Đặng Hương