PDA

View Full Version : Chuyển file PDF tiếng Việt sang Word chính xác mã Font



hellovit
24-09-2009, 12:00
Chuyển file PDF tiếng Anh sang Word thật dễ dàng nhưng đối với file PDF tiếng Việt thì thật là đau đầu. Sau đây, tôi xin giới thiệu cách chuyển đổi mang lại kết quả tốt, không bị lỗi Font.

Thực hiện theo các bước sau:

Bước 1: Gỡ bỏ password và các giới hạn nếu file PDF bị khoá password
Dùng công cụ PDF Password Remover 3.0 (portable)


http://www.ziddu.com/download/6622859/PPR.rar
pass=zidduzudid

http://preview.shareapic.net/preview6/019699031.jpg

Xem hình lớn: http://www.shareapic.net/View-19699031-PDF2DOC.html

Bước 2: Convert file PDF thành DOC
Dùng chương trình Solid Converter PDF 5.0 (portable)


http://www.ziddu.com/download/6623015/SCP5.rar
pass=zidduzudid

http://preview.shareapic.net/preview6/019699021.jpg

Xem hình lớn: http://www.shareapic.net/View-19699021-PDF2DOC.html

Mở chương trình -> Browse đến file PDF -> Convert -> xong

Bước 3: Chuyển mã Font

1. Cách thứ nhất: dùng Unikey

Dùng Unikey đơn giản nhất và cho kết quả chính xác cao và giữ được định dạng văn bản, nhưng trước tiên phải xác định mã nguồn là gì.

Để xác định mã nguồn, ta vào các trang sau:


http://fontchu.com/tiengviet.htm
hoặc

http://www.thanhnien.com.vn/ChuViet/default.htm

Copy thử một đoạn văn bản của file DOC đã chuyển đổi từ PDF dán vào cửa sổ mở ra, chọn 'Nhận dạng mã', trang web sẽ hiện thông báo cho biết bảng mã được dùng.

http://preview.shareapic.net/preview6/019699022.jpg

Xem hình lớn: http://www.shareapic.net/View-19699022-PDF2DOC.html

Có thể bấm Chuyển mã để chuyển mã online bằng các trang này luôn, nhưng nó sẽ không giữ được định dạng, mất công ta phải chỉnh sửa, do đó chỉ cần xác định mã là đủ.

Cách chuyển mã:

http://preview.shareapic.net/preview6/019699023.jpg

Xem hình lớn: http://www.shareapic.net/View-19699023-PDF2DOC.html

Copy toàn bộ văn bản (Ctrl-A) (copy xong không bỏ vùng chọn) -> click phải vào biểu tượng Unikey dưới khay hệ thống -> Công cụ -> chọn mã nguồn là mã vừa xác định, mã đích là Unicode -> Chuyển mã.

Quay trở lại văn bản (lúc này vẫn còn chọn toàn bộ văn bản) dán vào (Ctrl-V) -> xong

2. Cách thứ 2: dùng Vietkey Office


http://www.ziddu.com/download/6622860/VKO.rar
pass=zidduzudid

Dùng tiện nhất trong các trường hợp sau:

- Không vào mạng được để kiểm tra mã văn bản
- Dùng nhiều bảng mã khác nhau trong một văn bản

Cài đặt Vietkey Office đến bảng thông báo Setup Vietkey Tool thì chọn Microsoft Word -> trong Word sẽ xuất hiện một Toolbar Vietkey Tools.

http://preview.shareapic.net/preview6/019699024.jpg

Xem hình lớn: http://www.shareapic.net/View-19699024-PDF2DOC.html

Cách chuyển mã:

Mở file DOC cần chuyển mã -> click Toolbar Vietkey Tools -> Chuyen ma/font van ban... -> click Đoán Font/mã 1 lần -> chọn Font đích là VN Unicode 1 -> bỏ chọn mục Chuyển Font -> click chọn mục Tự động đoán mã -> click Chuyển đổi

http://preview.shareapic.net/preview6/019699025.jpg

Xem hình lớn: http://www.shareapic.net/View-19699025-PDF2DOC.html

Kết quả khỏi chê nhé!

thanh dat
24-09-2009, 20:05
đang test, than***x ^^

Hoa_Hong_Da
24-09-2009, 22:48
Bác rất nhiệt tình, nhưng mờ E dùng Acrobat Pro 7.0 net hơn nhìu

tiktiktak
29-09-2009, 10:50
Verification Code:zidduzudid ?
minh down ko dc

hellovit
30-09-2009, 09:14
1. down bình thường

2. bộ Acrobat quá cồng kềnh đồ sộ

matbao135
30-09-2009, 09:16
Một tip hay! Cảm ơn bác

QuanN
02-10-2009, 08:28
Chương trình VietOCR (http://vietocr.sf.net) cũng có thể convert PDF sang text.

hikhik
02-10-2009, 08:45
Nếu là convert PDF sang Doc thì các bạn có thể tham khảo bài viết này. Có 2 bản phần mềm:
http://www.daoduytu.edu.vn/forum/showthread.php?t=9704

Còn convert font, các bạn có thể tận dụng Unikey hoặc sử dụng dịch vụ web-base đây:
http://daoduytu.edu.vn/tool/convertfont/