Có pác nào bít lấy text từ file ảnh hok. Mình có 1 đống file giáo trình mà toàn là file ảnh jpg. pác nào bít soft có thể lấy text ra vào word hok, hiúp mình với !
Có pác nào bít lấy text từ file ảnh hok. Mình có 1 đống file giáo trình mà toàn là file ảnh jpg. pác nào bít soft có thể lấy text ra vào word hok, hiúp mình với !
Nếu những ảnh bạn có được scan chất lượng tốt, đọc rõ ràng bằng mắt thường và không có những vết lem / bẩn, độ phân giải đủ 300dpi thì bạn có thể tìm một phần mềm mà trong tên có chữ OCR để "quét" nó, nó sẽ nhận dạng hình ảnh thành chữ -> thành file Word hoặc RTF cho bạn. Một tên tuổi phần mềm như vậy do Việt Nam viết có tên VnDOCR2.
Ảnh của bạn chất lượng kém hoặc độ phân giải chỉ là 72 hoặc 96dpi thì bạn quên ý định của bạn đi là vừa đẹp.
"bất khả tri"
Mình kiếm dc trên mạng biết phần mềm OmniPage 16 cũng hay lắm, nhưng mà mình không có key, pác nào có cho mình link với ! thanks nhìu
Được sửa bởi it_duchung lúc 10:32 ngày 06-12-2008
Theo mình được biết , lấy Text ở file ảnh thì rất là khó . Mình cũng không biết là lấy được hay không . Nếu bạn muốn In Text ở trong ảnh ấy ra thì làm như sau : sử dụng phần mềm convert từ file ảnh sang PDF "image to pdf v2.20" , sau đấy mình convert từ PDF sang word (Solid Convert PDF v2.2 build 158)
Link download:
image to pdf v2.20(key): http://mega.1280.com/file/10UXTA5N/
Solid Convert PDF v2.2 build 158 : http://mega.1280.com/file/4KCROLZT/ ( Không cần cài đặt , các bạn download về rồi sử dụng luôn )
Good Luck !
le_ngoc_quan.online@yahoo.com
chắc phải bỏ ý định đi thôi, phần mềm này hiếm, độ chính xác không cao, phụ thuộc nhiều yếu tố. Lấy text từ image là một bài toán quá khó.
Lấy text từ image mà khó =)). Công nghệ xử lý ảnh thời nay đã tiến rất xa rồi.
- Nếu là chữ in từ tài liệu thì rất dễ, có rất nhiều thuật toán có thể đáp ứng.
- Nếu là chữ in trên các biển quảng cáo, được chụp từ nhiều góc độ thì có khó hơn 1 tý, nhưng cũng đã xử lý tốt.
- Nếu là chữ viết tay tiếng Anh thì cũng có một số thuật toán có thể xử lý được đến 95%.
- Còn chữ viết tay tiếng Việt thì công nhận khó.
Một phần mềm có thể nhận diện chữ trong ảnh(miễn phí, phần lớn nguồn mở): http://www.thefreecountry.com/utilities/ocr.shtml
Ví dụ 1 phần mềm có thể nhận diện chữ trong file scanned: http://www.simpleocr.com/.
Nếu bạn nào đã từng sử dụng phần mềm Evernote, sẽ thấy khi gõ 1 từ vào ô search của phần mềm này, nó sẽ search cả trong các ảnh (nếu có).
Đối với tiếng Anh/Mỹ thì soft OmniPage đứng đầu trong việc nhận chữ từ hình (OCR).
Thấy nói tới trong site này:
http://softvnn.com/forum/showthread....light=OmniPage
Còn tiếng Việt thì nghe nói có VNOCR, mà chỉ có nghe chớ chưa thấy.
Có bạn nào có thuật toán xử lý ảnh bằng cách scan file ảnh không?
giới thiệu cho mình với nhé!
thánk!!
Bookmarks