PDA

View Full Version : Lấy text từ trong file ảnh



it_duchung
05-12-2008, 21:51
Có pác nào bít lấy text từ file ảnh hok. Mình có 1 đống file giáo trình mà toàn là file ảnh jpg. pác nào bít soft có thể lấy text ra vào word hok, hiúp mình với !

langtu1991
05-12-2008, 22:58
Có pác nào bít lấy text từ file ảnh hok. Mình có 1 đống file giáo trình mà toàn là file ảnh jpg. pác nào bít soft có thể lấy text ra vào word hok, hiúp mình với !

Lấy text từ file ảnh:
dc chết liền.

superthin
06-12-2008, 00:12
Nếu những ảnh bạn có được scan chất lượng tốt, đọc rõ ràng bằng mắt thường và không có những vết lem / bẩn, độ phân giải đủ 300dpi thì bạn có thể tìm một phần mềm mà trong tên có chữ OCR để "quét" nó, nó sẽ nhận dạng hình ảnh thành chữ -> thành file Word hoặc RTF cho bạn. Một tên tuổi phần mềm như vậy do Việt Nam viết có tên VnDOCR2.

Ảnh của bạn chất lượng kém hoặc độ phân giải chỉ là 72 hoặc 96dpi thì bạn quên ý định của bạn đi là vừa đẹp.

it_duchung
06-12-2008, 08:12
Mình kiếm dc trên mạng biết phần mềm OmniPage 16 cũng hay lắm, nhưng mà mình không có key, pác nào có cho mình link với ! thanks nhìu

xman8x
25-05-2009, 00:40
Theo mình được biết , lấy Text ở file ảnh thì rất là khó . Mình cũng không biết là lấy được hay không . Nếu bạn muốn In Text ở trong ảnh ấy ra thì làm như sau : sử dụng phần mềm convert từ file ảnh sang PDF "image to pdf v2.20" , sau đấy mình convert từ PDF sang word (Solid Convert PDF v2.2 build 158)
Link download:
image to pdf v2.20(key): http://mega.1280.com/file/10UXTA5N/
Solid Convert PDF v2.2 build 158 : http://mega.1280.com/file/4KCROLZT/ ( Không cần cài đặt , các bạn download về rồi sử dụng luôn )
Good Luck !
le_ngoc_quan.online@yahoo.com

thietkewebsite
25-05-2009, 11:53
chắc phải bỏ ý định đi thôi, phần mềm này hiếm, độ chính xác không cao, phụ thuộc nhiều yếu tố. Lấy text từ image là một bài toán quá khó.

fnc
25-05-2009, 12:54
Lấy text từ image mà khó =)). Công nghệ xử lý ảnh thời nay đã tiến rất xa rồi.
- Nếu là chữ in từ tài liệu thì rất dễ, có rất nhiều thuật toán có thể đáp ứng.
- Nếu là chữ in trên các biển quảng cáo, được chụp từ nhiều góc độ thì có khó hơn 1 tý, nhưng cũng đã xử lý tốt.
- Nếu là chữ viết tay tiếng Anh thì cũng có một số thuật toán có thể xử lý được đến 95%.
- Còn chữ viết tay tiếng Việt thì công nhận khó.

Một phần mềm có thể nhận diện chữ trong ảnh(miễn phí, phần lớn nguồn mở): http://www.thefreecountry.com/utilities/ocr.shtml
Ví dụ 1 phần mềm có thể nhận diện chữ trong file scanned: http://www.simpleocr.com/.

Nếu bạn nào đã từng sử dụng phần mềm Evernote, sẽ thấy khi gõ 1 từ vào ô search của phần mềm này, nó sẽ search cả trong các ảnh (nếu có).

shinichi_kudo03
25-05-2009, 18:33
Theo mình được biết , lấy Text ở file ảnh thì rất là khó . Mình cũng không biết là lấy được hay không . Nếu bạn muốn In Text ở trong ảnh ấy ra thì làm như sau : sử dụng phần mềm convert từ file ảnh sang PDF "image to pdf v2.20" , sau đấy mình convert từ PDF sang word (Solid Convert PDF v2.2 build 158)
Link download:
image to pdf v2.20(key): http://mega.1280.com/file/10UXTA5N/
Solid Convert PDF v2.2 build 158 : http://mega.1280.com/file/4KCROLZT/ ( Không cần cài đặt , các bạn download về rồi sử dụng luôn )
Good Luck !
le_ngoc_quan.online@yahoo.com
Đúng là chẳng hiểu gì về phần mềm

The Old Man
25-05-2009, 23:05
Đối với tiếng Anh/Mỹ thì soft OmniPage đứng đầu trong việc nhận chữ từ hình (OCR).

Thấy nói tới trong site này:
http://softvnn.com/forum/showthread.php?t=137754&highlight=OmniPage


Còn tiếng Việt thì nghe nói có VNOCR, mà chỉ có nghe chớ chưa thấy.

cuongit4b
17-06-2009, 15:48
Có bạn nào có thuật toán xử lý ảnh bằng cách scan file ảnh không?
giới thiệu cho mình với nhé!
thánk!!

mabuquaylai
11-07-2009, 18:10
xin giới thiệu thêm một phần mềm để lấy file text từ file ảnh :
AABBYY Finereader 9.0.

QuanN
19-08-2009, 08:19
Bạn dùng thử chương trình VietOCR (http://vietocr.sf.net).

AkuVn
19-08-2009, 08:43
Làm gì có chuyện lấy được nhỉ?

nguoidemsao2006
02-01-2010, 01:27
Làm gì có chuyện lấy được nhỉ?

Cài này ra từ vài năm rồi. Giờ đã phát triển mạnh lắm rồi.

Hay nhất vẫn là ABBYY FineReader. Còn bây giờ thì nó đã ra rất nhiều phần mềm khác (ai quan tâm thì đi hỏi giáo sư google).

hoa_hong_da3
02-01-2010, 14:12
Nói chung sau đó cũng lỗi tùm lum. Mà giáo trình thì cứ thế mà đọc, muốn sửa thì liên lạc với ng đã scan vào.

tubong
03-01-2010, 12:04
mình không hiểu tại sao lại ẩn chữ trong file ảnh làm gì mà bây giờ lấy chữ khó khăn vậy

dakhachdatinh
03-01-2010, 13:02
Đã có tại đây: http://ddth.com/showthread.php?t=316756

The Old Man
04-01-2010, 10:41
mình không hiểu tại sao lại ẩn chữ trong file ảnh làm gì mà bây giờ lấy chữ khó khăn vậy

Bạn không hiểu rồi, không ai dấu chử trong hình cả.
Chuyện là như sau: có mấy trang giấy in của một tâp tài liệu nay scan mấy trang ấy lại thành file ảnh như BMP. rồi dùng chương trình lấy chữ ra lại thành text cho vô word dể edit sửa chửa làm lại.

hptvl
04-01-2010, 11:02
Lấy text từ file ảnh:
dc chết liền.

He he chết liền đi.
Lấy text từ file ảnh rất khó nhưng không phải là không làm được.

khanhnh76
07-01-2010, 10:51
Chào các bạn!

Xin chúc mừng cả nhà nhé, hiện tại Phần mềm nhận dạng của hãng ABBYY đã có khả năng nhận dạng tiếng Việt với độ chính xác rất cao trên 99%, tài liệu sau khi nhận dạng giữ nguyên được định dạng như văn bản gốc.

Một điều hết sức quan trọng là ABBYY hiện có nhà phân phối chính thức tại Việt Nam. Mọi chi tiết xin mời tham khảo trên www.sohoa.com.vn

Một điều hết sức thuận lợi là trang web này cho phép thực hiện việc convert các tài liệu dạng ảnh sang tài liệu dạng text trực tiếp trên Internet. Mình không cần phải tốn tiền mua phần mềm làm gì.
Chỉ việc vào trang www.sohoa.com.vn, đăng kí tài khoản sau đó đăng nhập, bạn sẽ được convert miễn phí 100 trang tài liệu ảnh sang tài liệu text.

Tớ dùng thử thấy tuyệt cú mèo, mọi người hãy dùng thử nhé!

Have a nice day!

hoa_hong_da3
07-01-2010, 22:19
Liêuk có chuyển pdf thành word không nhỉ?

maingoctu
08-01-2010, 01:35
Ai có phần mềm chuyển từ file text (.txt) sang file word (.doc)không cho mình với. Thanhk nhiều

dinhhung_dtvt88
08-01-2010, 01:46
Ai có phần mềm chuyển từ file text (.txt) sang file word (.doc)không cho mình với. Thanhk nhiều

ực,
ctrl - a
copy
mở microsoft word
paste

ặc ặc, phần mềm làm j

silenthero
09-01-2010, 09:15
Ai có phần mềm chuyển từ file text (.txt) sang file word (.doc)không cho mình với. Thanhk nhiều

bác đùa hay thật đây :)) cần gì phải soft chứ, cứ copy rồi paste thôi :))

nguoinhaque1
18-06-2010, 23:01
Có pác nào bít lấy text từ file ảnh hok. Mình có 1 đống file giáo trình mà toàn là file ảnh jpg. pác nào bít soft có thể lấy text ra vào word hok, hiúp mình với !

ĐÃ có tại đây www.newocr.com
Bạn có thể làm trực tuyến.Tỷ lệ nhận diện tiếng Việt hoàn chỉnh là khoảng 97%

gorkiit
20-06-2011, 21:19
Lấy text từ file ảnh:
dc chết liền.
Chết luôn đi anh bạn nhé =))

123345
01-12-2011, 16:10
có bản ***** rồi thì mình hướng dẫn , a e thấy hay thì thanks nhá

Mình nói qua phần mềm nhận dạng hàng đầu thế giới ABBYY FineReader 11

http://img825.imageshack.us/img825/7504/diagramfr11provietnames.jpg http://ne1.upanh.com/b3.s20.d1/3046f1330802651a9c828f9ea0af5892_36802011.logo.png

- Đây là phần mềm chuyển đổi file ảnh ( bao gồm PDF ) sang định dạng có thể chỉnh sửa được .

- Hỗ trợ tiếng Việt và khoảng 200 ngôn ngữ khác .

- Độ chính xác trên 99% và giữ nguyên cấu trúc so với văn bản gốc kể cả bảng biểu , công thức , sơ đồ...

- Định dạng đầu vào đa dạng , lấy file từ máy ảnh kts ,điện thoại ( kể cả ảnh mầu hay đen trắng ) , máy scan , file pdf... và cho ra word , excel , pdf/a ,html .... nói chung là các định dạng có thể chỉnh sửa được.

- Trang chủ ABBYY Việt Nam : http://www.sohoa.com.vn

Đầu tiên các bạn vào đây trước http://www.sohoa.com.vn

http://img254.imageshack.us/img254/2192/unledsyh.png

- Bước 1 : vào trang chủ http://www.sohoa.com.vn/ ở đây có banner FineReader 11 kích vào chữ tải dùng thử ở đây rồi nó hiện ra trang tiếp , kéo xuống dưới có chỗ download , các bạn kích vào đấy down load về.

- Bước 2 : cài đặt : các bạn cứ cài đặt bình thường , cứ next đến bao giờ xong thì thôi ( có khi nó chạy ẩn , đợi 1 lúc nó sáng chữ next lên , quá trình cài đặt mất khoảng 10p )

- Bước 3 : mở FineReader 11 lên và ấn vào chữ run program gì gì đấy (nếu là dùng thử ), không thì điền key của nó vào. hì . sau đó nó hiện ra bảng tasks để chọn các chuyển file dữ liệu ( ví dụ như từ pdf>word , từ scan > sách điện tử...) . (nó có chỗ chọn ngôn ngữ, các bạn chọn tiếng việt nhé ) nếu là ảnh mầu thì các bạn chon full color . nếu đen trắng thì chọn chế độ black/white... Bạn chon chế độ mà muốn chuyển sang ví dụ chọn cái send sang word chẳng hạn (nó còn chế độ chuyển sang PDF/a hoặc sách điện tử... )

http://ne5.upanh.com/b3.s16.d2/a025e4eb941697c85d849606dc5fdb2c_36803435.anh1.png

- Bước 4 : nó hiện ra đường dẫn link dẫn đến file PDF của bạn , bạn chọn file cần convert và nó tự động chuyển đổi và send ra word cho các bạn

- Bước 5 : soát lỗi . bên trên phía bên phải các bạn có chữ infinition thì phải , bạn ấn vào đấy sẽ hiện ra giao diện soát lỗi pro . chỉ việc ấn enter để chuyển nếu lỗi đúng , lỗi sai thì dùng con chuột hoặc 4 phím mũi tên để điều chỉnh rồi sửa . hì !

- Bước 6 : tắt giao diện soát lôi đi rồi ấn vào nút send ( có kèm chữ W biểu tượng của word ) ở giữa , bên trên giao diện FR11 .
thế là ô kê! Chúc các bạn thành công

http://ne7.upanh.com/b3.s20.d1/f3d9d578ecb5d32d650932e5c9ac9888_36803437.anh2.png
http://ne8.upanh.com/b5.s11.d2/57d4fb4eac61bf17f41fc169277cde65_36803438.anh3.png

- Đây là video hướng dẫn sử dụng : (hơi nặng lên load hơi lâu )
http://www.youtube.com/watch?v=sGcvZ2LslzY
có gì cứ pm qua nick yahoo: giangqn_1009
Link ở trang http://www.sohoa.com.vn down nhanh hơn [MF][COLOR="Silver"]

http://www.sohoa.com.vn/public/FRP11/FR11_B2C_flash_VT_button.swf

sandboxie
13-12-2011, 11:01
Hay nhỉ! cảm ơn các bạn.........

123345
15-12-2011, 10:13
hì , hay thì mới post lên chứ ko hay thì post lên a e mất thời gian thử thì mệt lắm @!@

trumvitinh
08-01-2012, 19:37
thằng ABBYY là thằng cùi mía nhất lấy test ra lỗi font tùm lum thà đánh lại tất cả còn hơn sử dụng nó ngay cả bản 11 mới nhất tóm lại là ko có cách nào làm dc hết đành potaykakka

jindohuyy
27-01-2012, 01:35
bạn hoc photoshop đi . lấy được ra đó hiiii

jindohuyy
27-01-2012, 01:37
bạn dùng photoshop đi . tìm hiểu trên mạng ý . dễ học lắm

S_Knight_Shop
23-02-2012, 16:48
dùng pts, dễ mà =.=!