PDA

View Full Version : Nhận dạng ảnh



le_hung
20-05-2007, 00:06
Mình mới vào diễn đàn , không bít post bài này ở chỗ nào .Em mún làm một đề tài nhận dạng ảnh qua WC , dùng VC++ để viết chương trình . Không bít bác nào có thể giúp em :
+ những sách về xử lí ảnh
+ sách về lập trình giao tiếp WC trong VC++
+ kinh nghiệm thực tế , nếu các bác đã làm qua
Góp ý của các bác với em là rất quý ,vì em gần như là newbie trong lĩnh vực này
Thankslot!

trieudoahong
20-05-2007, 00:40
ý bạn muốn nhạndạng cái gì trong ảnh đó, 1 phần hay tất cả, chữ, số hay nội dung bất kì; nếu là chữ thì có theo font chuẩn không hay ngoàn nghoèo như thằng rapidshare free download.

Nói chung mình chỉ biết sơ sơ như thế thôi. đây là 1 đề tài hay đấy nhưng khó.

le_hung
20-05-2007, 00:49
mình mún nhận dạng một khuôn mặt hoặc một vật thể đã có trong CSDL trong môi trường thực . cái này được áp dụng nhiều ở việt nam chủ yếu là bên công an , còn nước ngoài thì đã làm rất nhiều rồi .

The Old Man
20-05-2007, 00:56
Ai mà rành về bộ môn này thì hốt bạc.
Có cả ngàn applications hái ra tiền cho bộ môn này.

le_hung
20-05-2007, 01:01
Đúng thế . tuy nhiên để rành được thì không có dễ . Mình không có tham vọng trở thành chuyên gia trong lĩnh vực này . Mình muốn tìm hiểu nó vì nó có liên quan đến đề tài mình đang làm .Tất nhiên ở góc độ sinh viên , chỉ là một fần nhỏ của cái mỏ bạc ấy . hehehe

le_hung
20-05-2007, 01:01
Mong các bác giúp cho mấy vấn đề ở trên .!

thuongshoo
21-05-2007, 11:56
Tui mới học xong nhận dạng tiếng nói. Nhận dạng ảnh thì hình như đơn giản hơn. Thầy tui nói vậy á! Hình như, cái món này trường Tự Nhiên mạnh lắm!
Bạn vô mạng tìm mfcc , markov , noron là được. image regconition
Còn tiếng Việt thì bó tay!
Xử lý ảnh hình như khác với nhận dạng lắm bạn ơi! Xử lý thì theo tui biết chỉ là : co dãn, biến đổi màu, làm mịn, .... Còn nhận dạng là việc khác
Cái này chủ yếu là toán học thôi! Có giải thuật rồi thì lập trình cũng 0 khó đâu! Chủ yếu học toán suốt mười mấy năm mà dòm công thức cũng 0 biết gì luôn! Thầy tui nói là học toán xác suất thống kê cho dữ vô. Cái markov là 1 loại này.

le_hung
23-05-2007, 23:17
cám ơn bạn đã góp ý . mình cũgn tìm hiểu sơ qua cái lĩnh vực nhận dạng ảnh rùi ( không phải là sử lí ảnh ). tui thấy hiện nay người ta thường dùng mạng nơron trong các ứng dụng cần sử ý fức tạp như nhận dạng âm thanh,hình ảnh nhưng tui không hiẻu lắm về mạng nơron cách thức lập trình sử dụng nó thế nào .Bạn đã làm được nhận dạng âm thanh rùi àh . cao thủ thế . Tui đang muốn chế 1 con robo thông minh có khả năng nghe lệnh và nhận biết vật thể . Bạn có tài liệu gì hay ve fần âm thanh thì truyền tui với . khi nào thành công nhât định mời bạn đến xem .hì hì

thuongshoo
24-05-2007, 16:55
Tui học sơ sơ thôi! Bây giờ, chủ yếu là kiếm tiền nuôi thân bạn ạ! Thiệt tình thì tui cũng 0 mê cái này lắm vì nó siêu khó :D
Thầy tui nói sở dĩ nhận dạng ảnh dễ hơn nhận dạng tiếng nói vì nó thiên về lập trình.
Markov và Nơron đều 0 hoàn hảo bạn ạ! Thầy tui đã đề xuất ra mạng lai giữa 2 thằng này. KQ là nhận dạng chính xác hơn 5%. Cái này coi vậy chứ VN mình làm ăn vẫn chưa ra gì đâu! Thiệt tình thì tui 0 rành. Nhận dạng : MFCC và thằng gì kêu là mã hóa, tui quên tên rồi! Theo tui học thì 2 cái này có thể nói là nhận dạng được nhưng dốt lắm! Cái đó chỉ là trích xuất đặc điểm của tiếng nói thôi! Còn muốn chế tạo 1 máy học thì xài markov hoặc nơ ron
còn nhận dạng ảnh thì tui có xài chương trình tách lời bài hát. Đối với 1 video thì lời bài hát là 1 phần của video, tức là hard subtitle thì muốn tách lời bài hát tự động thì rõ ràng là phải xài nhận dạng ảnh. Cái này có hàng miễn phí luôn á!
Muốn chế tạo con Robo nghe lệnh thì còn đỡ, chứ nhận biết vật thể thì 0 dễ đâu! Thầy tui nói đó là hướng đi tương lai đó! Còn về phần âm thanh, tiếc là tui xóa mất tiêu cuốn sách. Bạn học ở đâu ? làm quen với bạn, thầy bên Tự nhiên á! Trời ơi! Bên đó mạnh lắm! Hình như thầy tui làm thạc sĩ là do bên đó chấm điểm á!

le_hung
24-05-2007, 20:41
Mình học bên bách khoa HN ,mới năm thứ 4 thui , học tự động hóa nên muốn nghich ngợm robot 1 chút. Thuongshoo đi làm rồi thì gọi bằng sư huynh (hay sư tỷ )được nhỉ .Hôm trước dọc qua vè mạng nơron , mới chỉ là khởi đầu thôi nhưng đã thấy thú vị lắm rồi.Tại mình không fai dân CNTT nên hơi khó khăn.Néu robot Nhận biết vật thể là định hướng của tương lai thì minh đi theo liền . Sư huynh ( sư tỷ) đang công tác ở đâu vậy ta ??

thuongshoo
25-05-2007, 08:38
Tui chỉ học nó có mấy chục tiết hà! Không phải làm luận văn.
Đây là hướng đi trong tương lai đó! Dùng để chế tạo robo làm việc thay người. Robo như vậy mới thay người nổi. Robo mà việc nhận biết chỉ là tia hồng ngoại thì chả ăn uống gì đâu! Xin giới thiệu, tui hồi đó cũng học Điện Tử hêh! Diễn đàn điện tử nè http://www.diendandientu.com .
Bạn gặp thầy mà nói thì họ đưa sách cho hà! Trời ơi! Đừng sợ! Chỉ sợ là đọc 0 hiểu thôi ! :) Thầy tui nói ở VN mình là do chưa có đồng bộ. CNTT phát triển thì các ngành khác như Cơ khí, Điện Tử cũng phải ở 1 mức nào đó. Thầy tui nói là đi xuống mấy khoa đó, chả ai tiếp mình hết trơn nên thôi!
Tui đang làm việc cho Tinh Vân. Kêu tui là thuongshoo là được.

imaging
25-05-2007, 22:46
Cái này các bác nói phức tạp thì là phức tạp thôi chứ thế giới họ làm nhiều rồi. Mình chỉ cần có nhu cầu (ứng dụng) và muốn làm là được thôi.

Bạn nên bắt đầu từ OpenCV, trong đó có lớp giao tiếp với WC và cả ví dụ là Face Recognition và Gesture Recognition ... Nếu muốn tự mình lập một lớp giao tiếp với WC cũng không khó bạn có thể đọc về VFW trong MSDN. Tôi cũng có thể giúp bạn phần này nếu cần. Nhưng nếu để thử nghiệm thì nên dùng OpenCV. Tất nhiên kết quả của nó ở dạng chấp nhận được, nó cũng là lĩnh vực đang được nghiên cứu.

Bên BKHN có 2 giáo trình là xử lý ảnh số (có sách bản cứng và bản mềm bên http://thegioiebook.com) và nhận dạng ảnh. Sách tiếng anh cũng có nhiều: objects Recognition, pattern Recognition ... tôi không nhớ link bạn có thể search thấy bản mềm đó. Chúc thành công.

thuongshoo
26-05-2007, 08:49
Cái này các bác nói phức tạp thì là phức tạp thôi chứ thế giới họ làm nhiều rồi. Mình chỉ cần có nhu cầu (ứng dụng) và muốn làm là được thôi.

Bạn nên bắt đầu từ OpenCV, trong đó có lớp giao tiếp với WC và cả ví dụ là Face Recognition và Gesture Recognition ... Nếu muốn tự mình lập một lớp giao tiếp với WC cũng không khó bạn có thể đọc về VFW trong MSDN. Tôi cũng có thể giúp bạn phần này nếu cần. Nhưng nếu để thử nghiệm thì nên dùng OpenCV. Tất nhiên kết quả của nó ở dạng chấp nhận được, nó cũng là lĩnh vực đang được nghiên cứu.

Bên BKHN có 2 giáo trình là xử lý ảnh số (có sách bản cứng và bản mềm bên http://thegioiebook.com) và nhận dạng ảnh. Sách tiếng anh cũng có nhiều: objects Recognition, pattern Recognition ... tôi không nhớ link bạn có thể search thấy bản mềm đó. Chúc thành công.
Heheheh! Gặp dân "image" đây rồi!
Đúng đó! Cái nhận dạng gương mặt, vật thể thì nứoc ngoài làm nhiều rồi! Mà le_hung là dân điện nên có lẽ phải xài cái frame có sẵn. Còn nếu nghiên cứu lý thuyết, sáng chế cho người xài thì khó lắm! Quên!
Cảm ơn imaging nhiều nhe! Thông tin rất bổ ích.

le_hung
27-05-2007, 20:37
Cám ơn sự giứp đỡ của các bác.Bác image có phải là hoạt động bên dientuvietnam nữa đúng không ahj .phần xử lý ảnh bên dó lèo tèo quá nên em phai chạy sang bên ddth.com .cám cơn các thông tin bác đã cung cấp .Nếu mình dùng lại các chương trình có sẵn thì mất tính sáng tạo bởi linh hồn của đề tài là nhận dạng vật thể mà mình lại sài đồ có sẵn thì...còn jif nữa phải không ah.Em có 1 năm để thực hiện vì vậy em sẽ đi từ những bước cơ bản .về phần webcame ,cóloại như logitech cho mình mảng dữ liệu luôn , có thể đọc trực tiếp bằng driver của nó.mỗi tội hơi đắt các bác ạ .

le_hung
27-05-2007, 22:45
Bác image ơi ! cho em hỏi , cái OpenCV với lại cái IPP theo em đọc cái hướng dãncủa nó thì thấy bao là phải sài trên nên Linux .có sài trên nền window được không hả bác? à quên ,bác có cái projec nào cho VFW kô ,cho em một cái để em tham khảo cách sử dụng . VC em mới biết bập bõm thui, không bít sâu . júp em nhé.thanks

imaging
28-05-2007, 01:28
OpenCV được đóng gói cho cả Windows (http://sourceforge.net/project/showfiles.php?group_id=22870&package_id=16937) và Linux, bạn cứ download về chạy thử.

Nếu bạn định tìm hiểu có hệ thống thì trước hết hãy tìm hiểu và làm thử về xử lý ảnh bằng WC. Bạn nên đọc những cuốn như: A Simplified Approach to Image Processing: Classical and Modern Techniques in C; Image Processing in C. 2 cuốn này có bản mềm và source code trên mạng để vừa học vừa làm. Về nhận dạng có thể đọc cuốn: 2D Object Detection and Recognition: Models, Algorithms, and Networks. Tất cả đều có trên site http://www.flazx.com.

thuongshoo
28-05-2007, 09:29
iamging có cuốn Recognition thì cho tui xin đi! Download 0 được. Một link dẫn tới rapidshare. Thằng này nói là file bị xóa. Còn link kia thì bị nói là Authentication AK 0 đúng. Cảm ơn trước nhe! host để upload là filesfly.com , midhd.com , box.net .mấy cái này dễ upload dễ download
Cảm ơn trước nhe!

imaging
28-05-2007, 21:21
Trên site http://www.flazx.com có rất nhiều ebook xử lý và nhận dạng ảnh. Cái file 2D mình sẽ up gửi bạn sớm.

Mình up một project nhỏ có sử dụng VFW, khi xử lý bạn chỉ cần viết mã xử lý trong hàm FrameCallbackProc với cấu trúc dữ liệu LPVIDEOHDR.

Chúc thành công.

hoangchau
28-05-2007, 21:53
Lâu rồi trên diễn đàn mới có chủ đề về học thuật. :cool2:
Bạn le_hung thân mến. Nhận dạng chung chung thì khó lắm, vì không biết làm cái gì? bạn nên khoanh vùng nhỏ thôi và làm từ từ.

Về thuật toán, bạn nên tìm hiều về SVM ( Support vector machine) cái này về nhận dạng ảnh nó lợi hại hơn thuật toán Neural và gene nữa đó. Về tài liệu, bạn nên tìm trên google với các từ khóa liên quan đến SVM,Support vector machine
chúc bạn thành công

thuongshoo
29-05-2007, 09:44
Cảm ơn mọi người nhe! Còn cuốn mà tui cần đã down được rồi! Lấy tên nó để vô google thì kiếm được. Cuốn này hình như 0 free vì thấy amazon rao bán

Vinhie47
29-05-2007, 10:07
Mình học bên bách khoa HN ,mới năm thứ 4 thui , học tự động hóa nên muốn nghich ngợm robot 1 chút. Thuongshoo đi làm rồi thì gọi bằng sư huynh (hay sư tỷ )được nhỉ .Hôm trước dọc qua vè mạng nơron , mới chỉ là khởi đầu thôi nhưng đã thấy thú vị lắm rồi.Tại mình không fai dân CNTT nên hơi khó khăn.Néu robot Nhận biết vật thể là định hướng của tương lai thì minh đi theo liền . Sư huynh ( sư tỷ) đang công tác ở đâu vậy ta ??

CNTT BKHN hình như cũng không có môn nào là nhận dạng ảnh hay nhận dạng tiếng nói hết, nếu có thì cũng chỉ là ở một môn nào đó thầy nào đó bảo tìm hiểu rồi nộp báo cáo, trình bày slide thôi:innocent:

le_hung
31-05-2007, 15:27
cám ơn bác imaging đã gửi file cho em . em sẽ nghiên cứu kĩ và phỏng vấn bác nhiều đấy . hehehee


Lâu rồi trên diễn đàn mới có chủ đề về học thuật. :cool2:
Bạn le_hung thân mến. Nhận dạng chung chung thì khó lắm, vì không biết làm cái gì? bạn nên khoanh vùng nhỏ thôi và làm từ từ.

Về thuật toán, bạn nên tìm hiều về SVM ( Support vector machine) cái này về nhận dạng ảnh nó lợi hại hơn thuật toán Neural và gene nữa đó. Về tài liệu, bạn nên tìm trên google với các từ khóa liên quan đến SVM,Support vector machine
chúc bạn thành công

bác hoangchau có thể so sánh rõ hơn về sự khác biệt giữa SVM và neural và gene được không ah. về : tốc độ nhận dạng , khả năng nhớ mẫu , phương pháp dạy cho mạng nào đơn giản hơn ? khả năng chống nhiễu ?...
Em đọc ở một tài liệu thì thấy nói SVM có tốc độ phân chia rất nhanh vì thế dễ gây nhầm lẫn, nên dùng thêm mạng nơron để đảm bảo chắc chắn . như thế có đúng không ?

le_hung
31-05-2007, 15:28
phù , mấy bữa nay ôn thi hết kì mà mệt phờ râu . hix còn gần một tháng nữa mới xong .lạy chúa !!!!!!!!!!

peekabooo
22-06-2007, 00:46
Mình là sinh vien DHBK. Năm nay cũng làm luận văn về xử lí ảnh. Chuyên về lập trình nên cũng khó khăn. Xữ lý ảnh,học vật thể... xác định khoảng cách đến vật. Imagine co kinh nghiệm xin cho chỉ giáo. Hơi bị yếu về lập trình.

imaging
03-07-2007, 00:04
Cuốn 2D và những cuốn khác (Handbook of Face Recognition, Handbook of Fingerprint Recognition,...) về recognition ở đây http://forum.algolist.ru/archive/index.php/t-15.html.
Về cái SVM, neural, bayer, haar, .. cũng có trong OpenCV. Tôi nhớ trương KHTN TpHCM có luận văn Thạc sỹ về nhận dạng mặt người dùng SVM và neural.
To Pee: Bạn có thể lựa chọn: 1/ Matlab, 2/OpenCV làm nền tảng. Bạn nên bắt đầu từ việc load ảnh, xử lý histogram, lọc ảnh nếu ok rồi thì đến trích chọn đặc trưng của ảnh, ...Bạn cứ bắt đầu làm có vấn đề gì thì cùng trao đổi.

nguyentuevy
13-10-2007, 09:30
Em muốn nhận các huynh làm sư phụ trong ImageProcessing.

fatmailer
15-10-2007, 17:12
Chào bạn,

Mình cũng là cựu SV BKHN và sau có làm một ít về xử lý ảnh. Xin mạo muội đóng góp vài ý kiến.

1 - Phần hỏi của bạn Hùng còn tương đối chung chung. Hùng nên tập trung xác định 1 phần nào đó để giải quyết, nếu không e rằng bạn làm vài năm không hết được, nhất là khi kinh nghiệm còn hạn chế.
2 - Mình khuyên bạn đến xin ý kiến của Dr Nguyễn Linh Giang, phó trưởng bộ môn Truyền thông - Mạng máy tính, khoa CNTT ĐHBKHN. Thầy là người trực tiếp giảng dạy môn Xử lý ảnh, chắc chắn sẽ cho bạn nhiều ý kiến đáng giá. (Về xử lý tiếng nói, recommend bạn đến TS Trịnh Văn Loan, trưởng bộ môn Kỹ thuật máy tính, khoa CNTT. Nhưng xử lý 1 cái thôi, âm hoặc ảnh, đừng cố quá mà quá cố nhé!)
3 - Đúng như bạn shoo nói, cái này quan trọng là giải thuật. Bạn nên để ý xem thiên hạ người ta đã làm gì, bằng giải thuật gì.. Googling với từ khóa thích hợp (VD: "face recognition") để tìm hiểu và rút kinh nghiệm, hơn là bắt đầu từ đầu. Thu thập tài liệu cũng là bước quan trọng của làm 1 project mà!
4 - Theo lời bạn imaging nói, bạn cũng nên chọn công cụ thích hợp, dù ta có thể xài Matlab, C++, VC, Java.. Bạn học khoa Điện chắc đã phải dùng Matlab, cái đó cực mạnh trong xử lý ảnh, lại có trang mathwork rất hữu ích khi cần hỏi han, nên tận dụng.

Tóm lại, khoanh vùng đồ án, tổng hợp tài liệu và xử lý những thứ đơn giản trước. Chúc may mắn

(need help? can email me via naquang@gmail.com)

Markov
14-02-2008, 09:53
le_hung mới bắt đầu thì anh khuyên chú nên dùng hẳn trên Linux, xây dựng các ứng dụng nhận dạng cho dịch vụ web, cái này mới hốt bạc vừa ngon vừa bổ.

motnguoiban
12-11-2008, 22:56
Ôi, minh cũng sắp làm đồ án nhận dạng khuôn mặt, không biết bắt đầu từ đâu. Sau khi đọc tin của các bạn mình đã thấy rõ ràng hơn chút. Cảm hơn các bạn nha, có gì xin các bạn chỉ giáo nhé.