Giáo trình Xử lý ảnh - Trường Đại học Hàng Hải

1
TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM  
KHOA CÔNG NGHỆ THÔNG TIN  
BỘ MÔN HỆ THỐNG THÔNG TIN  
-----***-----  
BÀI GIẢNG  
XỬ LÝ ẢNH  
TÊN HỌC PHẦN  
: XỬ LÝ ẢNH  
: 17411  
MÃ HỌC PHẦN  
TRÌNH ĐỘ ĐÀO TẠO  
: ĐẠI HỌC CHÍNH QUY  
DÙNG CHO SV NGÀNH : CÔNG NGHỆ THÔNG TIN  
HẢI PHÒNG - 2011  
.
2
MỤC LỤC  
Chƣơng I: Tổng quan về xử lý ảnh số  
1.1. Xử lý ảnh số là gì?  
7
7
7
1.2. Nguồn gốc của xử lý ảnh số  
1.3. Các ứng dụng của xử lý ảnh số  
1.4. Các bước cơ bản trong xử lý ảnh số  
7
8
1.5. Các thành phần của một hệ thống xử lý ảnh  
Chƣơng II: Các kiến thức cơ bản về ảnh số  
2.1. Cảm nhận thị giác  
11  
14  
14  
14  
16  
19  
19  
20  
21  
25  
29  
31  
34  
34  
37  
38  
40  
40  
42  
45  
50  
50  
51  
51  
53  
59  
59  
2.2. Lấy mẫu và lượng tử hóa ảnh  
2.3. Mối quan hệ giữa các điểm ảnh  
Chƣơng III: Nâng cao chất lƣợng ảnh trong miền không gian  
3.1. Các phép biến đổi mức xám cơ bản  
3.2. Xử lý histogram  
3.3. Nâng cao chất lượng ảnh sử dụng các toán tử số học/logic  
3.4. Bộ lọc trong miền không gian  
3.5. Các bộ lọc làm mượt ảnh trong miền không gian  
3.6. Các bộ lọc làm sắc nét ảnh trong miền không gian  
Chƣơng IV: Nâng cao chất lƣợng ảnh trong miền tần số  
4.1. Phép biến đổi Fourier và miền tần số  
4.2. Các bộ lọc làm mượt ảnh trong miền tần số  
4.3. Các bộ lọc làm sắc nét ảnh trong miền tần số  
Chƣơng V: Nén ảnh  
5.1. Các kiến thức cơ bản  
5.2. Nén ảnh không mất thông tin  
5.3. Nén ảnh có mất thông tin  
Chƣơng VI: Xử lý hình thái ảnh  
6.1. Phép giãn ảnh và phép co ảnh nhị phân  
6.2. Phép mở ảnh và phép đóng ảnh nhị phân  
6.3. Một số thuật toán hình thái cơ bản trên ảnh nhị phân  
6.4. Xử lý hình thái ảnh xám  
Chƣơng VII: Phân đoạn ảnh  
7.1. Phát hiện tính không liên tục  
3
7.2. Phân đoạn ảnh dựa vào các vùng ảnh con  
60  
64  
Một số đề thi mẫu  
4
Tên học phần: Nhận dạng và xử lý ảnh  
Bộ môn phụ trách giảng dạy: Hệ thống Thông tin  
Mã học phần: 17411  
Loại học phần: 2  
Khoa phụ trách: CNTT.  
Tổng số TC: 4  
Tổng số tiết Lý thuyết Thực hành/Seminar  
75 45 30  
Tự học  
Bài tập lớn  
Đồ án môn học  
không  
0
không  
Học phần học trƣớc: Không yêu cầu.  
Học phần tiên quyết: Không yêu cầu.  
Học phần song song: Không yêu cầu.  
Mục tiêu của học phần: Cung cấp các kiến thức về lĩnh vực xử lý ảnh số; Giúp cho sinh viên nắm  
được các kỹ thuật xử lý ảnh cơ bản.  
Nội dung chủ yếu:  
Các kiến thức cơ bản về ảnh số; Các kỹ thuật nâng cao chất lượng ảnh; Các thuật toán xử  
lý hình thái; Các kỹ thuật phân đoạn ảnh; Các thuật toán nén ảnh và chuẩn ảnh nén.  
Nội dung chi tiết:  
PHÂN PHỐI SỐ TIẾT  
TÊN CHƢƠNG MỤC  
TS LT TH BT KT  
Chƣơng I: Tổng quan về xử lý ảnh số  
1.1. Xử lý ảnh số là gì?  
5
3
2
1.2. Nguồn gốc của xử lý ảnh số  
1.3. Các ứng dụng của xử lý ảnh số  
1.4. Các bước cơ bản trong xử lý ảnh số  
1.5. Các thành phần của một hệ thống xử lý ảnh  
Chƣơng II: Các kiến thức cơ bản về ảnh số  
2.1. Cảm nhận thị giác  
5
3
9
2
6
2.2. Lấy mẫu và lượng tử hóa ảnh  
2.3. Mối quan hệ giữa các điểm ảnh  
Chƣơng III: Nâng cao chất lƣợng ảnh trong miền không gian  
3.1. Các phép biến đổi mức xám cơ bản  
3.2. Xử lý histogram  
15  
3.3. Nâng cao chất lượng ảnh sử dụng các toán tử số học/logic  
3.4. Bộ lọc trong miền không gian  
3.5. Các bộ lọc làm mượt ảnh trong miền không gian  
3.6. Các bộ lọc làm sắc nét ảnh trong miền không gian  
Chƣơng IV: Nâng cao chất lƣợng ảnh trong miền tần số  
15  
9
6
5
PHÂN PHỐI SỐ TIẾT  
TS LT TH BT KT  
TÊN CHƢƠNG MỤC  
4.1. Phép biến đổi Fourier và miền tần số  
4.2. Các bộ lọc làm mượt ảnh trong miền tần số  
4.3. Các bộ lọc làm sắc nét ảnh trong miền tần số  
Chƣơng V: Nén ảnh  
15  
10  
7
6
6
4
2
5.1. Các kiến thức cơ bản  
5.2. Nén ảnh không mất thông tin  
5.3. Nén ảnh có mất thông tin  
Chƣơng VI: Xử lý hình thái ảnh  
6.1. Phép giãn ảnh và phép co ảnh nhị phân  
6.2. Phép mở ảnh và phép đóng ảnh nhị phân  
6.3. Một số thuật toán hình thái cơ bản trên ảnh nhị phân  
6.4. Xử lý hình thái ảnh xám  
Chƣơng VII: Phân đoạn ảnh  
10  
4
4
2
7.1. Phát hiện tính không liên tục  
7.2. Phân đoạn ảnh dựa vào các vùng ảnh con  
Nhiệm vụ của sinh viên:  
Tham dự các buổi học lý thuyết và thực hành, làm các bài tập được giao, làm các bài thi giữa  
học phần và bài thi kết thúc học phần theo đúng quy định.  
Tài liệu học tập:  
1. Lương Mạnh Bá, Nguy n Thanh Thủy,  h               h   , Nhà xuất bản Khoa học và  
Kỹ thuật Hà Nội, 2003.  
2. V  Đức Khánh,  i       h         h, Nhà xuất bản Thống kê, 2003.  
3. Rafael C. Conzalez & Richard E. Woods, Digital Image Processing, 2nd edition, Pearson  
Education, 2004.  
Hình thức và tiêu chuẩn đánh giá sinh viên:  
- Hình thức thi: thi viết.  
- Tiêu chuẩn đánh giá sinh viên: căn cứ vào sự tham gia học tập của sinh viên trong các buổi  
học lý thuyết và thực hành, kết quả làm các bài tập được giao, kết quả của các bài thi giữa học  
phần và bài thi kết thúc học phần.  
Thang điểm: Thang điểm chữ A, B, C, D, F.  
Điểm đánh giá học phần: Z = 0,3X + 0,7Y.  
6
Bài giảng này là tài liệu chính thức và thống nhất của Bộ môn Hệ thống Thông tin, Khoa  
Công nghệ Thông tin và được dùng để giảng dạy cho sinh viên.  
Ngày phê duyệt:  
Trƣởng Bộ môn  
/
/
7
CHƢƠNG I: TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ  
1.1. Xử lý ảnh số là gì?  
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới  
mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung  
tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó.  
Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục năm nay. Nó là  
môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác. Đầu tiên phải kể đến Xử  
lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập,  
các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Thứ hai, các công cụ toán như Đại số  
tuyến tính, Sác xuất, thống kê. Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơ ron nhân  
tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh.  
1.2. Nguồn gốc của xử lý ảnh số  
Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân  
đôn đến New York từ những năm 1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố  
mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những  
năm 1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo  
điều kiện cho quá trình xử lý ảnh sô thuận lợi. Năm 1964, máy tính đã có khả năng xử lý và nâng  
cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh.  
Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không  
ngừng. Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại  
và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi thu nhiều kết quả khả quan.  
1.3. Các ứng dụng của xử lý ảnh số  
Biến đổi ảnh (Image Transform)  
Trong xử lý ảnh do số điểm ảnh lớn các tính toán nhiều (độ phức tạp tính toán cao) đòi hỏi dung  
lượng bộ nhớ lớn, thời gian tính toán lâu. Các phương pháp khoa học kinh điển áp dụng cho xử lý  
ảnh hầu hết khó khả thi. Người ta sử dụng các phép toán tương đương hoặc biến đổi sang miền xử  
lý khác để d  tính toán. Sau khi xử lý d  dàng hơn được thực hiện, dùng biến đổi ngược để đưa về  
miền xác định ban đầu, các biến đổi thường gặp trong xử lý ảnh gồm:  
- Biến đổi Fourier, Cosin, Sin  
- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker (theo xử lý số tín hiệu [3])  
- Các biến đổi khác như KL (Karhumen Loeve), Hadamard  
Một số các công cụ sác xuất thông kê cũng được sử dụng trong xử lý ảnh. Do khuôn khổ tài liệu  
hướng dẫn có hạn, sinh viên đọc thêm các tài liệu để nắm được các phương pháp biến đổi và một số  
phương pháp khác được nêu ở đây.  
8
Nén ảnh  
Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn. Khi mô tả ảnh người ta đã đưa kỹ thuật  
nén ảnh vào. Các giai đoạn nén ảnh có thể chia ra thế hệ 1, thế hệ 2. Hiện nay, các chuẩn MPEG  
được dùng với ảnh đang phát huy hiệu quả  
1.4. Các bƣớc cơ bản trong xử lý ảnh số  
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân  
tích ảnh.  
Để d  tưởng tượng, xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự nhiên từ thế giới  
ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh). Trước đây, ảnh thu qua  
Camera là các ảnh tương tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công  
nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số  
tạo thuận lợi cho xử lý tiếp theo. (Máy ảnh số hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng  
có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 1.1 dưới đây mô tả các  
bước cơ bản trong xử lý ảnh.  
Sơ đồ này bao gồm các thành phần sau:  
a) Phần thu nhận ảnh (Image Acquisition)  
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là ảnh  
tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã  
số hoá (như loại CCD – Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm  
ảnh.  
Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu  
nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)  
b) Tiền xử lý (Image Processing)  
Sau bộ thu nhận, ảnh có thể nhi u độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng  
cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhi u, nâng độ tương phản để làm ảnh r  
hơn, nét hơn.  
c) Phân đoạn (Segmentation) hay phân vùng ảnh  
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu di n phân tích,  
nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại  
9
bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các  
vạch) riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng d  gây  
lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.  
d) Biểu diễn ảnh (Image Representation)  
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã  
liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử  
lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng  
(Feature election) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc  
làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ:  
trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân  
biệt ký tự này với ký tự khác.  
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)  
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng cách so sánh  
với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận  
dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện  
thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình  
toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:  
- Nhận dạng theo tham số.  
- Nhận dạng theo cấu trúc.  
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và  
công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text),  
nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người…  
f) Cơ sở tri thức (Knowledge Base)  
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng  
điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhi u. Trong nhiều khâu xử lý và phân tích  
ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong  
muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các bước xử lý đó,  
nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri  
thức được phát huy. Trong tài liệu, chương 6 về nhận dạng ảnh có nêu một vài ví dụ về cách sử  
dụng các cơ sở tri thức đó.  
g) Mô tả (biểu diễn ảnh)  
Từ Hình 1.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp  
theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và  
không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông thường, các ảnh thô đó được đặc tả  
(biểu di n) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh  
10  
(Image Features) như: biên ảnh (Boundary), vùng ảnh (Region). Một số phương pháp biểu di n  
thường dùng:  
• Biểu di n bằng mã chạy (Run-Length Code)  
• Biểu di n bằng mã xích (Chaine -Code)  
• Biểu di n bằng mã tứ phân (Quad-Tree Code)  
Biểu diễn bằng mã chạy  
Phương pháp này thường biểu di n cho vùng ảnh và áp dụng cho ảnh nhị phân. Một vùng ảnh R  
có thể mã hoá đơn giản nhờ một ma trận nhị phân:  
- U( ,  ) = 1  ếu (m, n) thuc R  
- U( m,  ) = 0  ếu (m, n) không thuc R  
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách biểu di n trên, một  
vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1. Giả sử chúng ta mô tả ảnh nhị phân của  
một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó  
dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên tục theo  
chiều ngang hoặc dọc.  
Biểu diễn bằng mã xích  
Phương pháp này thường dùng để biểu di n đường biên ảnh. Một đường bất kỳ được chia thành  
các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó  
tạo thành một dây xích gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã  
hoá theo số thập phân hoặc số nhị phân thành mã của hướng.  
Biểu diễn bằng mã tứ phân  
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh. Vùng ảnh đầu tiên được chia làm  
bốn phần thường là bằng nhau. Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)),  
thì gán cho vùng đó một mã và không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn  
phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia thành các vùng  
con tạo thành một cây phân chia các vùng đồng nhất.  
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực tế, các quá trình sử  
dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy theo đặc điểm ứng dụng. Hình 1.2 cho sơ  
đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối một cách khá đầy đủ. Ảnh sau khi được  
số hóa được nén, lưu lại để truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo. Mặt khác,  
ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng theo một  
yêu cầu nào đó) để chuyển tới khâu phân đ n hoặc bỏ tiếp khâu  hâ  đ n chuyển trực tiếp tới  
khâu   ích chọ  đặc trưng. Hình 1.2 cũng chia các nhánh song song như: nâng cao chất lượng ảnh  
có hai nhánh phân biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhi u) hoặc khôi  
phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo) v.v…  
11  
1.5. Các thành phần của một hệ thống xử lý ảnh  
Theo quan điểm của quy trình xử lý, chúng ta đã thể hiện các khối cơ bản trên Hình 1.1, các  
khối chi tiết và luồng thông tin trên Hình 1.2. Theo quan điểm của h th ng xử lý trên máy tính số,  
hệ thống gồm các đầu đo (thu nhận ảnh); bộ số hóa ; máy tính số; Bộ hiển thị; Bộ nhớ. Các thành  
phần này không nhắc lại ở đây (đọc thêm giáo trình cấu trúc máy tính).  
Một hệ thống xử lý ảnh cơ bản có thể gồm: máy tính cá nhân kèm theo vỉ mạch chuyểnđổi đồ  
hoạ VGA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm tra các thuật toán và một màn hìnhcó hỗ trợ  
VGA hoặc SVGA. Nếu điều kiện cho phép, nên có một hệ thống như Hình 1.4. bao gồm một máy  
tính PC kèm theo thiết bị xử lý ảnh. Nối với cổng vào của thiết bị thu nhận ảnh là mộtvideo camera,  
và cổng ra nối với một màn hình. Thực tế, phần lớn các nghiên cứu của chúng tađược đưa ra trên  
ảnh mức xám (ảnh đen trắng). Bởi vậy, hệ thống sẽ bao gồm một thiết bị xử lýảnh đen trắng và một  
màn hình đen trắng.  
Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp.  
Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh, mức xám cũng ứng dụng được trên ảnhmàu. Với  
lý do đó, hệ thống ban đầu nên chỉ bao gồm cấc thiết bị thu nhận và hiển thị ảnh đen trắng. Với ảnh  
12  
màu, nên sử dụng một hệ thống mới như Hình 1.3, trừ trường hợp bạn cần mộtcamera TV màu  
và một màn hình đa tần số (ví dụ như NEC MultiSync, Sony Multiscan, hoặc Mitsubishi Diamond  
Scan) để hiển thị ảnh màu. Nếu khả năng hạn chế, có thể dùng PC kèm theo vỉ mạch VGA và màn  
hình VGA, để dựng ảnh được.  
CÂU HỎI ÔN TẬP  
1. Trình bày các thành phần và lưu đồ thông tin giữa các khối trong quá trình xử lý ảnh.  
2. Nêu khái niệm và định nghĩa điểm ảnh.  
3. Thế nào là độ phân giải ảnh, cho ví dụ?  
4. Trình bày định nghĩa mức xám, cho ví dụ.  
5. Nêu quan hệ giữa các điểm ảnh.  
6. Trình bày về khoảng cách đo và phân loại khoảng cách giữa các điểm ảnh.  
7. Nêu ý nghĩa của các phép biến đổi ảnh, liệt kê một số phép biến đổi và cho ví dụ.  
13  
CHƢƠNG II: CÁC KIẾN THỨC CƠ BẢN VỀ ẢNH SỐ  
2.1. Cảm nhận thị giác  
Thị giác máy tính là ảnh máy tính trong đó việc ứng dụng không dành cho thị giác người. Một  
trong những chủ đề chính trong lĩnh vực thị giác máy tính đó là phân tích ảnh.  
Phân tích ảnh bao hàm việc xem xét dữ liệu ảnh để giải quyết d  dàng một bài toán thị giác. Quá  
trình phân tích ảnh bao hàm hai vấn đề khác: trích chọn đặc trưng và phân lớp mẫu.  
Trích chọn đặc trưng là quá trình xử lí thông tin ảnh thu được ở mức cao như là thông tin về độ  
nhọn hay màu, Phân lớp mẫu là hoạt động lấy thông tin ở mức cao này và từ đó xác định các đối  
tượng nằm trong ảnh.  
Có nhiều ứng dụng của thị giác máy tính như:  
Trong các hệ thống sản xuất, thị giác máy tính thường được sử dụng trong việc điều khiển chất  
lượng.  
Trong nhiều lĩnh vực khác nhau trong cộng đồng y tế, mà ở đó chắc chắn các kiểu ứng dụng sẽ  
tiếp tục được phát triển. Các ví dụ hiện nay về các hệ thống y tế đang được phát triển bao gồm: các  
hệ thống chẩn đoán các khối u da tự động, các hệ thống trợ giúp giải phẩu thần kinh khi phẫu thuật  
não bộ, và các hệ thống test bệnh án tự động.  
Lĩnh vực an ninh và pháp luật cũng là một lĩnh vực hứa hẹn cho việc phát triển các hệ thống thị  
giác máy tính, với các ứng dụng từ nhận dạng tự động vân tay cho đến phân tích DNA. Các hệ  
thống an ninh nhận dạng người thông qua việc scan v ng mạc mắt, scan khuôn mặt, và các đường  
tĩnh mạch ở tay đã được phát triển.  
Chương trình không gian U.S. và BQP, với việc phát triển các khả năng thị giác cho rô bốt đang  
được nghiên cứu và phát triển. Các ứng dụng từ xe cộ tự chủ cho đến bắt bám mục tiêu và nhận  
dạng. Các vệ tinh theo quĩ đạo trái đất thu thập những dung lượng lớn dữ liệu ảnh hàng ngày, và các  
ảnh này sẽ tự động được scan để hỗ trợ việc lập bản đồ, dự báo thời tiết, và giúp chúng ta hiểu được  
những thay đổi đang xảy trên hành tinh chúng ta.  
2.2. Lấy mẫu và lƣợng tử hóa ảnh  
Giới thiệu  
Một ảnh g(x, y) ghi được từ Camera là ảnh liên tục tạo nên mặt phẳng hai chiều. Ảnh cần  
chuyển sang dạng thích hợp để xử lí bằng máy tính. Phương pháp biến đổi một ảnh (hay một  
hàm)liên tục trong không gian cũng như theo giá trị thành dạng số rời rạc được gọi là số hoá ảnh.  
Việcbiến đổi này có thể gồm hai bước:  
Bước 1: Đo giá trị trên các khoảng không gian gọi là lấy mẫu  
Bước 2: Ánh xạ cường độ (hoặc giá trị) đo được thành một số hữu hạn các mức rời rạc gọilà  
lượng tử hoá.  
14  
Lấy mẫu  
Lấy mẫu là một quá trình, qua đó ảnh được tạo nên trên một vùng có tính liên tục được chuyển  
thành các giá trị rời rạc theo tọa độ nguyên. Quá trình này gồm 2 lựa chọn:  
- Một là: khoảng lấy mẫu.  
- Hai là: cách thể hiện dạng mẫu.  
Lựa chọn thứ nhất được đảm bảo nhờ lý thuyết lấy mẫu của Shannon. Lựa chọn thứ hai liên quan  
đến độ đo (Metric) được dùng trong miền rời rạc.  
Khoảng lấy mẫu (Sampling Interval)  
Ảnh lấy mẫu có thể được mô tả như việc lựa chọn một tập các vị trí lấy mẫu trong không gian  
hai chiều liên tục. Đầu tiên mô tả qua quá trình lấy mẫu một chiều với việc sử dụng hàm delta:  
Tiếp theo chúng ta định nghĩa hàm răng lược với các khoảng Δx như sau:  
với r là số nguyên, Δx : khoảng lấy mẫu  
Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-∞ đến +∞). Giả sử hàm một chiều g(x)  
được mô tả (gần đúng) bằng g(r Δx ) tức là:  
Khi đó tín hiệu lấy mẫu được mô hình hoá  
hoặc tương đương  
Trong thực tế, r không thể tính được trong khoảng vô hạn (từ − ∞ đến + ∞ ) mà là một số lượng  
NΔx mẫu lớn cụ thể. Như vậy, để đơn giản có thể nói hàm liên tục g(x) có thể biểu di ntrên một  
miền với độ dài NΔx mẫu thành chuỗi như sau:  
Chú ý 1: Khoảng lấy mẫu (Sampling Interval) Δx là một tham số cần phải được chọn đủ nhỏ,  
thích hợp, nếu không tín hiệu thật không thể khôi phục lại được từ tín hiệu lấy mẫu.  
15  
Chú ý 2: Từ lý thuyết về xử lý tín hiệu số [5], (2-6) là tích chập trong miền không gian x.  
Mặt khác (2-6) tương đương với tích chập trong miền tần số ω tức là biến đổi Fourier của gs(x) là  
Gs(ωs).  
trong đó ωx là giá trị tần số ứng với giái trị x trong miền không gian.  
Điều kiện khôi phục ảnh lấy mẫu về ảnh thật được phát biểu từ định lý lẫy mẫu của Shannon.  
Lƣợng tử hóa  
Lượng tử hoá là một quá trình lượng hoá tín hiệu thật dùng chung cho các loại xử lý tín hiệu  
trên cơ sở máy tính. Vấn đề này đã được nghiên cứu kỹ lưỡng và có nhiều lời giải lý thuyết dưới  
nhiều giả định của các nhà nghiên cứu như Panter và Dite (1951), Max (1960), Panter (1965). Các  
giá trị lấy mẫu Z là một tập các số thực từ giá trị Zmin đến lớn nhất Zmax. Mỗi một số trong các giá  
trị mẫu Z cần phải biến đổi thành một tập hữu hạn số bit để máy tính lưu trữ hoặc xlý.  
Định nghĩa: Lượng tử hoá là ánh xạ từ các số thực mô tả giá trị lấy mẫu thành một giải hữu hạn  
các số thực. Nói cách khác, đó là quá trình số hoá biên độ.  
Giả sử Z là một giá trị lấy mẫu (số thực) tại vị trí nào đó của mặt phẳng ảnh, và Z i <=Z’<=Z a  
và giả sử chúng ta muốn lượng hoá giá trị đó thành một trong các mức rời rạc:  1,  2,…   tương ứng  
với Z i  đến Zmax (Hình 2.3). Khi đó, quá trình lượng hoá có thể thực hiện bằng cách chia toàn bộ  
miền vào (Zmax - Zmin) thành L khoảng, mỗi khoảng là Δl và khoảng thứ I được đặt tại điểm giữa  
các khoảng liền kề li. họ các giá trị z được thực hiện và mô tả bằng li theo quá trình trên đây, khi đó  
sai số của quá trình lấy mẫu có thể được xác định theo :  
2.3. Mối quan hệ giữa các điểm ảnh  
Một ảnh số giả sử được biểu di n bằng hàm f(x, y). Tập con các điểm ảnh là S; cặp điểm ảnh có  
quan hệ với nhau ký hiệu là p, q. Chúng ta nêu một số các khái niệm sau.  
a) Các lân cận của điểm ảnh (Image Neighbors)  
Giả sử có điểm ảnh p tại toạ độ (x, y). p có 4 điểm lân cận gần nhất theo chiều đứng và ngang  
(có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc).  
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p)  
16  
trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p.  
- Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo la 4 hướng:  
Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)  
Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}  
-
-
Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh p.  
Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh.  
b) Các mối liên kết điểm ảnh.  
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc  
xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức  
xám của chúng.  
Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cường độ sáng từ thang mức xám từ  
32 đến 64 được mô tả như sau :  
V={32, 33,  , 63, 64}.  
Có 3 loại liên kết.  
-
Liên kết 4: Hai điểm ảnh p q được nói là liên kết 4 với các giá trị cường độ sáng V  
nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)  
-
-
Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc N8(p)  
Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p q với các giá trị cường độ sáng V  
được nói là liên kết m nếu.  
+. q  huộc N4( ) h c  
+. q  huộc NP(p)  
c) Đo khoảng cách giữa các điểm ảnh.  
Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ (s, t) là hàm  
khoảng cách (Distance) hoặc Metric nếu:  
1. D( ,q)  0 (Với D(p,q)=0 nếu và ch nếu p=q)  
2. D(p,q) = D(q,p)  
3. D( ,z)  D( ,q) + D(q,z); z  à    điểm  nh khác.  
Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y) q(s, t) được định  
nghĩa như sau:  
17  
De(p, q) = [(x  s)2 + (y  t)2]1/2  
Khoảng cách khối: Khoảng cách D4(p, q) được gọi là khoảng cách khối đồ thị (City- Block  
Distance) và được xác định như sau:  
D4(p,q) = | x - s | + | y - t |  
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm ảnh từ tâm điểm ảnh đến  
tâm điểm ảnh q khác. Ví dụ: Màn hình CGA 12” (12”*2,54cm = 30,48cm=304,8mm) độ phân giải  
320*200; tỷ lệ 4/3 (Chiều dài/Chiều rộng). Theo định lý Pitago về tam giác vuông, đường chéo sẽ  
lấy tỷ lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài thật là  
(305/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA 200 điểm ảnh theo chiều dọc.  
Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là ≈ 1mm.  
Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p,  
q được xác định như sau:  
D8(p,q) = max (| x-s | , | y-t |)  
CÂU HỎI ÔN TẬP  
1. Tại sao phải số hóa ảnh? Trình bày cách biểu di n ảnh số trên máy tính?  
2. Lấy mẫu là gì? Lượng tử là gì? Khoảng lấy mẫu là gì? Cho ví dụ minh họa?  
3. Trình bày các mối quan hệ giữa các điểm ảnh?  
18  
CHƢƠNG III: NÂNG CAO CHẤT LƢỢNG ẢNH TRONG MIỀN  
KHÔNG GIAN  
3.1. Các phép biến đổi mức xám cơ bản  
Nâng cao chất lượng là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một số đặc tính của ảnh.  
Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ảnh. Tăng  
cường ảnh nhằm hoàn thiện các đặc tính của ảnh như :  
- Lọc nhi u, hay làm trơn ảnh,  
- Tăng độ tương phản, điều chỉnh mức xám của ảnh,  
- Làm nổi biên ảnh.  
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền  
điểm, không gian và tần số. Toán tử điểm là phép biến đổi đối với từng điểm ảnh đang xét, không  
liên quan đến các điểm lân cận khác, trong khi đó, toán tử không gian sử dụng các điểm lân cận để  
quy chiếu tới điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp được chuyển sang  
miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền không gian nhờ các biến đổi  
ngược.  
Khái niệm về toán tử điểm:  
Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá trị của chính nó mà không  
hề dựa vào các điểm ảnh khác. Có hai cách tiệm cận với phương pháp này. Cách thứ nhất dùng một  
hàm biến đổi thích hợp với mục đích hoặc yêu cầu đặt ra để biến đổi giá trị mức xám của điểm ảnh  
sang một giá trị mức xám khác. Cách thứ hai là dùng lược đồ mức xám (Gray Histogram). Về mặt  
toán học, toán tử điểm là một ánh xạ từ giá trị cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá  
tri cường độ ánh sáng khác v(m, n) thông qua hàm f(.), tức là:  
Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xác u [ 0 , N ] được  
ánh xạ sang một mức xám v [ 0 , N ] : v = f ( u ) . Ứng dụng chính của các toán tử điểm là biến đổi  
độ tương phản của ảnh. Ánh xạ f khác nhau tùy theo các ứng dụng. Các dạng toán tử điểm được  
giới thiệu cụ thể như sau:  
Tăng độ tương phn  
Các cấp độ α ,β ,γ xác định độ tương phản tương đối. L là số mức xám cực đại  
Tách nhiễu và phân ngưỡng  
19  
Trong đó a = b =t gọi là phân ngưỡng.  
Biến đổi âm bn.  
Cắt theo mc  
Trích chọn bit.  
3.2. Xử lý histogram  
a) Lý thuyết  
Lược đồ mức xám của một ảnh, từ nay về sau ta qui ước gọi là lược đồ xám, là một hàm  
cung cấp tần suất xuất hiện của mỗi mức xám (grey level).  
Lược đồ xám được biểu di n trong một hệ toạ độ vuông góc x,y. Trong hệ toạ độ này, trục  
hoành biểu di n số mức xám từ 0 đến N, N là số mức xám (256 mức trong trường hợp chúng ta  
xét). Trục tung biểu di n số điểm ảnh cho một mức xám (số điểm ảnh có cùng mức xám). Cũng có  
thể biểu di n khác một chút: trục tung là tỷ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh.  
Số điểm ảnh  
Số điểm ảnh  
Mức xám  
Mức xám  
a) ảnh đậm  
b) ảnh nhạt  
Lược đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh. Theo thuật ngữ của  
xử lý ảnh gọi là tính động của ảnh. Tính động của ảnh cho phép phân tích trong khoảng nào đó phân  
bố phần lớn các mức xám của ảnh: ảnh rất sáng hay ảnh rất đậm. Nếu ảnh sáng, lược đồ xám nằm  
bên phải (mức xám cao), còn ảnh đậm luợc đồ xám nằm bên trái(mức xám thấp).  
Theo định nghĩa của lược đồ xám, việc xây dựng nó là khá đơn giản. Thuật toán xây dựng  
lược đồ xám có thể mô tả như sau:  
20  
Bắt đầu  
H là bảng chứa lược đồ xám (là vec tơ có N phần tử)  
a. Khởi tạo bảng  
Đặt tất cả các phần tử của bảng là 0  
b. Tạo bảng  
Với mỗi điểm ảnh I(x,y) tính H[I(x,y)] = H[I(x,y)] + 1  
c. Tính giá trị Max của bảng H. Sau đó hiện bảng trong khoảng từ 0 đến Max.  
Kết thúc  
Lược đồ xám là một công cụ hữu hiệu dùng trong nhiều công đoạn của xử lý ảnh  
như tăng cường ảnh ( xem chương Bốn). Dưới đây ta xem xét một số biến đổi lược đồ xám hay  
dùng.  
b) Biến đổi lƣợc đồ mức xám  
Trong tăng cường ảnh, cỏc thao tỏc chủ yếu dựa vào ph n tớch lược đồ xỏm. Trước tiờn ta  
xột bảng tra LUT(Look Up Table). Bảng tra LUT là một bảng chứa biến đổi một mức xỏm i sang  
mức xỏm j như đó núi trong phần a. Một cách toán học, LUT được định nghĩa như sau:  
- Cho GI là tập các mức xám ban đầu GI = {0, 1, ..., NI}  
- Cho GF là tập các mức xám kết quả GF = {0, 1, ..., NF}  
để cho tiện ta cho NI = NF = 255.  
- f là ánh xạ từ GI vào GF: giGi sẽ gfGF mà gf = f(gi)  
Với mỗi giá trị của mức xám ban đầu ứng với một giá trị kết quả. Việc chuyển đổi một mức xám  
ban đầu về một mức xám kết quả tương ứng có thể d  dàng thực hiện được nhờ một bảng tra.  
Khi đã xây dựng được bảng, việc sử dụng bảng là khá đơn giản. Người ta xem xét mức xám của  
mỗi điểm ảnh, nhờ bảng tra tính được mức xám kết quả. Gọi là bảng tra.  
3.3. Nâng cao chất lƣợng ảnh sử dụng các toán tử số học/logic  
Có hai nhóm thao tác đại số áp dụng lên ảnh là: số học và logic. Các thao tác số học có: cộng,  
trừ, chia, và nhân còn các thao tác logic gồm: AND, OR, và NOT. Các thao tác này được thực hiện  
trên hai ảnh ngoại trừ thao tác NOT chỉ cần một ảnh, và được thực hiện trên cơ sở pixel-pixel.  
Để áp dụng các thao tác số học lên 2 ảnh, ta thao tác theo các pixel tương ứng. Chẳng hạn, để  
cộng hai ảnh I1 và I2 tao ra ảnh I3 ta có  
I1(r,c) I2 (r,c) I3 (r,c)  
3 4 7  
6 6 6  
36 4 6 7 6  
9 10 13  
I1 3 4 5 ;I2 4 2 6 ;I3 34 4 2 56 7 6 11  
2 4 6  
3 5 5  
2 3 4 5 6 5  
5 9 11  
Phép cộng được sử dụng để kết hợp thông tin trong hai ảnh. Các ứng dụng nó gồm phát triển  
các thuật toán khôi phục ảnh để mô hình hoá nhi u cộng, và tạo các hiệu ứng đặc biệt như là  
Tải về để xem bản đầy đủ
pdf 70 trang Thùy Anh 04/05/2022 4080
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Xử lý ảnh - Trường Đại học Hàng Hải", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfgiao_trinh_xu_ly_anh_truong_dai_hoc_hang_hai.pdf