Trong phương pháp đếm, hàng nghìn ấu trùng được pha loãng vào nhiều thùng chứa và được nhiều cá thể đếm thành nhiều đợt. Quá trình này tốn thời gian, tốn nhiều công sức và có hại cho ấu trùng vì rất dễ gây stress. Trong phương pháp cân, trọng lượng nhóm ấu trùng được đo và chia cho trọng lượng của một ấu trùng để xác định số lượng. Phương pháp này đòi hỏi ấu trùng phải được đặt trong môi trường không có nước và cũng có hại. Hơn nữa, độ chính xác của việc đếm bị ảnh hưởng bởi sự khác biệt về kích thước của ấu trùng.
Các phương pháp đếm ấu trùng tôm dựa trên xử lý hình ảnh có thể được phân loại thành các phương pháp truyền thống và dựa trên deep-learning. Các phương pháp truyền thống dựa vào việc sử dụng các kỹ thuật xử lý hình ảnh, chẳng hạn như phân ngưỡng, phép toán co (Erosion), phép giãn nở (Grayscale dilation) và phân tích miền kết nối để phân đoạn và định vị ấu trùng tôm trong hình ảnh bằng cách khai thác các đặc điểm nổi bật của gan tụy. Số lượng ấu trùng sau đó được ước tính dựa trên các miền được kết nối. Mặt khác, các phương pháp tiếp cận dựa trên deep learning sử dụng kỹ thuật phát hiện mục tiêu và phân đoạn cá thể để tự động xác định số lượng ấu trùng tôm từ hình ảnh tĩnh.
Tuy nhiên, việc xác định vị trí chính xác của ấu trùng là một thách thức do sự di chuyển của ấu trùng, dẫn đến sai số gia tăng đối với cả phương pháp truyền thống và phương pháp deep-learning. Dựa trên các nguyên tắc cụ thể có liên quan, các phương pháp lấy deep learning làm cốt lõi có thể được chia thành phát hiện mục tiêu, phân đoạn cá thể và đếm đám đông. Nghiên cứu mới đây của Ximing Li và cs (2023) đã thực hiện thử nghiệm sử dụng năm loại điện thoại thông minh khác nhau để chụp hàng nghìn bức ảnh có độ phân giải cao trong nhiều điều kiện môi trường khác nhau. Sau đó, nhóm tác giả đã chọn 1420 hình ảnh để xây dựng bộ dữ liệu có độ phân giải cao. Ngoài ra, tập dữ liệu có độ phân giải cao này còn bao gồm các chú thích điểm chung để sử dụng. Sau khi đào tạo với tập dữ liệu này, nhóm đã thu được một mô hình mà chúng tôi đã thử nghiệm với tập dữ liệu ấu trùng tôm sú thực.
Kết quả đào tạo mô hình
Phương pháp đề xuất đã được huấn luyện trên tập dữ liệu Penaeus_1k. Tổn thất huấn luyện được thể hiện trong Hình 1. Khi bắt đầu đào tạo, tổn thất ở mức cao. Tuy nhiên, khi số lần lặp huấn luyện tăng lên, tổn thất giảm nhanh chóng và ổn định sau 20 epochs, đạt giá trị rất thấp. Tỷ lệ tổn thất giảm nhanh chóng cho thấy mạng có thể nhanh chóng tìm hiểu các tính năng của hình ảnh, xác nhận thêm tính hợp lệ của mô hình. Ngoài ra, quá trình đào tạo mô hình trong 50 epochs trên GeForce RTX 3090 được hoàn thành chỉ trong 72 phút.
Hình 1. Đường cong giá trị hàm huấn luyện. Tổn thất giảm nhanh khi số lần lặp huấn luyện tăng lên
Kết quả đếm hình ảnh
Hiệu suất của mô hình đếm ấu trùng tôm cần được đánh giá kỹ lưỡng bằng cách sử dụng nhiều chỉ số. Trong bộ kiểm tra Penaeus_1k, nhóm tác giả đã sử dụng Acc, MAE và MSE làm số liệu đánh giá cho phương pháp được đề xuất. Bảng 1 trình bày hiệu suất đếm trung bình của mô hình trong bộ thử nghiệm gồm 720 hình ảnh. Độ chính xác trung bình của việc đếm ấu trùng trong bảy nhóm khác nhau (53, 183, 312, 427, 510, 675 và 883) là 93,79% và MAE là 33,69, cho thấy sai số đếm trung bình là 33,69 trong 720 hình ảnh trong bảy nhóm. MSE, nhạy cảm hơn với các giá trị bất thường, là 34,74, phản ánh tính ổn định của mô hình; giá trị thấp hơn cho thấy mô hình ổn định hơn với ít trường hợp lỗi đếm lớn hơn.
Bảng 1. Kết quả đánh giá thước đo của phương pháp đề xuất
Hình 2 hiển thị hiệu suất đếm trung bình của phương pháp được đề xuất giữa các nhóm mật độ ấu trùng khác nhau trong bộ thử nghiệm. Như được mô tả trong Hình 8a, khi mật độ ấu trùng tăng lên, độ chính xác của phép đếm của mô hình sẽ giảm, trong khi cả MAE và MSE đều tăng. Trong Hình 8b, có thể thấy rằng Nhóm 53 thể hiện MAE và MSE thấp nhất; tuy nhiên, độ chính xác của nó không cao bằng Nhóm 183. Điều này có thể là do độ chính xác của phương pháp tính toán, trong đó ngay cả một lỗi đếm nhỏ trong các nhóm mật độ thấp (như Nhóm 53) cũng có thể ảnh hưởng đáng kể đến độ chính xác của phương pháp. . Ví dụ: nếu số lượng sự thật cơ bản là 53 và mô hình dự đoán là 50 thì độ chính xác sẽ xấp xỉ 94,4%.
Hiệu suất của phương pháp trong mỗi nhóm của bộ thử nghiệm được minh họa trực quan trong Hình 3. Đối với các nhóm từ 53 đến 883, số lượng tôm tăng liên tục và sự tắc nghẽn trở nên nổi bật hơn. Tuy nhiên, phương pháp của các tác giả duy trì độ chính xác trên 90%, như trong Hình 3a–d. Tuy nhiên, đối với Nhóm 1691, trong hình ảnh ngoài cùng bên phải của Hình 3l, hình chữ nhật được biểu thị bằng mũi tên biểu thị trường hợp lỗi phát hiện điểm chính, có sự đông đúc, tắc nghẽn và chồng chéo đáng kể của tôm trong phần lớn hình ảnh. Trong những trường hợp như vậy, gần như không thể phân biệt chính xác tôm bị tắc theo cách thủ công và việc tắc nghẽn cũng cản trở việc định vị chính xác các điểm chính, dẫn đến hiệu suất đếm bị suy giảm hơn nữa. Độ chính xác trung bình của nhóm này chỉ là 75,69%.
Ngoài những khác biệt về mật độ tôm và sự tắc nghẽn giữa cá thể tôm, bộ dữ liệu Penaeus_1k còn bao gồm một số lượng đáng kể các hình ảnh được chụp từ nhiều góc nhìn, như được mô tả trong Hình 3e–h. Hình ảnh nhiều góc nhìn gây ra một số biến dạng nhất định trong hình thái tôm, nhưng phương pháp đề xuất của các tác giả có thể xử lý các tình huống đó một cách ổn định, chỉ giảm một chút độ chính xác so với hình ảnh được chụp song song với bể. Hơn nữa, trong môi trường ứng dụng thực tế, điều kiện ánh sáng rất phức tạp, như được minh họa trong Hình 3i–k, hiển thị hình ảnh với điều kiện ánh sáng phức tạp.
Biểu đồ được hiển thị ở góc trên bên phải của hình ảnh, trong khi độ sáng trung bình và độ lệch chuẩn được hiển thị ở phía dưới. Biểu đồ minh họa sự phân bố mức độ sáng, giá trị trung bình biểu thị độ sáng trung bình của hình ảnh và độ lệch chuẩn đo một phần độ tương phản của hình ảnh. Có thể nhận thấy phần lớn các pixel đều nằm trong dải độ sáng cao nhưng vẫn còn nhiều pixel có độ sáng thấp. Trong ảnh, điều này được biểu hiện ở các vùng chủ yếu là sáng với một số vùng tối hơn, cũng như sự hiện diện của ánh sáng chói và quầng sáng. Phương pháp này có thể xử lý hiệu quả độ sáng không đồng đều trong hình ảnh và phát hiện tôm dưới quầng sáng, duy trì mức độ chính xác cao.
Do đó, để đạt được hiệu suất tối ưu với phương pháp này, điều quan trọng là phải nâng cao chất lượng hình ảnh, bao gồm duy trì độ sáng đồng đều, cải thiện độ tương phản, nâng cao độ rõ nét của hình ảnh, đảm bảo sự hiện diện đầy đủ của vật chứa trong hình ảnh và tránh tình trạng tôm quá đông. Các tác giả khuyến cáo nên giữ số lượng ấu trùng tôm được đếm trong một hình ảnh trong khoảng từ 500 đến 800.
So sánh với các phương pháp đếm thông thường
Hiện tại, các phương pháp deep learning sử dụng bộ dữ liệu chú thích điểm đang phổ biến trong lĩnh vực đếm đám đông và phương pháp này được so sánh với ba phương pháp đếm bản đồ mật độ. Ba phương pháp đều được thử nghiệm trên Penaeus_1k. Kết quả so sánh được thể hiện trong Bảng 2 và Hình 4. So với các phương pháp đếm bản đồ mật độ khác, chẳng hạn như CSRNet, CCTrans và BLNet, phương pháp trong nghiên cứu này cho thấy những cải tiến đáng kể về MAE và MSE trên tất cả các nhóm. Cụ thể, phương pháp đề xuất đạt được mức giảm 13,73 ở MAE và 13,03 ở MSE, đồng thời đạt được mức tăng đáng kể về độ chính xác là 7,66%. Phương pháp đề xuất cho thấy những cải tiến đáng kể so với CCTrans đối với Nhóm 53, tức là nhóm mật độ thấp. Cụ thể, MAE và MSE giảm lần lượt 16,05 và 16,40. Hơn nữa, độ chính xác tăng lên đáng kể là 30,28%. Lý do cho độ chính xác kém của các phương pháp bản đồ mật độ có thể được thấy trong Hình 5. Trong các kịch bản mật độ thấp, các phương pháp bản đồ mật độ có xu hướng đánh giá quá cao số lượng ấu trùng tôm. Ngoài ra, do phương pháp tính toán chính xác, ngay cả những sai sót nhỏ trong việc đếm ấu trùng tôm trong điều kiện mật độ thấp cũng có thể làm giảm đáng kể độ chính xác.
Hình 3: Kết quả dự đoán và định vị của phương pháp đề xuất dưới các mật độ khác nhau, phối cảnh tùy ý, độ sáng không đồng đều và độ che phủ nặng
Hình 4: Độ chính xác và đường cong MAE so với mật độ được tạo ra bởi bốn mô hình đếm khác nhau trên bộ thử nghiệm. Kết quả của các phương pháp khác có được bằng cách đào tạo và thử nghiệm bằng mã chính thức trên tập dữ liệu chung. (a) So sánh độ chính xác; (b) So sánh MAE.
Hình 5. Sự khác biệt giữa các giá trị dự đoán và giá trị thực tế cơ bản đối với nhóm mật độ thấp, tức là Nhóm 53, được hiển thị cho cả phương pháp bản đồ mật độ và phương pháp được đề xuất trong nghiên cứu này
Bảng 3: Kết quả so sánh số liệu với các phương pháp đếm khác nhau trên tập dữ liệu Penaeus_1k
Nghiên cứu này đề xuất một phương pháp đếm ấu trùng tôm theo cách thân thiện, hiệu quả và chính xác với người sử dụng. Phương pháp này có thể ước tính chính xác số lượng ấu trùng trong bể chứa, nâng cao hiệu quả giao dịch mua bán giữa trại giống và người nuôi, giúp người nuôi biết chính xác hơn về số lượng ấu trùng tôm và có kế hoạch cho quá trình nuôi hợp lý hơn. Sau thời gian thu thập và chú thích dữ liệu rộng rãi, các tác giả đã phát triển một bộ dữ liệu có tên Penaeus_1k của ấu trùng tôm sú.
Để trích xuất tính năng, nhóm nghiên cứu đã sử dụng HRNet-w48, có thể duy trì độ phân giải cao trong khi kết hợp thông tin ngữ nghĩa để nâng cao hiệu suất đếm. Sau đó, họ đã giới thiệu một đầu đếm đơn giản, PLCS, để xử lý các bản đồ đặc trưng do mạng tạo ra và thu được kết quả đếm chính xác. Phương pháp đề xuất đã được đánh giá trên bộ thử nghiệm Penaeus_1k và đạt được kết quả đếm thuận lợi. Tỷ lệ chính xác trung bình đạt 93,79%, với MAE là 33,69 và MSE là 34,74. So với các phương pháp bản đồ mật độ, phương pháp đề xuất trong nghiên cứu này cho thấy hiệu suất tổng thể vượt trội.