Nhắc tới Xử Lý Ảnh thì nhiều anh em nghĩ chắc Team này toàn các chuyên gia về Photoshop. Thật vậy Computer Vision được người Việt mình dịch thân thương là “Xử Lý Ảnh” khiến nó hơi dễ gây nhầm lẫn với việc xử lý ảnh chụp của các thánh Photoshop.
Vậy Computer Vision thực tế là gì? Nó đơn giản là Thị Giác Máy Tính, nhưng nghe có vẻ mơ hồ quá nhỉ. Máy tính thì làm gì có thị giác? Theo định nghĩa được công bố rộng rãi thì: “Thị Giác Máy Tính là việc tạo ra các chương trình máy tính có khả năng diễn dịch (interpret) hình ảnh”. Đại loại là giúp cho máy tính có thể hiểu được nội dung, ý nghĩa đằng sau một bức ảnh.
Menu
Đôi nét về Team AI
– Sơn HS: Chuyên gia về Computer Vision, Kỹ sư Toán Tin Ứng Dụng – ĐHBK
– Hiếu NT: Kỹ sư CNTT – ĐHBK
– Tuấn HV: Kỹ sư CNTT – ĐH Xây Dựng.
– Trọng DHV: Intern, hiện đang học tại Texas A&M University Hoa Kỳ, chuyên ngành Computer Science.
– Biển HG: Cô hồn, tốt nghiệp ĐH Mở Hà Nội ngành CNTT.
Computer Vision có thể làm gì?
– Nhận diện đối tượng: Người, vật, động vật
– Tracking đối tượng.
– Nhận diện khuôn mặt, cảm xúc của đối tượng.
….
Bằng đó sức mạnh, Computer Vision có vô số ứng dụng trong thực tế.
Một dự án Computer Vision sẽ được Team AI xử lý như thế nào?
Như mọi dự án khác của DEHA, Team AI cũng phải lấy yêu cầu của khách hàng về phần mềm sẽ làm. Tuy nhiên các yêu cầu này thường khá mơ hồ, không cụ thể ngay từ đầu thậm chí siêu ngắn chỉ vọn vẹn 1 dòng.
Sau khi xác định được yêu cầu của khách hàng, Team bắt đầu đánh giá xem bài toán mà Team giải quyết thuộc loại bài toán nào. Thường trong Computer Vision sẽ có một vài dạng bài toán như:
– Tracking: Theo dõi
– Detecting: Phát hiện
– Recognition: Nhận diện.
Sau khi đã xác định được bài toán của dự án, Team bắt đầu đi đánh giá tính khả thi của những giải pháp được tìm ra. Một loạt tài liệu, báo cáo khoa học được Team ngấu nghiến trong một vài ngày để chứng minh được phương pháp mà Team chọn là khả thi với bài toán đặt ra.
Sau khi đã chọn ra được 1 phương pháp chim ưng nhất, Team tiến hành chia công việc cho các thành viên để thực hiện. Lúc này, việc quan trọng nhất của Team là phải Implement được những phương pháp và thuật toán đã tìm hiểu được thành một bản mẫu (Prototype) có thể chạy được. Đây có thể gọi là sản phẩm MVP của dự án, và khách hàng cũng như Team có thể xem được ngay cách thức mà ứng dụng sau này sẽ hoạt động. Những Prototype này thường sẽ được viết Python và OpenCV (Một Framework hỗ trợ Computer Vision mã nguồn mở). Tuy là Prototype, nhưng việc Implement cũng cần phải trải qua các bước sau
– Thu thập dữ liệu mẫu.
– Tiền xử lý dữ liệu mẫu
– Tiến hành cho máy tính xử lý.
– Thu kết quả.
Việc cho máy xử lý là một công đoạn thực thi rất nhiều thuật toán. Trong Computer Vision, với những bài toán phức tạp ta cần phải có được sự hỗ trợ của Machine Learning nên đây là bước mà Team phải thử rất nhiều thuật toán, model và các tham số của các mô hình Machine Learning. Việc thay đổi dữ liệu để cho máy học cũng như việc đánh giá tính khả thi của thuât toán rất tốn thời gian vì nhiều mô hình Machine Learning cần tính toán hiệu năng cao.
Sau khi đã chọn được mô hình Machine Learning và các thuật toán Computer Vision phù hợp ta sẽ có một bản Prototype như ý. Sau khi đã có Prototype, chúng ta tiếp tục tính đến bài toán về hiệu năng cho sản phẩm.
Hiện nay khi học Machine Learning hay Computer Vision, ta thấy mọi người hay sử dụng Python để làm vì nó dễ thực thi, nhanh ra kết quả hơn, tuy nhiên trong thực tế Python quá chậm và không mạnh trong việc xử lý Performance cho hệ thống Computer Vision, vì vậy sau khi đã có Prototype bằng Python, team tiến hành convert thuật toán, model của Machine Learning… sang ngôn ngữ xử lý mạnh hơn như C/C++ và ta có thành phẩm bàn giao cho khách hàng.
Những khó khăn mà Team gặp phải.
Computer Vision và Machine Learning không phải là một lĩnh vực mới tuy nhiên trong ngành Khoa Học Máy Tính thì đây là một nhánh khá là khó, đòi hỏi người thực hiện các dự án phải thật am hiểu về Toán, Giải thuật, Lập trình hiệu năng cao, Học máy… chưa kể phải có máy tính cấu hình rất cao mới có thể giải quyết được một vài bài toán. Điều đó cũng là một trở ngại đối với Team do năng lực của các thành viên mới vẫn còn hạn chế, chi phí cho Team cũng bị giới hạn.
Tuy nhiên bằng sự nhiệt huyết và ham học hỏi của toàn bộ thành viên, Team AI đã bàn giao thành công nhiều sản phẩm có chất lượng tới tay khách hàng. Hy vọng rằng trong thời gian sắp tới, công ty sẽ có nhiều dự án về Xử Lý Ảnh cũng như Team AI mong muốn có thêm thật nhiều thành viên nhiệt huyết để cùng nhau tạo ra những sản phẩm tuyệt vời, có hàm lượng chất xám cao và đặc biệt là thực sự hữu ích.