Hiện trạng áp dụng thị giác máy tính vào đô thị thông minh - FPT Digital
Hiện trạng áp dụng thị giác máy tính vào đô thị thông minh
Digital Strategy

Hiện trạng áp dụng thị giác máy tính vào đô thị thông minh

Từ nhiều năm nay, các ứng dụng của thị giác máy tính trong xây dựng, vận hành đô thị thông minh đã được phát biểu khá rõ ràng và chi tiết, đặc biệt trong các lĩnh vực quản lý giao thông, an ninh công cộng, tiết kiệm năng lượng, y tế cộng đồng.

Được phát triển nhờ trí tuệ nhân tạo, thị giác máy tính (computer vision) là công nghệ mà máy tính được đào tạo để bắt chước con người trong việc nhìn và hiểu hình ảnh như con người. Thị giác máy tính bao gồm các hoạt động thu nhận, xử lý ảnh kỹ thuật số, phân tích, nhận dạng và hình thành các hình ảnh dữ liệu đa chiều từ thế giới thực để cho ra các thông tin số hoặc biểu tượng. Với nhiều lợi ích ứng dụng, nhiều hệ thống thị giác máy tính cho đô thị thông minh đã được đưa vào vận hành và chứng tỏ tính thiết thực. Ở Việt Nam, chúng ta có thể đã bắt gặp các ứng dụng này trong cuộc sống hàng ngày, ví dụ như khi bị phạt nguội vi phạm giao thông, khi đăng ký sim điện thoại, khi lên xe buýt, khi đi qua trạm BOT…

Tuy nhiên thực tế rất ít trong số trên có thể triển khai ở mức độ đủ rộng để tạo ra đóng góp đáng kể vào mục tiêu tăng hiệu quả vận hành đô thị. Rào cản chính là đa phần các hệ thống thị giác máy tính yêu cầu giá trị đầu tư (thực tế) cao trong khi giá trị thu lại không tương xứng, dẫn đến việc chỉ triển khai được ở mức độ thăm dò, kể cả trong các lĩnh vực mà hiệu quả đầu tư của nó được coi là rõ ràng nhất hiện nay, được đề cập ở trên.

Các thành phần chi phí chủ yếu trong một hệ thống thị giác máy tính có thể kể ra bao gồm:

  • Chi phí đầu tư ban đầu: camera, lắp đặt camera, hạ tầng điện mạng, máy tính xử lý video stream (AI).
  • Chi phí vận hành: điện năng tiêu thụ, chi phí đường truyền, bảo dưỡng thiết bị, chi phí nhân lực vận hành hệ thống.

Thị giác nhúng và kỳ vọng

Để giảm chi phí, thị giác nhúng (embedded vision hay edge computing) được cho là một trong các hướng tiếp cận khả thi nhất hiện nay. Trong giải pháp thị giác nhúng cho đô thị thông minh, dữ liệu được xử lý (nhận diện) ngay tại camera để tránh phải truyền video về hệ thống xử lý hình ảnh ở trung tâm giám sát. Nhờ vậy cho phép tối thiểu hóa các rủi ro xuất phát từ đường truyền mạng, và tối thiểu hóa độ trễ từ khi xảy ra sự kiện tới khi hệ thống đưa ra phản ứng, với điều kiện phần cứng xử lý ảnh ở camera đủ mạnh. Phần cứng xử lý ảnh ở camera có thể là một bộ phận của camera hoặc một máy tính nhúng lắp thêm gần camera, có giá thành rẻ và mức tiêu thụ điện năng thấp. Trên thực tế, thị giác nhúng thường không giúp giảm chi phí đường truyền vì camera dù không phải truyền video về hệ thống xử lý hình ảnh thì vẫn phải truyền video về hệ thống quản lý video VMS (cũng nằm ở trung tâm giám sát). Đối lập với hướng tiếp cận thị giác nhúng là hướng tiếp cận xử lý đám mây, trong đó camera phải truyền video về hệ thống xử lý hình ảnh để xử lý trên nền máy chủ.

Ở thời điểm hiện tại, thị giác nhúng đang có cơ hội phát triển mạnh mẽ chưa từng có nhờ sự đột phá đồng thời ở cả 3 công nghệ nền tảng tạo ra nó: công nghệ chế tạo cảm biến hình ảnh, công nghệ chế tạo chip nhúng chuyên xử lý AI và các thuật toán học máy (machine learning).Rất nhiều công ty trên thế giới đang đầu tư mạnh vào mảng chip nhúng chuyên xử lý AI, có thể kể ra các tên tuổi lớn như Google, Intel, Nvidia… Những năm trở lại đây, sức mạnh của chip AI thường được cải thiện ở mức độ năm sau gấp đôi năm trước. Theo nghiên cứu của Omdia dự đoán tổng doanh thu thị trường chip nhúng AI sẽ tăng từ mức 7,7 tỷ USD năm 2019 lên 51,9 tỷ USD vào năm 2025.

Công nghệ cảm biến hình ảnh gần đây đã có bước tiến lớn trong việc tạo ra ảnh với độ phân giải siêu cao, rõ nét trong điều kiện ánh sáng thấp. Các thuật toán học máy thiết kế cho cấu hình máy tính nhúng đang ngày càng chạy nhanh hơn với độ chính xác ngày càng tiến gần hơn tới độ chính xác của phiên bản chạy trên máy chủ.

Tuy nhiên, các giải pháp trên nền máy tính nhúng hiện nay vẫn thiếu tính uyển chuyển so với các giải pháp trên nền máy chủ, máy trạm, trong khi các giải pháp thị giác máy tính muốn áp dụng được trên diện rộng thì cần độ linh hoạt rất cao. Một trở ngại nữa đối với giải pháp nhúng là rủi ro phát sinh chi phí phát triển và bảo trì hệ thống rất cao, đặc biệt ở giai đoạn hiện tại khi vòng đời của các chip chuyên xử lý AI rất ngắn (do công nghệ đang cải tiến và cạnh tranh, bị thay thế rất nhanh, thị trường không phát triển như ky vọng nên không đủ doanh thu để duy trì sản xuất và cung cấp dịch vụ…).

Ứng dụng thị giác nhúng và giải pháp ưu thế hiện tại theo hướng xử lý đám mây

Với một số ứng dụng trong bộ giải pháp đô thị thông minh thì thị giác nhúng gần như là lựa chọn bắt buộc, ví dụ: xe tự lái, điều khiển đèn tín hiệu giao thông, điều khiển đèn đường cao áp, kiểm soát vào ra, nhắc nhở đeo khẩu trang, cảnh báo đột nhập… và các ứng dụng đòi hỏi phản ứng tức thì khác nói chung. Vì trong các trường hợp này, không thể chấp nhận rủi ro khi đường truyền mạng bị đứt hoặc phát sinh độ trễ dẫn tới hệ thống không kịp phản ứng. Bên cạnh đó, một số ứng dụng dựa trên các thiết bị có tốc độ sinh dữ liệu quá lớn hoặc chỉ có thể duy trì kết nối không dây, ví dụ như LIDAR cũng bắt buộc phải xử lý theo hướng nhúng.

Với các ứng dụng có thể chấp nhận độ trễ càng cao thì các giải pháp xử lý đám mây càng có ưu thế hơn so với thị giác nhúng. Một số ví dụ ứng dụng của các giải pháp xử lý đám mây như:

  • Hệ thống chỉ dẫn tìm chỗ đỗ ô-tô: là ứng dụng di động dựa trên khả năng camera tự nhận biết các vùng trống tại các khu vực đỗ xe công cộng
  • Hệ thống phạt nguội: là ứng dụng dựa trên khả năng nhận biết các lỗi vi phạm giao thông, lấn chiếm, dừng đỗ sai quy định, hết đăng kiểm… của camera để tự động chụp, quay video làm căn cứ phạt chủ phương tiện hoặc hộ kinh doanh.
  • Hệ thống truy vết phương tiện: là ứng dụng dựa trên khả năng đọc biển số của camera để tiến hành truy vết khi xảy ra mất cắp hoặc cần theo dõi.
  • Hệ thống đo đếm lưu lượng: dựa trên khả năng đếm và phân loại xe tham gia giao thông, giúp cho công tác quy hoạch, quản lý, phát triển giao thông và các công trình công cộng.
  • Hệ thống truy vết tội phạm: là ứng dụng dựa trên khả năng nhận dạng khuôn mặt của các camera lắp tại sân bay, các bến tàu xe và khách sạn.

 

Về lâu dài, thị giác nhúng được kỳ vọng sẽ kéo chi phí về mức đủ thấp để có thể hiện thực hóa bức tranh đô thị thông minh. Tuy nhiên, ở hiện tại (2020) và tương lai gần (2021), thị giác nhúng tiềm ẩn khá nhiều rủi ro. Vì vậy, trong thời điểm này, với những ưu thế ứng dụng hơn so với thị giác nhúng, hướng tiếp cận xử lý đám mây sẽ được ưu tiên hơn trong việc xây dựng các hệ thống giải pháp của thị giác máy tính.

Nghiên cứu nổi bật
01. Chuyển đổi số trong ngành bán lẻ | Bức tranh từ tổng quan đến chi tiết 02. Trải nghiệm số nhân viên trong hành trình chuyển đổi số của doanh nghiệp sản xuất 03. Tiềm năng phát triển nguồn năng lượng tái tạo tại Việt Nam 04. Tác động của chuyển đổi số đến xây dựng và phát triển đô thị
Đăng kí theo dõi ngay!
Cập nhật những xu hướng và phân tích mới nhất về chuyển đổi số với các bản tin điện tử của FPT Digital.

    Tìm hiểu về chuyển đổi số cho doanh nghiệp
    Xác nhận