Trong khi AI đang ngày càng trở nên phổ biến và đóng vai trò quan trọng trong nhiều lĩnh vực của cuộc sống, thì việc đảm bảo an toàn cho các hệ thống AI lại là một thách thức lớn. Tại sự kiện Securing Data in the Wake of AI, ông Đoàn Hữu Hậu – Giám đốc tư vấn tại FPT Digital – đã chia sẻ những góc nhìn chuyên gia về cách tiếp cận thực tiễn để xây dựng hệ thống AI an toàn và đáng tin cậy.
Trí tuệ nhân tạo (AI) không còn là công nghệ xa lạ với các doanh nghiệp và cả xã hội. Đặc biệt trong hai năm vừa qua, khi OpenAI ra mắt ChatGPT, sự hiện diện của AI đã trở nên phổ biến. Hiện tại, AI không chỉ là một xu hướng mà đang dần trở thành một bước phát triển mới, thúc đẩy các hoạt động phát triển kinh tế và xã hội trong tương lai.
Theo Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng AI đến năm 2030, trí tuệ nhân tạo sẽ trở thành lĩnh vực công nghệ quan trọng của Việt Nam vào năm 2025, đồng thời Việt Nam nằm trong nhóm 5 nước dẫn đầu khu vực ASEAN và nhóm 60 nước dẫn đầu thế giới về nghiên cứu, phát triển và ứng dụng AI. Đến năm 2030, Việt Nam là 1 trong nhóm 4 nước dẫn đầu khu vực ASEAN và nhóm 50 nước dẫn đầu thế giới về AI.
Chỉ 11% chuyên gia quản lý rủi ro tự tin có đủ năng lực triển khai AI một cách an toàn
Tại hội nghị Swin BIC 2024 với chuyên đề “An toàn dữ liệu trong kỷ nguyên trí tuệ nhân tạo” vừa qua, Chủ tịch SCS cho biết sự phát triển nhanh chóng của AI đã làm cho giá trị của dữ liệu được tăng lên gấp nhiều lần.
AI dựa vào dữ liệu để học hỏi, phân tích và đưa ra các quyết định. Dữ liệu càng đa dạng và phong phú thì mô hình AI càng trở nên thông minh và chính xác. Có thể nói, dữ liệu đã trở thành tài sản vô cùng quý giá.
Với tầm quan trọng như vậy, bảo vệ an toàn dữ liệu là một nhiệm vụ, một thách thức. Đây không chỉ là vấn đề của Việt Nam mà còn của nhiều quốc gia trên thế giới, trong bối cảnh các vụ vi phạm dữ liệu đang diễn ra ngày càng nhiều và tinh vi hơn.
Dữ liệu chính là “nguồn sống” của các hệ thống AI.
Tại Swin BIC 2024, ông Đoàn Hữu Hậu, Giám đốc Dịch vụ Chuyển đổi số và AI, FPT Digital, đã trình bày tham luận về cách tiếp cận thực tiễn để xây dựng hệ thống AI an toàn và đáng tin cậy. Ông Hậu cho biết do tính chất phức tạp, ngay từ giai đoạn huấn luyện mô hình, hệ thống AI đã có thể bị tấn công thông qua việc tác động vào dữ liệu và thuật toán, gây sai lệch kết quả. Trong giai đoạn triển khai và sử dụng, các cuộc tấn công có thể nhắm vào mô hình bằng cách sử dụng dữ liệu đối kháng để đánh lừa hoặc làm sai lệch mô hình, cũng như trích xuất dữ liệu nhạy cảm. Ngoài ra, hệ thống AI cũng có thể bị tấn công gây gián đoạn dịch vụ, làm ảnh hưởng đến hiệu suất và độ tin cậy của toàn bộ hệ thống.
Cụ thể, trong bước xây dựng và đào tạo mô hình AI, rủi ro “đầu độc dữ liệu” có thể xảy ra trong quá trình thu thập dữ liệu, chẳng hạn như thêm vào dữ liệu sai lệch, xóa bỏ dữ liệu quan trọng, hoặc thay đổi nhãn dữ liệu, làm cho mô hình học từ những thông tin không chính xác. Kẻ tấn công có thể thay đổi thuật toán huấn luyện, thay đổi siêu tham số hoặc cấu trúc mạng thần kinh, dẫn đến kết quả đầu ra không đáng tin cậy.
Bên cạnh đó, quá trình thu thập dữ liệu cũng gặp nhiều nguy cơ. Kẻ tấn công có thể tạo ra dữ liệu giả hoặc thay đổi thiết bị thu thập dữ liệu, làm cho dữ liệu thu thập được không chính xác và ảnh hưởng đến chất lượng của mô hình. Những rủi ro này cần được xem xét và quản lý cẩn thận để đảm bảo tính toàn vẹn và độ tin cậy của hệ thống AI.
Hậu quả của các cuộc tấn công vào hệ thống AI có thể rất nghiêm trọng. Trước tiên, mô hình AI có thể đưa ra các quyết định sai lệch, ảnh hưởng tiêu cực đến kết quả hoạt động của doanh nghiệp và cá nhân. Thứ hai, những sai sót này có thể dẫn đến mất niềm tin vào AI, làm giảm sự chấp nhận và ứng dụng của công nghệ này trong xã hội. Cuối cùng, các cuộc tấn công này có thể gây ra tổn thất kinh tế đáng kể, từ việc phải sửa chữa hệ thống đến thiệt hại do các quyết định sai lầm gây ra. Những hậu quả này nhấn mạnh tầm quan trọng của việc bảo mật và quản lý rủi ro trong quá trình phát triển và triển khai hệ thống AI.
Chia sẻ tại sự kiện, ông Đoàn Hữu Hậu cho biết theo một khảo sát toàn cầu đối với các chuyên gia quản lý rủi ro, 58% người tham gia khảo sát nói rằng AI tiềm ẩn những nguy cơ lớn và có thể dẫn đến các hậu quả nghiêm trọng, bất ngờ trong vòng 2 năm tới đối với doanh nghiệp, cá nhân, và xã hội. Các chuyên gia tham gia khảo sát đã đề cập đến việc tăng cường bảo mật hệ thống AI. Tuy nhiên, chỉ 11% trong số họ tự tin có đủ năng lực để triển khai AI một cách an toàn và xử lý được các rủi ro.
“Điều này không có nghĩa là năng lực của những người làm bảo mật chưa đạt yêu cầu, mà nó phản ánh một vấn đề thực tiễn: hệ thống AI đang phải đối diện với các mối đe dọa ngày càng tinh vi xuyên suốt vòng đời”, ông Đoàn Hữu Hậu nói.
5 nguyên tắc quan trọng trong việc xây dựng hệ thống AI an toàn
Một ví dụ điển hình về xây dựng hệ thống AI an toàn chính là Watsonx Assistant do IBM phát triển. Đây là ứng dụng AI lĩnh vực chăm sóc sức khỏe, hỗ trợ các bác sĩ chẩn đoán bệnh, khám và điều chế thuốc. Watsonx tận dụng công nghệ máy học (ML) và xử lý ngôn ngữ tự nhiên (NLP), đặc biệt, ứng dụng được xây dựng dựa trên các nguyên tắc đảm bảo an toàn và tin cậy.
Theo phân tích, thành công của Watsonx Assistant dựa trên 7 yếu tố an toàn, bao gồm mã hóa end-to-end tiên tiến nhằm bảo vệ cả mẫu dữ liệu tĩnh và đang trung chuyển; kiểm soát chặt chẽ quyền truy cập được cấp theo vai trò thông qua hệ thống quản lý IBM Cloud; giám sát tự động và lưu trữ các bản ghi thay đổi trong mô hình; tuân thủ các tiêu chuẩn quốc tế (GDPR, HIPAA); hệ thống được cải tiến liên tục và học có giám sát; data tracing (theo dõi dữ liệu) cho những mẫu dữ liệu được sử dụng, phát hiện những dữ liệu không phù hợp; và cuối cùng là hệ thống được quản lý chặt chẽ bởi con người, đặc biệt trong các khâu đưa ra quyết định quan trọng cuối cùng.
Như vậy, ngay khi bước đầu ứng dụng AI, doanh nghiệp đã cần tuân thủ các nguyên tắc bảo vệ dữ liệu. Ông Đoàn Hữu Hậu cho biết có 5 nguyên tắc quan trọng trong việc xây dựng một hệ thống AI an toàn.
Đầu tiên là an toàn từ thiết kế. Điều này có nghĩa là các hệ thống AI phải được sáng tạo, thiết kế đảm bảo an toàn thông tin ngay từ đầu, tích hợp tính năng an toàn thông tin, đánh giá rủi ro và luôn đề cao tuân thủ tiêu chuẩn an toàn thông tin quốc tế.
Nguyên tắc thứ hai là tính minh bạch và khả năng giải thích. Đối với hệ thống GenAI, vốn có khả năng tạo ra dữ liệu mới dựa trên các dữ liệu đã có, việc đảm bảo tính minh bạch rất quan trọng. GenAI có thể trả lời các câu hỏi và tạo ra dữ liệu ngay cả khi không có thông tin sẵn có. Vì vậy, việc thiết kế và triển khai hệ thống cần phải đảm bảo rằng quá trình ra quyết định là rõ ràng và có thể được hiểu, kiểm tra, và tương tác với người dùng một cách dễ dàng.
Nguyên tắc thứ ba là khả năng chống lại các cuộc tấn công. Điều này bao gồm việc kiểm tra khả năng phòng chống tấn công, phát hiện các xâm nhập, và phản ứng nhanh chóng khi xảy ra sự cố.
Nguyên tắc thứ tư là bảo vệ dữ liệu, thực hiện mã hóa dữ liệu, quản lý truy cập một cách chặt chẽ, đảm bảo chỉ những người đúng phận sự, quyền hạn và đúng thời điểm phù hợp mới có thể truy cập vào dữ liệu. Ngoài ra, cần xóa bỏ các dữ liệu dư thừa vì các dữ liệu không cần thiết sẽ gây nhiễu và ảnh hưởng đến độ chính xác của kết quả.
Nguyên tắc cuối cùng là tính đa dạng và công bằng, nhằm tránh sự thiên vị trong hệ thống AI. Nếu dữ liệu đầu vào bị lệch lạc, hệ thống AI có thể trở nên thiên vị, ảnh hưởng đến kết quả và quyết định.
“Các hệ thống AI tiềm ẩn nhiều rủi ro mất an toàn thông tin từ giai đoạn xây dựng, huấn luyện cho đến khi sử dụng. Hậu quả của việc mất an toàn thông tin rất lớn, ảnh hưởng đến quyền riêng tư dữ liệu, hành vi của người dùng, tài chính, và uy tín của cá nhân, tổ chức. Do đó, phát triển và triển khai hệ thống AI cần được thực hiện một cách an toàn và đáng tin cậy”, ông Đoàn Hữu Hậu nói.
Những khuyến nghị để doanh nghiệp ứng dụng AI an toàn
Thực tế hiện nay, một số doanh nghiệp Việt đã có những bước đầu tiên trong việc áp dụng AI, nhưng mức độ sẵn sàng để đảm bảo an toàn cho các hệ thống này vẫn chưa đồng đều.
Theo các chuyên gia, về mặt chiến lược, một số doanh nghiệp lớn đã nhận thấy tầm quan trọng của AI và đang triển khai kế hoạch dài hạn để tích hợp AI vào quy trình kinh doanh. Tuy nhiên, không phải doanh nghiệp nào cũng có chiến lược rõ ràng, đặc biệt là trong việc đảm bảo an toàn dữ liệu và hệ thống. Các doanh nghiệp nhỏ và vừa, mặc dù có sự quan tâm nhất định đến AI, nhưng đôi khi vẫn chưa chuẩn bị đủ hạ tầng công nghệ cần thiết để xây dựng các hệ thống AI an toàn.
Ông Đoàn Hữu Hậu khuyến nghị, để xây dựng và vận hành các hệ thống AI an toàn, doanh nghiệp cần chú trọng chất lượng dữ liệu lẫn bảo mật dữ liệu. Dữ liệu đầu vào có thể ảnh hưởng trực tiếp đến hiệu quả và độ tin cậy của hệ thống AI. Trong khi đó, bảo mật dữ liệu phải là nguyên tắc được duy trì trong quá trình thu thập, xử lý, lưu trữ và chia sẻ dữ liệu. Các biện pháp bảo mật có thể là mã hóa dữ liệu, quy trình truy cập “đúng người, đúng phận sự, đúng thời điểm”, và triển khai các hệ thống giám sát liên tục để phát hiện kịp thời các mối đe dọa.
Ngoài các biện pháp kỹ thuật, yếu tố con người cũng đóng vai trò quan trọng trong việc đảm bảo an toàn cho hệ thống AI. Mỗi nhân viên trong doanh nghiệp cần được đào tạo về tầm quan trọng của bảo mật dữ liệu và các biện pháp cơ bản để bảo vệ dữ liệu. Văn hóa bảo mật cần được xây dựng một cách mạnh mẽ, đảm bảo rằng tất cả các nhân viên đều hiểu và tuân thủ các quy định về an ninh thông tin.
Doanh nghiệp Việt Nam có tiềm năng lớn xây dựng các hệ thống AI an toàn, nhưng điều này đòi hỏi sự chuẩn bị kỹ lưỡng, đầu tư vào hạ tầng, con người và đặc biệt là sự cam kết từ lãnh đạo cấp cao trong việc đảm bảo an toàn dữ liệu và hệ thống. Bài học từ các doanh nghiệp tiên phong đã chỉ ra rằng, thành công trong xây dựng hệ thống AI an toàn không chỉ nằm ở công nghệ, mà còn ở chiến lược dài hạn, sự chú trọng đến chất lượng dữ liệu và nâng cao nhận thức về bảo mật trong toàn bộ tổ chức.