
Deepfake là một công nghệ truyền thông mới trong đó một người chỉ cần lấy văn bản, hình ảnh, video hoặc âm thanh có sẵn rồi chỉnh sửa, tức là ‘làm giả’ chúng để trông giống người khác bằng công nghệ trí tuệ nhân tạo (AI) và mạng nơ-ron (NN) tiên tiến.
Nội dung bài viết
Sau lần đầu tiên xuất hiện cách đây vài năm, công nghệ deepfake đã phát triển từ trò gian lận vô hại của một chuyên gia công nghệ thành một vũ khí vu khống độc hại. Trong bài viết này, chúng ta sẽ xem công nghệ deepfake đáng sợ này chính xác là gì, nó hoạt động như thế nào, nó có những dạng nào và làm thế nào chúng ta có thể phát hiện hoặc phá vỡ một deepfake.
Deepfake là gì?
Deepfake là một trong những thuật ngữ thông dụng trong công nghệ truyền thông, trong đó một người chỉ cần lấy văn bản, hình ảnh, video hoặc âm thanh có sẵn rồi chỉnh sửa, tức là ‘làm giả’ chúng để trông giống người khác bằng công nghệ trí tuệ nhân tạo (AI) và mạng nơ-ron (NN) tiên tiến.
Bạn muốn nói những lời lăng mạ vào miệng kẻ thù của mình? Hay hoán đổi nhân vật chính trong phim với siêu sao Hollywood yêu thích của bạn? Hay bạn chỉ muốn tự làm mình nhảy như Michael Jackson? Vậy thì deepfake chính là thứ bạn cần!
Nội dung Deepfake đang tăng theo cấp số nhân. Thật không may, công nghệ deepfake đã được sử dụng nhiều lần để đạt được lợi thế chính trị, làm hoen ố hình ảnh của đối thủ hoặc thực hiện gian lận tài chính.
Bây giờ chúng ta hãy xem xét ba loại deepfake chính và khám phá khoa học dữ liệu cho phép chúng hoạt động. Chúng ta cũng sẽ tập trung vào các công nghệ phát hiện deepfake mà các nhà nghiên cứu và cố vấn bảo mật đang nghiên cứu để hạn chế việc sử dụng deepfake có mục đích xấu.
Văn bản Deepfake
Vào những ngày đầu của trí tuệ nhân tạo (AI) và xử lý ngôn ngữ tự nhiên (NLP), người ta cho rằng sẽ là một thách thức đối với một cỗ máy khi thực hiện một hoạt động sáng tạo như vẽ hoặc viết. Quay trở lại năm 2021; với các mô hình ngôn ngữ và thư viện mạnh mẽ đã được xây dựng trong nhiều năm qua bởi công việc gia tăng của các nhà nghiên cứu và chuyên gia khoa học dữ liệu, văn xuôi được AI tạo ra được đánh giá cao nhất hiện có thể viết với sự súc tích và mạch lạc giống như con người.
ới các thư viện và mô hình ngôn ngữ mạnh mẽ, các công cụ phần mềm hỗ trợ AI hiện có thể soạn thảo văn xuôi với sự mạch lạc và súc tích giống con người.
GPT-2
Ví dụ, GPT-2— thế hệ mới nhất của hệ thống tạo văn bản do phòng nghiên cứu OpenAI từ Thung lũng Silicon phát hành. Công nghệ này đã gây ấn tượng với cả người bình thường và chuyên gia trong lĩnh vực này với khả năng tạo ra văn bản mạch lạc với ít lời nhắc nhất.
Các kỹ sư của OpenAI đã sử dụng hơn 8 triệu tài liệu văn bản được loại bỏ (phương pháp trích xuất dữ liệu có liên quan từ các trang web) và kết hợp với một tỷ tham số để lập mô hình và đào tạo AI GPT-2.
Bản chất của deepfake và các công nghệ tương tự khác như deeplearning , tận dụng các công nghệ nhân tạo, nằm ở việc đào tạo phần mềm để suy nghĩ và tự thích ứng bằng cách sử dụng dữ liệu trong quá khứ được cung cấp thông qua các tập dữ liệu. Bạn có thể đọc thêm về trí tuệ nhân tạo trong bài viết này .
Sử dụng GPT-2, bạn chỉ cần nhập tiêu đề và thuật toán văn bản deepfake sẽ tạo ra một câu chuyện tin tức hư cấu xung quanh tiêu đề đó. Hoặc chỉ cần cung cấp cho nó dòng đầu tiên của một bài thơ và nó sẽ trả về toàn bộ câu thơ.
Nhiều đơn vị truyền thông đang sử dụng thuật toán deepfake kết hợp với công nghệ thu thập dữ liệu web để tạo ra các câu chuyện hoặc blog do chính phần mềm viết.
Các nhà nghiên cứu tại Trung tâm chống khủng bố, chủ nghĩa cực đoan và chống khủng bố (CTEC) thuộc Viện nghiên cứu quốc tế Middlebury cảnh báo rằng các công cụ như GPT-2 có thể bị sử dụng sai mục đích để truyền bá chủ nghĩa chủng tộc tối cao hoặc phát tán các thông điệp cực đoan của các tổ chức cực đoan.
Deepfake trên mạng xã hội
Song song với việc viết truyện hoặc blog, công nghệ deepfake cũng có thể được tận dụng để tạo ra một hồ sơ trực tuyến giả mà người dùng bình thường khó có thể phân biệt được. Ví dụ, một nhà báo của Bloomberg (không tồn tại) có tên Maisy Kinsley trên các trang mạng xã hội như LinkedIn và Twitter có khả năng là một deepfake . Ảnh hồ sơ của cô ấy trông lạ, có lẽ là do máy tính tạo ra. Hồ sơ này có thể được tạo ra vì lợi ích tài chính, vì hồ sơ của Maisy Kinsley đã nhiều lần cố gắng kết nối với những người bán khống cổ phiếu Tesla trên mạng xã hội. Những người bán khống là những người bi quan về thị trường chứng khoán và họ bán khống, tức là bán cổ phiếu với niềm tin rằng giá cổ phiếu sẽ giảm và sau đó mua cổ phiếu với giá thấp hơn, về cơ bản là tạo ra một khoản lợi nhuận lớn.
Một hồ sơ khác có tên Katie Jones, được cho là đề cập đến việc làm việc tại Trung tâm Nghiên cứu Chiến lược và Quốc tế, được phát hiện là deepfake được tạo ra với mục đích xấu là làm gián điệp.
Phát hiện Deepfake dạng văn bản
Các nhà nghiên cứu từ Viện Allen về Trí tuệ nhân tạo đã phát triển một công cụ phần mềm có tên là Grover để phát hiện nội dung tổng hợp trôi nổi trực tuyến. Các nhà nghiên cứu tuyên bố rằng phần mềm này có thể phát hiện các bài luận được viết bằng deepfake 92% thời gian. Grover làm việc trên một bộ kiểm tra được biên soạn từ Common Crawl, một kho lưu trữ web và trình thu thập dữ liệu nguồn mở. Tương tự như vậy, một nhóm các nhà khoa học từ Harvard và phòng thí nghiệm Watson của MIT-IBM đã cùng nhau thiết kế Giant Language Model Test Room , một công cụ web nhằm phân biệt xem văn bản được nhập có phải do AI tạo ra hay không.
Video Deepfake
Tạo ảnh và video giả là vũ khí chính của deepfake. Đây là hình thức deepfake được sử dụng nhiều nhất, vì chúng ta đang sống trong thế giới mạng xã hội phổ biến, trong đó hình ảnh và video làm sáng tỏ các sự kiện và câu chuyện tốt hơn văn bản thuần túy.
AI tạo video hiện đại có khả năng hơn, và có lẽ nguy hiểm hơn, so với đối tác ngôn ngữ tự nhiên của nó. Công ty công nghệ Hyperconnect có trụ sở tại Seoul gần đây đã phát triển một công cụ có tên là MarioNETte có thể tạo video deepfake của các nhân vật lịch sử, người nổi tiếng và chính trị gia. Điều này được thực hiện thông qua việc tái hiện khuôn mặt của một người khác, sau đó biểu cảm khuôn mặt của người này sẽ được chồng lên tính cách mục tiêu mà deepfake sẽ được tạo ra.
Video Deepfake được sản xuất như thế nào?
Trò lừa đảo video này sử dụng một kỹ thuật gọi là mạng đối nghịch tạo sinh ( GAN ). GAN là một phần của nhánh máy học gọi là mạng nơ-ron. Các mạng này được thiết kế để mô phỏng các quá trình nơ-ron của não người. Các lập trình viên có thể đào tạo mạng nơ-ron để nhận dạng hoặc thao tác một nhiệm vụ cụ thể.
Trong GAN được sử dụng để tạo deepfake, hai mạng nơ-ron được đặt đối đầu với nhau để tạo ra đầu ra thực tế. Mục đích của việc này là để đảm bảo rằng các deepfake được tạo ra trông giống thật nhất có thể. Bản chất của GAN nằm ở sự cạnh tranh giữa hai mạng nơ-ron. Trong GAN, trình làm giả hình ảnh và trình phát hiện giả mạo liên tục cố gắng qua mặt nhau. Cả hai mạng nơ-ron đều được đào tạo bằng cùng một tập dữ liệu.
Lưới đầu tiên được gọi là máy phát điện, có nhiệm vụ tạo ra một hình ảnh giả mạo bằng cách sử dụng các vectơ nhiễu (danh sách các số ngẫu nhiên) trông giống thật nhất có thể. Lưới thứ hai, được gọi là bộ phân biệt, xác định độ chân thực của các hình ảnh được tạo ra. Nó so sánh hình ảnh giả mạo do máy phát điện tạo ra với các hình ảnh chính hãng trong tập dữ liệu để xác định hình ảnh nào là thật và hình ảnh nào là giả. Trên cơ sở các kết quả đó, máy phát điện thay đổi tham số để tạo ra hình ảnh. Chu kỳ này tiếp tục cho đến khi bộ phân biệt không xác định được hình ảnh được tạo ra là giả mạo, sau đó được sử dụng trong đầu ra cuối cùng. Đây là lý do tại sao deepfake trông thật đến kỳ lạ.
Phát hiện video Deepfake
Các chuyên gia pháp y trên toàn cầu đang nỗ lực tìm ra các phương pháp và công cụ để xác định video deepfake, vì chúng ngày càng trở nên thuyết phục hơn.
Khi các công cụ học máy đang dần trở nên phổ biến, việc tạo ra các video giả có sức thuyết phục để phát tán tin tức tuyên truyền hoặc đơn giản là quấy rối một cá nhân mục tiêu trở nên dễ dàng hơn nhiều.
Bộ Quốc phòng Hoa Kỳ (DARPA) đã phát hành một công cụ phát hiện deepfake có tên là Media Forensics. Ban đầu, chương trình được phát triển để tự động hóa các công cụ pháp y hiện có, nhưng với sự gia tăng của deepfake, họ đã sử dụng AI để chống lại deepfake do AI điều khiển. Hãy cùng xem nó hoạt động như thế nào.
Video kết quả được tạo ra bằng deepfake về mặt kỹ thuật có sự khác biệt rõ rệt về cách siêu dữ liệu của video được phân phối, so với siêu dữ liệu gốc. Những khác biệt này được gọi là những cái nhìn thoáng qua trong ma trận, đó là những gì công cụ phát hiện deepfake của DARPA cố gắng tận dụng khi phát hiện phương tiện deepfake.
Siwei Lyu, giáo sư khoa khoa học máy tính tại Đại học bang New York, đã lưu ý rằng khuôn mặt được tạo ra bằng công nghệ deepfake hiếm khi chớp mắt. Ngay cả khi có, trông chúng cũng không tự nhiên. Ông cho rằng điều này là do hầu hết các video sử dụng deepfake đều được đào tạo bằng hình ảnh tĩnh. Tuy nhiên, ảnh chụp một người thường được chụp khi mắt họ mở. Bên cạnh việc chớp mắt, các điểm dữ liệu khác về chuyển động khuôn mặt, chẳng hạn như khi họ nhếch môi trên khi trò chuyện, cách họ lắc đầu, v.v. cũng có thể cung cấp manh mối về việc video được phát trực tuyến có phải là giả hay không.
Âm thanh Deepfake
Sức mạnh của trí tuệ nhân tạo và mạng nơ-ron không chỉ giới hạn ở văn bản, hình ảnh và video. Chúng có thể sao chép giọng nói của một người một cách dễ dàng. Tất cả những gì cần thiết là một tập dữ liệu về bản ghi âm giọng nói của một người có giọng nói cần được mô phỏng. Các thuật toán Deepfake sẽ học từ tập dữ liệu đó và được trao quyền để tái tạo ngữ điệu của giọng nói của một người được nhắm mục tiêu.
Phần mềm thương mại đang được tung ra thị trường như Lyrebird và Deep Voice, trong đó bạn chỉ cần nói một vài câu trước khi AI quen với giọng nói và ngữ điệu của bạn. Khi bạn đưa thêm âm thanh của chính mình vào, phần mềm này trở nên đủ mạnh để sao chép giọng nói của bạn. Sau khi đưa vào tập dữ liệu các mẫu âm thanh của riêng bạn, bạn chỉ cần đưa ra một câu hoặc một đoạn văn và phần mềm deepfake này sẽ đọc văn bản bằng giọng nói của bạn!
Phát hiện âm thanh Deepfake
Hiện tại, không có nhiều công cụ âm thanh deepfake chuyên dụng, nhưng các nhà phát triển và công ty an ninh mạng đang nỗ lực nghiên cứu để đưa ra các giải pháp bảo vệ tốt hơn về vấn đề này.
Ví dụ, năm ngoái, các nhà phát triển tại công ty khởi nghiệp công nghệ Resemble đã phát triển một công cụ nguồn mở có tên là Resemblyzer để phát hiện các đoạn âm thanh deepfake. Resemblyzer sử dụng các thuật toán học máy tiên tiến để đưa ra các biểu diễn tính toán của các mẫu giọng nói nhằm dự đoán liệu chúng là thật hay giả. Bất cứ khi nào người dùng gửi một tệp âm thanh để đánh giá, nó sẽ tạo ra một biểu diễn toán học tóm tắt các đặc điểm riêng biệt của mẫu giọng nói đã gửi. Thông qua quá trình chuyển đổi này, máy có thể phát hiện liệu giọng nói đó là thật hay được tạo ra một cách nhân tạo bởi các công cụ deepfake.
Con Đường Phía Trước Với Deepfakes
Một cuộc điều tra do Deeptrace labs thực hiện năm ngoái đã phát hiện ra rằng có hơn 14.000 video deepfake đang ẩn núp trực tuyến. Họ cũng ghi nhận mức tăng 84% trong sản lượng của mình chỉ trong bảy tháng. Điều thú vị là hơn 90% video deepfake là nội dung khiêu ***, trong đó phụ nữ nổi tiếng được hoán đổi khuôn mặt trong phim khiêu ***.
Khi deepfake đang nhận được sự chú ý nghiêm túc, nó đang đặt ra một vấn đề nghiêm trọng không chỉ xâm phạm quyền riêng tư mà còn xâm phạm đến phẩm giá của cá nhân. Trớ trêu thay, để chống lại deepfake do AI hỗ trợ, chính trí tuệ nhân tạo đang được sử dụng. Mặc dù một AI ‘tốt’ đang giúp xác định deepfake, hệ thống phát hiện này phụ thuộc rất nhiều vào tập dữ liệu mà nó sử dụng để đào tạo. Điều này có nghĩa là chúng có thể hoạt động tốt để phát hiện video deepfake của những người nổi tiếng, vì có một lượng lớn dữ liệu có sẵn về họ. Nhưng việc phát hiện deepfake của một người có hồ sơ thấp sẽ là thách thức đối với các hệ thống phát hiện như vậy.
Các công ty công nghệ truyền thông xã hội cũng đang nghiên cứu hệ thống phát hiện deepfake. Facebook gần đây đã thông báo rằng họ đang nghiên cứu hệ thống tự động để xác định nội dung deepfake trên nền tảng của mình và loại bỏ nó. Tương tự như vậy, Twitter đề xuất đánh dấu deepfake và loại bỏ chúng nếu chúng được phát hiện là khiêu khích.
Mặc dù chúng tôi ghi nhận và đánh giá cao những nỗ lực của các công ty công nghệ này, nhưng chỉ có thời gian mới có thể trả lời được mức độ thành công của họ trong việc ngăn chặn các video deepfake độc hại!
Nguồn: https://vnreview.vn/threads/deepfake-la-gi-nguoi-ta-tao-ra-deepfake-nhu-the-nao.56008/
Be the first to comment