Vụ Kiện NYT v. OpenAI & Microsoft: Đại chiến pháp lý giữa New York Times và Open AI trong kỷ nguyên trí tuệ nhân tạo | Vu Kien NYT v OpenAI Microsoft: Dai chien phap ly giua New York Times va Open AI trong ky nguyen tri tue nhan tao

Vụ Kiện NYT v. OpenAI & Microsoft: Đại chiến pháp lý giữa New York Times và Open AI trong kỷ nguyên trí tuệ nhân tạo

Luật sư Lê Quang Vinh – Bross & Partners

Email: vinh@bross.vn

Tiếp nối bài “The New York Times kiện OpenAI & Microsoft – Vụ kiện bản quyền định hình thời đại AI?” đã đăng ngày 2/7 ở Linkedin, Bross & Partners sẽ đi sâu hơn vào vụ kiện lịch sử giữa The New York Times (NYT) và hai "ông lớn" công nghệ OpenAI & Microsoft. Đây không chỉ là một tranh chấp pháp lý thông thường, mà là một cuộc chiến bản quyền có khả năng định hình lại tương lai của ngành công nghiệp AI và quyền sở hữu trí tuệ toàn cầu.

1. Quy Trình Huấn Luyện AI: Nơi Phát Sinh Cáo Buộc Vi Phạm Bản Quyền

Để hiểu rõ cáo buộc của NYT, cần nắm được quy trình cơ bản mà các mô hình AI như GPT được huấn luyện:

Crawl (Thu thập): Các công ty AI sử dụng chương trình tự động (web crawlers) để thu thập hàng tỷ dữ liệu (bài viết, hình ảnh, văn bản...) từ internet. [Complaint, trang 24-25]
Extract (Trích xuất/Lọc): Dữ liệu thô được xử lý, lọc bỏ các phần không cần thiết và chuẩn bị cho giai đoạn huấn luyện.[Complaint, trang 25]
Training (Huấn luyện): Đây là giai đoạn cốt lõi. Các mô hình AI được "dạy" bằng cách xử lý lượng lớn dữ liệu đã thu thập. Trong quá trình này, mô hình sẽ "ghi nhớ" (memorization) và mã hóa thông tin từ dữ liệu huấn luyện vào cấu trúc nội bộ của nó (các tham số).[Complaint, trang 23-24] NYT cáo buộc việc tạo ra và lưu trữ hàng triệu bản sao tác phẩm của họ trong bộ nhớ máy tính để huấn luyện AI đã cấu thành hành vi vi phạm bản quyền trực tiếp.[Complaint, trang 28]
Output (Đầu ra): Khi người dùng đưa ra lời nhắc (prompt), mô hình AI sẽ sử dụng những gì nó đã "ghi nhớ" để tạo ra phản hồi. Nếu mô hình đã "ghi nhớ" đáng kể, nó có thể tái tạo lại các phần lớn hoặc gần như nguyên văn nội dung gốc.[Complaint, trang 23-24] Đây là "biểu hiện" của sự ghi nhớ và cũng là một hành vi bị cáo buộc vi phạm bản quyền (phân phối công khai trái phép).[Complaint, trang 32]

2. NYT Cáo Buộc Cụ Thể Gì và Bằng Chứng Nào?

NYT cáo buộc OpenAI và Microsoft đã xâm phạm bản quyền hàng loạt bằng cách sử dụng trái phép hàng triệu bài báo có bản quyền của họ để huấn luyện mô hình GPT mà không xin phép hay trả phí.[Complaint, trang 2]. Các bằng chứng và cáo buộc cụ thể bao gồm:

"Ghi nhớ" và tái hiện nguyên văn: Các mô hình GPT có thể "ghi nhớ" và xuất ra các đoạn văn bản gần như nguyên văn từ các tác phẩm của NYT khi được nhắc đúng cách.[Complaint, trang 2, 29] Đơn kiện cung cấp nhiều ví dụ, như việc AI tái tạo nguyên văn bài đánh giá nhà hàng của Pete Wells về Guy Fieri [Complaint, trang 34-36], hay các đoạn từ loạt bài điều tra đoạt giải Pulitzer về ngành taxi New York.[Complaint, trang 29-31]
Output giống 95-100% và không trích nguồn: ChatGPT hoặc Bing Chat có thể tạo ra các đoạn văn bản dài, chi tiết, giống tới 95-100% bài báo gốc, nhưng lại không trích nguồn hoặc không cung cấp liên kết nổi bật đến nguồn gốc của NYT.[Complaint, trang 3, 37-46]
Gây nhầm lẫn và suy giảm giá trị: AI tạo ra các "ảo giác" (hallucinations) – thông tin sai lệch nhưng được gán sai cho NYT, gây nhầm lẫn cho người đọc và làm xói mòn uy tín của tờ báo.[Complaint, trang 3, 52-55]
Thiệt hại tài chính: NYT yêu cầu bồi thường hàng tỷ đô la, lập luận rằng việc sử dụng trái phép này đã giúp Microsoft tăng vốn hóa thị trường thêm một nghìn tỷ đô la và OpenAI đạt mức định giá 90 tỷ đô la.[Complaint, trang 3, 57]

3. OpenAI & Microsoft Tự Vệ Bằng Cách Nào?

Phía bị đơn không phủ nhận việc sử dụng dữ liệu từ internet để huấn luyện mô hình, nhưng phản bác mạnh mẽ với các lập luận chính:

Dữ liệu "công khai": Dữ liệu đầu vào đều là "publicly available" – tức là không bị chặn, không cần đăng nhập hay trả phí, tương tự như cách Google vẫn thu thập dữ liệu.[Complaint, trang 4]
Mục đích "biến đổi" (transformative): Việc sử dụng dữ liệu nhằm mục đích phân tích và trích rút mẫu ngôn ngữ, không phải tái bản hay sao chép nội dung. Output của AI là kết quả sáng tạo mới, không phải copy nguyên văn, và trong nhiều trường hợp có yếu tố "chuyển hóa".[Complaint, trang 4]
Học thuyết "sử dụng hợp lý" (fair use): Quá trình này được bảo vệ bởi học thuyết "fair use" trong luật bản quyền Hoa Kỳ, cho phép sử dụng tác phẩm có bản quyền trong những giới hạn nhất định (như phê bình, học thuật, nghiên cứu) không phải xin phép và cũng không phải trả tiền.[Complaint, trang 4]

4. Các Vấn Đề Pháp Lý Trung Tâm

Tòa án sẽ phải xem xét nhiều khía cạnh phức tạp, nhưng ba điểm then chốt nhất sẽ định đoạt số phận của vụ kiện:

Output của AI có thực sự là "biến đổi" (transformative) không? Nếu AI tạo ra nội dung có ý nghĩa, mục đích mới và không gây tổn hại thị trường gốc, nó có thể được coi là fair use. Ngược lại, nếu chỉ "nhại lại" hoặc thay thế trực tiếp sản phẩm gốc, nó có thể vẫn là vi phạm.[Complaint, trang 4]
Việc huấn luyện AI có phải là hành vi sử dụng hợp lý (fair use)? NYT lập luận rằng việc huấn luyện AI không chỉ trích một phần nhỏ để bình luận hay nghiên cứu, mà dùng toàn bộ tập dữ liệu để tái cấu trúc hệ thống ngôn ngữ, đây là sử dụng mang tính khai thác thương mại, không phải sử dụng hợp lý.[Complaint, trang 4]
Microsoft có phải chịu trách nhiệm liên đới? Vì Microsoft là nhà đầu tư lớn và đối tác chiến lược, cung cấp cơ sở hạ tầng siêu máy tính Azure để huấn luyện GPT [Complaint, trang 6, 20], NYT cho rằng Microsoft đã "tiếp tay và hưởng lợi" từ hành vi vi phạm, và có thể bị xem là góp phần vi phạm bản quyền (contributory infringement).[Complaint, trang 62-63]

5. Toà đã nói gì?

Vào ngày 4 tháng 4 năm 2025, Thẩm phán Sidney H. Stein đã ban hành Ý Kiến quan trọng dài 43 trang.[Opinion, trang 1] có mục đích giải quyết yêu cầu bác đơn kiện (motion to dismiss) của các bị đơn theo Rule 12(b) Quy tắc tố tụng liên bang.

Đây không phải là bản án hay phán quyết sơ bộ, mà là quyết định tố tụng quan trọng xác định rằng nhiều cáo buộc của NYT có đủ cơ sở pháp lý để tiếp tục xét xử sau khi các bị đơn yêu cầu bác bỏ đơn kiện.[Opinion, trang 4].

NYT thắng ở đâu (yêu cầu bác bỏ của bị đơn bị từ chối):
- Tòa án từ chối yêu cầu bác bỏ toàn bộ vụ kiện của OpenAI và Microsoft đối với các cáo buộc vi phạm bản quyền trực tiếp (bao gồm cả việc huấn luyện AI) và trách nhiệm liên đới.[Opinion, trang 4]. Điều này có nghĩa là các lập luận của NYT được coi là đủ thuyết phục để cần một phiên tòa đầy đủ.[Opinion, trang 10]
- Thẩm phán chấp nhận rằng NYT đã đưa ra đủ bằng chứng về các outputs của AI giống với tác phẩm của họ để cáo buộc vi phạm bản quyền nghiêm trọng từ phía người dùng cuối, và từ đó, OpenAI/Microsoft có thể phải chịu trách nhiệm liên đới.[Opinion, trang 15]
- Các cáo buộc vi phạm bản quyền trực tiếp liên quan đến giai đoạn huấn luyện các mô hình GPT-2 và GPT-3 không bị bác bỏ vì vấn đề thời hiệu (OpenAI chưa chứng minh được NYT đã biết về hành vi vi phạm này từ hơn ba năm trước khi nộp đơn kiện).[Opinion, trang 12]
- Các cáo buộc vi phạm nhãn hiệu (trademark dilution) của các nguyên đơn khác (Daily News) cũng không bị bác bỏ.[Opinion, trang 4, 36-37]
NYT thua ở đâu (cáo buộc của NYT bị bác bỏ):
Cáo buộc "cạnh tranh không lành mạnh theo thông luật" (common law unfair competition by misappropriation) liên quan đến "tin tức nóng" (hot news) và các khuyến nghị của Wirecutter bị bác bỏ.[Opinion, trang 4, 33-35].
Cáo buộc DMCA 1202(b)(1) chống lại Microsoft bị bác bỏ vì thiếu chi tiết cụ thể về hành vi xóa CMI của Microsoft.[Opinion, trang 4, 27]
Cáo buộc DMCA 1202(b)(1) chống lại OpenAI (chỉ riêng NYT) cũng bị bác bỏ do thiếu chi tiết cụ thể về cách CMI bị xóa trong quá trình huấn luyện.[Opinion, trang 4, 25]
Cáo buộc DMCA 1202(b)(3) chống lại tất cả các bị đơn bị bác bỏ vì các outputs của AI không được coi là "bản sao đáng kể" hoặc "toàn bộ" tác phẩm.[Opinion, trang 4, 28-29]
Cáo buộc vi phạm bản quyền trực tiếp liên quan đến "tóm tắt" (abridgments) của nguyên đơn CIR bị bác bỏ vì các bản tóm tắt này không đủ tương đồng đáng kể với tác phẩm gốc về phong cách, giọng điệu, cấu trúc câu.[Opinion, trang 4, 41-42].

6. Diễn Biến Tiếp Theo và Dự Kiến Kết Quả

Vụ kiện NYT v. OpenAI & Microsoft là một phiên tòa xét xử có bồi thẩm đoàn (jury trial) [Complaint, trang 1, 68], nghĩa là một nhóm công dân bình thường sẽ là người đưa ra phán quyết cuối cùng về các vấn đề thực tế.

Giai đoạn khám phá chứng cứ (Discovery): Sau quyết định của thẩm phán, vụ kiện sẽ bước vào giai đoạn "discovery" – nơi các bên sẽ trao đổi thông tin, tài liệu, và lấy lời khai của nhau. Giai đoạn này hứa hẹn sẽ rất "gay cấn" vì nó có thể phơi bày những "bí mật" về cách AI được huấn luyện và dữ liệu nào được sử dụng.[Opinion, trang 13]
Khả năng dàn xếp: Áp lực dàn xếp ngoài tòa án sẽ rất lớn, vì các công ty công nghệ thường muốn tránh một phiên tòa công khai với rủi ro và sự không chắc chắn cao.
Thời gian: Các vụ kiện bản quyền phức tạp như thế này có thể kéo dài nhiều năm, thậm chí là hàng thập kỷ, qua các cấp tòa phúc thẩm, có thể lên đến Tòa án Tối cao Hoa Kỳ. Do đó, việc dự đoán thời điểm có kết quả cuối cùng là rất khó khăn.

7. Tác Động Đến Ngành Xuất Bản, Báo Chí và Đổi Mới AI (Liên hệ Việt Nam)

Phán quyết cuối cùng của vụ kiện này sẽ tạo ra một tiền lệ pháp lý quan trọng, định hình lại cách các công ty AI hoạt động, cách các nhà sáng tạo nội dung được bảo vệ và đền bù.

Ngành xuất bản và báo chí: Nếu NYT thắng, các công ty AI có thể bị buộc phải cấp phép hoặc trả phí bản quyền cho việc sử dụng nội dung để huấn luyện mô hình, giúp bảo vệ nguồn thu và mô hình kinh doanh của các tổ chức báo chí. Điều này có thể khuyến khích các mô hình cấp phép mới (ví dụ: cấp phép dữ liệu huấn luyện) và đảm bảo sự đền bù công bằng cho người sáng tạo.
Ngành đổi mới sáng tạo và công nghệ AI: Kết quả sẽ định hình lại cách AI được phát triển, huấn luyện và thương mại hóa. Nó có thể làm tăng chi phí phát triển AI nhưng cũng tạo ra một môi trường pháp lý rõ ràng hơn, thúc đẩy sự minh bạch và trách nhiệm giải trình trong việc sử dụng dữ liệu có bản quyền.
Bối cảnh Việt Nam: Đối với Việt Nam, một quốc gia đang thúc đẩy đổi mới AI, việc theo dõi sát sao vụ kiện này là cực kỳ quan trọng. Phán quyết sẽ cung cấp những bài học quý giá để Việt Nam xây dựng khung pháp lý về bản quyền AI phù hợp, cân bằng giữa việc bảo vệ quyền tác giả và khuyến khích sự phát triển của công nghệ AI trong nước. Nó cũng sẽ là cơ sở để các nhà sáng tạo nội dung Việt Nam bảo vệ tác phẩm của mình trước sự phát triển của AI, đặc biệt trong bối cảnh các công ty AI toàn cầu hoạt động xuyên biên giới.

Bài 3 (sẽ được đăng tiếp sau) sẽ đi sâu hơn vào những khác biệt quan trọng giữa cách AI xâm phạm bản quyền và cách con người xâm phạm, cũng như những tranh luận triết học và chính sách xoay quanh vấn đề này.

Bross & Partners, một công ty sở hữu trí tuệ được xếp hạng Nhất (Tier 1) bởi Tạp chí Legal 500 Asia Pacific, có kinh nghiệm giải quyết tranh chấp quyền sở hữu trí tuệ bao gồm nhãn hiệu (thương hiệu), quyền tác giả, sáng chế, giống cây trồng ở Việt Nam và nước ngoài. Vui lòng liên hệ: vinh@bross.vn; mobile: 0903 287 057; Zalo: +84903287057; Microsoft teams: vinh@bross.vn; Wechat: Vinhbross2603.

Nguồn Tham Khảo:

: Federal court rules artificial intelligence machines can't claim copyright authorship | Constitution Center.

https://constitutioncenter.org/blog/federal-court-rules-artificial-intelligence-machines-cant-claim-copyright-authorship : Generative Artificial Intelligence and Copyright Law - Congress.gov.(https://www.congress.gov/crs-product/LSB10922)

: Generative AI Factsheet - WIPO.

https://www.wipo.int/about-ip/en/frontier_technologies/pdf/generative-ai-factsheet.pdf : The Growing Ambiguity in AI Copyright Law: One Question, Three Different Answers - Copyright.com.

https://www.copyright.com/blog/the-growing-ambiguity-in-ai-copyright-law-one-question-three-different-answers/ : AI Meets Copyright: A Legal Tussle Unfolds in India - OpenTools.AI.

https://opentools.ai/news/ai-meets-copyright-a-legal-tussle-unfolds-in-india : US Copyright Office on AI: Human creativity still matters, legally - WIPO.

https://www.wipo.int/web/wipo-magazine/articles/us-copyright-office-on-ai-human-creativity-still-matters-legally-73696 : US judge refuses OpenAI's motion to dismiss New York Times copyright infringement claims - The Global Legal Post.

https://www.globallegalpost.com/news/us-judge-refuses-openais-motion-to-dismiss-new-york-times-copyright-infringement-claims-887263879 : EU Issues Report on Relationship Between Generative AI and Copyright - Jones Day.

https://www.jonesday.com/en/insights/2025/01/eu-issues-report-on-relationship-between-generative-ai-and-copyright : The EU AI Act and Copyright Compliance - IAPP.

https://iapp.org/news/a/the-eu-ai-act-and-copyrights-compliance : SCCR 46 - Information Statements - WIPO.

https://www.wipo.int/edocs/mdocs/copyright/en/sccr_46/sccr_46_inf_statements.docx : WIPO SCCR AI generated works discussion.

https://webcast.wipo.int/video/WIPO_IP_CONV_GE_25_2025-04-23_AM_124875 : WIPO SCCR AI generated works discussion.(https://webcast.wipo.int/video/SCCR_46_2025-04-11_AM_124834)

: AI-Generated Content and IP Rights: Challenges and Policy Considerations - Diplomacy.edu.

https://www.diplomacy.edu/blog/ai-generated-content-and-ip-rights-challenges-and-policy-considerations/ :

Đơn kiện (Complaint – The New York Times Company v. Microsoft Corporation et al, Civil Action No. 1:23-cv-11195, filed 12/27/2023): https://www.documentcloud.org/documents/24220317-new-york-times-complaint ( Bản ý kiến của Thẩm phán (Opinion – The New York Times Company v. Microsoft Corporation et al, No. 1:23-cv-11195-SHS-OTW, Doc. 514, Filed 04/04/25): https://law.justia.com/cases/federal/district-courts/new-york/nysdce/1:2023cv11195/612697/514/

Judge Stein issues opinion rejecting most of OpenAI's motion to dismiss claims by newspapers, book authors - chatgptiseatingtheworld.com.

https://chatgptiseatingtheworld.com/2025/04/05/judge-stein-issues-opinion-rejecting-most-of-openais-motion-to-dismiss-claims-by-newspapers-book-authors-judge-now-will-preside-over-all-copyright-cases-v-openai-microsoft/ : US judge refuses OpenAI's motion to dismiss New York Times copyright infringement claims - The Global Legal Post.

https://www.globallegalpost.com/news/us-judge-refuses-openais-motion-to-dismiss-new-york-times-copyright-infringement-claims-887263879 : The New York Times v. OpenAI: The Biggest IP Case Ever - Sunstein LLP.

https://www.sunsteinlaw.com/publications/the-new-york-times-v-openai-the-biggest-ip-case-ever