Google thường bị xem là bên thất thế trong cuộc đua generative AI, bất chấp lợi thế về hạ tầng đám mây và đội ngũ kỹ sư hùng hậu. Trong một phát biểu nổi tiếng, CEO Microsoft Satya Nadella từng mỉa mai rằng Google “đã để vuột mất cơ hội trong AI”. CEO Alphabet Sundar Pichai không ngần ngại đáp trả, công kích mối quan hệ đang căng thẳng giữa Microsoft và OpenAI:
Tuy nhiên, theo một tài liệu mà Business Insider tiếp cận độc quyền, có vẻ Google cũng không hoàn toàn “tự thân vận động” như phát biểu trên. Các nhà thầu từ Scale AI – đơn vị cộng tác cùng Google – bị cáo buộc đã sử dụng chính ChatGPT để hỗ trợ huấn luyện Bard, nay là Gemini.
Hàng nghìn phản hồi từ ChatGPT được dùng để “tinh chỉnh” Bard?
Báo cáo cho biết các nhân sự tại Scale AI đã tạo ra hàng nghìn phản hồi từ ChatGPT, sau đó so sánh với phản hồi từ Bard. Kết quả từ ChatGPT được dùng như chuẩn để điều chỉnh đầu ra của Bard, với mục tiêu giúp sản phẩm của Google tiệm cận hoặc vượt qua đối thủ.
Thậm chí, báo cáo còn cho biết nhân sự làm việc cho dự án được thưởng thêm 15% nếu phản hồi của Bard được đánh giá là vượt trội hơn GPT-4. Các quản lý tại Scale AI cũng thừa nhận ChatGPT thường tạo ra câu trả lời hiệu quả hơn, định dạng rõ ràng và chứa thông tin thú vị hơn.
Điều đáng lưu ý là điều khoản sử dụng của OpenAI nghiêm cấm việc dùng kết quả đầu ra từ ChatGPT để huấn luyện các mô hình cạnh tranh. Tuy nhiên, phía Scale AI đã bác bỏ cáo buộc:
Scale khẳng định những tài liệu Business Insider có được chỉ mô tả các bài đánh giá so sánh đầu ra giữa các mô hình – một quy trình thường gặp trong ngành – chứ không phải quá trình huấn luyện trực tiếp bằng dữ liệu từ ChatGPT.
Nếu báo cáo của Business Insider là chính xác, đây có thể được xem như “gậy ông đập lưng ông” đối với Google. Từ vị thế chỉ trích Microsoft “dựa hơi” OpenAI, giờ chính Google lại bị nghi sử dụng sản phẩm của đối thủ để tinh chỉnh mô hình của mình.
Dù Scale AI phủ nhận việc sử dụng dữ liệu ChatGPT cho huấn luyện, nhưng vụ việc một lần nữa cho thấy ranh giới giữa “tham khảo” và “sao chép” trong AI ngày càng mờ nhạt, đặc biệt khi các công ty đều chạy đua để bắt kịp GPT-4.