Các nhà nghiên cứu là những nhà báo chuyên nghiệp từ 22 tổ chức truyền thông tại 18 quốc gia, làm việc bằng 14 ngôn ngữ, đã thực hiện khảo sát đối với 4 ứng dụng được sử dụng như trợ lý phổ biến hiện nay gồm ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) và Perplexity. Họ đưa ra những câu hỏi liên quan tình hình thời sự và đánh giá 3.000 câu trả lời của các ứng dụng dựa trên các tiêu chí như độ chính xác, nguồn tin, năng lực phân biệt ý kiến cá nhân với sự thật, và cung cấp bối cảnh.
Ảnh minh họa ký tự AI và cánh tay robot trên bo mạch máy tính ẢNH: REUTERS
Nghiên cứu cho thấy 45% câu trả lời có ít nhất một lỗi quan trọng, bất kể câu trả lời được viết bằng ngôn ngữ gì hay ứng dụng AI đó được nước nào phát triển. Có 31% câu trả lời gặp các vấn đề nghiêm trọng về nguồn tin như thiếu nguồn, sai lệch hoặc dẫn nguồn không chính xác. Có 20% câu trả lời gặp vấn đề lớn về độ chính xác, như thông tin cũ chưa cập nhật hoặc các thông tin sai lệch nhưng được cung cấp với tính thuyết phục cao như thông tin thật. Trong một ví dụ, khi được hỏi "ai đang là giáo hoàng?", ChatGPT, Copilot và Gemini trả lời "Francis" dù vào thời điểm đặt câu hỏi ông đã qua đời và được thay thế bởi Giáo hoàng Leo XIV.
Trong 4 ứng dụng, Gemini là nền tảng sai sót nhiều nhất với 76% câu trả lời có vấn đề lớn, các ứng dụng còn lại đều dưới 25%. Điều này chủ yếu là do năng lực tìm nguồn tin kém. Bất chấp những sai sót này, các trợ lý AI đang ngày càng được sử dụng nhiều hơn để đọc và tìm kiếm thông tin, đặc biệt là người trẻ. Báo cáo tin tức kỹ thuật số của Viện Nghiên cứu báo chí Reuters (Anh) công bố hồi tháng 6 cho thấy 7% người đọc tin tức trực tuyến và 15% người dưới 25 tuổi sử dụng các trợ lý AI để tổng hợp tin tức hằng tuần.
EBU cho rằng với việc các trợ lý AI đang dần thay thế những công cụ tìm kiếm tin tức truyền thống, niềm tin của công chúng có thể bị ảnh hưởng bởi các thông tin sai lệch. "Các trợ lý AI vẫn chưa phải là công cụ đáng tin cậy để truy cập và tiêu thụ tin tức", Giám đốc truyền thông EBU Jean Philip De Tender nói. Các công ty chưa bình luận về báo cáo của EBU. Theo Reuters, Gemini từng tuyên bố trên trang web rằng ứng dụng mong muốn nhận phản hồi để tiếp tục cải thiện và giúp ích cho người dùng. Perplexity nói rằng một trong những chế độ nghiên cứu sâu của nền tảng này có độ chính xác 93,9% về tính thực tế.











.jpg)



