Các nhà khoa học MIT và Qatari đang đào tạo máy tính để phát hiện các trang tin tức giả

tháng 7 22, 2020

Các nhà nghiên cứu đã đào tạo máy tính để phát hiện các trang web thiên vị chính trị và những trang web đẩy những câu chuyện ít hơn thực tế một phần bằng cách tập trung vào ngôn ngữ cảm xúc và các mục Wikipedia ngắn hơn.
Các nhà khoa học MIT và Qatari đang đào tạo máy tính để phát hiện các trang tin tức giả
[Hình ảnh: Seanbatty / Pixabay; Hilo Tribune / Wikimedia Commons]
TÁC GIẢ STEVEN MELENDEZ3 PHÚT ĐỌC
Nhờ phương tiện truyền thông xã hội, thật dễ dàng để bắt gặp báo cáo từ các nguồn tin tức lạ trên khắp thế giới. Nhưng thường có thể khó có thể nói được những trang web nào đang trình bày sự thật thẳng thắn, có sự thiên vị chính trị và những điều dối trá hoàn toàn.

Một dự án nghiên cứu mới từ Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo của Viện Công nghệ Massachusetts và Viện Nghiên cứu Điện toán Qatar nhằm mục đích sử dụng máy học để phát hiện trang web nào tập trung vào sự thật và có nhiều khả năng đưa ra thông tin sai lệch.

Trong một tuyên bố của MIT, CSAIL Ramy Baly, tác giả chính của một bài báo về công nghệ, cho biết, nếu một trang web đã đăng tải tin tức giả trước đó, rất có thể họ sẽ làm lại.

[Hình ảnh: lịch sự của MIT CSAIL]
Công cụ này sử dụng một kỹ thuật học máy được gọi là máy vectơ hỗ trợ để học dự đoán cách các tổ chức truyền thông sẽ được phân loại bởi Media Bias / Fact Check , một tổ chức theo dõi mức độ nội dung thực tế và thiên vị chính trị trong hàng ngàn trang web tin tức. Nó tính đến nội dung thực tế của các bài viết trên các trang web, cũng như các yếu tố bên ngoài như sự hiện diện Twitter của trang web, cấu trúc của tên miền trực tuyến của nó và cách nó được mô tả trên Wikipedia.
Một nguồn thông tin hữu ích nhất để đánh giá cả thực tế và thiên vị hóa ra lại là những bài báo thực tế, ông nói, Preslav Nakov, một nhà khoa học cao cấp tại QCRI, cho biết trong một cuộc phỏng vấn.

Có lẽ không có gì đáng ngạc nhiên, các trang web ít thực tế có nhiều khả năng sử dụng ngôn ngữ cường điệu và cảm xúc hơn so với các trang web báo cáo nội dung thực tế hơn. Ngoài ra, Nakov nói, các nguồn tin tức với các mô tả dài hơn trên Wikipedia có xu hướng đáng tin cậy hơn. Từ điển bách khoa trực tuyến cũng có thể cung cấp các dấu hiệu bằng lời nói rằng các nguồn tin tức bị nghi ngờ, chẳng hạn như các tham chiếu đến thiên vị hoặc xu hướng truyền bá các thuyết âm mưu, ông nói.

Ví dụ, nếu bạn, mở trang Wikipedia của Breitbart , bạn sẽ đọc những thứ như 'không chính xác', 'bài ngoại', 'phân biệt chủng tộc', Nott Nakov nói.

Một cách riêng biệt, các trang web có tên miền và cấu trúc URL phức tạp hơn thường kém tin cậy hơn so với các trang web có đơn giản hơn. Một số URL phức tạp hơn thuộc về các trang web có địa chỉ dài hơn về cơ bản mạo danh những cái quen thuộc với tên miền đơn giản hơn.

[Hình ảnh: lịch sự của MIT CSAIL]
Các nhà nghiên cứu tập trung vào việc theo dõi độ tin cậy của toàn bộ các cửa hàng tin tức thay vì các câu chuyện riêng lẻ một phần với hy vọng rằng các thuật toán có thể tốt hơn trong việc xử lý toàn bộ công việc thay vì các bài đăng ngắn. Một hệ thống phân loại toàn bộ trang web cũng có thể hữu ích trong việc giúp người đọc đánh giá nội dung mới từ trang web, ngay cả khi nó chưa được nghiên cứu bởi những người kiểm tra thực tế của các loại mạng xã hội như Facebook đang ngày càng sử dụng. Người kiểm tra thực tế cũng có thể sử dụng xếp hạng của thuật toán để đánh giá các trường hợp trong đó các trang web khác nhau báo cáo khác nhau về cùng một chủ đề, Nakov gợi ý.
Khi được giới thiệu với một cửa hàng tin tức mới, hệ thống này có độ chính xác khoảng 65% trong việc phát hiện xem nó có mức độ thực tế cao, trung bình hay thấp và chính xác 70% trong việc phát hiện xem nó nghiêng về bên trái, phải hay giữa hay không. Các nhà nghiên cứu có kế hoạch trình bày bài báo trong một vài tuần tại Hội thảo Phương pháp thực nghiệm trong xử lý ngôn ngữ tự nhiên ở Brussels.

Nghiên cứu khác xa với dự án duy nhất đang diễn ra liên quan đến việc chống lại thông tin sai lệch. Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến đã tài trợ cho nghiên cứu phát hiện hình ảnh và video giả mạo , và các nhà nghiên cứu khác đã đào sâu vào cách dạy mọi người phát hiện ra tin tức nghi ngờ.

Trong tương lai, các nhà nghiên cứu của MIT và QCRI có kế hoạch thử nghiệm hệ thống được đào tạo bằng tiếng Anh trên các ngôn ngữ khác và xem nó có giá trị như thế nào với các thành kiến khác ngoài trái và phải, chẳng hạn như phát hiện tin tức tôn giáo hoặc thế tục trong thế giới Hồi giáo. Nhóm này cũng có kế hoạch cho một ứng dụng có thể cung cấp cho người dùng cái nhìn về những câu chuyện tin tức từ nhiều khía cạnh chính trị.

Tìm kiếm Blog này

Thay đổi công nghệ mới

Các nhà khoa học MIT và Qatari đang đào tạo máy tính để phát hiện các trang tin tức giả

Nhận xét

Đăng nhận xét

Bài đăng phổ biến từ blog này

Facebook có thể vi phạm luật pháp EU bằng cách sử dụng dữ liệu bóng cho quảng cáo

Microsoft điều chỉnh lại tầm nhìn năng suất của mình cho kỷ nguyên phân tâm công nghệ

Câu chuyện bên trong về cuộc đấu tranh của Reddit để đối phó với những người dùng thân Trump độc hại nhất