Sử dụng máy học một cách cẩu thả đang gây ra

[ad_1]

Kapoor và Narayanan đã tổ chức một hội thảo vào cuối tháng trước để thu hút sự chú ý về cái mà họ gọi là “khủng hoảng khả năng tái tạo” trong khoa học sử dụng máy học. Họ hy vọng có khoảng 30 người tham dự nhưng đã nhận được đăng ký từ hơn 1.500 người, một điều ngạc nhiên là họ nói rằng các vấn đề với máy học trong khoa học đang phổ biến.

Trong sự kiện, các diễn giả được mời đã kể lại rất nhiều ví dụ về các tình huống mà AI đã bị lạm dụng, từ các lĩnh vực bao gồm y học và khoa học xã hội. Michael Roberts, một cộng sự nghiên cứu cấp cao tại Đại học Cambridge, đã thảo luận về các vấn đề với hàng chục bài báo tuyên bố sử dụng máy học để chống lại Covid-19, bao gồm các trường hợp dữ liệu bị sai lệch do nó đến từ nhiều loại máy ảnh khác nhau. Jessica Hullman, phó giáo sư tại Đại học Northwestern, đã so sánh các vấn đề xảy ra với các nghiên cứu sử dụng máy học với hiện tượng các kết quả chính trong tâm lý học được chứng minh là không thể tái tạo. Trong cả hai trường hợp, Hullman nói, các nhà nghiên cứu có xu hướng sử dụng quá ít dữ liệu và đọc sai ý nghĩa thống kê của kết quả.

Momin Malik, một nhà khoa học dữ liệu tại Mayo Clinic, đã được mời phát biểu về công việc của riêng mình theo dõi việc sử dụng máy học có vấn đề trong khoa học. Ông nói, bên cạnh những lỗi phổ biến trong việc triển khai kỹ thuật, các nhà nghiên cứu đôi khi áp dụng học máy khi nó là công cụ sai cho công việc.

Malik chỉ ra một ví dụ nổi bật về việc máy học tạo ra kết quả sai lệch: Google Xu hướng Dịch cúm, một công cụ được phát triển bởi công ty tìm kiếm vào năm 2008 nhằm sử dụng máy học để xác định các đợt bùng phát dịch cúm nhanh hơn từ nhật ký các truy vấn tìm kiếm do người dùng web nhập. Google đã giành được công chúng tích cực cho dự án, nhưng nó đã thất bại một cách ngoạn mục trong việc dự đoán diễn biến của mùa cúm năm 2013. Một nghiên cứu độc lập sau đó đã kết luận rằng mô hình này đã bám vào các điều khoản theo mùa không liên quan gì đến sự phổ biến của bệnh cúm. Malik nói: “Bạn không thể chỉ ném tất cả vào một mô hình học máy lớn và xem những gì xuất hiện.

Một số người tham dự hội thảo nói rằng có thể không phải tất cả các nhà khoa học đều có thể trở thành bậc thầy về học máy, đặc biệt là do sự phức tạp của một số vấn đề được nêu rõ. Amy Winecoff, một nhà khoa học dữ liệu tại Trung tâm Chính sách Công nghệ Thông tin của Princeton, nói rằng mặc dù điều quan trọng đối với các nhà khoa học là phải học các nguyên tắc kỹ thuật phần mềm tốt, nắm vững các kỹ thuật thống kê và dành thời gian duy trì các tập dữ liệu, nhưng điều này không nên làm miền kiến thức. Bà nói: “Ví dụ, chúng tôi không muốn các nhà nghiên cứu tâm thần phân liệt biết nhiều về kỹ thuật phần mềm, nhưng ít về nguyên nhân của chứng rối loạn này. Winecoff gợi ý rằng sự hợp tác nhiều hơn giữa các nhà khoa học và các nhà khoa học máy tính có thể giúp tạo ra sự cân bằng phù hợp.

Mặc dù việc lạm dụng máy học trong khoa học là một vấn đề, nhưng bản thân nó cũng có thể được coi là một dấu hiệu cho thấy các vấn đề tương tự thường xảy ra trong các dự án AI của công ty hoặc chính phủ vốn ít cởi mở hơn với sự giám sát từ bên ngoài.

Malik cho biết anh lo lắng nhất về viễn cảnh các thuật toán AI bị áp dụng sai gây ra các hậu quả trong thế giới thực, chẳng hạn như từ chối chăm sóc y tế cho ai đó một cách không công bằng hoặc đưa ra lời khuyên không chính đáng về việc ân xá. Ông nói: “Bài học chung là không thích hợp để tiếp cận mọi thứ bằng máy học. “Bất chấp những lời hùng biện, cường điệu, những thành công và hy vọng, đó là một cách tiếp cận hạn chế.”

Kapoor ở Princeton nói rằng điều quan trọng là các cộng đồng khoa học phải bắt đầu suy nghĩ về vấn đề này. Ông nói: “Khoa học dựa trên máy học vẫn còn sơ khai. “Nhưng điều này là khẩn cấp – nó có thể gây ra những hậu quả thực sự có hại, lâu dài.”

Dịch vụ cài đặt phần mềm máy tính từ xa
[ad_2]