Bot Hunting là tất cả về Vibes

Cài Win online

Christopher Bouzy là cố gắng đi trước bot. Là người đứng sau Bot Sentinel, một hệ thống phát hiện bot phổ biến, anh ấy và nhóm của mình liên tục cập nhật các mô hình học máy của họ vì sợ rằng chúng sẽ bị “cũ”. Nhiệm vụ? Sắp xếp 3,2 triệu tweet từ các tài khoản bị tạm ngưng thành hai thư mục: “Bot” hoặc “Not”.

Bạn Đang Xem: Bot Hunting là tất cả về Vibes

Để phát hiện bot, các mô hình của Bot Sentinel trước tiên phải tìm hiểu hành vi có vấn đề là gì thông qua việc tiếp xúc với dữ liệu. Và bằng cách cung cấp cho mô hình các tweet trong hai danh mục riêng biệt – bot hoặc không phải là bot – mô hình của Bouzy có thể tự hiệu chỉnh và được cho là tìm ra bản chất của những gì, anh ấy nghĩ, khiến một tweet có vấn đề.

Dữ liệu đào tạo là trái tim của bất kỳ mô hình học máy nào. Trong lĩnh vực phát hiện bot đang phát triển, cách những người săn bot xác định và gắn nhãn các tweet sẽ xác định cách hệ thống của họ diễn giải và phân loại hành vi giống như bot. Theo các chuyên gia, đây có thể là một nghệ thuật hơn là một khoa học. Bouzy nói: “Vào cuối ngày, đó là sự rung cảm khi bạn dán nhãn. “Không chỉ là về các từ trong tweet, ngữ cảnh còn quan trọng.”

Anh ấy là Bot, Cô ấy là Bot, Mọi người đều là Bot

Trước khi bất kỳ ai có thể săn bot, họ cần phải tìm hiểu bot là gì — và câu trả lời đó thay đổi tùy thuộc vào người bạn hỏi. Internet đầy rẫy những người cáo buộc nhau là bot vì những bất đồng chính trị vụn vặt. Troll được gọi là bot. Những người không có ảnh hồ sơ và ít tweet hoặc người theo dõi được gọi là bot. Ngay cả giữa những thợ săn bot chuyên nghiệp, câu trả lời vẫn khác nhau.

Bouzy định nghĩa bot là “tài khoản có vấn đề” và huấn luyện Bot Sentinel để loại bỏ chúng. Giáo sư tin học và khoa học máy tính của Đại học Indiana, Filippo Menczer cho biết công cụ mà ông giúp phát triển, Botometer, định nghĩa bot là tài khoản ít nhất được kiểm soát một phần bởi phần mềm. Kathleen Carley là giáo sư khoa học máy tính tại Viện Nghiên cứu Phần mềm tại Đại học Carnegie Mellon, người đã giúp phát triển hai công cụ phát hiện bot: BotHunter và BotBuster. Carley định nghĩa bot là “một tài khoản được chạy bằng phần mềm hoàn toàn tự động”, một định nghĩa phù hợp với chính Twitter. “Bot là một tài khoản tự động — không hơn không kém,” công ty đã viết trong một bài đăng trên blog vào tháng 5 năm 2020 về thao tác nền tảng.

Cũng giống như các định nghĩa khác nhau, kết quả mà các công cụ này tạo ra không phải lúc nào cũng phù hợp. Ví dụ: một tài khoản được Botometer gắn cờ là bot có thể trở lại hoàn toàn giống con người trên Bot Sentinel và ngược lại.

Một số điều này là do thiết kế. Không giống như Botometer, nhằm mục đích xác định các tài khoản tự động hoặc một phần tự động, Bot Sentinel đang săn lùng các tài khoản tham gia vào các hoạt động trolling độc hại. Theo Bouzy, bạn sẽ biết những tài khoản này khi nhìn thấy chúng. Chúng có thể được tự động hóa hoặc do con người kiểm soát và chúng có hành vi quấy rối hoặc thông tin sai lệch và vi phạm các điều khoản dịch vụ của Twitter. “Chỉ là điều tồi tệ nhất trong số những điều tồi tệ nhất,” Bouzy nói.

Botometer được duy trì bởi Kaicheng Yang, một ứng viên tiến sĩ về tin học tại Đài quan sát Truyền thông xã hội tại Đại học Indiana, người đã tạo ra công cụ này với Menczer. Công cụ này cũng sử dụng máy học để phân loại bot, nhưng khi Yang đang đào tạo các mô hình của mình, anh ấy không nhất thiết phải tìm kiếm hành vi quấy rối hoặc vi phạm điều khoản dịch vụ. Anh ấy chỉ đang tìm kiếm bot. Theo Yang, khi anh ấy dán nhãn dữ liệu đào tạo của mình, anh ấy tự hỏi mình một câu: “Tôi có tin tweet đến từ một người hay từ một thuật toán? “

Xem Thêm : Sau trận lụt của Bão Ian,

Làm thế nào để đào tạo một thuật toán

Không chỉ không có sự đồng thuận về cách xác định bot mà còn không có tiêu chí rõ ràng hoặc tín hiệu nào mà bất kỳ nhà nghiên cứu nào có thể chỉ ra để dự đoán chính xác liệu một tài khoản có phải là bot hay không. Các thợ săn bot tin rằng việc hiển thị một thuật toán cho hàng nghìn hoặc hàng triệu tài khoản bot sẽ giúp máy tính phát hiện hành vi giống như bot. Nhưng hiệu quả khách quan của bất kỳ hệ thống phát hiện bot nào cũng bị xáo trộn bởi thực tế là con người vẫn phải đưa ra các yêu cầu đánh giá về việc sử dụng dữ liệu nào để xây dựng nó.

Lấy ví dụ như Botometer. Yang cho biết Botometer được đào tạo trên các tweet từ khoảng 20.000 tài khoản. Trong khi một số tài khoản này tự nhận là bot, phần lớn được Yang và một nhóm các nhà nghiên cứu phân loại theo cách thủ công trước khi được giải thuật bằng thuật toán. (Menczer cho biết một số tài khoản được sử dụng để đào tạo Botometer đến từ các bộ dữ liệu từ nghiên cứu được đánh giá ngang hàng khác. nói.)

cài đặt phần mềm online

Nguồn: https://trungtamsuamaytinh.com
Danh mục: TIN HỌC

Vui lòng đánh giá về dịch vụ tại nhà