Robot mới của Google đã học để nhận đơn đặt hàng bằng cách cạo mủ

[ad_1]

Cài Win online

Cuối tuần trước, Nhà khoa học nghiên cứu của Google, Fei Xia, ngồi ở trung tâm của một căn bếp không gian mở, sáng sủa và nhập lệnh vào một máy tính xách tay được kết nối với một robot một tay có bánh xe giống như một chiếc đèn sàn lớn. “Tôi đói,” anh viết. Người máy nhanh chóng phóng đến một quầy gần đó, rón rén nhặt một túi khoai tây chiên nhiều hạt với một cái kìm nhựa lớn, và quay lại chỗ Xia để mời một món ăn nhẹ.

Điều ấn tượng nhất trong cuộc trình diễn đó, được tổ chức trong phòng thí nghiệm robot của Google ở ​​Mountain View, California, là không có lập trình viên nào là con người lập trình cho robot hiểu phải làm gì theo lệnh của Xia. Phần mềm điều khiển của nó đã học cách dịch một cụm từ được nói thành một chuỗi hành động vật lý bằng cách sử dụng hàng triệu trang văn bản được lấy từ web.

Điều đó có nghĩa là một người không phải sử dụng các từ ngữ cụ thể đã được phê duyệt trước để ra lệnh, như có thể cần thiết với các trợ lý ảo như Alexa hoặc Siri. Nói với rô bốt “Tôi bị khô” và nó sẽ cố tìm cho bạn thứ gì đó để uống; nói với nó “Rất tiếc, tôi vừa làm đổ đồ uống của mình” và nó phải quay lại với một miếng bọt biển.

Được phép của Google

“Để đối phó với sự đa dạng của thế giới thực, robot cần có khả năng thích nghi và học hỏi kinh nghiệm của chúng”, Karol Hausman, nhà khoa học nghiên cứu cấp cao của Google, cho biết trong bản demo, cũng bao gồm việc robot mang một miếng bọt biển qua để làm sạch một chất tràn. Để tương tác với con người, máy móc phải học cách nắm bắt cách các từ có thể được ghép lại với nhau theo nhiều cách để tạo ra các nghĩa khác nhau. “Việc hiểu tất cả những điều tinh tế và phức tạp của ngôn ngữ là tùy thuộc vào robot,” Hausman nói.

Bản demo của Google là một bước tiến tới mục tiêu lâu dài là tạo ra các robot có khả năng tương tác với con người trong các môi trường phức tạp. Trong vài năm qua, các nhà nghiên cứu đã phát hiện ra rằng việc cung cấp một lượng lớn văn bản lấy từ sách hoặc web vào các mô hình học máy lớn có thể mang lại các chương trình với các kỹ năng ngôn ngữ ấn tượng, bao gồm cả trình tạo văn bản GPT-3 của OpenAI. Bằng cách sử dụng nhiều hình thức viết trực tuyến, phần mềm có thể chọn khả năng tóm tắt hoặc trả lời các câu hỏi về văn bản, tạo ra các bài viết mạch lạc về một chủ đề nhất định hoặc thậm chí tổ chức các cuộc trò chuyện tập trung.

Google và các công ty Big Tech khác đang sử dụng rộng rãi các mô hình ngôn ngữ lớn này cho tìm kiếm và quảng cáo. Một số công ty cung cấp công nghệ thông qua các API đám mây và các dịch vụ mới đã xuất hiện áp dụng các khả năng của ngôn ngữ AI cho các tác vụ như tạo mã hoặc viết quảng cáo. Kỹ sư Blake Lemoine của Google gần đây đã bị sa thải sau khi cảnh báo công khai rằng một chatbot được hỗ trợ bởi công nghệ này, được gọi là LaMDA, có thể có tri giác. Một phó chủ tịch Google vẫn làm việc tại công ty đã viết trong Các Nhà kinh tế học rằng trò chuyện với bot giống như “nói chuyện với một thứ gì đó thông minh”.

Bất chấp những bước tiến đó, các chương trình AI vẫn có xu hướng trở nên nhầm lẫn hoặc lặp lại những điều vô nghĩa. Các mô hình ngôn ngữ được đào tạo bằng văn bản web cũng thiếu sự hiểu biết về sự thật và thường tái tạo thành kiến ​​hoặc ngôn ngữ gây thù hận được tìm thấy trong dữ liệu đào tạo của họ, cho thấy có thể cần phải có kỹ thuật cẩn thận để hướng dẫn một cách đáng tin cậy cho rô bốt mà không cần nó chạy.

Robot do Hausman trình diễn được hỗ trợ bởi mô hình ngôn ngữ mạnh mẽ nhất mà Google đã công bố cho đến nay, được gọi là PaLM. Nó có khả năng thực hiện nhiều thủ thuật, bao gồm giải thích, bằng ngôn ngữ tự nhiên, cách đi đến một kết luận cụ thể khi trả lời một câu hỏi. Cách tiếp cận tương tự được sử dụng để tạo ra một chuỗi các bước mà robot sẽ thực hiện để thực hiện một nhiệm vụ nhất định.

cài đặt phần mềm online
[ad_2]

Vui lòng đánh giá về dịch vụ tại nhà