Tại Sao Các Nhà Khoa Học Dữ Liệu Mong Đợi Lời Khuyên Thiếu Sót Từ Google Bard?

Liu

30 tháng 7

Published 22 tháng 2

tai-sao-cac-nha-khoa-hoc-du-lieu-mong-doi-loi-khuyen-thieu-sot-tu-google-bard

Trong một sự kiện quảng cáo gần đây, Google đã mang đến cho thế giới cái nhìn đầu tiên về Bard, nỗ lực của gã khổng lồ công nghệ nhằm đánh bật chatbot AI vô cùng phổ biến, ChatGPT. Và mặc dù sự kiện này có khả năng được thiết kế để tạo tiếng vang xung quanh bước đột phá của Google vào trò chuyện AI, nhưng nó nhanh chóng trở thành minh chứng công khai về những sai sót có thể xảy ra với các dịch vụ trò chuyện bí ẩn dựa trên AI này.

Báo cáo đầu tiên của Reuters, Bard đã đưa ra phản hồi không chính xác, dẫn đến giá cổ phiếu của Alphabet (GOOGL) giảm tới 9% vào ngày biểu tình. Đối với nhiều người trong cộng đồng dữ liệu, điều này không gây ngạc nhiên; đây là lý do tại sao.

Có gì sai với quảng cáo của Bard?

Vấn đề: Khi được hỏi người ta có thể chia sẻ thông tin gì với một đứa trẻ 9 tuổi về Kính viễn vọng Không gian James Webb (JWST) tuyệt đẹp, Bard đã gán sai thông tin đó là “. . .đã từng chụp những bức ảnh đầu tiên về một hành tinh bên ngoài hệ mặt trời của Trái đất”. Phản ứng này nhanh chóng được xác định là không chính xác, vì những bức ảnh đầu tiên về một hành tinh bên ngoài hệ mặt trời của Trái đất được chụp vào năm 2004 bởi Kính viễn vọng Rất lớn của Đài thiên văn Nam châu Âu (VLT).

Google Bard là gì?

Giám đốc điều hành Google Sundar Pichai gọi Bard là “dịch vụ AI đàm thoại”. Nếu điều đó nghe có vẻ quen thuộc, thì có thể bạn đã gặp một trong nhiều người có ảnh hưởng trực tuyến nói về ChatGPT trong vài tháng qua.

Ý kiến rất khác nhau về bước đột phá AI này. Những người ủng hộ thảo luận về các kế hoạch mang tính cách mạng hoặc chia sẻ sự phấn khích để tận dụng chatbot để phát triển doanh nghiệp một cách nhanh chóng. Một trong những trường hợp sử dụng phổ biến nhất cho ChatGPT là cơ hội tự động hóa các tác vụ lặp đi lặp lại. Mặt khác, các nhà phê bình đã bày tỏ quan điểm sai lầm về khả năng của nó — cho rằng chức năng của chatbot thay thế nghiên cứu và tư duy phản biện của con người. Google Bard sẽ châm ngòi cho những cuộc trò chuyện tương tự.

LaMDA là gì?

Bard của Google dựa trên LaMDA, một mô hình ngôn ngữ mà công ty đã triển khai vào năm 2021, bản thân mô hình này được xây dựng trên kiến trúc mạng nơ-ron nguồn mở phổ biến của công ty, Transformer.

Thật thú vị, LaMDA đã được đào tạo bằng cách sử dụng đối thoại, cho phép nó học cách phản hồi các cuộc trò chuyện của con người một cách tự nhiên hơn so với các mô hình ngôn ngữ trước đó. (Nếu cái tên LaMDA nghe có vẻ quen thuộc, có thể bạn nhớ lại khi một kỹ sư của Google tin rằng LaMDA đã trở nên có tri giác.)

Được công bố vào tháng 5 năm 2021, buổi ra mắt LaMDA của Google là cơ hội để thảo luận về lợi ích của mô hình của họ, với thông báo đặc biệt tập trung vào tính thực tế của các phản hồi. Hai năm sau, trong buổi công bố của Bard, các phóng viên nhanh chóng phát hiện ra một sai sót thực tế. Điều này có ý nghĩa gì đối với việc triển khai của Google? Chúng ta phải chờ xem như thế nào.

Google Bard khác với LaMDA như thế nào?

Vì hai âm thanh giống nhau như thế nào, một số người đã hỏi, điều gì làm cho sản phẩm mới này khác biệt? Google tuyên bố một cách khiêm tốn rằng dịch vụ mới của họ bổ sung “bề rộng kiến thức của thế giới” vào các kỹ năng đàm thoại vốn đã rất ấn tượng của LaMDA. Nó cũng hứa hẹn sẽ nâng cao khả năng của mô hình để cung cấp nhiều hướng dẫn và nghiên cứu hơn so với một chatbot thông thường. Tóm lại, Bard dựa vào LaMDA. LaMDA không dựa vào Bard.

Cũng lưu ý rằng Google có kế hoạch mở dịch vụ cho các nhà phát triển thông qua liên kết API Bard, khiến nó trở nên thú vị hơn so với một chatbot thông thường. Và mặc dù người dùng đã có thể thúc đẩy các cuộc trò chuyện diễn ra tự do với LaMDA, nhưng Google Bard hứa hẹn sẽ nâng cao cuộc trò chuyện bằng cách đưa vào cùng một thông tin mà công ty cung cấp với dịch vụ Google Tìm kiếm có mặt khắp nơi của mình.

Ngược lại, sai lầm thực tế của Bard không nên làm giảm giá trị hứa hẹn của dịch vụ mới này. Kết quả tìm kiếm của Google không bao giờ hứa hẹn độ chính xác tuyệt đối. Người tìm kiếm nên luôn luôn xem xét các nguồn của họ. Thực tế đó vẫn còn, ngay cả khi đã phát hành một chatbot ấn tượng.

Cách sử dụng Google Bard

Các nhà khoa học dữ liệu không phải là những người duy nhất hào hứng sử dụng Google Bard. Pichai tưởng tượng dịch vụ này sẽ giúp ích cho bất kỳ ai sử dụng Google. Lời hứa của anh ấy? Bard đơn giản hóa các chủ đề phức tạp. Hãy xem xét các trường hợp sử dụng sau:

Tìm câu trả lời đơn giản cho câu hỏi phức tạp

Hãy tưởng tượng bạn muốn có một kỳ nghỉ. Tìm kiếm hiện tại của Google dễ dàng trả lời các câu hỏi khi bạn biết nơi bạn muốn đến và giúp bạn tìm giá cho các ngày cụ thể. Nhưng Pichai ví chatbot mới này giống như một cuộc trò chuyện với một người bạn.

Bạn sẽ có thể bắt đầu một cuộc trò chuyện về một dự án tại nơi làm việc, chia nhỏ một bài báo nghiên cứu phức tạp thành những bài học quan trọng nhất, sau đó hỏi các đề xuất về việc áp dụng những bài học đó trong vài tuần tới.

Bard cũng có thể tăng cường đào tạo cho các nhóm bán hàng, đưa ra các đề xuất về bữa tối khi bạn tiếp đón một người kén ăn và thảo luận về những phần hay nhất của bộ phim Marvel mới nhất. Google đã triển khai AI để tăng cường các sản phẩm của mình, nhưng quá trình này sẽ mở rộng khi chatbot mới phát triển. Tất cả điều này và bạn sẽ không bao giờ phải rời khỏi công cụ tìm kiếm quen thuộc của mình.

Tự động hóa các tác vụ thường xuyên

Google đã tích hợp với các thị trường, cho phép bạn mua hàng và đặt chỗ trực tiếp từ giao diện của họ. Google Bard có thể cho phép bạn thực hiện việc này thông qua cuộc trò chuyện. Alexa có thể bắt đầu danh sách phát Spotify của bạn, nhưng hãy tưởng tượng làm việc song song với AI để sắp xếp nhạc nền cho chuyến đi tiếp theo của bạn trong khi bạn lái xe đi làm.

Tham gia một cuộc trò chuyện cộng đồng

Các mạng xã hội thường thúc đẩy các cuộc tranh luận trực tuyến, thưởng cho những người gây tranh cãi và cung cấp cho những kẻ troll tiếp xúc nhiều hơn. Điều này dẫn đến nhiều người từ bỏ các nền tảng phổ biến từ thời đại 2010. Google Bard có thể sắp xếp các cuộc trò chuyện cho các cộng đồng thích hợp, kết nối những bộ óc tò mò trong khi lọc ra lời nói căm thù và thông tin sai lệch.

Những cạm bẫy tiềm ẩn khi sử dụng Google Bard

Không có gì ngạc nhiên khi chatbot mới này đã thu hút được nhiều sự chú ý, ít nhất là một phần, vì tiềm năng ứng dụng rộng lớn của nó. Đối với một người đam mê board game cũng thú vị không kém đối với một người quản lý dự án. Pichai bỏ qua một số điểm quan trọng trong thông cáo báo chí của mình và những điều này trở nên rõ ràng hơn với sự phân bổ sai gần đây của nhiếp ảnh không gian phi thường. Dưới đây là một vài điểm nữa để xem xét.

Chatbots không cần phải nói sự thật

Các tác nhân trò chuyện phổ biến như ChatGPT có hướng dẫn đạo đức tích hợp. Ví dụ: nó không nên tạo ra những trò đùa lố bịch hoặc cố tình đánh lừa bạn. Nhưng điều đó không phải lúc nào cũng đúng với hệ thống trò chuyện AI.

Hãy xem nghiên cứu gần đây về việc sử dụng AI trong trò chơi bàn cờ Ngoại giao, tập trung vào khả năng đàm phán và hình thành liên minh. Nghiên cứu cũng nhấn mạnh việc sử dụng các hình phạt đối với bất kỳ bên nào thất hứa. Thật đáng khích lệ khi thấy các nhóm tập trung vào việc xây dựng các chiến lược AI nhằm thúc đẩy giao tiếp đáng tin cậy, nhưng hãy cân nhắc điều đó có ý nghĩa gì đối với các nhà khoa học dữ liệu thiếu thận trọng.

Chúng ta càng tiến xa hơn với công nghệ chatbot, chúng ta càng nên xem xét động cơ của những người cung cấp dịch vụ. Trong các tình huống diễn ra đàm phán (dịch vụ tài chính, giao dịch, đàm phán lương), chatbot có thể cố tình đánh lừa người dùng.

Học máy không phủ nhận sự thiên vị

Cộng đồng khoa học dữ liệu đã nhận thức rõ về những thành kiến trong học máy. Giống như đối tác con người của chúng, các chatbot trò chuyện thường xuyên thể hiện xu hướng xác nhận và xu hướng định kiến. Google Bard chắc chắn sẽ giải thích cho một số vấn đề này, nhưng chúng ta nên lường trước các sai sót từ các ứng dụng mới nhất của bên thứ ba khi được phát hành.

Và, trong khi Google thuê một số nhà khoa học dữ liệu giỏi nhất thế giới, gã khổng lồ công nghệ không phải không có lỗi. Hãy nhớ rằng nhà nghiên cứu đạo đức đã đưa ra một số câu hỏi bất tiện? Cô bày tỏ lo ngại về chi phí môi trường, các mô hình khó hiểu, nỗ lực nghiên cứu sai hướng và khả năng truyền bá thông tin sai lệch.

Tất cả các tập dữ liệu đều có lỗi

Về cốt lõi, chatbot dựa trên các mô hình xử lý ngôn ngữ tự nhiên (NLP). Nhưng không có bộ dữ liệu nào đại diện cho sự thật đầy đủ. Học sâu có thể giúp cung cấp các câu trả lời tự nhiên hơn cho các đối tác trò chuyện và tốt nhất là giảm thiểu một số hạn chế của bộ dữ liệu. Tuy nhiên, bất chấp những gì người có ảnh hưởng yêu thích của bạn có thể nói, không có chatbot nào là Chúa.

Để trích dẫn George Box, “. . . không cần đặt câu hỏi 'Mô hình có đúng không?'. Nếu 'sự thật' là 'toàn bộ sự thật', thì câu trả lời phải là 'Không'. Câu hỏi quan tâm duy nhất là 'Mô hình có sáng sủa và hữu ích không?'”.

Cách truy cập Google Bard

Google đã cung cấp Bard cho “những người thử nghiệm đáng tin cậy”, nhưng công ty hứa hẹn sẽ phát hành rộng rãi hơn trong vòng vài tuần. Điều đó có nghĩa là các nhà phát triển sẽ có quyền truy cập vào phiên bản nhẹ của Google trước khi tuyết tan ở bán đảo phía trên của Michigan.

Điều đó có ý nghĩa gì đối với các bản cập nhật cho Google Tìm kiếm? Chúng ta sẽ phải chờ xem. Google đã sử dụng AI để cải thiện kết quả tìm kiếm trực quan. Tôi hy vọng sẽ thấy nhiều thay đổi trong năm nay và năm tới. Tôi mong muốn khám phá tiềm năng của Bard như một công cụ cho doanh nghiệp.

Làm cách nào tôi có thể bắt đầu với Khoa học dữ liệu cho Bard?

Nếu bạn muốn bắt đầu với khoa học dữ liệu, chúng tôi đã xếp hạng một số khóa học yêu thích của mình . Chúng khác nhau về độ sâu và phạm vi, vì vậy hãy chắc chắn tìm thấy tùy chọn phù hợp với trình độ kỹ năng của bạn. Những người đang cân nhắc chuyển đổi nghề nghiệp có thể cân nhắc học ngành này từ đầu, mặc dù nhiều người chọn học một ngôn ngữ lập trình như Python làm điểm khởi đầu cho lĩnh vực này.

Học khoa học dữ liệu từ đầu

Tất cả những người mới bắt đầu nên làm quen với toán học, cụ thể là thống kê cho khoa học dữ liệu. Những kỹ năng này phục vụ nhà khoa học trong lập trình, đánh giá dữ liệu, kể chuyện dữ liệu và hầu hết các phần khác của công việc. Việc xác định mức độ liên quan của một xu hướng dữ liệu dựa trên việc hiểu ý nghĩa thống kê như một điểm khởi đầu.

Học lập trình như một nhà khoa học dữ liệu

Khoa học dữ liệu bao gồm nhiều chức năng khác nhau cho một doanh nghiệp, vì vậy các nhà khoa học dữ liệu học một số ngôn ngữ. Các kỹ năng phổ biến bao gồm Python, R, Hadoop, SQL và Apache Spark. Để tìm hiểu sâu hơn về chủ đề này, chúng ta cũng đã thảo luận về cách học khoa học dữ liệu.

Triển khai AI như một chuyên gia

Đối với các chuyên gia quan tâm đến việc áp dụng học máy, xử lý ngôn ngữ tự nhiên và các kỹ thuật hiện đại khác trong lĩnh vực của họ, hãy xem Chương trình chuyên nghiệp về trí tuệ nhân tạo của Stanford.

Kết luận

Nếu bạn hào hứng với Google Bard, bạn không đơn độc. Nếu bạn lo lắng về điều đó, sợ hãi hoặc bối rối vì điều đó, thì bạn không đơn độc. Những người đam mê dữ liệu hiểu cách chatbot cung cấp lời khuyên của nó và chúng ta có thể mong đợi các lỗi tương tự từ bất kỳ công nghệ nào dựa trên các mô hình ngôn ngữ lớn trong tương lai.

Copyright Disclaimer:

This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.

Tuyên bố miễn trừ bản quyền:

Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Tham khảo các bài viết cùng chủ đề:

1. 7 Công Cụ Hỗ Trợ AI Để Nâng Cao Năng Suất Cho Các Nhà Khoa Học Dữ Liệu

2. Khóa Học AI Miễn Phí Cho Người Mới Bắt Đầu

3. Trí Tuệ Nhân Tạo, Học Máy và Học Sâu Là Gì?

4. Trở Thành Một Nghệ Sĩ AI Bằng Cách Sử Dụng Cụm Từ Và Khuếch Tán Ổn Định

5. Giới Thiệu Về Thuật Toán Hill Climbing Trong AI

Weekly Study | Kênh Tri Thức Việt