Mega Công ty tìm cách biến AI có khuyết điểm thành công cụ hữu ích
Mega Công ty tìm cách biến AI có khuyết điểm thành công cụ hữu ích
Steve Jobs từng so sánh máy tính với xe đạp cho não bộ – khi bạn đạp, tốc độ tăng lên gấp bội; dùng máy tính, hiệu suất sáng tạo cũng tăng gấp đôi. Trong hội nghị phát triển Microsoft Build đêm qua, CEO của Microsoft, Satya Nadella, đã nhắc lại so sánh này, nói rằng “khi ChatGPT xuất hiện, xe đạp đã trở thành động cơ hơi nước”.
Nadella cho rằng đây là một thời khắc quan trọng trong lịch sử trí tuệ nhân tạo (AI). Microsoft đang ở vị trí độc đáo để nắm bắt điều này.
Bốn năm qua, Microsoft đã đầu tư 13 tỷ đô la vào nhà phát triển ChatGPT, OpenAI, và có quyền hợp tác kinh doanh độc quyền. Microsoft đã ảnh hưởng sâu sắc đến cách hàng tỷ người trên toàn cầu làm việc thông qua hệ thống Windows, phần mềm văn phòng Office và nhiều ứng dụng khác, thu về 72,7 tỷ đô la lợi nhuận ròng năm ngoái, gấp năm lần Tencent.
Sự ra đời của ChatGPT đã thay đổi tưởng tượng của chúng ta về tương lai công việc, nhưng các mô hình ngôn ngữ lớn vẫn còn những khuyết điểm, đưa ra lời khuyên sai lệch. Microsoft, đã đi trước, đang tìm cách mở rộng lợi thế của mình.
Tại hội nghị Build, Nadella và các giám đốc điều hành của Microsoft đã trình bày một kế hoạch lớn hơn: làm thế nào để tích hợp AI vào tất cả các ngành kinh doanh cốt lõi của Microsoft, mặc dù công nghệ này vẫn còn những khuyết điểm.
Trợ lý Copilot (hành khách phụ) là từ khóa tại hội nghị Build. Theo giải thích của Microsoft, Copilot là một ứng dụng sử dụng AI hiện đại và mô hình ngôn ngữ lớn (như GPT-4) để hỗ trợ con người hoàn thành các tác vụ phức tạp.
Năm 2021, Microsoft đã phát triển Copilot, một trợ lý lập trình viên giúp viết mã, dựa trên GPT-3 của OpenAI. Sau khi ChatGPT xuất hiện, Microsoft đã áp dụng nó vào các ứng dụng như Dynamics và Office. Tại hội nghị Build năm nay, Microsoft đã mở rộng Copilot tới hệ điều hành Windows và các ngành kinh doanh cốt lõi khác.
AI đã xâm nhập vào thế giới thực một cách quy mô lớn, mỗi nền tảng truyền thông xã hội và thương mại điện tử đều sử dụng thuật toán AI để đề xuất nội dung và quảng cáo, bán hàng. Nadella nói tuần trước rằng đây là kỷ nguyên tự lái của AI – AI tự quyết định kết quả cuối cùng. Microsoft đang chuyển hướng AI từ giai đoạn tự lái sang giai đoạn hành khách phụ.
“Dù tốc độ phát triển nhanh chóng, nhưng hướng đi đúng, con người vẫn nắm giữ nhiều quyền chủ động,” Nadella nói. “Việc con người tham gia rất quan trọng để tận dụng tối đa lợi ích mà công nghệ mang lại.” Khi Copilot giảm thiểu tác động tiêu cực của AI, ngay cả khi các mô hình lớn của AI vẫn còn khuyết điểm.
Jared Spataro, người đứng đầu bộ phận Office 365 của Microsoft, gọi Copilot là một cách làm việc: “Nó được nhúng vào các chương trình như Word, Excel, PowerPoint, Outlook, Teams và làm việc cùng bạn.”
Họ nhắc nhở Copilot chỉ hỗ trợ con người làm việc, chứ không phải thay thế họ. “Nó sẽ đưa ra một ý tưởng chưa hoàn hảo, và bạn bắt đầu từ đó,” bởi vì “có lúc nó đúng, có lúc nó sai.”
Tại hội nghị Build, Yusuf Mehdi, phó chủ tịch của Microsoft, đã trình diễn Copilot hỗ trợ soạn thảo một hợp đồng pháp lý ở California, thể hiện cách nó nâng cao hiệu suất làm việc.
Sau khi mở một bản hợp đồng chung trong phiên bản cập nhật của Word, nhấp vào nút Copilot bên phải thanh công cụ, sẽ xuất hiện cửa sổ trò chuyện để người dùng nhập yêu cầu. Khi người dùng muốn biết liệu các điều khoản pháp lý có phù hợp với luật pháp California hay không, Copilot sẽ gọi plugin WestLaw để phân tích. Khi người dùng muốn sửa đổi một số điều khoản cụ thể, Copilot sẽ đọc tài liệu, tìm các đoạn cụ thể và sửa đổi, đồng thời đưa ra tóm tắt sửa đổi. “Đây là một cách mạnh mẽ hơn để soạn thảo hợp đồng pháp lý,” Mehdi nói.
Copilot cũng là phương pháp tiết kiệm chi phí để hoàn thiện hệ thống AI: Mỗi người dùng trả tiền cho Microsoft để sử dụng phần mềm, đồng thời giúp AI hoàn thành công việc của họ một cách hiệu quả hơn, cũng giúp AI trở nên hữu ích hơn.
Kevin Scott, Giám đốc kỹ thuật của Microsoft, cho biết vài năm nữa, phần mềm không có Copilot sẽ giống như phần mềm không kết nối Internet ngày nay – thật khó tin.
Thực tế, đã có công ty làm điều này. Ví dụ, hệ thống “Tự lái toàn diện” (Full Self Driving) của Tesla, bán hệ thống lái phụ trợ cho chủ sở hữu, để họ cung cấp phản hồi. Hệ thống lái phụ trợ này đã đóng góp hàng tỷ đô la doanh thu cho Tesla trong những năm qua, giúp hệ thống của họ trở nên mạnh mẽ hơn.
Microsoft đang tích hợp hệ thống Copilot vào tất cả các dịch vụ cốt lõi của mình, nhằm tránh những vấn đề mà AI không giải quyết tốt. Nadella nói rằng các nhà phát triển chỉ cần viết một lần, sau đó có thể triển khai plugin này vào các sản phẩm như ChatGPT, Bing, Dynamics 365 Copilot, Microsoft 365 Copilot, Windows Copilot, tiếp cận hàng tỷ người dùng.
Microsoft coi plugin như một cây cầu, kết nối mô hình ngôn ngữ lớn được huấn luyện từ dữ liệu công khai và dữ liệu bí mật của các công ty khác nhau. Khi người dùng đặt câu hỏi cụ thể, plugin do công ty cụ thể phát triển sẽ đưa ra câu trả lời tốt hơn.
Plugin cũng là chìa khóa để mở rộng khả năng của mô hình lớn. “Bạn có thể đã nghe, mô hình cơ bản rất mạnh, nhưng nó không thể làm mọi thứ,” Scott nói. “Ngay cả khi mô hình không hoàn chỉnh hoặc không hoàn hảo, bạn cũng có thể sử dụng plugin để tăng cường Copilot hoặc ứng dụng AI, để nó có thể làm nhiều hơn.”
Đây cũng là nỗ lực của Microsoft trong việc xây dựng hệ sinh thái AI, với cơ sở người dùng lớn đảm bảo rằng việc phát triển plugin hấp dẫn đối với các nhà phát triển.
ChatGPT đã trở thành một cổng siêu tốc, là ứng dụng tiêu dùng nhanh nhất đạt 100 triệu người dùng hàng tháng (chỉ mất hai tháng). Theo dữ liệu của trang web theo dõi lưu lượng truy cập SimilarWeb, ChatGPT đã có 1,76 tỷ lượt truy cập toàn cầu trong tháng 4, chỉ sau ba công cụ tìm kiếm Google, Baidu và Yandex. Tại hội nghị Build, Nadella đã công bố tiến bộ quan trọng đầu tiên là tích hợp Bing như một plugin vào ChatGPT Plus, và sau đó mở rộng cho tất cả người dùng ChatGPT.
Số lượng người dùng của Microsoft cũng rất lớn. Theo báo cáo thống kê của Microsoft, không tính người dùng giả mạo, có khoảng 1,5 tỷ người dùng hệ điều hành Windows và 1,2 tỷ người dùng phần mềm văn phòng Office trên toàn cầu. Microsoft và OpenAI hoàn toàn có thể tạo ra một kho ứng dụng AI như App Store.
Nếu Microsoft sử dụng Copilot để cải thiện hoạt động kinh doanh của mình để theo kịp sự cách mạng công nghệ, thì plugin thể hiện mong muốn của họ đi xa hơn trong cuộc cách mạng này.
Scott nói rằng các plugin này giống như các tác nhân số, có thể tăng cường hệ thống AI, cho phép nó hành động. Ông kết luận bằng cách kể lại ví dụ về một kỹ sư huyền thoại đã tái cấu trúc ngành công nghiệp thông qua một cập nhật nhỏ về công nghệ, và kết thúc bằng câu “Làm những điều huyền thoại.”
Dù thiếu hụt nguồn lực tính toán, Microsoft vẫn tiếp tục triển khai mô hình lớn.
Theo các báo cáo, Microsoft đang đối mặt với tình trạng thiếu hụt nguồn lực tính toán do nhu cầu tăng đột biến từ ChatGPT. Nadella cho biết công việc của ông “cảm thấy tồi tệ và đau khổ”, vì không đủ GPU. Tại hội nghị Build, các giám đốc điều hành của Microsoft không tiết lộ giải pháp cho vấn đề thiếu hụt nguồn lực tính toán trong tương lai.
Google đã chọn chuyển một phần tiêu thụ năng lượng tính toán của các ứng dụng AI (như tra cứu và suy luận) đến thiết bị của người dùng hoặc điện thoại di động. Đối với người dùng cá nhân, nguồn tính toán đáng tin cậy nhất vẫn là điện thoại di động và máy tính gia đình. Nếu không chơi game, những nguồn lực tính toán này đều dư thừa. Nếu mô hình lớn có thể biến nguồn lực tính toán dư thừa này thành hữu ích, không chỉ giúp hàng tỷ người dùng chia sẻ chi phí tính toán, mà còn thúc đẩy sự cải tiến liên tục về hiệu suất phần cứng.
Trong hội nghị phát triển I/O gần đây, Google đã công bố mô hình ngôn ngữ lớn mới PaLM2. PaLM2 có nhiều phiên bản, phiên bản nhỏ nhất là Gecko có thể chạy ngoại tuyến trên thiết bị di động.
Tham số là các quy tắc và đặc điểm được mô hình lớn rút ra từ dữ liệu lớn. Thông thường, tham số càng lớn, khả năng của mô hình lớn càng mạnh, nhưng cũng tiêu tốn nhiều năng lượng tính toán hơn. Google đã đạt được kết quả tốt hơn với ít tham số hơn. Tuy nhiên, nếu một mô hình có quá ít tham số để chạy nhanh trên điện thoại di động, khả năng của nó sẽ giảm đáng kể, và xác suất đưa ra câu trả lời không chính xác sẽ tăng lên.
Microsoft và OpenAI dường như không chọn con đường này. GPT-4 không có phiên bản có tham số nhỏ hơn, không hỗ trợ chạy ngoại tuyến trên thiết bị cuối. OpenAI và Microsoft cũng không tiết lộ kế hoạch chuyển tính toán đến thiết bị cuối. Scott đã giới thiệu hệ thống kỹ thuật Copilot tại hội nghị Build, nhấn mạnh rằng mô hình cơ bản và cơ sở hạ tầng AI của Microsoft sẽ được cung cấp thông qua Azure.
Hệ thống kỹ thuật Copilot. Nguồn: Microsoft
Theo kế hoạch hiện tại của Microsoft và OpenAI, tính toán vẫn được thực hiện tại các trung tâm dữ liệu của Microsoft, và người dùng nhận câu trả lời thông qua kết nối mạng. Họ dự đoán rằng với sự tiến bộ của thuật toán và sự cải tiến của phần cứng, lượng năng lượng cần thiết để thực hiện một phép tính sẽ giảm xuống.
OpenAI đã thực hiện nghiên cứu cho thấy rằng lượng tính toán cần thiết để huấn luyện một mạng nơron AlexNet (loại mạng nơron được sử dụng cho nhận dạng hình ảnh) vào năm 2020 đã giảm xuống còn 1/45 so với năm 2012, trong khi hiệu suất phần cứng đại diện bởi quy luật Moore chỉ mang lại tối ưu hóa chi phí 11 lần.
Greg Brockman, Chủ tịch của OpenAI, đã nói tại hội nghị Build rằng GPT-4 hiện tại rất đắt, không hoàn toàn khả dụng, nhưng tương lai sẽ thay đổi. Chỉ trong năm qua, OpenAI đã giảm 90% chi phí của ChatGPT. Ông tin rằng hiệu suất giảm chi phí tương tự sẽ tiếp tục. Scott cũng nhấn mạnh rằng những điều trông có vẻ đắt đỏ hôm nay có thể trở nên rẻ hơn vào ngày mai.
Khi Microsoft tổ chức Build, các đối thủ cạnh tranh của họ cũng công bố các tiến bộ mới.
Công ty mô hình lớn được thành lập bởi cựu nhân viên OpenAI đã thu hút 450 triệu đô la từ các nhà đầu tư như Google, Salesforce và Zoom. Thị trường xem Anthropic là đối thủ cạnh tranh mạnh nhất của OpenAI.
Google đã công bố kế hoạch sử dụng AI sinh tạo để cải tiến quảng cáo. Khi người dùng tìm kiếm, mô hình lớn của Google sẽ tạo ra tiêu đề quảng cáo có mục đích dựa trên từ khóa tìm kiếm.
Adobe đã phát hành phiên bản thử nghiệm Photoshop có tích hợp AI. Người dùng chỉ cần nhập văn bản, Adobe có thể tự động chỉnh sửa hình ảnh. Adobe cho biết tính năng mới này sẽ được phổ biến rộng rãi trong Photoshop vào nửa cuối năm nay.
Không ai có thể dự đoán chính xác cách AI sinh tạo sẽ thay đổi công việc của con người. Nhưng chắc chắn rằng, các nền tảng sản xuất quan trọng nhất trên toàn cầu đều đang đầu tư mạnh mẽ vào hướng này, khám phá từ nhiều góc độ, để nhanh chóng biến đổi trở thành hiện thực.
Từ khóa:
- Trí tuệ nhân tạo
- Microsoft
- ChatGPT
- Copilot
- Build