NVIDIA: Từ Đường Trượt Xuống Đến Đỉnh Cao Công Nghệ AI
NVIDIA: Từ Đường Trượt Xuống Đến Đỉnh Cao Công Nghệ AI
Mọi thứ bắt đầu từ một đường đua không hoàn hảo.
Được viết bởi: Hei Min, Ke Hao
Sửa đổi bởi: Hoang Gia
Hai năm trước, NVIDIA đã ra mắt chip AI H100, với hiệu suất huấn luyện mô hình lớn hơn 9 lần so với thế hệ trước. Chỉ đến cuối năm ngoái, các đối thủ như AMD và Intel mới có sản phẩm phần cứng có thể so sánh được với H100 – tính cả hệ sinh thái phần mềm, vẫn còn một khoảng cách khá xa.
Khi H100 vừa ra mắt, thị trường vốn đã không tin tưởng vào tương lai của NVIDIA. Vào thời điểm đó, ChatGPT chưa được ra mắt, ai sẽ cần một chip được tối ưu hóa cho mô hình lớn? Sau nửa năm ra mắt H100, NVIDIA lại gặp phải “thảm họa Bitcoin”, khiến giá cổ phiếu của họ giảm một nửa.
Tuy nhiên, sau sự ra mắt của ChatGPT và GPT-4, H100 trở thành nguồn cung cấp chiến lược khan hiếm, đẩy lợi nhuận gộp của NVIDIA lên 73% vào năm 2023, vượt qua Apple và thậm chí vượt qua cả Hermès.
Vào ngày 19 tháng 3, NVIDIA đã công bố B200, điều này cho thấy dù thị trường vốn đã mất niềm tin, CEO và người sáng lập NVIDIA – Jensen Huang vẫn kiên định với tương lai của AI. Ông đã đầu tư 10 tỷ đô la Mỹ – gấp đôi lợi nhuận của năm trước – vào việc phát triển chip AI thế hệ mới.
Theo dữ liệu công khai của NVIDIA, B200 có hiệu suất huấn luyện mô hình lớn hơn 4 lần so với H100 và hiệu suất suy luận tăng lên đến 30 lần.
B200 vẫn luôn được săn đón. Tại cuộc họp báo cáo tài chính vào tháng 2, Huang đã dự đoán rằng B200 sẽ bị hết hàng. Amazon, Google, Microsoft và Oracle đã đặt hàng lớn.
NVIDIA tiếp tục đầu tư vào hiệu suất tối đa. Theo lộ trình sản phẩm được công bố vào năm ngoái, GPU thế hệ tiếp theo đang được chuẩn bị và sẽ ra mắt vào năm tới. Theo phong cách hành động của Huang, hiệu suất của GPU mới chắc chắn sẽ tăng vọt.
“Như những công nhân trên dây chuyền sản xuất,” một kỹ sư kiến trúc GPU của NVIDIA mô tả công việc của mình, “mỗi khi tôi hoàn thành một phần của kiến trúc GPU, kiến trúc thế hệ tiếp theo đã sẵn sàng.”
Động Lực Từ Ngành Công Nghiệp Trò Chơi
Khi Jensen Huang thành lập NVIDIA vào năm 1993, ông chọn làm chip đồ họa cho máy tính cá nhân (PC) để đánh cược vào tương lai của ngành công nghiệp trò chơi 3D sẽ phát triển mạnh mẽ, và nhiều người sẽ sử dụng PC để chơi game. Năm đó, trò chơi Doom được phát hành, và game bắt đầu có hình ảnh 3D.
Lúc bấy giờ, việc tạo ra một bộ xử lý đồ họa PC chuyên nghiệp không hề dễ dàng. Máy tính chủ yếu được sử dụng cho công việc văn phòng, không phải để chơi game, và cũng không có nhiều trò chơi 3D để chơi. Thị trường xử lý đồ họa phức tạp bị độc quyền bởi SGI, một công ty lớn ở Thung lũng Silicon. Spielberg đã phải mua một trạm đồ họa chuyên dụng để làm bộ phim Jurassic Park.
Để nâng cao sức hấp dẫn của sản phẩm, NVIDIA đã tích hợp nhiều chức năng vào sản phẩm đầu tiên của mình, NV1, không chỉ cung cấp tính toán đồ họa 2D và 3D, mà còn quản lý xử lý âm thanh (vào thời điểm đó vẫn cần một thẻ âm thanh riêng biệt) và tích hợp cổng tay cầm game (khi đó chưa có cổng USB). Huang đã nói trong một cuộc phỏng vấn: “Người tiêu dùng PC sẽ bị sốc bởi kết quả của chúng ta.”
Nhờ vào kinh nghiệm trong ngành chip, NVIDIA đã sản xuất xong nó trong hai năm, nhưng vì không có điểm mạnh rõ ràng trong bất kỳ hướng nào, cuối cùng nó đã thất bại. Sản phẩm thứ hai mà NVIDIA muốn cứu vãn, NV2, chưa kịp hoàn thiện thì đã bị khách hàng lớn Sega bỏ rơi.
Bây giờ Huang đã khởi nghiệp được 3 năm, và tiền chỉ đủ để duy trì hoạt động kinh doanh thêm 9 tháng nữa. Ông quyết định đánh cược, tạo ra một bộ xử lý đồ họa chuyên dụng. Đó là RIVA 128, có hiệu suất cao gấp 4 lần đối thủ, bán được 1 triệu đơn vị trong 4 tháng. Sau đó, NVIDIA tiếp tục cải tiến sản phẩm mỗi 6 tháng một lần, vượt qua cuộc khủng hoảng sinh tồn và niêm yết trên thị trường chứng khoán vào năm 1999.
Đối với NVIDIA, chiến lược này tiếp tục được áp dụng khi họ ra mắt GeForce 256, tăng hiệu suất lên 5 lần so với đối thủ, một lần nữa thành công. “Khi công nghệ phát triển nhanh như vậy, nếu bạn không tái cấu trúc bản thân, bạn sẽ dần dần chết đi,” Huang đã nói trong một bài giảng kinh doanh tại Đại học Stanford vào năm 2003.
Những năm sau đó, NVIDIA duy trì nhịp độ cải tiến sản phẩm tương tự, và ngành công nghiệp trò chơi đã tạo ra môi trường thuận lợi cho họ.
Cạnh Tranh Và Khát Vọng Của NVIDIA
Trong suốt thập kỷ qua, NVIDIA đã duy trì một nhịp độ cải tiến sản phẩm tương tự, và ngành công nghiệp trò chơi đã cung cấp môi trường thuận lợi cho họ. Năm 1998, Epic Games đã phát hành Unreal Engine, giảm đáng kể rào cản phát triển trò chơi 3D, giúp nhà phát triển tập trung vào độ chân thực của trò chơi. Yêu cầu của ngành công nghiệp trò chơi không chỉ đơn giản là hiển thị hình ảnh 3D, mà còn yêu cầu mô phỏng thay đổi ánh sáng và bóng tối trong thế giới thực, và sự tương tác tự nhiên giữa nhân vật hoặc vật thể trong trò chơi – tất cả đều đòi hỏi hiệu suất đồ họa cao hơn.
NVIDIA chỉ có thể liên tục tăng hiệu suất của bộ xử lý, và kích thước vi mạch cũng càng ngày càng lớn. “Mỗi năm, hiệu suất của sản phẩm của chúng tôi đều gấp đôi so với năm trước. Nhưng mỗi năm, mọi người đều nói ‘Đó vẫn chưa đủ tốt’, tôi muốn nó mạnh hơn,” Huang nói.
Rất ít công ty có thể kiên trì. Hơn 90 công ty cạnh tranh với NVIDIA vào những năm 1990 đều đã sụp đổ. ATI cũng đã bán cho AMD, tập trung vào GPU có chi phí thấp hơn, phù hợp với nhiều kịch bản khác nhau. Intel tập trung vào lĩnh vực văn phòng của máy tính cá nhân, quan tâm hơn đến chi phí và hiệu suất năng lượng của chip, thay vì hiệu suất của bộ xử lý đồ họa.
NVIDIA theo đuổi hiệu suất tối đa đã khiến nó khó thích nghi với nhiều lĩnh vực cạnh tranh, ví dụ như chip Tegra dành cho thiết bị di động đã thất bại. Nhưng thói quen này cũng giúp nó tìm thấy không gian để phát huy trong lĩnh vực AI.
Các đối thủ cạnh tranh không có quy mô tương đương với NVIDIA. Google đã bắt đầu phát triển chip AI sớm hơn NVIDIA. Nó đã sử dụng TPU nội bộ vào năm 2015, trong khi NVIDIA chỉ ra mắt P100 dành cho học sâu vào năm 2016. Cùng năm đó, thị trường xuất hiện một loạt công ty khởi nghiệp AI chip, như Graphcore ở Anh và Cambricon ở Trung Quốc.
Tuy nhiên, do mô hình AI phổ biến lúc bấy giờ nhỏ hơn, không tiêu thụ nhiều tài nguyên tính toán, thị trường chip AI tăng trưởng nhưng không quá lớn. Theo dữ liệu của Stratview Research, quy mô thị trường chip AI toàn cầu chỉ đạt 10,8 tỷ đô la Mỹ vào năm 2021 – gần bằng 1/5 quy mô thị trường chip xe hơi và chưa đến 2% thị trường chip toàn cầu.
Không có công ty nào có thể sống sót tốt nhờ bán chip AI riêng biệt, các công ty khởi nghiệp cơ bản đều thua lỗ và cần huy động vốn khổng lồ liên tục. Có quy mô đáng kể chỉ có Google và NVIDIA, phụ thuộc vào nhu cầu nội bộ và hoạt động chính của ngành công nghiệp trò chơi để “bơm máu” cho chip AI, nhưng con đường phát triển khác nhau.
Google luôn tập trung vào việc phát triển TPU mới cho nhu cầu nội bộ. NVIDIA thì tạo ra nền tảng, thu hút nhiều nhà phát triển AI hơn nhờ CUDA miễn phí, chiếm hơn 80% thị phần chip AI.
Khi ChatGPT bùng nổ, nhờ vào ngành công nghiệp trò chơi, NVIDIA đã xây dựng được lợi thế quy mô mà đối thủ không thể sánh kịp. Hiện nay, nguồn cung cấp chip AI cao cấp chủ yếu bị hạn chế bởi công nghệ đóng gói tiên tiến CoWoS và bộ nhớ băng thông cao (HBM), NVIDIA dễ dàng hơn đối thủ trong việc lấy được năng lực sản xuất.
CoWoS tiên tiến nhất được cung cấp bởi TSMC. Do ngành công nghiệp trò chơi, NVIDIA đã hợp tác với TSMC hơn 20 năm, luôn là khách hàng lớn. Với lượng xuất hàng chip AI tăng, đến năm 2024, NVIDIA trở thành khách hàng lớn thứ hai của TSMC, chỉ sau Apple. Điều này giúp nó có cơ hội chiếm lấy năng lực sản xuất với giá thấp hơn.
HBM được cung cấp chủ yếu bởi Samsung và SK Hynix. Do card đồ họa cao cấp cần bộ nhớ băng thông cao, NVIDIA cũng luôn là khách hàng lớn của họ. Với nhu cầu tăng cao của NVIDIA về GPU, họ càng ngày càng phụ thuộc vào NVIDIA.
NVIDIA cũng tận dụng lợi thế quy mô của mình. Theo thông tin từ SemiAnalysis, NVIDIA đã đặt trước khoảng 60% năng lực CoWoS của TSMC và đặt đơn hàng lớn với ba nhà cung cấp HBM, SK Hynix, Samsung, để chiếm giữ năng lực sản xuất hạn chế, đảm bảo nguồn cung ứng của mình và đồng thời ép đối thủ.
Dựa trên hàng triệu nhà phát triển được thu hút bởi CUDA và lượng lớn khách hàng được tích lũy từ việc bán GPU, NVIDIA có thể cảm nhận sự thay đổi sớm hơn hầu hết đối thủ. Ví dụ điển hình nhất là H100 được ra mắt vào tháng 3 năm 2022, khi còn cách OpenAI ra mắt ChatGPT hơn nửa năm, đã được tối ưu hóa cho kiến trúc Transformer.
“Trong những thập kỷ qua, một phần quan trọng trong việc cải tiến chip của chúng tôi là liên lạc với nhiều khách hàng quan trọng,” Colette Kress, CFO của NVIDIA, nói tại một sự kiện gần đây. “Họ không ngạc nhiên với kiến trúc mới vì chúng tôi luôn hiểu rõ nhu cầu của họ để đưa vào kiến trúc mới.”
Lợi thế quy mô đã mang lại lợi nhuận cao cho NVIDIA. Lợi nhuận gộp của NVIDIA đạt 73% vào năm ngoái, cao hơn cả Hermès, vượt xa đối thủ. Điều này cho phép NVIDIA có đủ nguồn lực để tiếp tục đầu tư vào nghiên cứu và chiếm lấy năng lực sản xuất, mở rộng quy mô.
Đào Sâu Lòng Bảo Mật
Nhu cầu và lợi nhuận lớn từ chip AI đã thu hút nhiều đối thủ cạnh tranh. Microsoft, Meta, Google, Amazon, Tesla và các khách hàng lớn khác của NVIDIA đều đầu tư nhiều hơn vào việc phát triển chip AI, thậm chí OpenAI cũng đang chuẩn bị cho dự án chip của mình.
Đối thủ đã bắt đầu xâm nhập lãnh thổ của NVIDIA. Google đã chứng minh rằng không cần sử dụng GPU hàng đầu của NVIDIA cũng có thể huấn luyện mô hình lớn ngang ngửa GPT-4, và nó còn thành công trong việc bán TPU tự phát triển cho các đối thủ của OpenAI. Microsoft, Meta và các khách hàng lớn khác của NVIDIA cũng bắt đầu mua chip AMD rẻ hơn.
Cạnh tranh chắc chắn sẽ gay gắt hơn. Lợi nhuận cao của NVIDIA đồng nghĩa với việc đối thủ và cả khách hàng có động lực lớn để thay thế nó.
Phản ứng của NVIDIA không chỉ là ra mắt GPU hiệu suất cao hơn trong thời gian ngắn hơn. Nó còn tận dụng tình trạng khan hiếm GPU của mình để mở rộng biên giới kinh doanh, cố gắng ràng buộc khách hàng.
Vào tháng 3 năm 2022 tại GTC, NVIDIA đã ra mắt dịch vụ đám mây DXG Cloud: NVIDIA thuê lại GPU từ các công ty đám mây, tối ưu hóa chúng bằng đội ngũ của mình, sau đó cho thuê lại cho khách hàng cần sức mạnh tính toán GPU. Cách làm này giúp các nền tảng đám mây chịu trách nhiệm về chi phí xây dựng trung tâm dữ liệu, trong khi khách hàng chuyển sang NVIDIA. Tuy nhiên, Microsoft, Google, Oracle vẫn tham gia kế hoạch của NVIDIA, AWS cũng chỉ có thể chấp nhận sau nửa năm kháng cự để đổi lấy quyền mua GPU mới nhanh hơn.
Năm nay, NVIDIA tiếp tục tăng cường trong lĩnh vực phần mềm, ra mắt nền tảng phần mềm NIM, giúp người dùng dễ dàng triển khai mô hình AI tùy chỉnh và tiền huấn luyện trong môi trường sản xuất. Cũng giống như CUDA trước đây, NIM miễn phí nhưng chỉ có thể sử dụng với GPU. Theo Ben Thompson, một nhà phân tích, đây là nỗ lực của NVIDIA nhằm khóa khách hàng trong kỷ nguyên mô hình lớn. Hiện tại, kiến trúc mô hình lớn đã ổn định, lợi thế của CUDA đang suy yếu.
NVIDIA không chỉ bán GPU đơn lẻ hay các máy chủ được cấu hình từ nhiều GPU, mà còn kết hợp sản phẩm mạng trung tâm dữ liệu như Infiniband, Ethernet mà NVIDIA đã mua lại từ Mellanox vào năm 2019, cùng với CPU và GPU tự phát triển, để tạo ra giải pháp trung tâm dữ liệu toàn diện.
Jensen Huang gọi nó là “nhà máy trí tuệ nhân tạo”, ông cho rằng đây là một ngành công nghiệp hoàn toàn mới, không chỉ cung cấp dịch vụ lưu trữ và tính toán dữ liệu, mà còn biến dữ liệu thành mô hình lớn có giá trị, “điều này không khác gì động cơ điện trong cuộc cách mạng công nghiệp lần trước.”
Khi được hỏi NVIDIA nhìn nhận như thế nào về cạnh tranh từ các công ty như AMD, CFO của NVIDIA, Colette Kress, nói rằng hiện tại, NVIDIA không chỉ đơn thuần thiết kế chip để giải quyết một nhiệm vụ cụ thể, mà còn cung cấp giải pháp tính toán dưới mọi hình thức mà trung tâm dữ liệu cần, bao gồm hạ tầng tính toán, hạ tầng mạng, bộ nhớ… và một siêu máy tính hoàn chỉnh.
Từ: Stratechery Blog
1957, lần đầu tiên một vật thể nhân tạo bay vào vũ trụ, quanh trái đất trong ba tuần. Con người có thể nhìn thấy một tia sáng nhỏ lướt qua bầu trời đêm, song hành với những ngôi sao huyền thoại.
Những bước tiến như vậy vượt qua ranh giới chủng tộc và ý thức hệ, tạo ra niềm vui mừng khắp nơi trên thế giới. Nhưng không phải là niềm vui mừng của việc con người đạt được một thành tựu vĩ đại, mà theo quan sát của Hannah Arendt, một triết gia chính trị, đó là niềm vui mừng của sự nhẹ nhõm – khoa học cuối cùng đã bắt kịp kỳ vọng, “con người đã thực sự bước đầu thoát khỏi cái lồng của Trái Đất”.
Con người luôn điều chỉnh kỳ vọng của mình về thế giới dựa trên những khám phá công nghệ. Khi một ý tưởng trong tiểu thuyết khoa học trở thành hiện thực, thường là công nghệ cuối cùng đã bắt kịp kỳ vọng của con người, hoặc theo lời của Arendt, “công nghệ khẳng định và xác nhận ước mơ của con người không điên rồ hay vô ích.”
Ngày nay, việc mơ ước nhiều hơn là điều tốt đẹp. Đây cũng chính là mục đích của việc khởi động chuyên mục TECH TUESDAY của CAVOI CAVOI. Chúng tôi mong muốn trong lĩnh vực thương mại mà CAVOI thường chú trọng, định kỳ đưa ra các báo cáo về nghiên cứu khoa học và tiến bộ công nghệ mới.
Đây có thể là một tiến bộ trong nghiên cứu tiền tuyến, một quan sát về ứng dụng công nghệ, hoặc thậm chí là sự tôn vinh đối với một số công nghệ xuất sắc và cả một thời đại.
Chuyên mục này sẽ xuất phát từ góc nhìn khoa học và công nghệ, ghi lại sự đa dạng thay đổi của thế giới. Trong hành trình này, hy vọng rằng độc giả sẽ cùng chúng tôi, tăng thêm sự hiểu biết về thế giới này.
Từ khóa:
- AI
- NVIDIA
- Chip
- Trí tuệ nhân tạo
- Công nghệ