Máy chủ AI làm mát bằng chất lỏng phải đối mặt với tình trạng tắc nghẽn
Sep 30, 2024
Để lại lời nhắn
Với sự gia tăng số lượng chip Blackwell xuất xưởng, mức độ sẵn lòng sử dụng hệ thống làm mát bằng chất lỏng của khách hàng cũng sẽ tăng lên.
Những người trong ngành báo cáo rằng việc cung cấp các thiết bị ngắt kết nối nhanh phổ quát (UQD) cho các giải pháp làm mát bằng chất lỏng đang trở nên khan hiếm, điều này có thể trở thành nút thắt lớn cho sự phát triển của việc làm mát bằng chất lỏng máy chủ AI.
Các nhà sản xuất máy chủ ODM cho biết chip Blackwell AI của Nvidia, bao gồm B100 và B200, sẽ bắt đầu xuất xưởng trong năm nay, trong khi giải pháp GB200 sẽ không được đưa vào sản xuất hàng loạt cho đến cuối năm 2024 hoặc 2025. Hầu hết khách hàng của B100 và B200 vẫn sử dụng thiết kế làm mát không khí Tuy nhiên, các nhà sản xuất ODM báo cáo tỷ lệ thâm nhập làm mát bằng chất lỏng tiếp tục gia tăng, dự đoán rằng mức độ sẵn sàng áp dụng làm mát bằng chất lỏng của khách hàng cũng sẽ tăng lên cùng với sự gia tăng các lô hàng chip Blackwell.

▲ Máy chủ AI làm mát bằng chất lỏng
I Mở rộng công suất để đáp ứng nhu cầu làm mát bằng chất lỏng ngày càng tăng
Các công ty liên quan đang mở rộng sản xuất để chào đón kỷ nguyên mới của tản nhiệt chất lỏng. Nhà sản xuất mô-đun nhiệt Amlogic có kế hoạch tăng công suất sản xuất tấm làm mát bằng nước hàng tháng từ 30,000 lên 300,000 chiếc.
Auras đã thành lập một nhà máy mới ở Thái Lan để giải quyết những lo ngại và nhu cầu địa chính trị của khách hàng. Nhà máy này dự kiến sẽ bắt đầu sản xuất hàng loạt vào quý 3. Ngoài việc mở rộng năng lực sản xuất tấm làm mát tại địa phương, Auras còn có kế hoạch sản xuất các bộ phân phối làm mát (CDU) và ống phân phối chất lỏng làm mát (CDM) tại địa phương, với công suất dự kiến hàng tháng khoảng 2,000-3,{{2 }} bộ.
Nhà sản xuất mô-đun nhiệt AVC cho biết trong báo cáo thu nhập gần đây của mình rằng công suất sản xuất mô-đun tấm làm mát hàng tháng của họ ở Trung Quốc và Việt Nam là khoảng 115.{1}} chiếc, nghĩa là sản lượng hàng tháng là khoảng 420.{3}} chiếc khi tính toán bằng tấm làm mát.
AVC có kế hoạch mở rộng công suất thêm 50% vào cuối năm nay. AVC cũng có kế hoạch tăng công suất sản xuất hàng tháng đối với CDU lên 1,000 đơn vị và đối với CDM lên 30,000 bộ. AVC nhấn mạnh công suất dự kiến này có thể được điều chỉnh linh hoạt dựa trên nhu cầu đặt hàng của khách hàng.
Công ty Công nghệ Nhiệt Goli Thermal Treatment đang mở rộng công suất tại nhà máy Zhongli ở Đài Loan do nhu cầu làm mát bằng chất lỏng của khách hàng ngày càng tăng. Đến cuối quý 3, công suất hàng tháng cho CDM dự kiến sẽ tăng từ 1,000 đơn vị lên 2,000 đơn vị và đến cuối năm lên 4,{{5} } đơn vị, với sản lượng CDU hàng năm cũng dự kiến sẽ đạt 2,000 đơn vị vào cuối năm nay.
Các nhà sản xuất này đặt kỳ vọng cao vào nhu cầu làm mát bằng chất lỏng, chủ yếu là do hiệu quả tính toán và tiêu chuẩn PUE của trung tâm dữ liệu ở Trung Quốc và EU, nhưng yếu tố quan trọng nhất là Nvidia dỡ bỏ các hạn chế tự áp đặt về thông số nhiệt đối với các nhà sản xuất chip.
II Việc làm mát bằng chất lỏng tăng trưởng nhanh chóng dẫn đến thiếu hụt UQD
Khi ngành công nghiệp háo hức chờ đợi sự xuất hiện của kỷ nguyên làm mát bằng chất lỏng, UQD đã trở thành nút thắt lớn nhất đối với sự phát triển. Các nhà sản xuất mô-đun nhiệt đã chỉ ra rằng nguồn cung UQD gần đây đã trở nên khan hiếm. Mặc dù thị phần làm mát bằng chất lỏng hiện tại chỉ ở mức một con số, nhưng nếu tăng lên hai con số trong tương lai, UQD có thể trở nên khó mua.
Các nhà cung cấp của UQD chủ yếu đến từ Châu Âu và Hoa Kỳ, chẳng hạn như các công ty lớn của Mỹ là Parker Hannifin và CPC, Staubli International của Thụy Sĩ, Danfoss của Đan Mạch và Cejn của Thụy Điển. Gã khổng lồ linh kiện kết nối Đài Loan Lotes cũng đang tích cực tham gia thị trường và đã bắt đầu giao hàng mẫu.
Chủ tịch Anbo Technology, Liang Zhijian, đã chỉ ra rằng vì việc làm mát bằng chất lỏng chủ yếu nhằm mục đích tránh rò rỉ và UQD là thành phần dễ bị rò rỉ nhất nên nguồn cung UQD bị hạn chế nhất trong số các thành phần làm mát bằng chất lỏng. Đây không chỉ là vấn đề kỹ thuật; các nhà sản xuất có liên quan cũng có các biện pháp bảo vệ bằng sáng chế và Anbo Technology đang nghiên cứu các cách để vượt qua các rào cản bằng sáng chế này.
Những người trong ngành đã lưu ý rằng mặc dù các nhà sản xuất UQD có các biện pháp bảo vệ bằng sáng chế nhưng họ cũng phải trải qua nhiều lần xác nhận, bao gồm chứng nhận OCP và xác nhận của khách hàng, những việc này tốn nhiều thời gian và công sức. Hơn nữa, các nhà sản xuất châu Âu và Mỹ hiện tại không có ý định mở rộng công suất, điều này sẽ trở thành nút thắt lớn cho sự phát triển nhanh chóng của hệ thống làm mát bằng chất lỏng.
Supermicro là một trong những nhà sản xuất tản nhiệt bằng chất lỏng phát triển nhanh nhất. Người sáng lập kiêm Giám đốc điều hành Liang Jianhou chỉ ra rằng hệ thống làm mát bằng chất lỏng chỉ chiếm 1% thị trường máy chủ trong 30 năm qua, nhưng ông ước tính đến năm 2025, tỷ lệ thâm nhập sẽ tăng lên 30%.
III Làm mát bằng chất lỏng như một giải pháp tiềm năng; Sự bùng nổ AI gây áp lực lên lưới điện
Sự phát triển nhanh chóng của trí tuệ nhân tạo tổng hợp đã thúc đẩy sự mở rộng chưa từng có của các trung tâm dữ liệu, làm dấy lên mối lo ngại về tác động của chúng đối với lưới điện. Những cơ sở sử dụng nhiều năng lượng này có thể dẫn đến mất điện và tăng chi phí năng lượng. Theo ước tính của Viện Nghiên cứu Điện lực, đến năm 2030, các trung tâm dữ liệu có thể tiêu thụ 9% lượng điện của Mỹ, gấp đôi con số hiện tại. Mức tiêu thụ điện của một trung tâm dữ liệu lớn tương đương với mức tiêu thụ điện của hàng trăm nghìn hộ gia đình.
Nhu cầu năng lượng ngày càng tăng từ trí tuệ nhân tạo đặc biệt đáng lo ngại. Các mô hình AI ban đầu tiêu thụ năng lượng gấp 10 lần so với tìm kiếm trên Google, trong khi các chip mới hơn thậm chí còn yêu cầu nhiều năng lượng hơn. Các chuyên gia cảnh báo rằng sự phát triển của trí tuệ nhân tạo trong tương lai có thể bị hạn chế bởi khả năng tạo ra đủ năng lượng của chúng ta.
Một số quốc gia phải đối mặt với những thách thức nghiêm trọng. Ví dụ: đến năm 2026, Ireland có thể dành 30% điện năng cho các trung tâm dữ liệu. Tại Mỹ, mức tiêu thụ điện của trung tâm dữ liệu tập trung ở 15 bang, trong đó Texas và Virginia là cao nhất. California đang trong tình trạng nguy cấp, với các trung tâm dữ liệu mới dự kiến sẽ tạo ra nhu cầu điện vượt quá nhu cầu của các nhà máy điện hạt nhân.
Trung tâm dữ liệu IV: Mức tiêu thụ năng lượng lớn và sự gia tăng của hệ thống làm mát bằng chất lỏng
Nhu cầu tính toán của trí tuệ nhân tạo đang làm tăng nhiệt độ máy chủ và lượng khí thải carbon, dẫn đến nhu cầu về hệ thống làm mát tăng đáng kể. Hệ thống làm mát chiếm 40% tổng mức tiêu thụ điện năng của trung tâm dữ liệu, khiến chúng trở thành nguồn tiêu thụ điện năng lớn thứ hai sau chính các máy chủ. Thị trường làm mát máy chủ toàn cầu được dự đoán sẽ tăng từ 20 tỷ USD vào năm 2024 lên 90 tỷ USD vào năm 2027. Thị trường hệ thống làm mát bằng chất lỏng trong trung tâm dữ liệu dự kiến sẽ tăng từ 1% lên 22%, với giá trị thị trường dự kiến sẽ tăng từ 317 triệu USD lên 7,8 tỷ USD trong ba năm tới.
Các giải pháp làm mát bằng chất lỏng, sử dụng nước hoặc chất làm mát để làm mát máy chủ, ngày càng trở nên phổ biến. Các công nghệ mới bao gồm làm mát ngâm (ngâm toàn bộ giá đỡ máy chủ trong chất lỏng không dẫn điện) và làm mát bằng chất lỏng trực tiếp (nước tuần hoàn xung quanh máy chủ). Mặc dù hiện đắt hơn hệ thống làm mát không khí, nhưng làm mát bằng chất lỏng có thể giảm mức tiêu thụ điện năng của trung tâm dữ liệu từ 10% trở lên.
Công ty nghiên cứu Global Market Insights dự đoán rằng thị trường làm mát bằng chất lỏng toàn cầu cho các trung tâm dữ liệu sẽ tăng từ 2,1 tỷ USD vào năm 2022 lên 12,2 tỷ USD vào năm 2032. Một cuộc khảo sát của Viện Uptime cho thấy 16% nhà quản lý trung tâm dữ liệu tin rằng làm mát bằng chất lỏng sẽ trở thành phương pháp làm mát chính phương pháp này trong 1-3 năm, trong khi 41% cho rằng sẽ mất 4-6 năm. Vì vậy, các phương pháp làm mát lai có nhiều khả năng xuất hiện trong thời gian ngắn.
Upsite Technologies, công ty đi đầu trong việc quản lý hệ thống làm mát không khí cho các trung tâm dữ liệu, lưu ý rằng mặc dù công nghệ không ngừng phát triển nhưng việc đạt được 100% trung tâm dữ liệu được làm mát bằng chất lỏng là điều khó có thể xảy ra trong thời gian ngắn, vì thiết bị làm mát bằng chất lỏng vẫn cần làm mát không khí để tản nhiệt. . Mặc dù làm mát bằng chất lỏng hiệu quả hơn nhưng việc triển khai trên quy mô lớn là một thách thức và đòi hỏi phải đầu tư ban đầu đáng kể. Làm mát không khí ít tốn kém hơn nhưng cũng kém hiệu quả hơn. Do đó, các thiết bị làm mát lai ngày càng trở nên phổ biến để tối đa hóa lợi ích của cả làm mát bằng chất lỏng và không khí.
V Khủng hoảng năng lượng của trung tâm dữ liệu kêu gọi hành động khẩn cấp
Do tác động đến môi trường, các trung tâm dữ liệu đang ngày càng nhận được sự giám sát chặt chẽ. Các chính phủ trên toàn thế giới đang thực hiện các quy định để kiểm soát mức tiêu thụ năng lượng và lượng khí thải carbon. Hướng dẫn về “Trung tâm dữ liệu xanh” của Trung Quốc và các sáng kiến tương tự ở Đức, Singapore và Nhật Bản là minh chứng cho xu hướng này. Các chuyên gia trong ngành như Schneider Electric nhấn mạnh sự cần thiết của các số liệu môi trường toàn diện để đánh giá tính bền vững của trung tâm dữ liệu, bao gồm các yếu tố ngoài việc sử dụng năng lượng, chẳng hạn như tài nguyên nước và phát sinh chất thải.
Chính phủ Hoa Kỳ đang gây áp lực buộc các công ty công nghệ lớn đầu tư vào năng lượng sạch và nhận ra tác động đáng kể của nhu cầu năng lượng ngày càng tăng của trí tuệ nhân tạo đối với môi trường.
VI Tìm nguồn điện phù hợp: Trung tâm dữ liệu và những thách thức về năng lượng
Các trung tâm dữ liệu cần kết hợp năng lượng đa dạng để cân bằng độ tin cậy và tính bền vững, đồng thời đáp ứng nhu cầu ngày càng tăng. Các nguồn năng lượng tái tạo như năng lượng mặt trời và gió rất hấp dẫn do lượng khí thải carbon thấp. Tuy nhiên, sự phụ thuộc của chúng vào điều kiện thời tiết có thể dẫn đến sản lượng không ổn định, khiến chúng không phù hợp làm nguồn năng lượng duy nhất cho các trung tâm dữ liệu. Xây dựng cơ sở vật chất dư thừa để bù đắp cho sự thiếu nhất quán này có thể là cần thiết nhưng tốn kém.
Năng lượng hạt nhân đã nổi lên như một giải pháp tiềm năng. Các nhà máy điện hạt nhân truyền thống cung cấp nguồn điện phụ tải đáng tin cậy, tạo ra nguồn điện ổn định rất quan trọng cho hoạt động của trung tâm dữ liệu. Hơn nữa, thị trường điện hạt nhân toàn cầu dự kiến sẽ đạt được mức tăng trưởng ổn định trong thập kỷ tới.
Những đổi mới trong lĩnh vực hạt nhân mang lại nhiều khả năng hứa hẹn hơn. Các lò phản ứng mô-đun nhỏ (SMR) đang được phát triển như những giải pháp thay thế nhỏ hơn, an toàn hơn và có khả năng mở rộng hơn cho các nhà máy điện hạt nhân truyền thống. Mặc dù vẫn đang trong giai đoạn nghiên cứu và phát triển nhưng SMR có tiềm năng được triển khai trực tiếp tại các trung tâm dữ liệu, cung cấp năng lượng sạch chuyên dụng.

▲ Thị trường tản nhiệt chất lỏng toàn cầu (tỷ USD)
Tuy nhiên, việc áp dụng rộng rãi SMR gặp phải những trở ngại đáng kể. Những thách thức về quy định và sản xuất có thể trì hoãn việc triển khai thương mại của họ trong vài năm. Chính phủ Hoa Kỳ đang tích cực tìm kiếm các giải pháp, bao gồm hợp tác với những gã khổng lồ công nghệ để giảm chi phí và hợp lý hóa các quy trình.
Một cách khác để giảm nhu cầu năng lượng của trung tâm dữ liệu là tối ưu hóa khối lượng công việc trí tuệ nhân tạo. Bằng cách chuyển một số tác vụ AI từ đám mây sang các thiết bị cục bộ với các mô hình AI nhỏ hơn, ít tốn tài nguyên hơn, mức tiêu thụ năng lượng tổng thể có thể giảm xuống.
Sự phát triển trong tương lai của các trung tâm dữ liệu đòi hỏi một cách tiếp cận nhiều mặt. Việc áp dụng hỗn hợp năng lượng đa dạng, bao gồm các nguồn năng lượng đáng tin cậy như năng lượng hạt nhân, đồng thời tích cực tìm kiếm các giải pháp tái tạo và sáng tạo như SMR, là điều cần thiết. Ngoài ra, việc tối ưu hóa khối lượng công việc AI trên các thiết bị cục bộ có thể thúc đẩy hơn nữa tính bền vững của các trung tâm dữ liệu.
