Google ứng dụng AI vào hệ thống làm mát máy chủ

15/10/2021

Google ứng dụng AI vào hệ thống làm mát máy chủ

Giới thiệu

Với tổng cộng 6 trung tâm dữ liệu lớn nhỏ trải dài khắp nước Mỹ kèm theo tốc độ đường truyền siêu khủng gấp 200.000 lần tốc độ cáp quang dân dụng thông thường, các hệ thống máy chủ lưu trữ của Google có thể chứa đựng lượng dữ lớn gấp nhiều lần Facebook.

 

Hệ thống máy chủ của Google tập trung phần lớn vào lưu trữ các kết quả tìm kiếm, từ khóa hay các đoạn video lớn nhỏ mà người dùng tải lên Youtube và cả những hệ thống backup thông tin được lưu trữ nhằm đề phòng trường hợp dữ liệu ở máy chủ bị thất thoát. Đây cũng là một trong những hệ thống máy chủ lớn nhất trên thế giới, chính vì vậy nó tiêu tốn rất nhiều năng lượng, để ngăn chặn sự gia tăng của việc sử dụng năng lượng thì cần nhiều việc phải làm hơn nữa do nhu cầu ngày càng tăng của thế giới về sức mạnh tính toán.

 

Thách thức

Giảm mức sử dụng năng lượng là trọng tâm chính của Google trong 10 năm qua: Google đã xây dựng các máy chủ siêu hiệu quả của riêng mình, phát minh ra các cách hiệu quả hơn để làm mát các trung tâm dữ liệu và đầu tư mạnh vào các nguồn năng lượng xanh với mục tiêu cung cấp 100% bằng năng lượng tái tạo. 

Việc làm mát này thường được thực hiện thông qua các thiết bị công nghiệp lớn như máy bơm, máy làm lạnh và tháp giải nhiệt. Tuy nhiên, môi trường như trung tâm dữ liệu làm cho nó khó hoạt động tối ưu vì một số lý do:

  1. Thiết bị, cách vận hành thiết bị và môi trường tương tác với nhau theo những cách phức tạp. Kỹ thuật làm mát dựa trên công thức truyền thống và trực giác của con người thường không nắm bắt được những tương tác này.
  2. Hệ thống không thể thích ứng nhanh chóng với những thay đổi bên trong hoặc bên ngoài (như thời tiết) khiến không thể đưa ra các quy tắc và phản ứng nhanh cho các tình huống hoạt động.
  3. Mỗi trung tâm dữ liệu có một kiến ​​trúc và môi trường khác nhau. Một mô hình được tùy chỉnh cho một hệ thống có thể không áp dụng được cho một hệ thống khác. Do đó, cần có một khuôn khổ thông tin chung để hiểu được các tương tác của trung tâm dữ liệu.

Giải pháp

Để giải quyết vấn đề này, Google đã bắt đầu áp dụng học máy để vận hành các trung tâm dữ liệu của mình hiệu quả hơn. Và trong vài tháng, các nhà nghiên cứu của DeepMind đã làm việc với nhóm trung tâm dữ liệu của Google để cải thiện hệ thống. Sử dụng hệ thống mạng nơ-ron được đào tạo dựa trên các kịch bản hoạt động và các thông số khác nhau trong trung tâm dữ liệu , họ đã tạo ra một khuôn khổ thích ứng và hiệu quả hơn để vận hành hoạt động làm mát của trung tâm dữ liệu và tối ưu hóa hiệu quả.

Hệ thống đã được hoàn thành bằng cách lấy dữ liệu lịch sử đã được thu thập bởi hàng nghìn cảm biến trong trung tâm dữ liệu - dữ liệu như nhiệt độ, công suất, tốc độ bơm, điểm đặt, v.v. - và sử dụng nó để đào tạo một nhóm các mạng thần kinh sâu: đào tạo mạng nơ-ron về hiệu quả sử dụng điện - PUE (PUE là tỷ lệ giữa tổng mức sử dụng năng lượng của tòa nhà với mức sử dụng năng lượng CNTT). 

Sau đó, họ đào tạo thêm hai nhóm mạng thần kinh sâu để dự đoán nhiệt độ và áp suất trong tương lai của trung tâm dữ liệu trong giờ tới. Mục đích của những dự đoán này là để mô phỏng các hành động được đề xuất từ ​​mô hình PUE, để đảm bảo rằng các hoạt động không vượt ra ngoài bất kỳ ràng buộc vận hành nào.

 

Kết quả

Google đã thử nghiệm mô hình của mình bằng cách triển khai trên một trung tâm dữ liệu trực tiếp. Biểu đồ bên dưới cho thấy một ngày thử nghiệm điển hình, bao gồm cả thời điểm bật các đề xuất học máy và thời điểm tắt các đề xuất này.

 

Hệ thống học máy của họ đã có thể được mức giảm 40% lượng năng lượng được sử dụng để làm mát, tương đương với việc giảm 15% tổng chi phí PUE sau khi tính đến tổn thất điện và các trường hợp kém hiệu quả không làm mát khác.

Việc này đối với các trung tâm dữ liệu của Google giúp cải thiện đáng kể hiệu quả sử dụng năng lượng và giảm lượng khí thải nói chung. Nó cũng sẽ giúp các công ty khác chạy trên hạ tầng điện toán đám mây của Google cải thiện hiệu quả sử dụng năng lượng của chính họ. Mọi cải tiến về hiệu quả của trung tâm dữ liệu đều làm giảm tổng lượng khí thải vào môi trường và với công nghệ như DeepMind, sẽ giúp tiêu thụ ít năng lượng hơn và giúp giải quyết một trong những thách thức lớn nhất - biến đổi khí hậu.

Chúng tôi có thể giúp gì thêm cho bạn?

Hãy liên hệ với C.OPE2N ngay bây giờ