Ubuntu Server trên Proxmox: Hướng dẫn cài đặt AI GPU NVIDIA cực nhanh
Tạo Máy Chủ AI Mạnh Mẽ: Hướng Dẫn Cài Đặt Ubuntu Server trên Proxmox với GPU NVIDIA
Bạn đã có máy chủ Proxmox được cấu hình, GPU đã được cách ly thành công thông qua passthrough. Giờ là lúc biến phần cứng đắt tiền này thành một cỗ máy tăng tốc AI hiệu quả. Bài viết này sẽ hướng dẫn bạn từng bước để tạo một môi trường Ubuntu Server gọn nhẹ, ổn định, sẵn sàng cho các tác vụ học máy của bạn. Chúng ta sẽ tập trung vào việc tối ưu hóa hiệu suất và độ ổn định, đặc biệt quan trọng khi làm việc với các mô hình ngôn ngữ lớn (LLM).
Điều Kiện Tiên Quyết
- Máy chủ Proxmox đã được cấu hình hoàn chỉnh.
- GPU passthrough đã được thiết lập thành công (tham khảo hướng dẫn trước đó).
- File ISO Ubuntu Server LTS đã được tải lên bộ nhớ Proxmox.
- Tài nguyên máy ảo đã được phân bổ phù hợp (số lõi CPU, dung lượng RAM).
- Kết nối mạng đến máy chủ Proxmox.
Giai Đoạn 1: Tạo Máy Ảo Proxmox – Cấu Hình Quan Trọng Cho AI
Truy cập bảng điều khiển Proxmox và nhấp vào \”Tạo máy ảo\”. Hãy xem xét kỹ từng tab, vì các cài đặt ở đây ảnh hưởng trực tiếp đến tính ổn định và khả năng nhận diện GPU của máy ảo.
General Tab
Nhập tên máy ảo mô tả rõ ràng (ví dụ: “ubuntu-ai-server”) và để Proxmox tự động gán ID. Việc đặt tên rõ ràng giúp bạn dễ dàng quản lý máy ảo sau này.
OS Tab
Chọn \”Linux\” làm loại hệ điều hành, sau đó chọn ảnh ISO Ubuntu Server LTS đã tải lên. Giữ nguyên mục “Loại” là Linux – Proxmox sẽ tự động phát hiện bản phân phối.
System Tab – Yếu Tố Quyết Định Cho GPU Passthrough Hiện Đại
Đây là tab quan trọng nhất đối với các tác vụ GPU. Đặt BIOS thành OVMF (UEFI). Các GPU NVIDIA hiện đại yêu cầu firmware UEFI để khởi tạo chính xác. Không sử dụng SeaBIOS, vì nó có thể gây ra sự cố với tính năng truyền GPU trực tiếp. Chọn ô “Thêm ổ đĩa EFI” và phân bổ 1 GB. Đặt Machine thành q35 (mặc định của Proxmox) và SCSI Controller thành VirtIO SCSI để tối ưu hóa hiệu suất lưu trữ.
CPU Tab – Tập Lệnh AVX/AVX2 Quan Trọng
Phân bổ 4-8 lõi CPU tùy thuộc vào CPU máy chủ và khối lượng công việc. Đặt Loại thành “host”. Điều này là bắt buộc. Loại CPU “host” truyền trực tiếp các tập lệnh của CPU vật lý, bao gồm AVX và AVX2, đến máy ảo. Các thư viện AI (PyTorch, TensorFlow, v.v.) được tối ưu hóa để sử dụng các tập lệnh này. Nếu không có loại CPU “host”, hiệu suất AI sẽ giảm đáng kể.
Tab Bộ Nhớ – Cài Đặt Quan Trọng Nhất Cho Độ Ổn Định
Phân bổ một lượng RAM cố định (ví dụ: 32 GB). Điều chỉnh dựa trên dung lượng RAM khả dụng và quy mô khối lượng công việc dự kiến. Bỏ chọn “Thiết bị Ballooning”. Ballooning cho phép Proxmox tự động điều chỉnh RAM của máy ảo, gây ra hiện tượng chậm trễ và lỗi bộ nhớ cache trong quá trình huấn luyện hoặc suy luận AI. Khối lượng công việc AI yêu cầu phân bổ bộ nhớ ổn định.
Network Tab
Để nguyên mặc định. Proxmox sẽ tự động gán một card mạng ảo và DHCP sẽ cung cấp địa chỉ IP.
Xác Nhận và Tạo
Xem lại tất cả các thiết lập và nhấp vào \”Hoàn tất\” để tạo máy ảo.
Giai Đoạn 2: Cài Đặt Hệ Điều Hành và Khởi Động Lần Đầu
Nhấp vào \”Bắt đầu\” để khởi động máy ảo. Mở tab \”Console\” trong Proxmox để theo dõi quá trình khởi động. Trình cài đặt Ubuntu sẽ xuất hiện trong vài giây.
Làm theo các hướng dẫn cài đặt tiêu chuẩn: ngôn ngữ, bố cục bàn phím, cấu hình mạng và thiết lập lưu trữ. Khi đến màn hình Lưu trữ, hãy chấp nhận mặc định – sử dụng toàn bộ ổ đĩa ảo. Nhập tên máy chủ (ví dụ: “ai-server”) và tạo tài khoản người dùng với mật khẩu mạnh.
Quan trọng: Khi đến màn hình Chọn phần mềm, hãy đảm bảo hộp OpenSSH được ĐÁNH DẤU. Điều này cho phép bạn kết nối từ xa qua SSH, thuận tiện hơn so với việc sử dụng bảng điều khiển Proxmox.
Để quá trình cài đặt hoàn tất và khởi động lại máy ảo.
Giai Đoạn 3: Dọn Dẹp Sau Cài Đặt – Những Việc Cần Làm
Sau khi máy ảo khởi động, đăng nhập bằng thông tin đăng nhập đã tạo. Chạy các lệnh sau:
sudo apt update && sudo apt upgrade -y
Lệnh này cập nhật kho gói phần mềm và cài đặt các bản vá bảo mật. Tiếp theo, cài đặt các tiện ích thiết yếu:
sudo apt install qemu-guest-agent neofetch htop -y
- qemu-guest-agent: Cho phép Proxmox giám sát máy ảo và thực hiện các lệnh tắt máy sạch.
- neofetch: Hiển thị thông tin hệ thống.
- htop: Trình giám sát tiến trình tương tác.
Khởi động lại máy ảo:
sudo reboot
Kiểm tra trạng thái của QEMU Guest Agent:
sudo systemctl status qemu-guest-agent
Đảm bảo trạng thái là \”active (running)\”. Nếu không, khởi động lại:
sudo systemctl restart qemu-guest-agent
Quay lại giao diện Proxmox và làm mới. Bạn sẽ thấy địa chỉ IP của máy ảo trong mục “IPs”.
Giai Đoạn 4: Cài Đặt Trình Điều Khiển NVIDIA
Đây là bước quan trọng để GPU được nhận diện. Nếu tính năng truyền GPU được cấu hình chính xác, GPU của bạn sẽ được nhận diện ở đây. Nếu không, hãy kiểm tra lại cấu hình IOMMU và danh sách đen của máy chủ.
Sử dụng công cụ ubuntu-drivers tích hợp sẵn:
sudo ubuntu-drivers list
Lệnh này sẽ hiển thị các trình điều khiển NVIDIA có sẵn. Ưu tiên các phiên bản mã nguồn mở (có hậu tố -open) để đảm bảo độ ổn định. Cài đặt trình điều khiển được đề xuất:
sudo ubuntu-drivers autoinstall
Quá trình này sẽ cài đặt trình điều khiển phù hợp. Khởi động lại máy ảo:
sudo reboot
Sau khi khởi động lại, chạy:
nvidia-smi
Nếu mọi thứ hoạt động chính xác, bạn sẽ thấy thông tin về GPU, phiên bản trình điều khiển và bộ nhớ. Nếu lệnh này thất bại, hãy kiểm tra lại cấu hình Proxmox và đảm bảo GPU không nằm trong danh sách đen.
Những Điều Cần Kiểm Tra
- Tên GPU: Xác nhận GPU của bạn đã được truyền thành công.
- Phiên bản trình điều khiển: Đảm bảo trình điều khiển đã được cài đặt đúng cách.
- Phiên bản CUDA: Kiểm tra khả năng tương thích với các framework AI.
- Bộ nhớ: Xác nhận toàn bộ VRAM có thể truy cập được.
Giám Sát GPU Thời Gian Thực (Tùy Chọn)
Cài đặt:
sudo apt install nvtop
Chạy:
nvtop
Công cụ này cung cấp giao diện trực quan để giám sát việc sử dụng GPU.
Kết Luận: Nền Tảng Vững Chắc Cho AI
Bây giờ bạn đã có một máy chủ Ubuntu ổn định, được tăng tốc bằng GPU, sẵn sàng cho việc phát triển AI. Hệ thống có bộ nhớ cố định, truyền CPU đúng cách và nhận diện GPU đã được xác minh. Đây là nền tảng vững chắc để chạy các LLM, huấn luyện mô hình hoặc thực hiện các tác vụ suy luận.
Bước tiếp theo là cài đặt Ollama – cách đơn giản nhất để tải xuống và chạy các LLM mã nguồn mở trên hệ thống của bạn. Với Ollama, bạn sẽ có thể chạy mô hình Llama 7 tỷ tham số chỉ trong vòng chưa đầy 15 phút.
Từ khóa chính: Ubuntu Server trên Proxmox: Hướng dẫn cài đặt AI GPU NVIDIA cực nhanh
\”>