OpsFusion: Khi Dev & ML "Hòa Quyện" - Toàn Cảnh Meetup Công Nghệ Đỉnh Cao!
Lê Lân
0
Tổng Kết Sự Kiện OpsFusion: Nơi Dev Gặp Gỡ MLOps và Platform Engineering
Mở Đầu
OpsFusion là một sự kiện kỹ thuật độc đáo kết nối các chuyên gia và người đam mê trong lĩnh vực DevOps, MLOps và Platform Engineering. Đây không chỉ là nơi giao lưu chia sẻ kiến thức mà còn là cơ hội để trải nghiệm các xu hướng mới và các phiên thực hành sâu sắc.
Trong bài viết này, chúng ta sẽ cùng khám phá các nội dung chính từ sự kiện OpsFusion, nơi mà các công nghệ phát triển phần mềm, máy học và hạ tầng đám mây được hội tụ, thảo luận và ứng dụng một cách thực tế. Tôi sẽ tóm tắt từng phiên trình bày, cùng những điểm quan trọng được chia sẻ, giúp người đọc có cái nhìn tổng quát và chi tiết về cách các lĩnh vực này đang phát triển đồng bộ và hỗ trợ lẫn nhau.
MLOps Trong Vertex AI – Diễn giả Navaneethan Gopal
Giới Thiệu Phiên Trình Bày
Phiên này tập trung xây dựng pipeline machine learning đầu-cuối bằng Vertex AI, đặc biệt nhấn mạnh vào tự động hóa vòng đời ML vượt ra ngoài việc phát triển mô hình.
Điểm Nổi Bật Chính
Sử dụng bộ dữ liệu phân loại đa lớp Dry Beans trong Google Colab với hỗ trợ từ Gemini cho viết code.
Chỉ dưới 1% công việc MLOps là code ML thực thụ; phần lớn là vận hành, bao gồm hạ tầng, điều phối, kiểm thử và giám sát.
Các Thành Phần Cốt Lõi Của MLOps
Thu thập và kiểm tra dữ liệu
Huấn luyện và kiểm thử mô hình
Gỡ lỗi và phân tích
Giám sát mô hình sau triển khai
Hợp tác đa chức năng
Các Giai Đoạn Vòng Đời MLOps
Khám phá: Tìm hiểu vấn đề và dữ liệu
Phát triển: Kỹ thuật đặc trưng, quản lý phiên bản dữ liệu, tích hợp feature stores
Triển khai: Phục vụ mô hình thông qua pipeline tự động
Mức Độ Trưởng Thành Trong MLOps
Cấp độ
Đặc điểm
0
Xây dựng và triển khai thủ công
1
Tự động hóa quy trình huấn luyện
2
Pipeline tự động, tái lập trên nhiều môi trường
Tổng Quan Pipeline Vertex AI
Quy trình xây dựng pipeline Vertex AI được kích hoạt từ Bitbucket hoặc cronjob gồm:
Tạo bucket Google Cloud Storage (GCS)
Định nghĩa dataset và thành phần huấn luyện sử dụng XGBoost
Khởi tạo và triển khai pipeline với SDK
Xu Hướng Mới Trong Vận Hành Máy Học
MLFMOps: Quản lý các mô hình Foundation Model, latency, chi phí token
LLMOps: Quản lý các mô hình ngôn ngữ lớn và RAG
PromptOps: Giám sát và tối ưu prompt, giảm hiện tượng hallucination
Giới Thiệu Kubeflow
Kubeflow là nền tảng Kubernetes-native hỗ trợ các workflow ML. Phiên trình bày nêu bật tạo các component tùy chỉnh và pipeline tái sử dụng, tăng tính mở rộng và khả năng tái lập của hệ thống ML.
Kubeflow giúp thu hẹp khoảng cách giữa phát triển mô hình ban đầu và triển khai quy mô lớn trong môi trường sản xuất.
Phát Triển Trunk-Based Với Terraform – Diễn giả Harini Muralidharan
Bối Cảnh: Những Thách Thức Trong DevOps Truyền Thống
Môi trường dev và production không đồng nhất
Nhà phát triển phải phụ thuộc đội vận hành cho cả thay đổi nhỏ
Thiếu minh bạch và theo dõi các thay đổi hệ thống
Nguyên Tắc DevOps Do Nhà Phát Triển Dẫn Dắt
Nhà phát triển tự định nghĩa và phiên bản hạ tầng cùng code ứng dụng
Phát hiện và xử lý sự cố sớm nhờ tự động hóa
Khuyến khích tinh thần sở hữu nhưng không yêu cầu trở thành chuyên gia vận hành
Giới Thiệu Terraform
Terraform cho phép triển khai hạ tầng quy mô, đa nền tảng với:
Mã khai báo (HCL) dễ hiểu
Hỗ trợ tích hợp với GCP, AWS, Azure
Cộng đồng lớn và liên tục phát triển
Thành Phần Cốt Lõi Của Terraform
Thành phần
Mô tả
Providers
Kết nối với dịch vụ đám mây
Resources
Định nghĩa các thành phần hạ tầng
Variables & Outputs
Quản lý tham số và hiển thị kết quả
State Management
Theo dõi trạng thái hạ tầng qua các lần áp dụng
Quy Trình Làm Việc Thông Thường
terraform init – Khởi tạo thư mục làm việc
terraform plan – Lập kế hoạch thay đổi
terraform apply – Áp dụng thay đổi
terraform destroy – Hủy tài nguyên
Tích Hợp Terraform Với CI/CD
Sử dụng pipeline YAML để tự động chạy lệnh Terraform
Đảm bảo các cập nhật hạ tầng chính xác, nhất quán và có kiểm soát phiên bản
Những Thực Hành Tốt Nhất Với Terraform
Lưu mã trong hệ thống Git với quản lý phiên bản chặt chẽ
Sử dụng lưu trữ trạng thái từ xa (GCS, Terraform Cloud)
Áp dụng nguyên tắc quyền tối thiểu
Viết mã mô-đun để tái sử dụng hiệu quả
Kiểm thử tự động các module hạ tầng
Giám sát sự lệch pha cấu hình và tự động xử lý
Mô hình này giúp nhà phát triển tự chủ mà vẫn giữ được tính an toàn, bảo mật và mở rộng của hạ tầng.
Platform Engineering vs DevOps: Tiến Hóa Hay Cách Mạng? – Diễn giả Crystal Darling
Những Khó Khăn Trong DevOps Truyền Thống
Đội vận hành thường bị chặn do tiến độ phát triển của nhà phát triển
Developer phải gửi ticket cho hỗ trợ vận hành khiến xử lý chậm
Thiếu tự chủ trong môi trường và công cụ
Platform Engineering Là Gì?
Xây dựng và duy trì Internal Developer Platforms (IDPs)
Phát triển các công cụ tự phục vụ cho nhà phát triển
Xử lý nhà phát triển như khách hàng, cung cấp môi trường đồng nhất, bảo mật
Kỹ Năng Quan Trọng Của Platform Engineering
Điều phối Kubernetes
Công cụ IaC như Terraform, Helm
Hệ thống CI/CD
Công cụ quan sát và deploy của CNCF
Thông Điệp Cốt Lõi
Platform Engineering không đơn thuần chỉ là đổi tên DevOps. Đây là sự tiến hóa về văn hóa và kiến trúc, tập trung nâng cao trải nghiệm, quyền tự chủ và khả năng mở rộng cho nhà phát triển.
Thảo Luận Về Nghiên Cứu ML Và Mạng Lưới Kết Nối
Buổi kết thúc với các trao đổi về nghiên cứu mới từ Microsoft và Google liên quan đến Copilot, RAG, cũng như hệ thống sinh sáng tạo (generative systems). Đây cũng là dịp tuyệt vời để kết nối, chia sẻ và học hỏi kinh nghiệm thực tế từ cộng đồng.
Lời Kết
Tham dự OpsFusion giúp tôi có cái nhìn toàn diện hơn về cách các hệ thống phần mềm hiện đại vận hành: từ mở rộng mô hình ML với MLOps, tự động hạ tầng bằng Terraform đến xây dựng nền tảng nội bộ hỗ trợ nhà phát triển. Nếu bạn đang tìm cách kết nối ML, hạ tầng và quy trình phát triển một cách hiệu quả, những sự kiện tương tự cực kỳ đáng giá.
Tham Khảo
Gopal, N. (2024). "Building ML Pipelines with Vertex AI".
Muralidharan, H. (2024). "Developer-Driven DevOps and Terraform".
Darling, C. (2024). "Platform Engineering: Evolution of DevOps".