Databricks "tung chiêu" đỉnh cao tại Data + AI Summit 2025: Toàn cảnh những cải tiến "khủng" thay đổi cuộc chơi!
Lê Lân
0
Tin Tức Databricks và Các Phiếu Ưu Đãi: Tóm Tắt Sự Kiện Data + AI Summit 2025
Mở Đầu
Sự kiện Data + AI Summit 2025, tổ chức ngày June 12, 2025 tại San Francisco, đã thu hút hơn 20.000 chuyên gia dữ liệu và trí tuệ nhân tạo từ khắp nơi trên thế giới. Đây là dịp để Databricks giới thiệu nhiều đổi mới quan trọng, hứa hẹn làm thay đổi sâu rộng hệ sinh thái dữ liệu, AI và hợp tác đám mây.
Trong bài viết này, chúng ta sẽ cùng điểm qua 10 bản tin chính được công bố tại sự kiện, cùng với những mô tả ngắn gọn giúp bạn dễ dàng nắm bắt các cải tiến và giải pháp mới trong lĩnh vực dữ liệu và trí tuệ nhân tạo.
1. Databricks Lakeflow: Giải Pháp Dữ Liệu Thống Nhất
Giới Thiệu Lakeflow
Databricks Lakeflow là một nền tảng toàn diện cho việc thu thập, biến đổi và điều phối dữ liệu. Giải pháp này tích hợp nhiều kết nối quản lý đến các ứng dụng doanh nghiệp, cơ sở dữ liệu và kho dữ liệu lớn.
Điểm Nổi Bật: Zerobus
Zerobus là một API mới giúp thu nhận dữ liệu sự kiện theo thời gian thực với độ trễ thấp và băng thông cao. Điều này giúp các tổ chức dễ dàng sử dụng dữ liệu quy mô lớn cho phân tích và ứng dụng AI hơn bao giờ hết.
Zerobus tạo ra cầu nối hiệu quả giữa dữ liệu thời gian thực và các ứng dụng phân tích, là công cụ then chốt cho hệ sinh thái dữ liệu hiện đại.
2. Unity Catalog: Quản Trị Thông Minh và Tự Động Hóa
Tính Năng Mới
Unity Catalog được nâng cấp với các chức năng nhằm hợp nhất quản trị dữ liệu và AI trên nhiều định dạng, đa đám mây và giữa các nhóm làm việc.
Các Bản Cập Nhật Chính
Attribute-Based Access Control (ABAC): Chính sách truy cập linh hoạt dựa trên thẻ (tags), hiện đang trong giai đoạn beta trên AWS, Azure, và GCP
Tag Policies: Giúp đảm bảo tính nhất quán và an toàn khi phân loại và sử dụng dữ liệu, cũng nằm trong phiên bản beta trên các đám mây lớn
ABAC là bước tiến quan trọng trong việc xây dựng hệ thống bảo mật dữ liệu thông minh và thích ứng theo từng ngữ cảnh sử dụng.
3. Chia Sẻ Dữ Liệu và Hợp Tác An Toàn
Cải Thiện Trong Hợp Tác
Databricks công bố những cải tiến giúp hỗ trợ việc chia sẻ dữ liệu giữa các tổ chức một cách bảo mật, bao gồm tính năng “clean rooms” – không gian làm việc chung cho phép cộng tác mà không làm lộ thông tin nhạy cảm.
“Clean rooms” là công nghệ đảm bảo quyền riêng tư trong quá trình hợp tác dữ liệu đa bên.
4. Hỗ Trợ Toàn Diện Apache Iceberg™
Databricks đã tích hợp đầy đủ hỗ trợ cho Apache Iceberg™, một định dạng dữ liệu mở mở rộng khả năng quản lý dữ liệu theo chuẩn mực mới, giúp dễ dàng tích hợp với nhiều công cụ và nền tảng khác nhau.
Lợi ích chính
Mô tả
Quản lý dữ liệu cỡ lớn
Hỗ trợ truy cập nhanh và ổn định
Mở rộng độ tương thích
Tích hợp tốt với hệ sinh thái dữ liệu đa dạng
Cập nhật hiệu quả
Quản lý dữ liệu phiên bản tiên tiến
5. Spark Declarative Pipelines: Tiến Hóa Phát Triển Pipeline Dữ Liệu
Tính Năng Mới
Spark Declarative Pipelines là một cải tiến giúp phát triển các pipeline dữ liệu theo phong cách khai báo, mở rộng khả năng mở rộng và chuẩn hóa cho các nhóm kỹ sư dữ liệu.
Giảm thiểu mã lệnh phức tạp, tăng khả năng tái sử dụng và dễ dàng bảo trì pipeline.
6. Databricks SQL và Phiên Bản Miễn Phí
Mở Rộng Tiếp Cận
Databricks chính thức ra mắt phiên bản tổng quát của Databricks SQL cùng với một phiên bản miễn phí, giúp các tổ chức, đặc biệt là doanh nghiệp vừa và nhỏ, dễ dàng tiếp cận các tính năng phân tích dữ liệu nâng cao.
7. MLflow 3.0: Quan Sát và Quản Trị AI Nâng Cao
Cải Tiến Chính
MLflow 3.0 mang đến các cải tiến về:
Quản lý thử nghiệm AI
Quan sát hệ thống mô hình AI
Tăng cường tính tuân thủ và kiểm soát vòng đời dự án machine learning
Hỗ trợ hoàn chỉnh vòng đời AI giúp giảm thiểu rủi ro và tăng tốc phát triển mô hình.
8. Mosaic AI và Agent Bricks: Đẩy Mạnh Phát Triển Agent Thông Minh
Tính Năng Mới
Mosaic AI trình làng Agent Bricks, công cụ phát triển các tác nhân thông minh có khả năng tự tối ưu dựa trên dữ liệu riêng của doanh nghiệp, góp phần thúc đẩy ứng dụng AI sinh tạo (generative AI) và các agent tự động.
9. Lakebase: Phiên Bản Công Khai
Lakebase được giới thiệu ở phiên bản xem trước công khai, cung cấp giải pháp quản lý dữ liệu giao dịch và phân tích trong cùng một môi trường duy nhất, giúp đơn giản hóa vận hành và tăng tốc độ khai thác thông tin.
10. Power Platform Connector
Kết Nối Mới với Azure Databricks
Kết nối mới cho Power Platform cho phép truy cập dữ liệu thời gian thực và được quản lý an toàn cho các ứng dụng như Power Apps, Power Automate và Copilot Studio, mở rộng cơ hội tích hợp giữa nền tảng dữ liệu và công cụ năng suất.
Kết Luận
Sự kiện Data + AI Summit 2025 của Databricks đã mang đến nhiều thông tin và giải pháp đột phá trong lĩnh vực dữ liệu và AI. Từ nền tảng Lakeflow, các cải tiến quản trị, đến các công cụ phát triển AI hiện đại như MLflow 3.0 và Agent Bricks, Databricks tiếp tục khẳng định vị thế dẫn đầu trong việc hỗ trợ tổ chức xây dựng các hệ sinh thái dữ liệu an toàn, thông minh và hiệu quả.
Đừng bỏ lỡ những cập nhật mới nhất từ Databricks để tận dụng tối đa các công nghệ tiên tiến, thúc đẩy đổi mới và nâng cao năng lực cạnh tranh cho doanh nghiệp của bạn.