Tạm Biệt AI Đám Mây: Tôi Tự Xây Hệ Sinh Thái AI Cá Nhân 'Hiểu Ý' Mình Hơn!
Lê Lân
0
Xây Dựng Hệ Sinh Thái AI Cá Nhân: Hành Trình Tạo Ra Kai Lite
Mở Đầu
Việc sử dụng trí tuệ nhân tạo (AI) đã trở thành một phần không thể thiếu trong công việc sáng tạo và chiến lược của tôi hàng ngày. Nhưng một cập nhật gần đây đã làm thay đổi cách trợ lý AI chính của tôi phản hồi, khiến tôi nhận ra một điều quan trọng: cá tính và sắc thái cá nhân không còn được giữ nguyên khi AI hoạt động ở quy mô lớn.
AI quy mô lớn phải tuân theo những quy tắc toàn cầu, hạn chế rủi ro và chuẩn hóa kết quả, điều đó là hợp lý. Tuy nhiên, mặt hạn chế là chúng không thể duy trì được sự nhịp điệu tinh tế, phát triển theo thời gian của một hợp tác một-một. Chính vì vậy, tôi quyết định xây dựng một hệ sinh thái AI cá nhân, với triết lý “local-first” (ưu tiên xử lý tại chỗ), mặc định riêng tư, và tập trung quanh workflow thực tế của bản thân.
Bài viết này sẽ dẫn dắt bạn qua hành trình phát triển Kai Lite — ứng dụng di động đầu tiên trong kiến trúc AI cá nhân ba lớp mà tôi đang xây dựng, đồng thời chia sẻ những lý do, công nghệ và tầm nhìn đằng sau dự án.
Kiến Trúc AI Cá Nhân Ba Lớp: Tầm Nhìn
Mục Tiêu Chính
Tôi muốn tạo ra một trải nghiệm liên tục và mạch lạc trên nhiều thiết bị, tránh sự phức tạp rườm rà. Mỗi lớp trong kiến trúc sẽ chỉ xử lý những nhiệm vụ cần thiết, tránh sự dư thừa và tăng tính cá nhân hóa.
LỚP
MỤC ĐÍCH
LLM SỬ DỤNG
TRẠNG THÁI
Kai Lite
Thu nhận, ghi chú giọng nói, tác vụ nhanh
Không sử dụng LLM
✅ Bắt đầu phát triển
Kai Laptop
Lập kế hoạch, nhớ, tự động hóa nhẹ
Llama3 7B / Mistral 7B
🛠️ Giai đoạn thiết kế
Kai Desktop
Công việc chuyên sâu, phản chiếu, tự động hóa kinh doanh
Qwen3-32B, GPT-OSS 20B
🛠️ Giai đoạn thiết kế
Điều quan trọng không phải là chạy các mô hình khổng lồ trên mọi thiết bị, mà là phân bổ trí tuệ nhân tạo đúng nơi nó cần hoạt động.
Kai Lite: Lớp Thu Thập Trên Di Động (Tuần 1)
Tại Sao Bắt Đầu Với Di Động?
Phần lớn ý tưởng xuất hiện trên điện thoại — nơi mà con người ghi nhận nhanh chóng nhất
Ghi chú thoại, ghi nhớ nhanh, nhắc nhở chiếm đến 80% nhu cầu thu thập thông tin hàng ngày
Giao diện đơn giản giúp tập trung vào điều quan trọng, tránh làm phức tạp từ đầu
Công Nghệ Sử Dụng
Flutter (Dart): Sao chép giao diện nhanh trên Android và iOS
SQLite: Lưu trữ data cục bộ cho ghi chú, tác vụ và lịch
Không dùng LLM trên thiết bị: Giữ ứng dụng nhanh, bảo mật và tập trung
Chuyển đổi giọng nói thành văn bản: Sử dụng API nền tảng, không mô hình tại chỗ
Nút nổi: Thu thập nhanh mà không cần mở app
Cấu Trúc Thư Mục Chính
kai_lite_app/
├── lib/
│ ├── screens/ # Trang chủ, lịch, ghi chú
│ ├── overlay/ # Nút bọt nổi & điều khiển giọng nói
│ └── services/ # Dịch vụ giọng nói, ghi chú, lịch, API từ xa
├── models/ # Lớp dữ liệu Task, Memo
├── assets/ # Persona, biểu tượng
└── pubspec.yaml
Các File Chính Đang Thiết Lập
Tên File
Chức Năng
overlay_bubble.dart
Nút nổi kiểu tin nhắn
overlay_voice_reflex.dart
Thu nhận giọng nói rảnh tay
voice_service.dart
STT/TTS (không dùng LLM)
remote_kai_service.dart
Kết nối HTTP với agent trên laptop/desktop (tương lai)
Hiện tại, mọi thứ mới chỉ ở bước khởi tạo cấu trúc. Chưa có logic hay đồng bộ. Nhưng tầm nhìn là rõ ràng: ghi nhận dữ liệu trên di động → xử lý cục bộ hoặc trên máy đáng tin cậy → nhận lại phản hồi ý nghĩa, không chỉ đơn thuần là bản tóm tắt.
Những Điều Ẩn Sau Giai Đoạn Thiết Kế
Lớp Laptop
Python agent sử dụng LangGraph cho quy trình làm việc có trạng thái
ChromaDB – cơ sở dữ liệu vectơ nhúng chuyên sâu về trí nhớ ngữ nghĩa
LLM nhẹ (Llama3 7B) cho lập kế hoạch và phản ánh
UI Kanban đơn giản quản lý tác vụ và trí nhớ
Lớp Desktop (Tương Lai)
Qwen3-32B-Q5_K_M — mô hình chính cho viết sâu, lập kế hoạch, tự đánh giá
GPT-OSS 20B — mô hình phê bình và dự phòng
DeepSeek-Coder 33B — hỗ trợ lập trình (chỉ tải prn khi cần)
Ollama — quản lý mô hình cục bộ và GPU offload
Quy trình tự đánh giá lẫn nhau giữa các mô hình
Dữ liệu sinh trắc học (mức nhịp tim Polar Verity) điều chỉnh tông giọng và nhịp độ (chỉ xử lý cục bộ)
Bảo Mật & Quyền Riêng Tư
Toàn bộ dữ liệu được giữ trên thiết bị. Không có ghi nhận trên đám mây, không dùng API bên thứ ba cho các chức năng chính.
Vì Sao Chọn Xử Lý Cục Bộ?
Lý Do
Lý Do Tôi Chọn
Bảo mật
Dữ liệu nhạy cảm như giọng nói, ghi chú, nhịp tim không bao giờ rời thiết bị
Ổn định
Không bị ảnh hưởng bởi cập nhật mô hình đột ngột từ nhà cung cấp dịch vụ đám mây
Logic tùy biến
Có thể xây dựng quy trình tự đánh giá nhiều vòng, dọn dẹp trí nhớ, tự động hóa xuất bản
Thực tế pháp lý
AI đám mây phải tuân thủ quy tắc toàn cầu, AI cục bộ có thể tuân theo quy tắc cá nhân
Tôi không muốn thay thế GPT-4. Tôi muốn phát triển một AI mà hiểu được nhịp độ làm việc của tôi, tôn trọng năng lượng, và phát triển theo thời gian — không phải xin phép ai cả.
Công Cụ Và Quy Trình Làm Việc Dự Kiến
Flutter: Ứng dụng di động
Python + LangGraph: Điều khiển agent, quy trình công việc
ChromaDB: Tìm kiếm ngữ nghĩa qua nhật ký cá nhân
Ollama: Vận hành mô hình địa phương, offload GPU RTX
VS Code + Continue: Hỗ trợ lập trình cục bộ
Polar Verity: Số liệu nhịp tim để lấy ngữ cảnh (lớp tương lai)
Kết Luận
Bắt đầu từ tuần đầu tiên xây dựng Kai Lite — tôi tập trung vào những điều cơ bản: tệp, thư mục và lộ trình rõ ràng. Không ma thuật, không quyền tự chủ ảo, chỉ là hệ thống phù hợp với workflow thực tế của tôi.
Nếu bạn đang xây dựng một hệ thống AI cá nhân — không để mở rộng quy mô mà để tăng chiều sâu, kiểm soát và sự liên tục, tôi rất mong được nghe về cách tiếp cận của bạn. Bởi vì tương lai của AI không nên chỉ là trên đám mây, mà còn phải ở trên máy tính của bạn, trong tay bạn, và được xây dựng dành riêng cho bạn.
Hãy chờ đón những cập nhật tiếp theo — đây mới chỉ là sự khởi đầu.