TÀI LIỆU TỔNG QUAN KIẾN TRÚC VÀ VẬN HÀNH HỆ THỐNG GROWTHHACK SEO#
Dự án: GrowthHack SEO / Landing Page Builder API
Loại tài liệu: System Overview Document (SOD) & QA/QC Guidelines
Phiên bản: 1.0
Đối tượng sử dụng: Quản trị dự án (PM), Đội ngũ Phát triển (Dev), Đội ngũ Kiểm thử (QA/QC), Kỹ sư Vận hành (SysAdmin).
1. GIỚI THIỆU TỔNG QUAN HỆ THỐNG#
GrowthHack SEO là một hệ thống tự động hóa Marketing/SEO ở quy mô công nghiệp (Mass-scale SEO Automation). Mục tiêu cốt lõi của hệ thống là xây dựng một mạng lưới site vệ tinh (Private Blog Network - PBN) khổng lồ, tự động sinh ra hàng triệu trang đích (Landing Pages) dựa trên từ khóa ngách, ép Google lập chỉ mục (Indexing) thông qua API, và cuối cùng là điều hướng (Redirect) toàn bộ lưu lượng truy cập tự nhiên (Organic Traffic) thu được về các tên miền đích (Money Sites / Final Domains) nhằm phục vụ kinh doanh.Hệ thống được thiết kế để giải quyết bài toán xử lý khối lượng dữ liệu khổng lồ (Big Data) và các tác vụ bất đồng bộ (Asynchronous Tasks) như: sinh HTML hàng loạt, quản lý hàng ngàn tài khoản Google Service, và crawl thứ hạng từ khóa liên tục.
2. KIẾN TRÚC CÔNG NGHỆ (TECHNOLOGY STACK)#
Hệ thống áp dụng mô hình kiến trúc Client-Server phân tách rõ ràng, kết hợp với hệ thống xử lý hàng đợi (Queue Worker) chuyên sâu.2.1. Tầng Giao Diện (Frontend / Client-side)#
Framework: Vue 3 (Composition API), Vite.
Ngôn ngữ: TypeScript để đảm bảo tính chặt chẽ của kiểu dữ liệu.
UI/UX: Naive UI kết hợp Tailwind CSS.
Nhiệm vụ: Cung cấp Dashboard quản trị tĩnh (SPA), giao tiếp 100% với Backend thông qua các API chuẩn RESTful.
2.2. Tầng Ứng dụng & Nghiệp vụ (Backend Core)#
Framework: Laravel 10 (PHP).
Bảo mật & Phân quyền: JWT Auth (JSON Web Token) và Spatie Permission (RBAC).
Nhiệm vụ: Xử lý logic nghiệp vụ, chuẩn hóa dữ liệu đầu vào (Validation), và cung cấp API cho Frontend.
2.3. Tầng Xử lý nền (Background Processing / Automation)#
Đây là "trái tim" của hệ thống, chịu trách nhiệm cho các tác vụ nặng.Công cụ: Laravel Horizon, Redis Queue.
PushRecordDomain: Sinh HTML nội suy từ Template và Keyword, đẩy file lên AWS S3 / Cloudfront.
PushCheckDomain: Gọi API Google Search Console để check/push index cho hàng triệu URL.
FillterDomain / ScanKeyword: Quét logs thứ hạng và traffic định kỳ.
2.4. Tầng Lưu trữ & Tích hợp bên thứ ba (Storage & 3rd Party)#
Lưu trữ file tĩnh: AWS S3, Cloudfront.
APIs: Google Indexing API, Google Search Console API.
3. PHÂN RÃ CÁC MODULE NGHIỆP VỤ (BUSINESS MODULES)#
Hệ thống được chia thành 5 nhóm module nghiệp vụ chính, tương tác chặt chẽ với nhau:3.1. Nhóm Dữ liệu nền tảng (Master Data)#
Nơi thiết lập các "nguyên liệu" thô để đúc Landing Page:Từ khóa -> Ngành & Thương hiệu: Phân loại và phân cấp dữ liệu cấu trúc.
Từ khóa -> Kho hình ảnh: Quản lý tài nguyên media (URL ảnh) kèm thẻ Alt/Mô tả để n ội suy ngẫu nhiên vào HTML nhằm tối ưu SEO On-page.
Từ khóa -> Từ khóa: Quản lý danh sách từ khóa hạt giống, metadata (Title, H1, Description) và ánh xạ tới các "Mã thay thế" (Shortcodes).
Quản lý trang -> Quản lý trang mẫu: Kho lưu trữ các mã nguồn giao diện HTML thô có chứa các mã nội suy (Ví dụ: @dataset-body_h1).
3.2. Nhóm Hạ tầng Mạng lưới (Infrastructure)#
Nơi điều phối dòng chảy traffic:Quản lý trang -> Trang nguồn: Các tên miền vệ tinh (Sub-domains/Branch domains) dùng để hứng traffic. Định nghĩa nơi lưu trữ file (S3) và cài đặt điểm đến.
Quản lý trang -> Trang đích: Các tên miền kinh doanh cuối cùng (Money Sites).
Quản lý trang -> Tài khoản Google: Kho quản lý hàng ngàn Service Accounts (JSON Credentials) để phá vỡ giới hạn Rate Limit của Google khi bắn Index.
3.3. Nhóm Động cơ Vận hành (Execution Engine)#
Tạo trang HTML: Bảng điều khiển kích hoạt các Job sinh trang hàng loạt. Nơi quản lý việc ghép nối giữa "Trang nguồn" + "Trang mẫu" + "Từ khóa" để đúc ra hàng triệu file tĩnh và đẩy lên S3. Đồng thời trigger tính năng "Bắn Index" qua API Google.
3.4. Nhóm Báo cáo & Giám sát (Monitoring & Reports)#
Dashboard (Trang chủ): Tóm tắt quy mô hệ thống (Tổng HTML, Tỉ lệ Lỗi Index).
Báo cáo -> Thứ hạng: Tra cứu vị trí SERP của từ khóa theo ngày.
Báo cáo -> Volume: Tra cứu lượng tìm kiếm và xu hướng (Trend) của từ khóa để điều chỉnh chiến lược.
Báo cáo -> Report Index: Đối soát thời gian gửi yêu cầu (Bắn) và thời gian Google chấp nhận (Nhận) của từng file HTML.
3.5. Nhóm Quản trị Hệ thống (System Admin)#
Người dùng -> Tài khoản: Quản lý vòng đời nhân sự và cấp quyền (Admin, Editor, Viewer).
Người dùng -> Hoạt động: Hệ thống Audit Log bất biến, lưu vết mọi thao tác thay đổi dữ liệu (Thêm/Sửa/Xóa) dưới định dạng JSON Payload nhằm bảo vệ tính toàn vẹn hệ thống.
4. SƠ ĐỒ LUỒNG VẬN HÀNH CỐT LÕI (CORE DATA FLOW)#
Quy trình hoạt động chuẩn của hệ thống diễn ra theo luồng (Pipeline) sau:BƯỚC 1: KHỞI TẠO TÀI NGUYÊN (SETUP)
- Admin thiết lập Ngành, Thương hiệu, nhập file Từ khóa.
- Admin upload các bộ giao diện HTML lên "Quản lý trang mẫu".
- Khai báo "Trang đích" (Nơi chốt sale) và cấu hình các "Trang nguồn" (Vệ tinh) trỏ về Trang đích.
- Nạp hàng ngàn "Tài khoản Google" (Service Accounts) vào hệ thống.
BƯỚC 2: SẢN XUẤT NỘI DUNG (GENERATION)
- Tại module "Tạo trang HTML", Admin chọn 1 Trang mẫu và 10.000 Từ khóa.
- Worker ở Backend khởi chạy: Đọc mã HTML, tìm các thẻ @dataset, thay thế bằng dữ liệu SEO của từng từ khóa, sinh ra 10.000 file .html tĩnh.
- Tự động đẩy 10.000 file này lên AWS S3 bucket của Trang nguồn.
BƯỚC 3: ĐẨY LẬP CHỈ MỤC (INDEXING)
- Admin kích hoạt tính năng "Bắn Index".
- Hệ thống tự động phân bổ 10.000 URL vừa tạo cho các Tài khoản Google (Mỗi tài khoản gánh ~200 request) để gọi Google Indexing API.
BƯỚC 4: THU HOẠCH & ĐIỀU HƯỚNG (HARVEST & REDIRECT)
- Google Bot cào dữ liệu. Các trang HTML lọt top tìm kiếm.
- Người dùng thật tìm kiếm từ khóa và click vào Trang nguồn.
- Trang nguồn thực thi lệnh Redirect (đã thiết lập ở BƯỚC 1) đẩy người dùng về Trang đích.
- Cronjob chạy ngầm mỗi đêm quét GSC API để cập nhật "Thứ hạng" và "Traffic" lên báo cáo.
Ngày cập nhật 2026-04-04 05:38:03