Thiết lập trợ lý lập trình bằng Gemini MCP và Skills

Trợ lý lập trình AI rất mạnh mẽ nhưng cũng có những hạn chế – dữ liệu huấn luyện bị cắt ở một ngày cụ thể, thiếu các tính năng và thay đổi mới của API. Nếu không có quyền truy cập vào tài liệu dành riêng cho Gemini, các tác nhân có thể đề xuất các mẫu chung thay vì các phương pháp được tối ưu hoá.

Để trợ lý lập trình của bạn luôn cập nhật API Gemini đang phát triển và cách sử dụng được đề xuất, bạn nên thiết lập Gemini Docs MCP và nâng cao môi trường của mình bằng Kỹ năng Gemini API. Mặc dù có thể sử dụng độc lập, nhưng các công cụ này được thiết kế để hoạt động cùng nhau nhằm cung cấp phạm vi phủ sóng đầy đủ.

Kết nối Gemini Docs MCP

Gemini lưu trữ một máy chủ Giao thức ngữ cảnh mô hình (MCP) công khai tại gemini-api-docs-mcp.dev. Việc kết nối tác nhân lập trình của bạn với máy chủ này đảm bảo rằng tất cả các truy vấn đều có quyền truy cập vào các API mới nhất, bản cập nhật mã và ví dụ về cấu hình tối ưu.

Chạy lệnh sau trong thiết bị đầu cuối hoặc thư mục gốc của dự án của tác nhân để cài đặt máy chủ:

npx add-mcp gemini-api-docs-mcp.dev

Máy chủ này thêm một hàm search_documentation mà tác nhân của bạn có thể sử dụng để truy xuất các định nghĩa API và mẫu tích hợp theo thời gian thực từ các tệp tài liệu Gemini chính thức.

Thêm kỹ năng phát triển API

Các kỹ năng cung cấp các quy tắc và phương pháp hay nhất được tích hợp sẵn (chẳng hạn như thực thi SDK chính xác và các phiên bản mô hình hiện tại) trực tiếp trong bối cảnh của trợ lý. Kỹ năng này hoạt động cùng với dịch vụ Gemini Docs MCP: Nếu bạn đã cài đặt cả hai, thì kỹ năng này sẽ sử dụng dịch vụ MCP cho tài liệu, nhưng ngay cả khi không cài đặt MCP, kỹ năng này sẽ tìm nạp llms.txt từ ai.google.dev làm phương án dự phòng.

Để cài đặt các kỹ năng này, bạn có thể sử dụng một trong các công cụ được hỗ trợ sau đây. Hướng dẫn cài đặt cho cả hai được cung cấp bên dưới mỗi mô-đun kỹ năng:

  • skills.sh: Nên dùng. Tiêu chuẩn mở cho các hành vi của tác nhân di động.
  • Context7

gemini-api-dev

Kỹ năng cơ bản để phát triển Gemini cho mục đích chung. Kỹ năng này cung cấp tài liệu và các phương pháp hay nhất cho:

  • Định tuyến lời nhắc đến các mô hình hiện tại (ví dụ: Gemini 3.1 Pro/Flash) và tránh các mô hình không dùng nữa
  • Đặt câu lệnh đa phương thức, gọi hàm, đầu ra có cấu trúc và các mẫu tích hợp phổ biến

Cài đặt bằng skills.sh

npx skills add google-gemini/gemini-skills --skill gemini-api-dev --global

Cài đặt bằng Context7

npx ctx7 skills install /google-gemini/gemini-skills gemini-api-dev

gemini-live-api-dev

Kỹ năng xây dựng các ứng dụng AI đàm thoại theo thời gian thực bằng Gemini Live API. Kỹ năng này cung cấp tài liệu và các phương pháp hay nhất cho:

  • Kết nối WebSocket để truyền trực tuyến có độ trễ thấp
  • Truyền trực tuyến âm thanh, video và văn bản
  • Phát hiện hoạt động bằng giọng nói và hỗ trợ xen ngang

Cài đặt bằng skills.sh

npx skills add google-gemini/gemini-skills --skill gemini-live-api-dev --global

Cài đặt bằng Context7

npx ctx7 skills install /google-gemini/gemini-skills gemini-live-api-dev

gemini-interactions-api

Kỹ năng xây dựng ứng dụng bằng Interactions API. Interactions API là một giao diện hợp nhất để tương tác với các mô hình và tác nhân Gemini, được thiết kế cho các ứng dụng dựa trên tác nhân. Kỹ năng này bao gồm:

  • Tạo văn bản, trò chuyện nhiều lượt và truyền trực tuyến
  • Gọi hàm, đầu ra có cấu trúc và tạo hình ảnh
  • Chạy ở chế độ nền và tác nhân Deep Research
  • Quản lý trạng thái cuộc trò chuyện phía máy chủ
  • Các mẫu SDK Python và TypeScript

Cài đặt bằng skills.sh

npx skills add google-gemini/gemini-skills --skill gemini-interactions-api --global

Cài đặt bằng Context7

npx ctx7 skills install /google-gemini/gemini-skills gemini-interactions-api

Xác minh cài đặt

Sau khi cài đặt, hãy xác nhận rằng trợ lý lập trình của bạn có thể kết nối với máy chủ Gemini Docs MCP và sử dụng các kỹ năng đã cài đặt.

1. Xác minh hành vi của tác nhân

Cách đáng tin cậy nhất để xác minh là hỏi tác nhân của bạn một câu hỏi kỹ thuật về Gemini API.

Lời nhắc: "Làm cách nào để sử dụng tính năng lưu vào bộ nhớ đệm theo bối cảnh với Gemini API?"

Quá trình thiết lập thành công sẽ:

  • Cung cấp mã chính xác: Tham chiếu các phương thức Gemini cụ thể như cacheContent hoặc cachedContents.create từ các điểm cuối mới nhất.
  • Sử dụng Công cụ MCP: Cho biết công cụ này được kết nối với Máy chủ Gemini Docs MCP hoặc sử dụng công cụ search_documentation để tìm nạp dữ liệu.
  • Gọi các kỹ năng đã tải: Hiển thị một chỉ báo cho biết "Using skill: gemini-api-dev" (Đang sử dụng kỹ năng: gemini-api-dev) (nếu dựa vào một trình bao bọc thứ cấp).

2. Xác minh biểu hiện và công cụ

Nếu tác nhân đưa ra câu trả lời chung hoặc chung chung, hãy sử dụng các lệnh Khám phá hoặc Trạng thái cụ thể cho môi trường của bạn để xác minh rằng Docs MCP hoặc kỹ năng được tải vào bộ nhớ.

Môi trường Xác minh MCP Xác minh kỹ năng
Mã Claude Nhập /mcp trong thiết bị đầu cuối để xem các máy chủ đang hoạt động và công cụ search_documentation. Nhập /skills trong thiết bị đầu cuối để liệt kê tất cả các tệp kê khai đang hoạt động.
Con trỏ Chuyển đến Cài đặt > Tính năng > MCP. Đảm bảo máy chủ có trạng thái "Đã kết nối". Mở Cài đặt > Quy tắc. Xác minh kỹ năng xuất hiện trong phần "Tác nhân quyết định".
Antigravity Kiểm tra thanh bên Tuỳ chỉnh > Kết nối để biết trạng thái MCP. Nhập /skills list hoặc kiểm tra thanh bên Tuỳ chỉnh > Quy tắc.
Gemini CLI Chạy gemini mcp list hoặc sử dụng /mcp list. Chạy gemini skills list hoặc sử dụng lệnh dấu gạch chéo /skills trong phiên.
Copilot Nhập @gemini /mcp để liệt kê các trình kết nối dữ liệu đang hoạt động. Nhập @gemini /skills (hoặc /skills) để xem các tiện ích đang hoạt động.

Khắc phục sự cố

Nếu tác nhân của bạn chỉ cung cấp thông tin chung hoặc không nhận ra các phương thức dành riêng cho Gemini, hãy kiểm tra những điều sau:

Tác nhân không phát hiện ra kỹ năng

Hầu hết các tác nhân chỉ lập chỉ mục kỹ năng khi khởi động.

Cách khắc phục: Khởi động lại hoàn toàn IDE (Cursor/VS Code) hoặc thoát và mở lại tác nhân dựa trên Terminal (Mã Claude).

Xung đột chung so với xung đột cục bộ

Nếu bạn cài đặt bằng cờ --global, tác nhân có thể bỏ qua cờ này để ưu tiên các quy tắc dành riêng cho dự án.

Cách khắc phục: Thử cài đặt kỹ năng trực tiếp vào thư mục gốc của dự án mà không có cờ chung:

npx skills add google-gemini/gemini-skills --skill gemini-api-dev

Tài nguyên