Asystenci kodowania AI są potężni, ale mają ograniczenia – dane treningowe są aktualne tylko do określonej daty, brakuje w nich nowych funkcji i zmian w interfejsie API. Bez dostępu do dokumentacji dotyczącej Gemini agenci mogą sugerować ogólne wzorce zamiast zoptymalizowanych rozwiązań.
Aby asystent kodowania był na bieżąco z rozwijającym się interfejsem Gemini API i jego zalecanym użyciem, zalecamy skonfigurowanie Gemini Docs MCP i rozszerzenie środowiska o umiejętności Gemini API. Chociaż te narzędzia mogą być używane niezależnie, zostały zaprojektowane tak, aby współpracować i zapewniać pełne pokrycie.
Łączenie Gemini Docs MCP
Gemini hostuje publiczny serwer Model Context Protocol (MCP) pod adresem https://gemini-api-docs-mcp.dev. Połączenie agenta kodowania z tym serwerem zapewnia, że wszystkie zapytania mają dostęp do najnowszych interfejsów API, aktualizacji kodu i optymalnych przykładów konfiguracji.
Aby zainstalować serwer, uruchom to polecenie w terminalu agenta lub w katalogu głównym projektu:
npx add-mcp "https://gemini-api-docs-mcp.dev"
Ten serwer dodaje funkcję search_documentation, której agent może używać do pobierania definicji interfejsu API i wzorców integracji w czasie rzeczywistym z oficjalnych plików dokumentacji Gemini.
Dodawanie umiejętności programowania API
Umiejętności zapewniają wbudowane reguły i sprawdzone metody (np. wymuszanie prawidłowych wersji pakietu SDK i bieżącego modelu) bezpośrednio w kontekście asystenta. Umiejętność współpracuje z usługą Gemini Docs MCP: jeśli masz zainstalowane obie te usługi, umiejętność używa usługi MCP do dokumentacji, ale nawet bez zainstalowanej usługi MCP pobiera llms.txt z ai.google.dev jako rezerwę.
Aby zainstalować te umiejętności, możesz użyć jednego z tych obsługiwanych narzędzi. Instrukcje instalacji obu narzędzi znajdziesz poniżej każdego modułu umiejętności:
- skills.sh: zalecane. Otwarty standard przenośnych zachowań agenta.
- Context7: obsługiwane w przypadku użytkowników, którzy już korzystają z ekosystemu Context7.
gemini-api-dev
Podstawowa umiejętność do programowania Gemini do zwykłych obciążeń. Ta umiejętność zawiera dokumentację i sprawdzone metody dotyczące:
- przekierowywania promptów do bieżących modeli (np. Gemini 3.1 Pro/Flash) i unikania wycofanych modeli;
- tworzenie promptów multimodalnych, wywoływania funkcji, uporządkowanych danych wyjściowych i typowych wzorców integracji.
Instalacja za pomocą skills.sh
npx skills add google-gemini/gemini-skills --skill gemini-api-dev --global
Instalacja za pomocą Context7
npx ctx7 skills install /google-gemini/gemini-skills gemini-api-dev
gemini-live-api-dev
Umiejętność tworzenia aplikacji konwersacyjnej AI w czasie rzeczywistym za pomocą Gemini Live API. Ta umiejętność zawiera dokumentację i sprawdzone metody dotyczące:
- połączeń WebSocket do przesyłania strumieniowego z niskim opóźnieniem;
- przesyłania strumieniowego dźwięku, obrazu i tekstu;
- wykrywania aktywności głosowej i obsługi przerywania.
Instalacja za pomocą skills.sh
npx skills add google-gemini/gemini-skills --skill gemini-live-api-dev --global
Instalacja za pomocą Context7
npx ctx7 skills install /google-gemini/gemini-skills gemini-live-api-dev
gemini-interactions-api
Umiejętność tworzenia aplikacji za pomocą Interactions API. Interactions API to ujednolicony interfejs do interakcji z modelami i agentami Gemini, zaprojektowany z myślą o aplikacjach agentowych. Ta umiejętność obejmuje:
- generowanie tekstu, czat wieloetapowy i przesyłanie strumieniowe;
- wywoływanie funkcji, uporządkowane dane wyjściowe i generowanie obrazów;
- wykonywanie w tle i agenci Deep Research;
- zarządzanie stanem rozmowy po stronie serwera;
- wzorce pakietu SDK w Pythonie i TypeScript.
Instalacja za pomocą skills.sh
npx skills add google-gemini/gemini-skills --skill gemini-interactions-api --global
Instalacja za pomocą Context7
npx ctx7 skills install /google-gemini/gemini-skills gemini-interactions-api
Zweryfikuj instalację
Po instalacji sprawdź, czy asystent kodowania może połączyć się z serwerem Gemini Docs MCP i korzystać z zainstalowanych umiejętności.
1. Sprawdź zachowanie agenta
Najbardziej niezawodnym sposobem sprawdzenia jest zadanie agentowi pytania technicznego dotyczącego Gemini API.
Prompt: „Jak używać buforowania kontekstu w Gemini API?”
Prawidłowa konfiguracja:
- zapewnia dokładny kod: odwołuje się do konkretnych metod Gemini, takich jak
cacheContentlubcachedContents.create, z najnowszych punktów końcowych; - używa narzędzia MCP: pokazuje, że jest połączona z serwerem Gemini Docs MCP lub używa narzędzia
search_documentationdo pobierania danych; - wywołuje załadowane umiejętności: wyświetla wskaźnik „Using skill: gemini-api-dev” (jeśli korzysta z dodatkowej otoczki).
2. Sprawdź manifesty i narzędzia
Jeśli agent udzieli ogólnej odpowiedzi, użyj konkretnych poleceń Discovery lub Status dla swojego środowiska, aby sprawdzić, czy Docs MCP lub umiejętność są załadowane do pamięci.
| Środowisko | Weryfikacja MCP | Weryfikacja umiejętności |
|---|---|---|
| Claude Code | Wpisz /mcp w terminalu, aby wyświetlić aktywne serwery i narzędzia search_documentation. |
Wpisz /skills w terminalu, aby wyświetlić wszystkie aktywne manifesty. |
| Kursor | Kliknij Ustawienia > Funkcje > MCP. Sprawdź, czy serwer jest „Połączony”. | Otwórz Ustawienia > Reguły. Sprawdź, czy umiejętność jest widoczna w sekcji „Decyzja agenta”. |
| Antigravity | Sprawdź stan MCP na pasku bocznym Dostosowania > Połączenia. | Wpisz /skills list lub sprawdź pasek boczny Dostosowania > Reguły. |
| Interfejs wiersza poleceń Gemini | Uruchom gemini mcp list lub użyj /mcp list. |
Uruchom gemini skills list lub użyj polecenia po ukośniku /skills w sesji. |
| Copilot | Wpisz @gemini /mcp, aby wyświetlić listę aktywnych łączników danych. |
Wpisz @gemini /skills (lub /skills), aby wyświetlić aktywne rozszerzenia. |
Rozwiązywanie problemów
Jeśli agent podaje tylko ogólne informacje lub nie rozpoznaje metod specyficznych dla Gemini, sprawdź te kwestie:
Agent nie wykrył umiejętności
Większość agentów indeksuje umiejętności tylko podczas uruchamiania.
Rozwiązanie: całkowicie uruchom ponownie IDE (Cursor/VS Code) lub zamknij i ponownie otwórz agenta opartego na terminalu (Claude Code).
Konflikt globalny a lokalny
Jeśli instalacja została przeprowadzona z flagą --global, agent może ją ignorować na rzecz reguł specyficznych dla projektu.
Rozwiązanie: spróbuj zainstalować umiejętność bezpośrednio w katalogu głównym projektu bez flagi globalnej:
npx skills add google-gemini/gemini-skills --skill gemini-api-dev