Gemini-Modelle können verwendet werden, um die Grundlagenforschung in verschiedenen Disziplinen voranzutreiben. Hier sind einige Möglichkeiten, wie Sie Gemini für Ihre Forschung nutzen können:
- Modellausgaben analysieren und steuern: Für weitere Analysen können Sie einen
vom Modell generierten Antwortkandidaten mit Tools wie
CitationMetadatauntersuchen. Sie können auch Optionen für die Modellgenerierung und -ausgaben konfigurieren, z. B.responseSchema,topPundtopK. Weitere Informationen. - Multimodale Eingaben: Gemini kann Bilder, Audio und Videos verarbeiten und so eine Vielzahl spannender Forschungsrichtungen ermöglichen. Weitere Informationen.
- Lange Kontextfenster: Gemini 3.0 Flash und Pro haben ein Kontextfenster von 1 Million Tokens. Weitere Informationen.
- Grow with Google: Über die API und Google AI Studio können Sie schnell auf Gemini-Modelle für Produktionsanwendungsfälle zugreifen. Wenn Sie eine Google Cloud-basierte Plattform suchen, kann die Gemini Enterprise Agent Platform zusätzliche unterstützende Infrastruktur bieten.
Um die akademische Forschung zu unterstützen und innovative Forschung voranzutreiben, bietet Google Wissenschaftlern und akademischen Forschern über das Gemini Academic ProgramZugriff auf Gemini API-Guthaben.
Gemini ausprobieren
Mit der Gemini API und Google AI Studio können Sie mit den neuesten Modellen von Google arbeiten und Ihre Ideen in skalierbare Anwendungen umwandeln.
Python
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="How large is the universe?",
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function main() {
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "How large is the universe?",
});
console.log(response.text);
}
await main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts":[{"text": "How large is the universe?"}]
}]
}'
Vorgestellte Wissenschaftler
„In unserer Forschung untersuchen wir Gemini als visuelles Sprachmodell (Visual Language Model, VLM) und seine agentischen Verhaltensweisen in verschiedenen Umgebungen aus Robustheits- und Sicherheitsperspektive. Bisher haben wir die Robustheit von Gemini gegenüber Ablenkungen wie Pop-up-Fenstern getestet, wenn VLM-Agents Computeraufgaben ausführen. Außerdem haben wir Gemini verwendet, um soziale Interaktionen, zeitliche Ereignisse und Risikofaktoren auf der Grundlage von Videoeingaben zu analysieren.“
„Gemini Pro und Flash mit ihren langen Kontextfenstern haben uns bei OK-Robot geholfen, unserem Projekt zur mobilen Manipulation mit offenem Wortschatz. Mit Gemini sind komplexe Abfragen und Befehle in natürlicher Sprache für das „Gedächtnis“ des Roboters möglich. In diesem Fall sind das frühere Beobachtungen des Roboters über einen langen Zeitraum. Mahi Shafiullah und ich verwenden Gemini auch, um Aufgaben in Code zu zerlegen, den der Roboter in der realen Welt ausführen kann.“
Gemini Academic Program
Qualifizierte akademische Forscher (z. B. Fakultätsmitglieder, Mitarbeiter und Doktoranden) in unterstützten Ländern können sich bewerben, um Gemini API Guthaben und höhere Ratenlimits für Forschungsprojekte zu erhalten. Diese Unterstützung ermöglicht einen höheren Durchsatz für wissenschaftliche Experimente und fördert die Forschung.
Wir sind besonders an den Forschungsbereichen im folgenden Abschnitt interessiert, freuen uns aber über Bewerbungen aus verschiedenen wissenschaftlichen Disziplinen:
Bewertungen und Benchmarks: Von der Community empfohlene Bewertungsmethoden, die ein starkes Leistungssignal in Bereichen wie Faktentreue, Sicherheit, Befolgung von Anweisungen, Argumentation und Planung liefern können.
Beschleunigung wissenschaftlicher Entdeckungen zum Wohle der Menschheit: Potenzielle Anwendungen von KI in der interdisziplinären wissenschaftlichen Forschung, einschließlich Bereichen wie seltene und vernachlässigte Krankheiten, experimentelle Biologie, Materialwissenschaft und Nachhaltigkeit.
Verkörperung und Interaktionen: Einsatz von Large Language Models zur Untersuchung neuartiger Interaktionen in den Bereichen verkörperte KI, Umgebungs interaktionen, Robotik und Mensch-Computer-Interaktion.
Emergente Fähigkeiten: Untersuchung neuer agentischer Funktionen, die zur Verbesserung von Argumentation und Planung erforderlich sind, und wie Fähigkeiten während der Inferenz erweitert werden können (z.B. durch Verwendung von Gemini Flash).
Multimodale Interaktion und multimodales Verständnis: Ermittlung von Lücken und Möglichkeiten für multimodale Foundation Models für Analyse, Argumentation, und Planung bei einer Vielzahl von Aufgaben.
Teilnahmeberechtigung: Nur Personen (Fakultätsmitglieder, Forscher oder Ähnliches), die einer gültigen akademischen Einrichtung oder akademischen Forschungsorganisation angehören, können sich bewerben. Der API-Zugriff und das Guthaben werden nach Googles Ermessen gewährt und entfernt. Wir prüfen Bewerbungen monatlich.