Accélérez la découverte avec Gemini pour la recherche

Les modèles Gemini peuvent être utilisés pour faire progresser les recherches fondamentales dans différentes disciplines. Voici quelques façons d'explorer Gemini pour vos recherches:

  • Affinage: vous pouvez affiner les modèles Gemini pour diverses modalités afin de faire progresser vos recherches. En savoir plus
  • Analyser et contrôler les sorties du modèle: pour une analyse plus approfondie, vous pouvez examiner une réponse candidate générée par le modèle à l'aide d'outils tels que Logprobs et CitationMetadata. Vous pouvez également configurer des options pour la génération de modèles et les sorties, telles que responseSchema, topP et topK. En savoir plus
  • Entrées multimodales: Gemini peut traiter des images, des contenus audio et des vidéos, ce qui ouvre de nombreuses perspectives de recherche intéressantes. En savoir plus
  • Fonctionnalités de contexte étendu: Gemini 1.5 Flash est fourni avec une fenêtre de contexte d'un million de jetons, et Gemini 1.5 Pro est fourni avec une fenêtre de contexte de deux millions de jetons. En savoir plus
  • Développez-vous avec Google: accédez rapidement aux modèles Gemini via l'API et Google AI Studio pour les cas d'utilisation en production. Si vous recherchez une plate-forme basée sur Google Cloud, Vertex AI peut fournir une infrastructure de soutien supplémentaire.

Pour soutenir la recherche universitaire et stimuler la recherche de pointe, Google fournit aux scientifiques et aux chercheurs universitaires un accès aux crédits de l'API Gemini via le programme Gemini pour les chercheurs universitaires.

Premiers pas avec Gemini

L'API Gemini et Google AI Studio vous aident à commencer à travailler avec les derniers modèles de Google et à transformer vos idées en applications évolutives.

Python

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content("How large is the universe?")
print(response.text)

Node.js

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });

const prompt = "How large is the universe?";

const result = await model.generateContent(prompt);
console.log(result.response.text());

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key=YOUR_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

"Notre recherche étudie Gemini en tant que modèle de langage visuel (VLM) et ses comportements d'agentivité dans divers environnements du point de vue de la robustesse et de la sécurité. Jusqu'à présent, nous avons évalué la robustesse de Gemini face aux distractions telles que les fenêtres pop-up lorsque les agents VLM effectuent des tâches informatiques. Nous avons également utilisé Gemini pour analyser les interactions sociales, les événements temporels et les facteurs de risque en fonction des entrées vidéo."

"Gemini Pro et Flash, avec leur longue fenêtre de contexte, nous ont aidés dans OK-Robot, notre projet de manipulation mobile à vocabulaire ouvert. Gemini permet d'effectuer des requêtes et des commandes complexes en langage naturel sur la "mémoire" du robot, c'est-à-dire les observations précédentes effectuées par le robot sur une longue durée d'opération. Mahi Shafiullah et moi-même utilisons également Gemini pour décomposer les tâches en code que le robot peut exécuter dans le monde réel."

Programme Gemini pour les établissements d'enseignement

Les chercheurs universitaires qualifiés (enseignants, membres du personnel et doctorants, par exemple) dans les pays acceptés peuvent demander à recevoir des crédits pour l'API Gemini et des limites de débit plus élevées pour leurs projets de recherche. Cette compatibilité permet d'augmenter le débit des expériences scientifiques et de faire progresser la recherche.

Nous sommes particulièrement intéressés par les domaines de recherche de la section suivante, mais nous acceptons les candidatures de diverses disciplines scientifiques:

  • Évaluations et benchmarks: méthodes d'évaluation approuvées par la communauté qui peuvent fournir un signal de performance fort dans des domaines tels que la véracité, la sécurité, le respect des instructions, le raisonnement et la planification.

  • Accélérer les découvertes scientifiques pour le bien de l'humanité: applications potentielles de l'IA dans la recherche scientifique interdisciplinaire, y compris dans des domaines tels que les maladies rares et négligées, la biologie expérimentale, la science des matériaux et la durabilité.

  • Incarnation et interactions: utilisation de grands modèles de langage pour étudier de nouvelles interactions dans les domaines de l'IA incarnée, des interactions ambiantes, de la robotique et de l'interaction homme-machine.

  • Fonctionnalités émergentes: exploration des nouvelles fonctionnalités d'agentivité requises pour améliorer le raisonnement et la planification, et comment les fonctionnalités peuvent être étendues lors de l'inférence (par exemple, en utilisant Gemini Flash).

  • Interaction et compréhension multimodales: identification des lacunes et des opportunités pour les modèles de base multimodaux d'analyse, de raisonnement et de planification dans diverses tâches.

Éligibilité: seules les personnes (membres du corps enseignant, chercheurs ou équivalents) affiliées à une institution académique ou à une organisation de recherche académique peuvent postuler. Notez que l'accès à l'API et les crédits seront accordés et supprimés à la discrétion de Google. Nous examinons les demandes chaque mois.

Commencer à effectuer des recherches avec l'API Gemini

Envoyer une demande