Szybsze odkrywanie dzięki Gemini for Research

Modele Gemini mogą być używane do prowadzenia badań podstawowych w różnych dziedzinach. Oto sposoby, w jakie możesz wykorzystać Gemini w swoich badaniach:

  • Analizowanie i kontrolowanie danych wyjściowych modelu: aby przeprowadzić dalszą analizę, możesz zbadać kandydata na odpowiedź wygenerowanego przez model za pomocą narzędzi takich jak CitationMetadata. Możesz też skonfigurować opcje generowania i danych wyjściowych modelu, takie jak responseSchema, topP i topK. Więcej informacji.
  • Dane wejściowe multimodalne: Gemini może przetwarzać obrazy, dźwięk i filmy, co otwiera wiele ciekawych kierunków badań. Więcej informacji.
  • Możliwości długiego kontekstu: Gemini 3.0 Flash i Pro mają okno kontekstu o wielkości 1 mln tokenów. Więcej informacji.
  • Grow with Google: szybki dostęp do modeli Gemini przez interfejs API i Google AI Studio w przypadku zastosowań produkcyjnych. Jeśli szukasz platformy opartej na Google Cloud, Gemini Enterprise Agent Platform może zapewnić dodatkową infrastrukturę pomocniczą.

Aby wspierać badania akademickie i prowadzić nowatorskie badania, Google udostępnia naukowcom i badaczom akademickim środki na Gemini API w ramach programu Gemini Academic.

Pierwsze kroki z Gemini

Gemini API i Google AI Studio pomagają rozpocząć pracę z najnowszymi modelami Google i przekształcić pomysły w aplikacje, które można skalować.

Python

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemini-3-flash-preview",
    contents="How large is the universe?",
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: "How large is the universe?",
  });
  console.log(response.text);
}

await main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

„Nasze badania dotyczą Gemini jako wizualnego modelu językowego (VLM) i jego zachowań agentowych w różnych środowiskach z perspektywy odporności i bezpieczeństwa. Do tej pory oceniliśmy odporność Gemini na rozpraszacze, takie jak wyskakujące okienka, gdy agenci VLM wykonują zadania na komputerze, i wykorzystaliśmy Gemini do analizowania interakcji społecznych, zdarzeń czasowych oraz czynników ryzyka na podstawie danych wejściowych wideo”.

„Gemini Pro i Flash z długim oknem kontekstu pomagają nam w OK-Robot, naszym projekcie manipulacji mobilnej z otwartym słownikiem. Gemini umożliwia złożone zapytania i polecenia w języku naturalnym dotyczące „pamięci” robota, w tym przypadku wcześniejszych obserwacji robota podczas długiego okresu działania. Wraz z Mahi Shafiullah używamy też Gemini do rozkładania zadań na kod, który robot może wykonać w prawdziwym świecie”.

Program Gemini Academic

Kwalifikujący się badacze akademiccy (np. wykładowcy, pracownicy i doktoranci) w obsługiwanych krajach mogą ubiegać się o środki na Gemini API i wyższe limity liczby żądań w przypadku projektów badawczych. Dzięki temu można zwiększyć przepustowość eksperymentów naukowych i przyspieszyć badania.

Szczególnie interesują nas obszary badawcze wymienione w sekcji poniżej, ale przyjmujemy zgłoszenia z różnych dziedzin nauki:

  • Oceny i testy porównawcze: metody oceny zatwierdzone przez społeczność, które mogą zapewnić silny sygnał skuteczności w takich obszarach jak rzetelność, bezpieczeństwo, wykonywanie instrukcji, rozumowanie i planowanie.

  • Przyspieszanie odkryć naukowych z korzyścią dla ludzkości: potencjalne zastosowania AI w interdyscyplinarnych badaniach naukowych, w tym w takich obszarach jak rzadkie i zaniedbane choroby, biologia eksperymentalna, materiałoznawstwo i zrównoważony rozwój.

  • Ucieleśnienie i interakcje: wykorzystanie dużych modeli językowych do badania nowych interakcji w dziedzinach ucieleśnionej AI, interakcji otoczenia, robotyki i interakcji człowiek–komputer.

  • Możliwości emergentne: odkrywanie nowych możliwości agentowych wymaganych do ulepszenia rozumowania i planowania oraz sposobów rozszerzania możliwości podczas wnioskowania (np. przez wykorzystanie Gemini Flash).

  • Interakcje i rozumienie multimodalne: identyfikowanie luk i możliwości w zakresie multimodalnych modeli podstawowych do analizy, rozumowania, i planowania w różnych zadaniach.

Kryteria kwalifikacji: zgłaszać się mogą tylko osoby (wykładowcy, badacze lub osoby o równoważnym statusie) powiązane z uznaną instytucją akademicką lub organizacją badawczą. Pamiętaj, że dostęp do interfejsu API i środki będą przyznawane i odbierane według uznania Google. Zgłoszenia sprawdzamy co miesiąc.

Rozpoczęcie badań z Gemini API

Zgłoś się