Acelera el descubrimiento con Gemini para la investigación
Los modelos de Gemini se pueden usar para avanzar en la investigación fundamental en todas las disciplinas. Estas son algunas formas en las que puedes explorar Gemini para tu investigación:
- Ajuste fino: Puedes ajustar los modelos de Gemini para una variedad de modalidades para avanzar en tu investigación. Obtén más información.
- Analizar y controlar las salidas del modelo: Para realizar un análisis más detallado, puedes examinar una respuesta candidata que genera el modelo con herramientas como
Logprobs
yCitationMetadata
. También puedes configurar opciones para la generación de modelos y los resultados, comoresponseSchema
,topP
ytopK
. Obtén más información. - Entradas multimodales: Gemini puede procesar imágenes, audio y videos, lo que permite una gran cantidad de direcciones de investigación interesantes. Obtén más información.
- Funciones de contexto a largo plazo: Gemini 1.5 Flash viene con una ventana de contexto de 1 millón de tokens y Gemini 1.5 Pro con una ventana de contexto de 2 millones de tokens. Obtén más información.
- Crece con Google: Accede rápidamente a los modelos de Gemini a través de la API y Google AI Studio para casos de uso de producción. Si buscas una plataforma basada en Google Cloud, Vertex AI puede proporcionar infraestructura de asistencia adicional.
Para respaldar la investigación académica y fomentar la investigación de vanguardia, Google proporciona acceso a los créditos de la API de Gemini a científicos y académicos a través del Programa académico de Gemini.
Comienza a usar Gemini
La API de Gemini y Google AI Studio te ayudan a comenzar a trabajar con los modelos más recientes de Google y a convertir tus ideas en aplicaciones que se escalan.
Python
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content("How large is the universe?")
print(response.text)
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });
const prompt = "How large is the universe?";
const result = await model.generateContent(prompt);
console.log(result.response.text());
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key=YOUR_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts":[{"text": "How large is the universe?"}]
}]
}'
Académicos destacados
"Nuestra investigación analiza Gemini como un modelo de lenguaje visual (VLM) y sus comportamientos agentes en diversos entornos desde las perspectivas de robustez y seguridad. Hasta ahora, evaluamos la solidez de Gemini frente a distracciones, como ventanas emergentes cuando los agentes de VLM realizan tareas informáticas, y aprovechamos Gemini para analizar la interacción social, los eventos temporales y los factores de riesgo en función de la entrada de video".
"Gemini Pro y Flash, con su ventana de contexto a largo plazo, nos han ayudado en OK-Robot, nuestro proyecto de manipulación de dispositivos móviles con vocabulario abierto. Gemini permite realizar consultas y comandos complejos en lenguaje natural sobre la "memoria" del robot: en este caso, las observaciones anteriores que hizo el robot durante un período prolongado de operación. Mahi Shafiullah y yo también usamos Gemini para descomponer tareas en código que el robot puede ejecutar en el mundo real".
Programa académico de Gemini
Los investigadores académicos calificados (como profesores, personal y estudiantes de doctorado) de los países admitidos pueden postularse para recibir créditos de la API de Gemini y límites de tarifas más altos para proyectos de investigación. Esta compatibilidad permite una mayor productividad para los experimentos científicos y avanza en la investigación.
Nos interesan especialmente las áreas de investigación que se mencionan en la siguiente sección, pero aceptamos solicitudes de diversas disciplinas científicas:
Evaluaciones y comparativas: Son métodos de evaluación respaldados por la comunidad que pueden proporcionar un indicador de rendimiento sólido en áreas como la veracidad, la seguridad, el seguimiento de instrucciones, el razonamiento y la planificación.
Aceleración del descubrimiento científico para beneficiar a la humanidad: Posibilidades de aplicación de la IA en la investigación científica interdisciplinaria, incluidas áreas como las enfermedades raras y desatendidas, la biología experimental, la ciencia de los materiales y la sostenibilidad.
Incorporación e interacciones: Usar modelos grandes de lenguaje para investigar interacciones novedosas en los campos de la IA incorporada, las interacciones ambientales, la robótica y la interacción entre humanos y computadoras.
Capacidades emergentes: Exploración de nuevas capacidades de agencia necesarias para mejorar el razonamiento y la planificación, y cómo se pueden expandir las capacidades durante la inferencia (p.ej., mediante Gemini Flash).
Interacción y comprensión multimodal: Identificar brechas y oportunidades para modelos de base multimodales para el análisis, el razonamiento y la planificación en una variedad de tareas.
Elegibilidad: Solo pueden postularse personas (profesores, investigadores o equivalentes) afiliadas a una institución académica o una organización de investigación académica válidas. Ten en cuenta que el acceso a la API y los créditos se otorgarán y quitarán a discreción de Google. Revisamos las postulaciones todos los meses.