Guía de desarrollo de API de Google Gemini: ¿Cómo integrar Google Gemini en sus sitios web y proyectos?
El mes pasado, Google lanzó Gemini. Inmediatamente después, desarrollé AI SEO basado en Google Gemini, un complemento de WordPress que genera automáticamente y por lotes artículos aptos para motores de búsqueda, un artefacto de SEO.
Detalles pueden ser encontrados aqui:
Este mes desarrollé un chatbot basado en Google Gemini.
Aquí me gustaría compartir mi experiencia de desarrollo basada en la API de Google Gemini.
I. Descripción general
1. Lenguaje de desarrollo
Si está desarrollando js, python, go, swift y android, puede consultar directamente los ejemplos en la documentación oficial de la API de Google Gemini:
https://ai.google.dev/docs?hl=zh-cn
Los ejemplos de este artículo están desarrollados en base a PHP.
2. API de descanso
Además de los lenguajes de desarrollo anteriores, otros lenguajes de desarrollo utilizarán Rest API para interactuar con Google Gemini.
Por lo tanto, el PHP utilizado en este artículo también se basa en la interacción Rest API y Google Gemini.
2. Tres modos de solicitud
1. Texto de generación de texto
Este es el más básico.
Modelo:
Géminis Pro.
URL solicitada:
https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=’${API_KEY}
Método de solicitud:
CORREO
Estructura de datos solicitada:
{ "contenido": [ { "partes": [ { "texto": "xxxxxx" } ] } ] }
2. Multimodo (texto + imagen para generar texto)
Utilice imágenes, o texto e imágenes como palabras clave para generar texto.
Modelo:
Versión Géminis Pro.
URL solicitada:
https://generativelanguage.googleapis.com/v1beta/models/gemini-pro-vision:generarContenido?key='${API_KEY}
Método de solicitud:
CORREO
Estructura de datos solicitada:
{ "contents": [ { "parts": [ { "text": "hola\n ¡Hola! ¿En qué puedo ayudarte hoy?\na cat" }, { "inlineData": { "mimeType": "image/jpeg ", "datos": "'$(base64 -w0 imagen0.jpeg)'" } }, { "texto": "xxxxxxx" } ] } ], }
3. Múltiples rondas de diálogo (chat)
Sólo puedes utilizar el modelo Gemini Pro, lo que significa que sólo puedes generar texto a partir de texto.
Modelo:
Géminis Pro.
URL solicitada:
https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=’${API_KEY}
Método de solicitud:
CORREO
Estructura de datos solicitada:
{ "contenido": [ {"rol":"usuario", "piezas":[{ "texto": "xxxxxx"}]}, {"rol": "modelo", "piezas":[{ "texto" : "xxxxxx"}]}, {"rol": "usuario", "partes":[{ "texto": "xxxxxx"}]}, ] }
3. Ejemplos
Utilice PHP y la API Rest de Google Gemini para realizar la llamada.
1. Obtenga la clave API de Google Gemini
Consulte este artículo:
2. Código de solicitud PHP (el texto genera texto)
function gemini_post(){ //clave API de gemini $apikey="xxxxxx"; //url $url = "https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=" $apikey; Solicitar datos $data = [ "contents" => [ "parts" => [ "text" => $text ] ] ] // Publicar solicitud $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $url); header curl_setopt($curl, CURLOPT_HTTPHEADER, ['Tipo de contenido: aplicación/json']); curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false); si es una solicitud POST curl_setopt($curl, CURLOPT_POST, 1); curl_setopt($curl, CURLOPT_POSTFIELDS, json_encode($data)); $res = json_decode($response) ; curl_close($curl); devolver $res }
3. multimodo
El método de solicitud multimodo es el mismo que la generación de texto, excepto que habrá imágenes en los datos solicitados.
4. Charla
El método de solicitud de chat es el mismo que la generación de texto, excepto que los datos solicitados contienen varios datos y debe haber un campo de "rol".
4. Mejores prácticas
¿Solicitud del servidor o solicitud del cliente?
Según mi experiencia, si el producto incluye una gran cantidad de palabras clave, entonces es mejor solicitarlo a través del servidor porque es más fácil administrar las palabras clave.
Además, considerando que algunas regiones no pueden solicitar Google Gemini, las solicitudes del lado del servidor pueden permitir a los usuarios de estas regiones utilizar productos basados en Google Gemini.
Si no es necesario considerar estos dos puntos, es más conveniente que el cliente lo solicite.
5. Resumen
Las capacidades de Google Gemini no son inferiores a las de GPT y se pueden utilizar de forma gratuita. Basado en Google Gemini, se pueden desarrollar varias aplicaciones de inteligencia artificial de manera más conveniente. Somos optimistas sobre el desarrollo futuro de Google Gemini.
6. Apéndice
Sitio web oficial de Google Géminis:
Documentación de la API de Google Gemini:
https://ai.google.dev/docs?hl=zh-cn