Руководство по разработке API Google Gemini: как интегрировать Google Gemini в свои веб-сайты и проекты?
В прошлом месяце Google выпустила Gemini. Сразу после этого я разработал AI SEO на основе Google Gemini — плагина WordPress, который автоматически и в пакетном режиме генерирует статьи, удобные для поисковых систем, — артефакт SEO.
Подробности можно найти здесь:
В этом месяце я разработал чат-бота на основе Google Gemini.
Здесь я хотел бы поделиться своим опытом разработки на основе Google Gemini API.
I. Обзор
1. Язык разработки
Если вы разрабатываете js, python, go, Swift и Android, вы можете напрямую обратиться к примерам в официальной документации Google Gemini API:
https://ai.google.dev/docs?hl=zh-cn
Примеры в этой статье разработаны на основе PHP.
2. Остальной API
Помимо вышеперечисленных языков разработки, другие языки разработки будут использовать Rest API для взаимодействия с Google Gemini.
Таким образом, PHP, используемый в этой статье, также основан на взаимодействии Rest API и Google Gemini.
2. Три режима запроса
1. Текст генерации текста
Это самое основное.
Модель:
Близнецы Про.
Запрошенный URL:
https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=’${API_KEY}
Метод запроса:
ПОЧТА
Запрошенная структура данных:
{ "содержание": [ { "части": [ { "текст": "xxxxxx" } ] } ] }
2. Многорежимный (текст + изображение для генерации текста)
Используйте изображения или текст и изображения в качестве слов-подсказок для создания текста.
Модель:
Версия Gemini Pro.
Запрошенный URL:
https://generativelanguage.googleapis.com/v1beta/models/gemini-pro-vision:генерироватьContent?key='${API_KEY}
Метод запроса:
ПОЧТА
Запрошенная структура данных:
{ "contents": [ { "parts": [ { "text": "hello\n Здравствуйте! Чем я могу вам помочь сегодня?\na cat" }, { "inlineData": { "mimeType": "image/jpeg ", "data": "'$(base64 -w0 image0.jpeg)'" } }, { "text": "xxxxxxx" } ] } ], }
3. Несколько раундов диалога (чата)
Вы можете использовать только модель Gemini Pro, что означает, что вы можете генерировать текст только из текста.
Модель:
Близнецы Про.
Запрошенный URL:
https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=’${API_KEY}
Метод запроса:
ПОЧТА
Запрошенная структура данных:
{ "contents": [ {"role":"user", "parts":[{ "text": "xxxxxx"}]}, {"role": "model", "parts":[{ "text" : "xxxxxx"}]}, {"role": "user", "parts":[{ "text": "xxxxxx"}]}, ] }
3. Примеры
Для выполнения вызова используйте PHP и Rest API Google Gemini.
1. Получите ключ API Google Gemini.
Обратитесь к этой статье:
2. Код запроса PHP (текст генерирует текст)
function gemini_post(){ //ключ API Gemini $apikey="xxxxxx"; //url $url = "https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=" . $apikey; / / Запросить данные $data = [ "contents" => [ "parts" => [ "text" => $text ] ] ]; //Опубликовать запрос $curl = Curl_init(); Curl_setopt($curl, CURLOPT_URL, $url); // Запрос настроек header Curl_setopt($curl, CURLOPT_HTTPHEADER, ['Content-Type: application/json']); Curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); Curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false); if (!empty($data)) { // Определить является ли это POST-запросом Curl_setopt($curl, CURLOPT_POST, 1); Curl_setopt($curl, CURLOPT_POSTFIELDS, json_encode($data)); } Curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $response = cur_exec($curl) ; $res = json_decode($response) ; Curl_close($curl); вернуть $res; }
3. Многорежимный
Метод многорежимного запроса аналогичен генерации текста, за исключением того, что в запрашиваемых данных будут изображения.
4. Чат
Метод запроса чата аналогичен генерации текста, за исключением того, что запрошенные данные содержат несколько фрагментов данных и должно быть поле «роль».
4. Лучшие практики
Запрос сервера или запрос клиента?
По моему опыту, если продукт включает в себя большое количество слов-подсказок, то лучше всего запрашивать через сервер, поскольку так проще управлять словами-подсказками.
Кроме того, учитывая, что некоторые регионы не могут запрашивать Google Gemini, запросы на стороне сервера могут позволить пользователям в этих регионах использовать продукты на базе Google Gemini.
Если вам не нужно учитывать эти два момента, клиенту удобнее сделать запрос.
5. Резюме
Возможности Google Gemini не уступают возможностям GPT, и его можно использовать бесплатно.На основе Google Gemini можно более удобно разрабатывать различные приложения искусственного интеллекта. Мы с оптимизмом смотрим на будущее развитие Google Gemini.
6. Приложение
Официальный сайт Google Gemini:
Документация Google Gemini API:
https://ai.google.dev/docs?hl=zh-cn