Portkey-AI · VisargD · Oct 1, 2024 · Sep 22, 2024 · Sep 23, 2024 · Sep 26, 2024
diff --git a/src/providers/google-vertex-ai/api.ts b/src/providers/google-vertex-ai/api.ts
@@ -50,14  50,24 @@ export const GoogleApiConfig: ProviderAPIConfig = {
 
     const { provider, model } = getModelAndProvider(inputModel as string);
     const projectRoute = getProjectRoute(providerOptions, inputModel as string);
     const googleUrlMap = new Map<string, string>([
       [
         'chatComplete',
         `${projectRoute}/publishers/${provider}/models/${model}:generateContent`,
       ],
       [
         'stream-chatComplete',
         `${projectRoute}/publishers/${provider}/models/${model}:streamGenerateContent?alt=sse`,
       ],
       [
         'embed',
         `${projectRoute}/publishers/${provider}/models/${model}:predict`,
       ],
     ]);
 
     switch (provider) {
       case 'google': {
-        if (mappedFn === 'chatComplete') {
-          return `${projectRoute}/publishers/${provider}/models/${model}:generateContent`;
-        } else if (mappedFn === 'stream-chatComplete') {
-          return `${projectRoute}/publishers/${provider}/models/${model}:streamGenerateContent?alt=sse`;
-        }
         return googleUrlMap.get(mappedFn) || `${projectRoute}`;
       }
 
       case 'anthropic': {
@@ -72,8  82,6 @@ export const GoogleApiConfig: ProviderAPIConfig = {
         return `${projectRoute}/endpoints/openapi/chat/completions`;
       }
 
-      // Embed API is not yet implemented in the gateway
-      // This may be as easy as copy-paste from Google provider, but needs to be tested
       default:
         return `${projectRoute}`;
     }

diff --git a/src/providers/google-vertex-ai/embed.ts b/src/providers/google-vertex-ai/embed.ts
@@ -0,0  1,93 @@
 import { ErrorResponse, ProviderConfig } from '../types';
 import {
   EmbedResponse,
   EmbedResponseData,
   EmbedParams,
 } from '../../types/embedRequestBody';
 import {
   GoogleErrorResponse,
   EmbedInstancesData,
   GoogleEmbedResponse,
 } from './types';
 import { GOOGLE_VERTEX_AI } from '../../globals';
 import { generateInvalidProviderResponseError } from '../utils';
 import { GoogleErrorResponseTransform } from './utils';
 
 enum TASK_TYPE {
   RETRIEVAL_QUERY = 'RETRIEVAL_QUERY',
   RETRIEVAL_DOCUMENT = 'RETRIEVAL_DOCUMENT',
   SEMANTIC_SIMILARITY = 'SEMANTIC_SIMILARITY',
   CLASSIFICATION = 'CLASSIFICATION',
   CLUSTERING = 'CLUSTERING',
   QUESTION_ANSWERING = 'QUESTION_ANSWERING',
   FACT_VERIFICATION = 'FACT_VERIFICATION',
   CODE_RETRIEVAL_QUERY = 'CODE_RETRIEVAL_QUERY',
 }
 
 interface GoogleEmbedParams extends EmbedParams {
   task_type: TASK_TYPE | string;
 }
 
 export const GoogleEmbedConfig: ProviderConfig = {
   input: {
     param: 'instances',
     required: true,
     transform: (params: GoogleEmbedParams): Array<EmbedInstancesData> => {
       const instances = Array<EmbedInstancesData>();
       if (Array.isArray(params.input)) {
         params.input.forEach((text) => {
           instances.push({
             content: text,
             task_type: params.task_type,
           });
         });
       } else {
         instances.push({
           content: params.input,
           task_type: params.task_type,
         });
       }
       return instances;
     },
   },
   parameters: {
     param: 'parameters',
     required: false,
   },
 };
 
 export const GoogleEmbedResponseTransform: (
   response: GoogleEmbedResponse | GoogleErrorResponse,
   responseStatus: number
 ) => EmbedResponse | ErrorResponse = (response, responseStatus) => {
   if (responseStatus !== 200) {
     const errorResposne = GoogleErrorResponseTransform(
       response as GoogleErrorResponse
     );
     if (errorResposne) return errorResposne;
   }
 
   if ('predictions' in response) {
     const data: EmbedResponseData[] = [];
     let tokenCount = 0;
     response.predictions.forEach((prediction, index) => {
       data.push({
         object: 'embedding',
         embedding: prediction.embeddings.values,
         index: index,
       });
       tokenCount  = prediction.embeddings.statistics.token_count;
     });
     return {
       object: 'list',
       data: data,
       model: '', // Todo: find a way to send the google embedding model name back
       usage: {
         prompt_tokens: tokenCount,
         total_tokens: response.metadata.billableCharacterCount,
       },
     };
   }
 
   return generateInvalidProviderResponseError(response, GOOGLE_VERTEX_AI);
 };
diff --git a/src/providers/google-vertex-ai/index.ts b/src/providers/google-vertex-ai/index.ts
@@ -12,6  12,7 @@ import {
   VertexLlamaChatCompleteStreamChunkTransform,
 } from './chatComplete';
 import { getModelAndProvider } from './utils';
 import { GoogleEmbedConfig, GoogleEmbedResponseTransform } from './embed';
 
 const VertexConfig: ProviderConfigs = {
   api: VertexApiConfig,
@@ -24,9  25,11 @@ const VertexConfig: ProviderConfigs = {
         return {
           chatComplete: VertexGoogleChatCompleteConfig,
           api: GoogleApiConfig,
           embed: GoogleEmbedConfig,
           responseTransforms: {
             'stream-chatComplete': GoogleChatCompleteStreamChunkTransform,
             chatComplete: GoogleChatCompleteResponseTransform,
             embed: GoogleEmbedResponseTransform,
           },
         };
       case 'anthropic':

diff --git a/src/providers/google-vertex-ai/types.ts b/src/providers/google-vertex-ai/types.ts
@@ -68,3  68,25 @@ export interface VertexLlamaChatCompleteStreamChunk {
   created?: number;
   provider?: string;
 }
 
 export interface EmbedInstancesData {
   task_type: string;
   content: string;
 }
 
 interface EmbedPredictionsResponse {
   embeddings: {
     values: number[];
     statistics: {
       truncated: string;
       token_count: number;
     };
   };
 }
 
 export interface GoogleEmbedResponse {
   predictions: EmbedPredictionsResponse[];
   metadata: {
     billableCharacterCount: number;
   };
 }
diff --git a/src/providers/google-vertex-ai/utils.ts b/src/providers/google-vertex-ai/utils.ts
@@ -1,3  1,8 @@
 import { GoogleErrorResponse } from './types';
 import { generateErrorResponse } from '../utils';
 import { GOOGLE_VERTEX_AI } from '../../globals';
 import { ErrorResponse } from '../types';
 
 /**
  * Encodes an object as a Base64 URL-encoded string.
  * @param obj The object to encode.
@@ -164,3  169,22 @@ export const getMimeType = (url: string) => {
   ] as keyof typeof fileExtensionMimeTypeMap;
   return fileExtensionMimeTypeMap[extension] || 'image/jpeg';
 };
 
 export const GoogleErrorResponseTransform: (
   response: GoogleErrorResponse,
   provider?: string
 ) => ErrorResponse | undefined = (response, provider = GOOGLE_VERTEX_AI) => {
   if ('error' in response) {
     return generateErrorResponse(
       {
         message: response.error.message ?? '',
         type: response.error.status ?? null,
         param: null,
         code: response.error.status ?? null,
       },
       provider
     );
   }
 
   return undefined;
 };